Liebe Gemeinde,
ihr seid meine letzte Hoffnung etwas Licht in die für mich doch unverständliche Welt der Statistik zu erhalten.
Ich habe einen Datensatz mit 10.000 Messungen eines Laborwertes, der an mehreren Patienten gemessen wurden. Weiterhin beinhaltet jeder Datensatz eine Angabe über die zugrunde liegende Krankheit (als Text), dem Alter und noch einem weiteren Messwert. Es gibt in meinem Fall ein Dutzend verschiedene Krankheitsbilder, die den Patienten zugeordnet sind.
Ziel ist es nun signifikante Korrelationen zu ermitteln:
- zwischen dem Messwert und dem Krankheitsbild
- zwischen dem Messwert und zweiten Messwert
Für mich erschwerend kommt hinzu, dass diese Korrelationen zur Altersgruppe (18-40, 40-60 und >60 Jahre) erfolgen muss und ein Patient manchmal auch mehrfache Messungen erhalten hat, die unter Umständen zwei verschiedenen Altersgruppen zugeteilt werden (da die Messungen z.B. im Alter von 39 und 41 Jahren erfolgt sind.
Im Ergebnis würde mich also interessieren, dass der erhobene Laborwert z.B. für 'Krankheit_1' für Patienten von 40-60 Jahren eine signifikante Korrelation aufweist. Für ältere Menschen wäre dieser für dieses Krankheitsbild u.U. nicht hilfreich.
Meine Auswertung versuche ich mit SPSS zu machen. Allerdings ergibt sich für mich die grundsätzliche Frage, welcher Test in diesem Zusammenhang sinnvoll ist. Begonnen hatte ich mit einer Clusteranalyse, die mir schlicht nicht gelungen ist. Außerdem meinten Kollegen, dass das die völlig falsche Methode wäre. Deshalb habe ich diesen Post jetzt keinem bestimmtem Testverfahren in diesem Forum zugeteilt - wäre bestimmt im falschen Forum gelandet
Ich bin jetzt schon dankbar für jeden Tipp und jede Hilfestellung, die ihr mir geben könnt.