Hallo,
ich bin neu in der Statistikwelt und habe ein paar wenige Fragen zu einem medizinischem Projekt an dem ich sitze.
Situation
Excel Datei 1:
- Beinhaltet Blutproben von Patienten.
https://imgur.com/BOo7F7a
Excel Datei 2:
- Beinhaltet Informationen der Patienten bzw. deren Krankengeschichte
https://imgur.com/tO8KxRT
Das einzig gemeinsame was die beiden Datensätze haben sind also die Patientencodes am Anfang.
Was möchte ich gerne herausfinden?
1. Zunächst möchte ich gerne wissen, ob eine Phosphatmessung stattfand (Analysecode 'PHOS') und wenn ja, ob mind. eine von diesen bei dem Patienten <0.80 lag ('Reply' column), aka Hypophosphatemia.
2. Hypophoshatemia vs. Normales Phosphate für die jeweiligen Kategorien der Krankengeschichte https://imgur.com/7qROcHm
3. anschließende Analyse der potential predictors of hypophosphatemia um mögliche independent predictors zu finden https://imgur.com/opbTK4r
Meine Überlegungen
Generell/Excel
- Ich muss die beiden Dateien irgendwie kombinieren. Dafür habe ich die Blutwerte in die Patientendaten-datei kopiert und die Patientencodes in die Anfangskolonne eingefügt und den Rest dann in unbesetzte Kolonnen am Ende.
- Für die Kategorisierung als "Hypophosphatemia" kann ich folgende Commands verwenden:
O: =IF(AND(L17<0.80),1,IF(AND(L17>=0.80),0))
P: =IF(K17="PHOS",1,0)
Q: =IF(AND(O17=1,P17=1),1,0)
https://imgur.com/eqAwHNV
Statistik
Für die Einteilung der verschiedenen Infos der Krankengeschichte nach 'all', 'Hypophosphatemie' und 'normal phosphat' (https://imgur.com/7qROcHm) kann ich mit excel wohl nicht weiter fortfahren, da die Messungen ja einem Patientencode zugewiesen werden sollen und zudem ein Wert <0.80 für die Kategorisierung "hypophosphatemie" ausreichend ist. ( Ich hoffe das macht Sinn).
Ich bin mir ich auch nicht sicher, ob ich für die dichotomen Daten einen Chi²-test anwenden kann und für den Rest einen unpaired t-test. Ich habe da mal aufgeschnappt, dass eine logistische Regression/Generalized Estimating Equation eher geeignet sein soll.
Welche Programme habe ich zur Verfügung?
Kostenlos bekomme ich leider nur R und SPSS gestellt und kein PRISM GraphPad, von dem ich zumindest minimal Ahnung habe. Ich werde somit wohl primär SPSS benutzen.
Falls sich jemand die Mühe macht und mir hilft, bin ich der/demjenigen sehr dankbar!
Schönes Wochenende!
P.S. Ich habe das gleiche schon im statistik-tutorial.de forum geposted. Die Seiten scheinen sich sehr zu ähneln, aber hier scheint mehr los zu sein