Hallo,
mir geht es genauso - ich habe keine Ahnung, wie Daten eines ganzen Darmbioms aussehen und finde auch nicht, dass man das allgemein voraussetzen kann.
Das wäre eine multiple logistische Regression mit 17 Prädiktoren und der abhängigen Variable Pneumonie ja/nein.
Allerdings bräuchtest Du dafür eine weitaus größere Stichprobe.
Das sehe ich auch so, mit 17 Prädiktoren und 10 Pneumoniefällen wird die logistische Regression überfordert sein, weil sie versucht, für jede Bakterienart einen Koeffizienten zu schätzen. Wenn die Daten mit ordinalem Datenniveau vorliegen sollten schon gar nicht.
Das ist aber auch in der Fragestellung nicht gefordert:
Roskalla23 hat geschrieben:Die Fragestellung liegt darin, ob die Zusammensetzung der Bakterien einen Einfluss auf das Auftreten einer Pneumonie hat.
Ich könnte mir vorstellen (ist ja alles nur hypothetisch, falls die Daten dazu passen), hier mit Mitteln des statistischen Lernen heranzugehen. KI ist ja gerade auch der hype. Beispielsweise könnte man einen random forest anhand der Daten trainieren und anschließend prüfen, ob dieser es schafft, aus der Bakterienverteilung die Gruppenzugehörigkeit überzufällig gut vorherzusagen.
Alternativ, wenn einem die Vorstellung einer logistischen Regression besser gefällt, weil sie ein besser interpretierbares Ergebnis produziert, könnte man eine logistische Regression als LASSO-Regression rechnen und dann mittels leave-one-out Kreuzvalidierung prüfen, ob diese überzufällig die Gruppenzugehörigkeit vorhersagen kann.
Neben der Frage, wie der gewonnene Datensatz denn jetzt aussieht finde ich die Frage spannend, worum es in dieser Arbeit geht. Ist das eine Qualifizierungsarbeit die zu einem Bachelor-, einem Master- oder einem Doktortitel führen soll, oder ist das eine Studie bei der der Erkenntnisgewinn im Vordergrund steht und die peer-reviewed publiziert werden soll? Ich hätte da so eine Idee...
Ansonsten würde ich gerne ergänzen:
Roskalla23 hat geschrieben:Die Fragestellung liegt darin, ob die Zusammensetzung der Bakterien einen Einfluss auf das Auftreten einer Pneumonie hat.
Wenn Du einen Zusammenhang zwischen Darmbakterien und Pneumonie findest kannst Du wahrscheinlich nicht ohne weiteres davon ausgehen, dass das eine das andere beeinflusst. Die hier besprochene Statistik zeigt, dass es einen Zusammenhang gibt. Die Richtung eines Zusammenhangs kann man daraus nicht unbedingt ableiten. Wäre es eventuell denkbar, dass die Pneumonie-Fälle auch früher schon immer mal wieder Atemwegsinfekte hatten und Schleim mit Entzündungsmediatoren erst hochgehustet und dann verschluckt haben, sodass die Atemwegsempfindlichkeit Einfluss auf das Darmbiom hatte? Vielleicht gibt es auch einfach Menschen die gesund und solche, die ungesund leben. Die Gesunden haben sich viel bewegt und dadurch weniger Pneumonierisiko und die Gesunden haben auch gesünder gegessen und deshalb ein anderes Darmbiom? Das nichts mit dem Inhalt dieses Threads zu tun - diese Argumentation musst Du unabhängig von Deinen Daten führen und im Zweifel einfach forsichtig formulieren, dass es einen statistischen Zusammenhang gibt.
LG,
Bernhard