STATISTIK-FORUM.de

nexttry · von **nexttry** » Mi 16. Nov 2011, 23:42

Hallo,

ich habe eine Frage zu einer Auswertung von Daten. Ich habe eine Untersuchung an Patienten einer Klinik gemacht und diese Patienten (N=45) auf 8 verschiedene Eigenschaften untersucht. Jede Eigenschaft kann einen Wert zwischne 0 und 100 annehmen.

Die Patientengruppe kann nun in verschiedene Unergruppen aufgeteilt werden (Beispielsweise: Migration ja/nein, Doppeldiagnose ja/nein oder Fest vergeben/ledig). Ich würde nun gerne untersuchen, ob es in den jeweiligen Untergruppen signifikante Unterschiede gibt. Also ob beispielsweise Patienten mit Migrationshintergrund in einer der 8 Eigenschaften signifikant von den Patienten ohne Migrationshintergrund abweichen.

Ich bin leider absoluter Laie, benutze SPSS und mein erster Ansatz war eine hübsche Kreuztabelle und der Chi Quadrat Test. Nach Recherche bin ich weiterhin auf den einfaktoriellen Anova gestoßen... und ich bin leider nun komplett überfragt, was richtig oder falsch ist.

Ich bedanke mich schonmal im Voraus!

Gruß
Jan

PonderStibbons · von **PonderStibbons** » Mi 16. Nov 2011, 23:51

Wenn Du die Patienten immer in 2 Gruppen unterteilst, dann wäre das nächstliegende
ein Mittelwertsvergleich per t-Test für unabhängige Gruppen. Alternativ der
"nonparametrische" Mann-Whitney U-Test (bzw. Wilcoxon Rangsummentest), der
hängt von weniger Voraussetzungen ab als der t-Test.

Mit freundlichen Grüßen

P.

nexttry · von **nexttry** » Do 17. Nov 2011, 00:07

Vielen Danke für die schnelle Antwort!

Die meisten Untergruppen bestehen aus ja/nein, dann passt es. Allerdings habe ich bei z.B. "Alter" 3 Unterteilungen.

Zur Datenverteilung: Ich gehe stark davon aus, dass die Daten nicht normalverteilt sind. Fällt damit der t-test komplett raus und ich sollte nur den Mann-Whitney U-Test nutzen, richtig? Was tue ich, wenn ich in mehr als 3 Gruppen (Beispiel wie oben mit dem Alter) unterteilen muss?

Ich habe noch eine weitere Frage, die allerdings ein anderes Problem darstellt: Ich habe diese Daten sowohl am Zeitpunkt x und am Zeitpunkt y. Die eine Hälfte der Patienten hat an einem speziellen Training teilgenommen, die andere Hälfte nicht. Ich würde nun gerne Untersuchen, ob der Teil der Patienten mit dem Training anders "performt" hat wie der Teil der Patienten ohne Training (also in Bezug auf die 8 Eigenschaften).
Ich habe zunächst den Ansatz gewählt, dass ich eine Kreuztabelle gemacht habe (mit Training ja/nein und den Änderungen der Eigenschaften) und dann mit dem Chi Quadrat Test die Irrtumswahrscheinlichkeit berechnet, schätze aber, dass dieses ebenfalls nciht der beste Ansatz ist....

Ich würde mich über eine erneute Antworte freuen!

Erneut Dank im Voraus!

Gruß
Jan

strukturmarionette · von **strukturmarionette** » Do 17. Nov 2011, 01:09

Hi,

Ich gehe stark davon aus, dass die Daten nicht normalverteilt sind

Wie kann diese ´Stärke-Annahme´ denn verstanden werden?
Welche Daten, Vars, Teilstichproben...?

S.

nexttry · von **nexttry** » Do 17. Nov 2011, 09:01

strukturmarionette hat geschrieben:Hi,

Ich gehe stark davon aus, dass die Daten nicht normalverteilt sind

Wie kann diese ´Stärke-Annahme´ denn verstanden werden?
Welche Daten, Vars, Teilstichproben...?

S.

Hallo.

Patienten in diesen Kliniken neigen oft zu einem Extremen (würden sie überwiegend im Normbereich liegen wären sie keine Patienten

) Entsprechend ist das von mir eine reine Annahme (ich habe mir zumindest die 8 Eigenschaften mal grafisch dargestellt und es weicht doch erheblich von dem ab, was man bei einer Normalverteilung erwarten würde).
Zur Frage "welceh Daten": Ich bezog mich auf die 8 Eigenschaften der ursprünglichen Stichprobe, wo alle Patienten drin enthalten sind.

Danke.

PonderStibbons · von **PonderStibbons** » Do 17. Nov 2011, 11:10

Zur Datenverteilung: Ich gehe stark davon aus, dass die Daten nicht normalverteilt sind.

Die Daten müssen nicht normalverteilt sein, um parametrische Verfahren wie Varianzanalyse
oder lineare Regression zu rechnen. Normalverteilt sein sollen die Vorhersagefehler (die Residuen).
Im Fall eines t-Tests zum Beispiel sollten die Daten in den beiden Subgruppen jeweils aus normalverteilten
Grundgesamtheiten stammen, nicht die Gesamtstichprobe.

Fällt damit der t-test komplett raus

Gegen kleinere Abweichungen ist der t-Test bei n=45 einigermaßen robust. Wichtiger ist eher, dass
die Subgruppen in etwa dieselbe Streuung haben, sofern die Subgruppen unterschiedlich groß sind.

und ich sollte nur den Mann-Whitney U-Test nutzen, richtig? Was tue ich, wenn ich in mehr als 3 Gruppen (Beispiel wie oben mit dem Alter) unterteilen muss?

Kruskal-Wallis H-Test.

Ich habe diese Daten sowohl am Zeitpunkt x und am Zeitpunkt y. Die eine Hälfte der Patienten hat an einem speziellen Training teilgenommen, die andere Hälfte nicht. Ich würde nun gerne Untersuchen, ob der Teil der Patienten mit dem Training anders "performt" hat wie der Teil der Patienten ohne Training (also in Bezug auf die 8 Eigenschaften).
Ich habe zunächst den Ansatz gewählt, dass ich eine Kreuztabelle gemacht habe (mit Training ja/nein und den Änderungen der Eigenschaften) und dann mit dem Chi Quadrat Test die Irrtumswahrscheinlichkeit berechnet, schätze aber, dass dieses ebenfalls nciht der beste Ansatz ist....

Was hast Du eigentlich immer mit dem Chi-Quadrat, der ist für kategoriale Varablen. Da müsstest Du erstmal Deine Scores in Kategorien umwandeln, was Informationsverschwendung wäre.

Es wäre Methode der Wahl eine Messwiederholungsanalyse, mit dem Gruppierungs-Faktor (Zwischensubjekt-Faktor) "Trainig ja/nein" und dem Messiwderholungsfaktor "Messzeitpunkt (prä - post). Die Wechselwirkung beider Faktoren testet, ob die Veränderung über die Zeit bei den beiden Trainingsgruppen unterschiedlich ist.

Falls das nicht geht mangels ausreichender Kenntnisse oder weil die Verteilungseigenschaften der Daten nicht den Voraussetzungen für ein solches Verfahren entsprechen, käme auch einfach ein Gruppenvergleich zu t2 mittels U-Test in Betracht. Allerdings ergibt der nur Sinn, wenn die beiden Untersuchungsgruppen nach Zufall gebildet wurden oder zumindest sehr ähnliche Ausgangswerte aufweisen.

Eine weitere Möglichkeit ist dann die Berechnung von Differenzwerten prä-post und Vergleich dieser Differenzen
zwischen den Gruppen mittels U-Test. Auch da mit der Problematik, dass ungleiche Ausgangsniveaus zu Scheineffekten führen können.

Etwas Sorge bereitet, dass Du mit vollen 8 abhängigen Messungen und vielen Untergruppierungen hantierst.
Allein Deine Beispiele bedeuten bereits schon 32 Tests. Da wäre eine Verschärfung des sonst üblichen alpha-Niveaus (5%) für ein "signifikantes" Ergebnis angebracht, um die Gefahr von Zufallsfunden aufgrund vielfacher Testung zu begrenzen.

Mit freundlichen Grüßen

P.

folgende User möchten sich bei PonderStibbons bedanken:
nexttry, Orlando

nexttry · von **nexttry** » Do 17. Nov 2011, 12:52

Selten heutzutage, dass man in einem Forum so kompetente Antworten bekommt (man sollte das direkt mal statistisch auswerten

), ich danke erneut dafür!

PonderStibbons hat geschrieben:Die Daten müssen nicht normalverteilt sein, um parametrische Verfahren wie Varianzanalyse
oder lineare Regression zu rechnen. Normalverteilt sein sollen die Vorhersagefehler (die Residuen).
Im Fall eines t-Tests zum Beispiel sollten die Daten in den beiden Subgruppen jeweils aus normalverteilten
Grundgesamtheiten stammen, nicht die Gesamtstichprobe.

Hierzu noch eine kurze Frage, ob ich es richtig verstanden habe: Diese psychologischen Tests, die ich benutze, sind eigentlich so aufgebaut, dass die Ergebnisse Normalverteilt sind (bezogen auf die Weltbevölkerung). Die Grundgesamtheit, die ich betrachte, ist allerdings nur ein Teil der Weltbevölkerung (nämlich diejenigen, die in die Klinik eingewiesen wurden). Bei letzteren ist die Normalverteilung meiner Meinung nach nicht geben. Das gleiche gilt auch für die Subgruppen, sprich eigentlich müssten diese ebenfalls Normalverteilt sein, dadurch, dass ich allerdings nur Personen betrachte, die in die Klinik eingewiesen wurden, glaube ich, dass die Normalverteilung nicht mehr gegeben ist (Patienten neigen viel mehr zu Extrema als "normale" Personen).
Unter diesen Annahmen benutze ich also ganz klar den U-Test, da die notwendigen Vorraussetzungen für den t-Test nicht gegeben sind.

PonderStibbons hat geschrieben:Es wäre Methode der Wahl eine Messwiederholungsanalyse, mit dem Gruppierungs-Faktor (Zwischensubjekt-Faktor) "Trainig ja/nein" und dem Messiwderholungsfaktor "Messzeitpunkt (prä - post). Die Wechselwirkung beider Faktoren testet, ob die Veränderung über die Zeit bei den beiden Trainingsgruppen unterschiedlich ist.

Falls das nicht geht mangels ausreichender Kenntnisse oder weil die Verteilungseigenschaften der Daten nicht den Voraussetzungen für ein solches Verfahren entsprechen, käme auch einfach ein Gruppenvergleich zu t2 mittels U-Test in Betracht. Allerdings ergibt der nur Sinn, wenn die beiden Untersuchungsgruppen nach Zufall gebildet wurden oder zumindest sehr ähnliche Ausgangswerte aufweisen.

Eine Messwiderholungsanalyse hört sich perfekt an. Es könnte natürlich an der Umsetzung scheitern, aber kurz als Frage: Ist dieses mit SPSS (benutze ich) ohne größere Probleme durchzuführen?

PonderStibbons hat geschrieben:Eine weitere Möglichkeit ist dann die Berechnung von Differenzwerten prä-post und Vergleich dieser Differenzen
zwischen den Gruppen mittels U-Test. Auch da mit der Problematik, dass ungleiche Ausgangsniveaus zu Scheineffekten führen können.

Das war mein derzeitiger Ansatz, allerdings natürlich wieder mit Chi², den ich natürlich durch den U-Test austauschen werde.

PonderStibbons hat geschrieben:Etwas Sorge bereitet, dass Du mit vollen 8 abhängigen Messungen und vielen Untergruppierungen hantierst.
Allein Deine Beispiele bedeuten bereits schon 32 Tests. Da wäre eine Verschärfung des sonst üblichen alpha-Niveaus (5%) für ein "signifikantes" Ergebnis angebracht, um die Gefahr von Zufallsfunden aufgrund vielfacher Testung zu begrenzen.

Sehr guter Einwand, danke dafür!

Gruß
Jan

PonderStibbons · von **PonderStibbons** » Do 17. Nov 2011, 16:09

Die Grundgesamtheit, die ich betrachte, ist allerdings nur ein Teil der Weltbevölkerung (nämlich diejenigen, die in die Klinik eingewiesen wurden).

Ich kenne die Tests und die Probandengruppe nicht, deswegen kann ich das nicht beurteilen.
Es ist auch eine empirische Frage, keine nur der Meinung. Aber abgesehen davon ist ein U-Test
aufgrund seiner Robustheit oft eine gute Wahl.

Eine Messwiederholungsanalyse hört sich perfekt an. Es könnte natürlich an der Umsetzung scheitern, aber kurz als Frage: Ist dieses mit SPSS (benutze ich) ohne größere Probleme durchzuführen?

Weiß ich nicht. Du müsstest in ein SPSS-Buch schauen. Das von Andy Field habe ich öfter
mal hier empfohlen gefunden. Aber wenn Du Dich aufgrund von Verteilungsanomalien von
einem t-Test fernhälst, dann müsstest Du das von einer ANOVA eigentlich erst recht tun.

Mit freundlichen Grüßen

P.

STATISTIK-FORUM.de

Gruppe auf signifikante Unterschiede untersuchen

Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Re: Gruppe auf signifikante Unterschiede untersuchen

Wer ist online?