ChiQuadrat/Anova

Fragen, die sich auf kein spezielles Verfahren beziehen.

ChiQuadrat/Anova

Beitragvon Markus_Müller » Mi 1. Apr 2015, 22:37

Hi,

vorweg: Ich lese hier schon seit geraumer Zeit mit weil google mich bei kleineren Problemchen hierher geführt hat...einiges hat mir schon sehr geholfen, vielen Dank dafür :)
Ich habe ein kleines statistisches Problem bzw. ein Verständnisproblem....vielleicht kann mir ja jemand helfen:

Ich habe eine Gruppe von Personen, die sind hellhäutig und eine andere Gruppe die sind dunkelhäutig (also kategoriale Variablen 1,0). In diesen beiden Gruppen gibt es jeweils nun Personen die Rauchen gar nicht, wenig oder viel (=1,2, oder 3 also auch kategorial). Nun haben in jeder Gruppe (also z.b. hellhäutig+wenig Rauchen oder hellhäutig und viel rauchen) eine bestimmte Anzahl überlebt, die anderen sind verstorben (wieder kategorial, also 1,0).
Wenn ich nun z.b. eine Aussage darüber treffen möchte ob bei den hellhäutigen viel rauchen signifikant häufiger zum tod geführt hat als wenig rauchen oder gar nicht rauchen kann ich doch den ChiQuadrat Test (bzw Exakten Fischer wenn n<5) machen oder? :oops:
Und wenn eine Variable davon metrisch wäre (also z.b. anstatt hellhäutig/dunkelhäutig das Alter) würde man doch einen T-test machen oder?
Die Alternative wäre eine Regression zu machen (mit Tot/leben(=1,0) als abhängige Variable und gar nicht/wenig/viel Rauchen (=1,2,3) als unabhängige Variablen).



Ich bin komplett verwirrt und würde gerne wissen wie ich das Problem nun lösen kann.


Gruß
Markus
Markus_Müller
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 1. Apr 2015, 22:20
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: ChiQuadrat/Anova

Beitragvon strukturmarionette » Do 2. Apr 2015, 02:21

Hi,

kleines statistisches Problem


Wenn ich nun z.b. eine Aussage darüber treffen möchte ob bei den hellhäutigen viel rauchen signifikant häufiger zum tod geführt hat als wenig rauchen oder gar nicht rauchen kann ich doch den ChiQuadrat Test (bzw Exakten Fischer wenn n<5) machen oder?


- Ja. (Obwohl Deine Versuchsanordnung ziemlich undurchsichtig ist)

Und wenn eine Variable davon metrisch wäre (also z.b. anstatt hellhäutig/dunkelhäutig das Alter) würde man doch einen T-test machen oder?


- Ja, wenn die UV dichotom ist und die AV intervallskaliert (u.a.)

Die Alternative wäre eine Regression zu machen (mit Tot/leben(=1,0) als abhängige Variable und gar nicht/wenig/viel Rauchen (=1,2,3) als unabhängige Variablen).


- Ja. Ich würd es aber nicht als eine 'Alternative' bzeichnen. Regressionen sind ein sehr weites Feld.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4356
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: ChiQuadrat/Anova

Beitragvon PonderStibbons » Do 2. Apr 2015, 10:19

strukturmarionette hat geschrieben:
Die Alternative wäre eine Regression zu machen (mit Tot/leben(=1,0) als abhängige Variable und gar nicht/wenig/viel Rauchen (=1,2,3) als unabhängige Variablen).


- Ja. Ich würd es aber nicht als eine 'Alternative' bzeichnen. Regressionen sind ein sehr weites Feld.

Ack. Man kann auch den Status tot/lebendig als Gruppierungsvariable nehmen
und Rauchhäufigkeit als technische gesehen abhängige Variable und einen
U-Test rechnen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: ChiQuadrat/Anova

Beitragvon Markus_Müller » Do 2. Apr 2015, 10:53

Vielen Dank für deine Antwort!

Ja du hast recht, es ist wirklich etwas unübersichtlich.


Bild

Habe die Zahlen verändert damit ich es hier besser aufschreiben kann.
Führt starkes Rauchen in der Gruppe der hellhäutigen signifikant häufiger zum Tod als nicht bzw wenig rauchen?

............keine Rauchen.......wenig.....................viel

lebend..........10..................20........................30.........60

tot...............40.................10........................100........150

..................50..................30........................130........210



Als Ergebnis kriege ich ja bei der Tabelle ein p. Nun muss ich doch eigentlich jede Gruppe gegen die andere testen um rauszufinden "wo die Signifikanz herkommt" oder?

Es ist doch eigentlich auch zulässig 2 Gruppen zusammenzufassen oder? Also z.b. Nichtraucher vs. Raucher (egal ob wenig oder viel).

Man könnte doch ebenfalls auch die beiden Gruppen der starken raucher vergleichen: Sterben starke Raucher signifikant häufiger wenn sie dunkelhäutig sind im vergleich zu hellhäutigen.


Ist es für den ChiQuadrat ein Problem wenn Daten fehlen? Insgesamt habe ich 250 hellhäutige Personen aber nur von 210 die Info über den Rauchstatus.
Aber die Differenz sollte ja keine Rolle spielen weil ja eh nur der Unterschied kein Rauchen/wenig Rauchen/viel Rauchen bestimmt wird oder?


Gruß
Markus
Zuletzt geändert von Markus_Müller am Do 2. Apr 2015, 11:44, insgesamt 2-mal geändert.
Markus_Müller
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 1. Apr 2015, 22:20
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: ChiQuadrat/Anova

Beitragvon Markus_Müller » Do 2. Apr 2015, 11:15

PonderStibbons hat geschrieben:
strukturmarionette hat geschrieben:
Die Alternative wäre eine Regression zu machen (mit Tot/leben(=1,0) als abhängige Variable und gar nicht/wenig/viel Rauchen (=1,2,3) als unabhängige Variablen).


- Ja. Ich würd es aber nicht als eine 'Alternative' bzeichnen. Regressionen sind ein sehr weites Feld.

Ack. Man kann auch den Status tot/lebendig als Gruppierungsvariable nehmen
und Rauchhäufigkeit als technische gesehen abhängige Variable und einen
U-Test rechnen.

Mit freundlichen Grüßen

P.


Ok habe mich gerade eingelesen, also dann sozusagen 1,2,3 (für gar nicht/wenig/viel Rauchen) und dann die Gruppe der Lebenden (90) und der toten (130) und dann jedem Rangplätze zuweisen. Habe ich das richtig verstanden?
Markus_Müller
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 1. Apr 2015, 22:20
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: ChiQuadrat/Anova

Beitragvon PonderStibbons » Do 2. Apr 2015, 12:13

Da Du zwei Prädiktoren hast, wäre es angebracht, Verfahren zu rechnen,
die simultan beide Prädiktoren berücksichtigen. Die eine Variante wäre
der Cochran-Mantel-Haenszel-Test, hierbei wird der Zusammenhang Hautfarbe/
Tod über alle Stufen von Rauchen hinweg verglichen und zugleich
überprüft, ob eine Wechselwirkung von Hautfarbe und Rauchen vorliegt.

Oder Du rechnest eine binär-logistische Regression mit dem Kriterium
tot/lebend, und den Prädiktoren Hautfarbe und und Raucherstatus
sowie deren Wechselwirkung.

Bei allen Verfahren wäre relevant, ob eine der beiden Kategorien der
abhängigen Variable sehr selten vorkommt.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: ChiQuadrat/Anova

Beitragvon Markus_Müller » Do 2. Apr 2015, 12:52

PonderStibbons hat geschrieben:
Oder Du rechnest eine binär-logistische Regression mit dem Kriterium
tot/lebend, und den Prädiktoren Hautfarbe und und Raucherstatus
sowie deren Wechselwirkung.


Ja danke das ist ein guter Hinweis mit den Prädiktoren, sehe ich auch so.
Rein Praktisch: Eine Spalte tot/lebend (1/0) , eine spalte hautfarbe (1/0) und eine Spalte rauchverhalten (1/2/3).


PonderStibbons hat geschrieben:Bei allen Verfahren wäre relevant, ob eine der beiden Kategorien der
abhängigen Variable sehr selten vorkommt.


Nein insgesamt teilt sich das auf. Es sind hohe Fallzahlen (>1000), sodass beide Kategorien (tot/lebend) so ca. 600/400 vorkommen. In den untersten Untergruppen wirds dann natürlich deutlich weniger, d.h. da kann dann ein Verhältnis von 10 tot zu 7 lebend vorkommen.


Gruß
Markus
Markus_Müller
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 1. Apr 2015, 22:20
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: ChiQuadrat/Anova

Beitragvon PonderStibbons » Do 2. Apr 2015, 21:01

eine Spalte rauchverhalten (1/2/3).

Je nach verwendeter Software kannst Du das entweder so machen und
in der Software einstellen, dass Rauchverhalten kategorial ist und wie
damit verfahren werden soll, oder Du erstellst 2 dummy-Variablen für
Rauchverhalten (eine Stufe bleibt als Referenzkategorie ohne eigenen
dummy).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron