logistische Regression?

Alle Verfahren der Regressionanalyse.

logistische Regression?

Beitragvon claudia » Do 23. Feb 2012, 16:20

Hallo zusammen,


Ich bräuchte wirklich seeeehr dringend eure Hilfe!!
Ich muss eine Regressionsanalyse über Kindersterblichkeit durchführen. Ich habe mehrere Hypothesen aufgestellt, die ich beweisen möchte.
Ich arbeite mit STATA


Zielvariable:
dead5 ist dichotom

Einflussvariablen:
twin ist dichotom
child_sex ist dichotom
region ist kategorial mit 10 Ausprägungen
hhs (Anzahl der Haushaltsmitglieder) ist metrisch? (da bin ich mir nicht sicher ob das kategorial oder metrisch ist, die Anzahl geht von von 1 bis 14)

Hypothesen:
Wenn das Geschlecht weiblich ist, dann ist die Wahrscheinlichkeit von Kindersterblichkeit niedriger -> Einflussvariable ist child_sex
Wenn das Kind als Zwilling zur Welt kommt, ist die Wahrscheinlichkeit einer Kindersterblichkeit höher. -> Einflussvariable ist twin
Je niedriger die Anzahl der Haushaltsmitglieder, desto wahrscheinlicher eine niedrigere Kindersterblichkeit. -> Einflussvariable ist hhs
Wenn die Region im Süden liegt, ist die Wahrscheinlichkeit von Kindersterblichkeit niedriger. Einflussvariable ist region

Nun denke ich mir, dass nichts gegen eine logistische Regression spricht (zumindest ist mir beim Durchlesen der Voraussetzungen dafür nichts aufgefallen).

Was ich nicht wirklich weiß ist wie man die Analyse an sich durchführt und ob es üblich ist noch Kreuztabelle oder Korrelationsmatrix vorher zu machen? Wenn ja, was genau ist meine Konsequenz daraus bzw. wirklich sich das erst auf meine Interpretation aus, richtig?


Eine wichtige Frage für mich ist, ob es einen Unterschied macht die Daten einzeln in ein Modell zu nehmen , also Befehl „logit dead5 twin“, „ logit dead5 child_sex“, logit dead5 region“ … oder alle auf einmal „logit dead5 twin child_sex… ?

Ich hab das mal versucht, aber da waren die Ergebnisse unterschiedlich bei den einzelnen im Vergleich dazu wenn man alle auf einmal rein nimmt…
Ich hab mir mal die Mühe gemacht und für alle Ausprägungen von region Dummys zu kodieren. Also für jede einzelne eine 0/1 Variable. Das Gleiche habe ich auch für die Haushaltsmitglieder gemacht, weil ich mir dachte, dass das der Fehler ist warum unterschiedliche Ergebnisse rauskommen, aber ich denke dann muss ich eines als Referenz weglassen, richtig?


Ich weiß, für Statistikchecker ist es bestimmt so spannend sich mit meinen Ausführen zu beschäftigen wie wenn in China ein Fahrrad umfällt… aber ich bräuche wirklich ganz dringend eure Hilfe.
Also quasi den Schritt für Schritt Ablauf vom Datensatz bis zur Interpretation.

LG, Claudia
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon claudia » Fr 24. Feb 2012, 10:52

hallo nochmal,

also dass die variable hhs metrisch ist und dass die umkodierung in dummys bei region sinnvoll ist, ist mir nun klar.

ich hab gestern nochmal bücher gewälzt und versucht herauszufinden wie normalerweise das vorgehen ist und dass, dass es backward oder forward stepward verfahren gibt.
kann mir das jemand erklären? wäre ein backward stepward verfahren hier sinnvoll?

ich hoffe sehr es kann mir jemand weiterhelfen von euch....

lg, claudia
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon claudia » Di 28. Feb 2012, 11:37

bin schon am verzweifeln :(
gibts keinen von euch, der mir da weiter helfen kann?
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon PonderStibbons » Di 28. Feb 2012, 14:18

Vielleicht http://www.stata-forum.de/

Ich würde im Betreff auch nicht so BRÜLLEN, manche schreckt das ab.

Mit freundlichen Grüßen

P.
---
Gottseidank...Kanon für 36
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon claudia » Do 1. Mär 2012, 13:42

das brüllen sollte nur meiner verzweiflung mehr audruck verleihen, wollte damit auf keinen fall jemanden verschrecken... eigentlich genau das gegenteil! :)

danke für den link, leider hilft es mir nicht sehr viel weiter...

ich müsste nur wissen, ob hier viele kleine logistische regressionen mit immer der gleichen zielvariable und der jeweils zur hypothese gehörenden co-variable sinn macht? kann mir das jemand sagen?
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon integral » Fr 2. Mär 2012, 10:47

claudia hat geschrieben:ich hab gestern nochmal bücher gewälzt und versucht herauszufinden wie normalerweise das vorgehen ist und dass, dass es backward oder forward stepward verfahren gibt.
kann mir das jemand erklären? wäre ein backward stepward verfahren hier sinnvoll?


Hallo,

Also natürlich kannst du mehrere logistische Regressionen mit jeweils nur einem Prädiktor rechnen, allerdings - und das ist ja der Grund, weshalb man multivariate Analysen durchführt - werden dann halt die Effekte der übrigen Prädiktoren nicht auspartialisiert. Ausserdem muss man bei multiplem Testen in derselben Stichprobe immer die α-Fehler-Inflation berücksichtigen und das Signifikanzniveau entsprechend korrigieren (http://de.wikipedia.org/wiki/Alphafehler-Kumulierung).

Prädiktoren-Auswahl: Bei der schrittweisen Aufnahme/Entfernung ins/aus dem Modell besteht das Problem, dass beim Entscheid, ob ein Prädiktor ins Modell aufgenommen/aus dem Modell ausgeschlossen wird oder nicht entscheidend ist, welche anderen Prädiktoren bereits darin enthalten sind. Schau mal im Statistik-Buch von Bortz/Schuster steht dazu übrigens was, habs aber leider nicht hier und kann daher keine Seitenzahl nennen.
integral
Power-User
Power-User
 
Beiträge: 57
Registriert: Fr 17. Jun 2011, 10:08
Danke gegeben: 4
Danke bekommen: 2 mal in 2 Posts

Re: STATISTIKPROFIS BITTE UM HILFE!!

Beitragvon claudia » Mo 5. Mär 2012, 14:19

hm.. ich habe mich dafür entschieden einzelne logistische Regressionen durchzuführen.
Muss ich nun diese Alpha-Fehler Kumulierung auch machen, wenn sich nur die Zielvariable (Kind lebt oder ist tot) immer die gleiche bleibt, sich aber für jede Regression die jeweilige Einflussvariable ändern?
Denn es ist im meinem Falle so, dass keine Einflussvariable für zwei Regressionen verwendet wird.

Meine Hypothesen lauten immer zB. Die Wahrscheinlichkeit von Kindersterblichkeit sink, wenn der Vater im Haushalt lebt.
Zielvariable Kind lebt/tot und Einflussvariable ist Vater_lebt_im_Haushalt (ja/nein)

Oder: Wahrscheinlichkeit von Kindersterblichkeit sink, wenn die Befragt im Süden lebt.
Zielvariable Kind lebt/tot und Einflussvariable sind Region 1-10 (als dichotome Dummys kodiert)


(Es sind alle Daten aus einer Erhebung)
Muss ich in so einem Fall nun auch diese Alpha-Fehler Kumulierung machen?
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: logistische Regression?

Beitragvon Holgonaut » Di 6. Mär 2012, 23:11

Hi,

du solltest die Regressionen nicht einzeln machen, sei denn du denkst, dass der jeweilige Prädiktor unkorreliert mit allen anderen Prädiktoren ist. Ist er das nicht
(was sich ja feststellen lässt, sind deine Regressionskoeffizienten schlicht und ergreifend nichts wert und völlig uninterpretierbar. Die alpha-Adjustierung dient dem
statisistischen Test und der Kontrolle des statistischen Fehlers - es geht aber erst mal um das wichtigere Ziel der Unverzerrtheit der Regressionskoeffizienten. Und die
ist nicht gegeben, wenn du die Regressionen einzeln machst, sorry.
Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
claudia

Re: logistische Regression?

Beitragvon claudia » Mi 7. Mär 2012, 01:45

Hi, erstmal vielen Dank für deine Antwort!

Ich habe meine metrischen unabhängigen variablen mit der abhängigen Variable auf Korrelation überprüft, das kann ich also schon mal ausschließen. Müsste ich noch andere Tests dazu durchführen?

für meine restlichen unabhängigen Variablen habe ich Kreuztabellen jeweils mit der abhängigen Variable gemacht um die Verteilung zu betrachten.

Auf Grund dieser Ergebnisse dachte ich spricht nichts gegen die einzelnen Regressionen.

Zu einem stepward Vorgehen:
Mein Problem ist, dass ich noch nicht verstanden habe ich wie es sonst Schritt für Schritt machen muss. Welche Werte mir sagen ob ich dann eine Variable ausschließen soll oder nicht Sagt mir das die log likelihood? Und bei welcher ich beginnen muss.
Muss ich dann meine beiden kategorialen mit k größer 2 Variablen als Dummys aufnehmen in der ursprünglichen Form?


Grüße Claudia
claudia
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 23. Feb 2012, 14:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: logistische Regression?

Beitragvon Holgonaut » Do 8. Mär 2012, 23:49

Claudia,

du musst die unabhängigen Variablen miteinander korrelieren. Aber selbst wenn sie nicht-sign. miteinander korrelieren, werden die Korrelationen ja nicht 0 sein. Deshalb rein in die
multiple Regression :)

Warum willst du Variablen ausschließen? Hau diejenigen rein, für die du Effekte erwartest und solche ("Kontrollvariablen"), für die Effekte bestehen könnten und die die übrigen
verzerren. Dann interpretier das Ergebnis.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste