Interpretation PArameterschätzer

Alle Verfahren der Regressionanalyse.

Re: Interpretation PArameterschätzer

Beitragvon aziz » Sa 30. Mär 2013, 17:43

klaus82 hat geschrieben:1. Sollte natürlich pseudo-R²= 0,8 sein!

An sich spricht solch ein hoher Wert für eine gute Modellanpassung. Nichtsdestotrotz scheint für die Häufigkeitsverteilung der gesundheitlichen Beeinträchtigung der log-log-negativ als Verküpfungsfunktion (Das meinte ich mit Link(funktion)) zu sprechen. Niedrige Kategorien sind in deiner Stichprobe häufiger vertreten. Solange du die Kodierung 1=Kein Einfluss, 2=einfluss und 3=starker Einfluss beibehälst.

klaus82 hat geschrieben:2. Beim letzten Modell habe ich Smog an die Reihenfolge von Gesundheit (AV) und Umwelt angepasst!

Ich tendiere dazu die Kodierung dieser beiden Variable wie in deinem zweiten Modell zu benutzen. Also, für Umweltverhalten: 1=Keine Ahnung, 2=schlecht, 3=mittelmäßig und 4=gut und für Rauchentwicklung: 1= Keiner, 2=gemäßgt, 3=stark und 4=sehr stark.

klaus82 hat geschrieben:4. Kann man ein Modell beibehalten, wenn für eine Kategorie ein Standartfehler bei Null liegt?

Das Modell muss nicht zwangsläufig verworfen werden. Natürlich ist es nicht schön, wenn ein Schätzer vorliegt, der keine Varianz aufweist. Dies bedeutet, dass innerhalb der Daten bezüglich dieses Parameters nicht genügend Variabilität vorliegt. Generell ist natürlich gewünscht, dass die Standardfehler möglichst klein sind, dies deutet auf eine präzise Schätzung hin, aber größer Null müssen sie schon sein, um den Test durchzuführen und um Aussagen über eine Signifikanz zu treffen.

Klaus82 hat geschrieben:Das wäre dann beispielsweise Kontingenztafel/Kreuztabelle mit Zeilenprozenten wie im Anhang? Ich bin mir nicht sicher, welche die relevanten links sind (gelb, rot?)

Eigentlich meinte ich damit, dass du dir die Häufigkeitsverteilung der abhängigen Variable in einer Häufigkeitstabelle anschauen könntest. Alternativ könntest du auch ein Stabdiagramm verwenden.

Klaus82 hat geschrieben:
Es wäre besser die Wahl des Links, aus einer geeigneten Kontrollstichprobe abzuleiten.


Meinst Du damit eine Diskriminanzanalyse?

Nein. Falls es dir möglich ist, so könntest du eine neue Stichprobe zum Merkmal gesundheitliche Beeinträchtigung erheben, und aus dieser, wie oben beschrieben, die Wahl der Verküpfungsfunktion (Link) ableiten.

Gruß
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
klaus82

Re: Interpretation PArameterschätzer

Beitragvon klaus82 » Sa 30. Mär 2013, 19:44

Eigentlich meinte ich damit, dass du dir die Häufigkeitsverteilung der abhängigen Variable in einer Häufigkeitstabelle anschauen könntest. Alternativ könntest du auch ein Stabdiagramm verwenden.


Ok, verstanden, die werden ja bei der zusammenden Fallverarbeitung zu Beginn des Outputs angegeben. Bei dem von Dir vorgezogenem Modell 2 ist die niedrigste Kategorie mit 37% stärker gewichtet als die höchste, dementsprechend war log-log-negativ richtig, oder?


Hier könnte ich mich auf die beiden jeweils signifikanten Kategorien konzentrieren und vorsichtig eine gewisse Tendenz ansprechen, daß
1. die Grupp, die keine Ahnung bei der Umwelt angeben eher in die kategorie keine gesundheitl. Beeinträchtigung bzw. normale Beeinträchtigung fallen und
2. bei starkem Rauch auch tendenziell ein stärkerer gesundheitlicher Einfluß vorliegt...oder ist das schon viel zu vage?


Mir ist noch aufgefallen, daß für Smog die -2 Log-Likelihood in keiner Weise signifikant ist, wenn als einzige erklärende Variable gewählt. Mit Hereinnahme von Smog erhöht sich das pseudo-R² dann nur von 0,36 auf 0,42. Bei der linearen wäre es fraglich, ob man diese VAriable dann noch dazu nimmt.

Wie kann mann eigentlich den Zusammenhang zwischen meiner ordinalen AV und einer multinominalen Variable (beide erklärende messen) Spearman geht ja wohl hier nicht.

Bei den Kreuztabellen ist doch der gelb Hinterlegte Wert entscheidender, wenn es um die Kombinationswahrscheinlichkeit geht, oder`?

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Interpretation PArameterschätzer

Beitragvon aziz » Sa 30. Mär 2013, 21:51

klaus82 hat geschrieben:
Eigentlich meinte ich damit, dass du dir die Häufigkeitsverteilung der abhängigen Variable in einer Häufigkeitstabelle anschauen könntest. Alternativ könntest du auch ein Stabdiagramm verwenden.


Ok, verstanden, die werden ja bei der zusammenden Fallverarbeitung zu Beginn des Outputs angegeben. Bei dem von Dir vorgezogenem Modell 2 ist die niedrigste Kategorie mit 37% stärker gewichtet als die höchste, dementsprechend war log-log-negativ richtig, oder?

Ja, richtig! Die mittlere Kategorie liegt zwar mit 54,2% am häufigsten vor. Aber dadurch, dass die niedrigste Kategorie häufiger vertreten ist als die höchste Kategorie, wird der Schwerpunkt der Daten eher auf den niedrigen Kategorien liegen.

klaus82 hat geschrieben:Hier könnte ich mich auf die beiden jeweils signifikanten Kategorien konzentrieren und vorsichtig eine gewisse Tendenz ansprechen, daß
1. die Grupp, die keine Ahnung bei der Umwelt angeben eher in die kategorie keine gesundheitl. Beeinträchtigung bzw. normale Beeinträchtigung fallen und
2. bei starkem Rauch auch tendenziell ein stärkerer gesundheitlicher Einfluß vorliegt...oder ist das schon viel zu vage?

Diesem Modell zufolge: Ja.


klaus82 hat geschrieben:Mir ist noch aufgefallen, daß für Smog die -2 Log-Likelihood in keiner Weise signifikant ist, wenn als einzige erklärende Variable gewählt. Mit Hereinnahme von Smog erhöht sich das pseudo-R² dann nur von 0,36 auf 0,42. Bei der linearen wäre es fraglich, ob man diese VAriable dann noch dazu nimmt.

Erläuter das mal bitte ein bisschen genauer.

klaus82 hat geschrieben:Wie kann mann eigentlich den Zusammenhang zwischen meiner ordinalen AV und einer multinominalen Variable (beide erklärende messen) Spearman geht ja wohl hier nicht.

Du könnest beispielsweise Cramer V verwenden. Dies ist ein Zusammenhangsmaß für nominale Merkmale, was zur Folge hat, dass die Ordinalstuktur der des einen Merkmal nicht mit einfließt, Stichwort: Informationsverlust.

Gruß
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: Interpretation PArameterschätzer

Beitragvon klaus82 » So 31. Mär 2013, 00:11

Erläuter das mal bitte ein bisschen genauer.


Ich habe die erklärende Variable Umwelt rausgeschmissen, also nur Smog als einzige erklärende Variable belassen. Dabei ist jetzt das Xi² bei der Modelanpassung (2-Log-Likelihood) nicht mehr signifikant (0,106). Ausserdem ist das Pearson Xi² bei der Anpassungsgüte jetzt < 0,05, was ja nicht sein darf. Nagelkerke liegt bei 0,146. Signifikanzen für die Kategorien allerdings alle 0,000.

Aber mit der Umweltvariable zusammen ist das Modell ja ok, also belasse ich Smog, oder?

Du könnest beispielsweise Cramer V verwenden


Super, das habe ich genommen, was ist mit Fishers exaktem Test und Phi?

Vielleicht nerve ich nochmal mit der logistischen Regression, aber das ist nur eine Kleinigkeit...

AZIZ, ich wünsche Dir ein schon mal ein frohes Osterfest! Gerne würde ich mich richtig bedanken, aber als einfacher Diplomand...ich überlege, was ich machen könnte...

LG Klaus
klaus82
User
User
 
Beiträge: 47
Registriert: Mi 20. Feb 2013, 13:15
Danke gegeben: 32
Danke bekommen: 0 mal in 0 Post

Re: Interpretation PArameterschätzer

Beitragvon aziz » So 31. Mär 2013, 00:25

klaus82 hat geschrieben:Aber mit der Umweltvariable zusammen ist das Modell ja ok, also belasse ich Smog, oder?

Ich würde das Modell auch so belassen.

klaus82 hat geschrieben:Super, das habe ich genommen, was ist mit Fishers exaktem Test und Phi?

Nein. Beides nur für dichotome Merkmale.

klaus82 hat geschrieben:Vielleicht nerve ich nochmal mit der logistischen Regression, aber das ist nur eine Kleinigkeit...

Schau'n mer mal.

klaus82 hat geschrieben:AZIZ, ich wünsche Dir ein schon mal ein frohes Osterfest! Gerne würde ich mich richtig bedanken, aber als einfacher Diplomand...ich überlege, was ich machen könnte...

Wünsch ich dir auch. Frohe Ostern.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste