Klassifikationstabelle bei logistischer Regression

Alle Verfahren der Regressionanalyse.

Klassifikationstabelle bei logistischer Regression

Beitragvon layback » So 19. Apr 2015, 18:31

Hallo,

ich habe im Rahmen einer binären logistischen Regression eine Klassifikationstabelle erhalten, bei denen das Ereignis 0 zu 100% richtig geschätzt wird, während das Ereignis 1 laut Tabelle zu 0% richtig geschätzt wird (,0). Das ergibt einen Gesamtprozentsatz von 79,1%, nur verstehe ich das Ergebnis dieser Tabelle nicht so ganz. Zum einen wundert es mich, das bei einer 100%igen Schätzung von 0 das Ereignis 1 tatsächlich zu 0% geschätzt wird, wie kann das zustande kommen? Damit ist das Modell doch eigentlich unbrauchbar, oder?

Danke und Grüße
layback
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 19. Apr 2015, 18:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Klassifikationstabelle bei logistischer Regression

Beitragvon PonderStibbons » Mo 20. Apr 2015, 08:55

ich habe im Rahmen einer binären logistischen Regression eine Klassifikationstabelle erhalten, bei denen das Ereignis 0 zu 100% richtig geschätzt wird, während das Ereignis 1 laut Tabelle zu 0% richtig geschätzt wird (,0).

Ist das das Ausgangsmodell, noch ganz ohne Prädiktoren?
Oder ist es ein Ergebnis nach versuchtem Einbringen von
Prädiktoren ins Modell?
Das ergibt einen Gesamtprozentsatz von 79,1%, nur verstehe ich das Ergebnis dieser Tabelle nicht so ganz. Zum einen wundert es mich, das bei einer 100%igen Schätzung von 0 das Ereignis 1 tatsächlich zu 0% geschätzt wird, wie kann das zustande kommen?

Für alle Stichprobenfälle wurde die häufigere Kategorie (0) vorhergesagt.
Das ergibt eine Trefferquote von 79,1%, den Anteil der Kategorie 0.
Damit ist das Modell doch eigentlich unbrauchbar, oder?

Wenn die Prädiktoren nicht in der Lage sind, eine
bessere Quote als 79,1% hervorzubringen, dann schon.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Klassifikationstabelle bei logistischer Regression

Beitragvon strukturmarionette » Mo 20. Apr 2015, 09:41

Hi,

- wie lauten die absoluten Zahlen in der Tabelle für die observed /predicted?
- was lässt sich über die Anpassungsgüte des Gesamtmodelles sagen?
- wie lautet die Modellspezifikation?
- wie lauten hierbei die Einzelbefunde?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Klassifikationstabelle bei logistischer Regression

Beitragvon layback » Mo 20. Apr 2015, 19:54

Hallo,

erst einmal danke für die Antworten/Hilfe. Seht mir bitte eventuelle Lücken nach denn ich bin gerade dabei, mir das Verfahren anzueignen.

@PonderStibbons:

Es ist das Ergebnis nach Einbringen der Prädiktoren.

@strukturmarionette:

- 85 / 0
24 / 0

(es sind 78%, ich habe mich vertan)

- Devianz: 103,870; laut Literatur ist dieses Kriterium bei großen Verteilungsunterschieden in den beobachteten Gruppen umstritten
Modell-Chi 11,046 (p=.001)
Nagelkerkes R .148
Hosmer-Lemeshow (p=.512)

- Ist mit Modellspezifikation die sachlogische Überlegung gemeint? Falls ja, es wurde eine Stichprobe mit zwei Fragebögen befragt, einer zur Arbeitszufriedenheit (A) und ein Stress-Test (B). A habe ich dichotomisiert (unzufrieden/zufrieden) und B in die Terzile niedrig/mittel/hoch "gestresst" eingeteilt. Nun will ich für das Ereignis 1 (unzufrieden) die Eintrittswahrscheinlichkeit modellieren.

- Was genau brauchst du hier?
Für den Prädiktor: B (.999) / Wald (9,641) / df (1) / Sig. (.001) / Exp(B) (2,717)

Ich hoffe, dass ist das wonach du gefragt hast.

Grüße
layback
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 19. Apr 2015, 18:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Klassifikationstabelle bei logistischer Regression

Beitragvon PonderStibbons » Mo 20. Apr 2015, 21:14

A habe ich dichotomisiert (unzufrieden/zufrieden) und B in die Terzile niedrig/mittel/hoch "gestresst" eingeteilt.

Das ist, als würde man sich freiwillig einen Arm abhacken und ins
Bein schießen. Warum und wozu kategorisierst Du (mehr oder minder
willkürlich) kontinuierliche Variablen, Du kannst doch eine
lineare Regression rechnen und gegebenenfalls zur Illustration
Gruppen bilden?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste