Interpretation von logistischer Regressionsanalyse

Alle Verfahren der Regressionanalyse.

Interpretation von logistischer Regressionsanalyse

Beitragvon Dalo » So 16. Aug 2015, 22:49

Hallo Leute,

Ich schreibe gerade an meiner Bachelorarbeit (Bin BWLer, also leider etwas fachfremd) und bräuchte diesbezüglich etwas Hilfe bei der Interpretation der Ergebnisse einer logistischen Regressionsanalyse.
Diese habe ich auf zweierlei Wege durchgeführt, einmal mit Excel und einmal mit dieser Seite hier: http://statpages.org/logistic.html. Die Ergebnisse scheinen zu stimmen, sind nämlich genau gleich.

Mein Problem liegt jetzt bei der Interpretation. Ich werde aus der Fachliteratur leider nicht schlau da ich wie schon geschrieben fachfremd bin.
Könnte jemand versuchen mir zu erklären, wie ich diese Zahlen zu lesen habe? Bzw. wie ich daraus Kennzahlen ableite mit denen ich die Güte der Regression messen kann.
Woran kann ich jetzt erkennen ob denn ein Zusammenhang zwischen den Variablen besteht und wie stark dieser ist?
Wie lautet die Regressionskurve und wie gut beschreibt sie die tatsächlichen Verhältnisse?


Bin für jede Hilfe dankbar und bedanke mich auch schonmal im Voraus.

Grüße
Daniel

Hier die Ergebnisse von der Seite (Die Tabellen wollten sich irgendwie nur mit Punkten gerade rücken lassen):

Descriptives...

84 cases have Y=0; 151 cases have Y=1.

Variable Avg SD
1 60.4823 21.1068

Iteration History...
-2 Log Likelihood = 306.4095 (Null Model)
-2 Log Likelihood = 305.8798
-2 Log Likelihood = 305.0699
-2 Log Likelihood = 304.3393
-2 Log Likelihood = 303.8914
-2 Log Likelihood = 303.7021
-2 Log Likelihood = 303.6488
-2 Log Likelihood = 303.6395
-2 Log Likelihood = 303.6386
-2 Log Likelihood = 303.6386
-2 Log Likelihood = 303.6386
-2 Log Likelihood = 303.6386 (Converged)

Overall Model Fit...
Chi Square= 2.7709; df=1; p= 0.0960

Coefficients, Standard Errors, Odds Ratios, and 95% Confidence Limits...
Variable .......Coeff......StdErr.......p ..........O.R......Low...--...High
1..............0.0107.....0.0064....0.0968.....1.0108....0.9981....1.0236
Intercept...-0.0538.....0.4056....0.8945

Predicted Probability of Outcome, with 95% Confidence Limits...
X.........Y....Prob....Low...--...High
32.2600 1 0.5723 0.4644 0.6737
81.0500 0 0.6928 0.6056 0.7681
95.2400 1 0.7242 0.6076 0.8165
17.8600 1 0.5343 0.3893 0.6737
21.4300 1 0.5438 0.4080 0.6733
24.0300 1 0.5506 0.4216 0.6732
25.6500 1 0.5549 0.4301 0.6732
83.0900 0 0.6974 0.6063 0.7753
65.3600 0 0.6560 0.5905 0.7160
68.6700 1 0.6639 0.5956 0.7260
79.0700 0 0.6883 0.6047 0.7612
43.8200 0 0.6023 0.5208 0.6785
50.1900 1 0.6185 0.5477 0.6846
23.6300 0 0.5496 0.4195 0.6732
29.3900 0 0.5648 0.4496 0.6734
35.1600 0 0.5799 0.4792 0.6744
38.3300 1 0.5881 0.4949 0.6754
40.9200 1 0.5948 0.5074 0.6767
49.8600 0 0.6177 0.5464 0.6842
57.6400 1 0.6371 0.5729 0.6968
67.4600 1 0.6610 0.5939 0.7222
88.4500 1 0.7094 0.6074 0.7939
91.9500 1 0.7171 0.6077 0.8057
58.7700 1 0.6399 0.5760 0.6992
73.6000 0 0.6756 0.6010 0.7422
54.4300 1 0.6291 0.5630 0.6908
65.8200 1 0.6571 0.5913 0.7173
82.1300 1 0.6953 0.6060 0.7719
88.8400 0 0.7103 0.6075 0.7952
94.2100 0 0.7219 0.6077 0.8132
39.6900 1 0.5917 0.5015 0.6760
42.0200 0 0.5977 0.5126 0.6773
68.4000 1 0.6633 0.5953 0.7252
71.1800 1 0.6699 0.5987 0.7341
74.1700 0 0.6769 0.6015 0.7441
75.0600 1 0.6790 0.6022 0.7472
87.6900 1 0.7077 0.6073 0.7913
89.3600 0 0.7114 0.6075 0.7970
36.3600 1 0.5830 0.4852 0.6747
40.9100 1 0.5948 0.5073 0.6766
59.7400 1 0.6423 0.5786 0.7014
87.2700 1 0.7068 0.6073 0.7898
81.7400 0 0.6944 0.6059 0.7706
83.7500 0 0.6989 0.6065 0.7776
67.0400 1 0.6600 0.5933 0.7210
57.3400 0 0.6364 0.5720 0.6962
74.1800 0 0.6770 0.6015 0.7442
78.8000 0 0.6877 0.6046 0.7602
81.7900 0 0.6945 0.6059 0.7707
88.8600 1 0.7103 0.6075 0.7953
37.4600 0 0.5859 0.4906 0.6751
43.1700 0 0.6006 0.5179 0.6780
51.4300 1 0.6216 0.5524 0.6862
66.0300 1 0.6576 0.5917 0.7180
81.5900 0 0.6940 0.6058 0.7700
89.2100 1 0.7111 0.6075 0.7965
84.0200 1 0.6995 0.6066 0.7785
41.3600 0 0.5960 0.5095 0.6769
46.1700 0 0.6083 0.5312 0.6803
48.5800 0 0.6144 0.5413 0.6827
60.8300 1 0.6450 0.5812 0.7039
66.7500 1 0.6593 0.5928 0.7201
60.6100 1 0.6444 0.5807 0.7034
61.3500 1 0.6462 0.5825 0.7052
81.6400 1 0.6942 0.6058 0.7702
18.0600 0 0.5348 0.3903 0.6737
19.7300 0 0.5392 0.3991 0.6735
21.7400 1 0.5446 0.4096 0.6733
28.6000 0 0.5627 0.4455 0.6733
30.4300 0 0.5675 0.4550 0.6735
34.7800 0 0.5789 0.4773 0.6743
38.9600 0 0.5898 0.4980 0.6757
50.5000 0 0.6193 0.5489 0.6850
84.2800 0 0.7001 0.6067 0.7795
47.0300 1 0.6105 0.5349 0.6811
37.2400 0 0.5853 0.4896 0.6750
53.1500 0 0.6259 0.5586 0.6887
54.0500 0 0.6282 0.5617 0.6901
66.3700 1 0.6584 0.5922 0.7190
69.0700 1 0.6649 0.5962 0.7273
35.2300 1 0.5801 0.4795 0.6744
54.4000 0 0.6291 0.5629 0.6907
64.5000 0 0.6539 0.5890 0.7136
65.9600 0 0.6574 0.5916 0.7177
27.6800 0 0.5603 0.4407 0.6733
54.0500 0 0.6282 0.5617 0.6901
66.3200 1 0.6583 0.5922 0.7188
65.4000 1 0.6561 0.5906 0.7161
83.8900 1 0.6992 0.6066 0.7781
33.5800 1 0.5758 0.4712 0.6740
91.4100 1 0.7159 0.6076 0.8039
91.9800 1 0.7171 0.6077 0.8058
47.5400 1 0.6118 0.5370 0.6816
55.1900 1 0.6310 0.5655 0.6921
56.0100 1 0.6331 0.5681 0.6936
21.8600 1 0.5449 0.4102 0.6733
22.6300 1 0.5469 0.4143 0.6733
50.7300 0 0.6199 0.5498 0.6853
51.6000 0 0.6220 0.5531 0.6864
52.1900 0 0.6235 0.5552 0.6873
52.4800 0 0.6243 0.5563 0.6877
53.0600 0 0.6257 0.5583 0.6886
53.5000 1 0.6268 0.5598 0.6893
57.5800 1 0.6370 0.5727 0.6967
69.6800 1 0.6663 0.5969 0.7292
70.2600 1 0.6677 0.5976 0.7311
71.7200 1 0.6712 0.5993 0.7359
74.6400 1 0.6780 0.6019 0.7458
75.9500 1 0.6811 0.6029 0.7503
77.2600 1 0.6841 0.6037 0.7548
78.4300 1 0.6868 0.6044 0.7589
80.7600 0 0.6922 0.6055 0.7671
16.9600 1 0.5319 0.3846 0.6738
19.0500 1 0.5374 0.3955 0.6735
80.6600 0 0.6919 0.6055 0.7668
81.4400 1 0.6937 0.6058 0.7695
18.6500 1 0.5364 0.3934 0.6736
62.7500 1 0.6497 0.5855 0.7088
65.2000 1 0.6556 0.5903 0.7155
72.5500 1 0.6731 0.6001 0.7387
74.5100 1 0.6777 0.6018 0.7453
70.7500 1 0.6689 0.5982 0.7327
54.2300 0 0.6286 0.5623 0.6904
70.1500 1 0.6675 0.5975 0.7307
73.3200 0 0.6749 0.6008 0.7412
64.0100 1 0.6527 0.5881 0.7122
39.4700 1 0.5911 0.5005 0.6759
83.0900 1 0.6974 0.6063 0.7753
49.5500 1 0.6169 0.5452 0.6838
73.1400 1 0.6745 0.6006 0.7406
61.5000 1 0.6466 0.5828 0.7056
65.4200 1 0.6561 0.5907 0.7162
88.3300 0 0.7091 0.6074 0.7935
87.7800 1 0.7079 0.6073 0.7916
60.4500 1 0.6440 0.5803 0.7030
60.7200 0 0.6447 0.5810 0.7037
61.0900 1 0.6456 0.5819 0.7046
61.5400 0 0.6467 0.5829 0.7057
62.1700 0 0.6482 0.5843 0.7073
66.9700 0 0.6599 0.5932 0.7208
68.4200 1 0.6633 0.5953 0.7252
79.8900 1 0.6902 0.6051 0.7640
59.3700 0 0.6414 0.5776 0.7005
60.4200 0 0.6440 0.5803 0.7030
84.4300 0 0.7005 0.6067 0.7800
54.0900 0 0.6283 0.5619 0.6902
55.3500 1 0.6314 0.5660 0.6924
82.7800 0 0.6967 0.6062 0.7742
16.0000 1 0.5293 0.3796 0.6739
22.1800 1 0.5457 0.4119 0.6733
27.2700 1 0.5592 0.4386 0.6732
34.5500 1 0.5783 0.4761 0.6742
38.1800 1 0.5878 0.4942 0.6754
45.8200 1 0.6074 0.5297 0.6800
51.2700 0 0.6212 0.5518 0.6860
60.0000 1 0.6429 0.5792 0.7020
87.8900 1 0.7082 0.6074 0.7920
55.9700 0 0.6330 0.5679 0.6935
57.0500 0 0.6357 0.5712 0.6956
57.5800 0 0.6370 0.5727 0.6967
58.2600 0 0.6387 0.5746 0.6981
62.2800 1 0.6485 0.5845 0.7076
66.3100 0 0.6583 0.5921 0.7188
68.5900 1 0.6637 0.5955 0.7257
2.0000 0 0.4919 0.3093 0.6767
4.3200 1 0.4981 0.3205 0.6762
90.5700 1 0.7141 0.6076 0.8011
94.2400 1 0.7220 0.6077 0.8133
47.0800 1 0.6106 0.5351 0.6812
73.4000 1 0.6751 0.6009 0.7415
73.6500 1 0.6757 0.6011 0.7424
76.0200 1 0.6812 0.6029 0.7505
78.5800 1 0.6872 0.6045 0.7594
80.2800 1 0.6911 0.6053 0.7654
5.6700 1 0.5017 0.3272 0.6759
38.8800 0 0.5896 0.4976 0.6757
39.4500 0 0.5910 0.5004 0.6759
40.0200 0 0.5925 0.5031 0.6762
40.9400 0 0.5949 0.5075 0.6767
48.3500 0 0.6138 0.5404 0.6825
82.1000 1 0.6952 0.6060 0.7718
55.0300 1 0.6306 0.5650 0.6918
77.3400 1 0.6843 0.6038 0.7551
80.7300 1 0.6921 0.6055 0.7670
82.2000 1 0.6954 0.6060 0.7722
84.2400 1 0.7000 0.6066 0.7793
85.3400 1 0.7025 0.6069 0.7832
19.5100 0 0.5387 0.3979 0.6735
88.9600 1 0.7105 0.6075 0.7956
13.2100 1 0.5219 0.3652 0.6743
69.2600 1 0.6653 0.5964 0.7279
71.6900 1 0.6711 0.5992 0.7358
41.9500 1 0.5975 0.5122 0.6772
62.6900 1 0.6495 0.5854 0.7086
68.7700 1 0.6642 0.5958 0.7263
62.8000 1 0.6498 0.5856 0.7089
72.5600 1 0.6732 0.6001 0.7387
77.4100 1 0.6845 0.6038 0.7554
66.0600 1 0.6577 0.5917 0.7180
77.8500 1 0.6855 0.6041 0.7569
68.8200 1 0.6643 0.5958 0.7265
68.8200 1 0.6643 0.5958 0.7265
94.7100 1 0.7230 0.6077 0.8148
73.7800 1 0.6760 0.6012 0.7428
55.1700 1 0.6310 0.5654 0.6921
56.7300 1 0.6349 0.5703 0.6950
32.2400 1 0.5723 0.4643 0.6737
64.3800 1 0.6536 0.5888 0.7132
78.5200 1 0.6870 0.6044 0.7592
79.6300 1 0.6896 0.6050 0.7631
83.2000 1 0.6977 0.6064 0.7757
46.9000 0 0.6102 0.5343 0.6810
69.6600 1 0.6663 0.5969 0.7291
24.0000 1 0.5506 0.4214 0.6732
28.4000 1 0.5622 0.4445 0.6733
50.8000 1 0.6200 0.5501 0.6854
62.8300 1 0.6499 0.5857 0.7090
79.3700 1 0.6890 0.6049 0.7622
80.8600 0 0.6924 0.6055 0.7675
74.3400 1 0.6773 0.6017 0.7447
94.0700 1 0.7216 0.6077 0.8127
96.4700 1 0.7268 0.6076 0.8205
81.3500 1 0.6935 0.6057 0.7692
79.4500 1 0.6892 0.6049 0.7625
69.0000 0 0.6647 0.5961 0.7270
69.9900 1 0.6671 0.5973 0.7302
82.7500 1 0.6967 0.6062 0.7741
62.2700 0 0.6485 0.5845 0.7075
40.6200 1 0.5941 0.5060 0.6765
55.8200 0 0.6326 0.5675 0.6932
57.2400 0 0.6361 0.5718 0.6960
62.9500 0 0.6501 0.5860 0.7093
64.1300 1 0.6530 0.5883 0.7125
58.6400 0 0.6396 0.5757 0.6989
97.5500 0 0.7291 0.6075 0.8239
Dalo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 16. Aug 2015, 21:44
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon strukturmarionette » Mo 17. Aug 2015, 00:48

Hi,

ich die Güte der Regression messen kann.

Overall Model Fit...
Chi Square= 2.7709; df=1; p= 0.0960

Zusammenhang zwischen den Variablen besteht

- welche und wieviele UVs hast du denn?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Dalo

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon Dalo » Mo 17. Aug 2015, 01:23

Ich hab das so verstanden, das Y die Abhängige, binäre Variable ist und ich 1 UV habe mit X, die ist stetig und stellt eine Prozentzahl dar, liegt also zwischen 0 und 100.

Grüße
Daniel
Dalo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 16. Aug 2015, 21:44
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon strukturmarionette » Mo 17. Aug 2015, 01:50

Hi,

erkennen ob denn ein Zusammenhang zwischen den Variablen besteht und wie stark dieser ist?

Coefficients, Standard Errors, Odds Ratios, and 95% Confidence Limits...
Variable .......Coeff......StdErr.......p ..........O.R......Low...--...High
1..............0.0107.....0.0064....0.0968.....1.0108....0.9981....1.0236
Intercept...-0.0538.....0.4056....0.8945

Ich werde aus der Fachliteratur leider nicht schlau

- Dann kannst du am besten nochmal nachschauen.
- Es gibt dabei reichlich.
- Wo liest Du denn?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Dalo

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon PonderStibbons » Mo 17. Aug 2015, 09:03

Worin besteht denn das Thema der Studie, die Fragestellung? Was konkret wurde
da an Variablen gemessen? Bleibt es bei dieser 1 Analyse, oder findet da noch mehr
statt?

Statt eine einfache logistische Regressiuon zu rechnen kann man die Sache meist
schlicht umdrehen und die "abhängige" Variable zur Gruppierungsvariable machen,
den Prädiktor zur (technisch) "abhängigen" Variable und das dann per Mittelwertvergleich
(t-Test) analysieren. Ist weitaus einfacher zu interpretieren. Aber ob das hier ginge,
hängt von den bislang unbekannten Umständen ab.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Dalo

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon Dalo » Mo 17. Aug 2015, 16:13

Das Thema meiner Arbeit ist eine Teilauswertung von Beobachtungsdaten, die von der Universität erhoben wurden. Dabei handelt es sich um Personen die innerhalb eines bestimmten Zeitraums, der in Prozentzahlen (von 0 bis 100) angegeben ist (UV X) Aktionen durchführen (nicht regelmäßig), die entweder ein bestimmte Folge auslösen oder nicht (die binäre Variable). Die Frage ist nun ob zwischen dem Fortschritt des Zeitraums und der Wahrscheinlichkeit, das die Aktion die Folge auslöst oder nicht, ein Zusammenhang nachweisbar ist und wie stark dieser ist.
Mein Betreuer hat mich dazu ausdrücklich auf die logistische Regression hingewiesen.

An Literatur habe ich jetzt einiges gelesen, am meisten geholfen hat mir bisher das "Handbuch der sozialwissenschaftlichen Datenanalyse" (Wolf, Best).


Ich habe das bis jetzt folgendermaßen verstanden:

Die lineare Regression funktioniert nach p=a+b*x

Bei der logistischen Regression ersetzt man p durch die Logits welche ln(Odds) lauten, die Odds sind p/(1-p), um die AV auf den Bereich von 0 bis 1 zu beschränken.

Dann hat man ln(p/(1-p))=a+b*x was man umformt und p(Y=1|x)=1/(1+e^-(a+b*x)) erhält, was dann die Regressionskurve beschreibt.

Dabei ist dann nach meinem Verständnis a das was mir als Intercept ausgegeben wurde und b der Coefficient der (einzigen) UV.

Die Regressionskurve in diesem speziellen Fall würde also lauten p=1/(1+e^-(-0,0538+0,0107*x))


Habe jetzt auch schon oft gelesen, dass man die Güte über Pseudo-R² bestimmt, da ist aber immer die Rede von zwei verschiedenen -2LogLikelihood-Werten (0 und 1). Habe ich diese oder wo kriege ich diese her?

Auch vom Modell-Fit habe ich schon gelesen, mein Problem damit ist aber, das ich daraus Aussagen ziehen muss wie: "Der Chi Square Wert ist mit <?> größer/kleiner als <?> ist, und daraus kann man ableiten, dass das Modell die tatsächlichen Beobachtungen gut/schlecht wiedergibt"


Grüße
Daniel
Dalo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 16. Aug 2015, 21:44
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon PonderStibbons » Mo 17. Aug 2015, 16:22

Was der Prädiktor konkret sein soll, habe ich nicht ganz verstanden.
Womöglich solltest Du eine Überlebenszeitanalyse (Cox Regression)
machen, die ist mit der logistischen Regression verwandt.

Was die logistische Regression angeht,
Coefficients, Standard Errors, Odds Ratios, and 95% Confidence Limits...
Variable .......Coeff......StdErr.......p ..........O.R......Low...--...High
1..............0.0107.....0.0064....0.0968.....1.0108....0.9981....1.0236
Intercept...-0.0538.....0.4056....0.8945
der Koeffizient für Variable1 ist nicht inferenzstatistisch signifikant mit
dem Ergebnis (Aktion ja / nein) assoziiert, p = 0,097. Das hat den Vorzug,
dass Du Dir über R² etc. eigentlich keine Gedanken mehr machen musst.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Interpretation von logistischer Regressionsanalyse

Beitragvon Dalo » Mo 17. Aug 2015, 17:20

Ich möchte nicht zu konkret werden, da die Daten nicht mir gehören. Aber stell es dir vor als eine Person die durch einen Park geht, die Dauer des Spaziergangs wird in Prozent umgewandelt sodass 0 Prozent der Start ist und 100 Das Ende. Jetzt wird die Person beobachtet, und etwa jedes mal wenn man einen Vogel hört wird der Zeitfortschritt notiert zusammen mit 0 für "blickt sich nicht um" und 1 für "blickt sich um". Daraus ergibt sich dann z.B. ein Datenpaar 87,5486; 0.
Die Frage ist jetzt ob sich die Person (es waren viele verschiedene Personen) z.B. später während des Spaziergangs eher nach einem Vogel umschauen würde, oder ob es einen anderen Zusammenhang gibt.

der Koeffizient für Variable1 ist nicht inferenzstatistisch signifikant mit
dem Ergebnis (Aktion ja / nein) assoziiert, p = 0,097. Das hat den Vorzug,
dass Du Dir über R² etc. eigentlich keine Gedanken mehr machen musst.


Heisst das, dass die Prozentzahl (Variable 1) keinen signifikanten Einfluss auf die Eintrittswahrscheinlichkeit des mit 0 und 1 beschriebenen Ereignis hat und ich deshalb nicht prüfen muss, wie gut das Modell passt?

Wie gesagt mein Betreuer hat mich auf die logistische Regression gebracht, deshalb werde ich wohl mit ihm abklären ob ich das ganze so stehen lasse oder noch etwas anderes probiere.


Grüße
Daniel
Dalo
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 16. Aug 2015, 21:44
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste