Hallo,
zurzeit arbeite ich an einer multiplen logistischen Regression und ich bin mir nicht sicher welche Link-Funktion ich verwenden sollte. Ich habe eine binäre Antwortvariable (Tod/Lebend) und 10 potentielle erklärende Variablen (sowohl kontinuierliche, als auch kategoriale). Ich habe nun ein "volles" Modell mit allen Variablen erstellt (Interaktionen waren nicht relevant) und dann eine stepwise Selection in R durchgeführt, um herauszufinden, welche Variablen einen signifikanten Einfluss haben. Zunächst hatte ich als Link-Funktion logit verbunden, da ich es bisher so gelernt hatte. Als Ergebnis habe ich zwei signifikante Prädiktoren und einen recht schlechten goodness of fit insgesamt. Danach habe ich es mal mit einem complementary log-log link versucht und nach der Modellselektion ergaben sich drei signifikante Prädiktoren und der fit war etwas besser.
Nun bin ich mir nicht sicher, welche Link-Funktion ich verwenden sollte bzw. ob ich überhaupt den cloglog Link in meinem Fall verwenden kann.
Falls ja, würde ich gerne konkret wissen, wie man das Ergebnis also die Parameterschätzungen interpretiert. Genauso wie bei logit? Bisher habe ich dazu nichts eindeutiges gefunden!
Vielleicht kann mir ja jemand weiterhelfen! Das würde mich sehr freuen, denn ich komme gerade einfach nicht weiter! Meinen R code inkl. Ergebnis findet ihr unten!
Schon mal herzlichen Dank im Voraus!
Gadus
################Logit##############
glm(formula = Dead ~ Temp + Blood, family = binomial, data = a2f)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.7571 -0.8384 -0.5626 0.7597 1.9604
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.5723 1.5344 -2.980 0.002884 **
Temp 0.2371 0.1005 2.359 0.018330 *
Blood 1.9598 0.5040 3.888 0.000101 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 176.20 on 136 degrees of freedom
Residual deviance: 148.66 on 134 degrees of freedom
(2 observations deleted due to missingness)
AIC: 154.66
Number of Fisher Scoring iterations: 4
drop1(opt3, test="Chisq")
Single term deletions
Model:
Dead ~ Temp + Blood
Df Deviance AIC LRT Pr(>Chi)
<none> 148.66 154.66
Temp 1 155.67 159.67 7.0164 0.008077 **
Blood 1 165.79 169.79 17.1359 3.48e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
PseudoRsqu
[1] 15.62881
#############Cloglog#############
Call:
glm(formula = Dead ~ Temp + Blood + pos, family = binomial(link = "cloglog"),
data = a2f)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.0203 -0.7112 -0.4736 0.5276 2.2022
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.52764 1.36687 -3.312 0.000925 ***
Temp 0.19745 0.08479 2.329 0.019881 *
Blood 1.33987 0.35672 3.756 0.000173 ***
posA2 0.81838 0.79122 1.034 0.300983
posD 1.03977 0.90905 1.144 0.252704
posM 0.81302 0.62389 1.303 0.192525
posS -0.19103 0.66549 -0.287 0.774073
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 176.20 on 136 degrees of freedom
Residual deviance: 138.39 on 130 degrees of freedom
(2 observations deleted due to missingness)
AIC: 152.39
Number of Fisher Scoring iterations: 7
drop1(clog2, test="Chisq")
Single term deletions
Model:
Dead ~ Temp + Blood + pos
Df Deviance AIC LRT Pr(>Chi)
<none> 138.39 152.39
Temp 1 145.54 157.54 7.1500 0.007496 **
Blood 1 151.75 163.75 13.3604 0.000257 ***
pos 4 148.21 154.21 9.8119 0.043718 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
PseudoRsqu
[1] 24.05507