Welche Regressionsmethode bei prozentwerten?

Alle Verfahren der Regressionanalyse.

Welche Regressionsmethode bei prozentwerten?

Beitragvon Trout » Do 10. Dez 2015, 12:36

Hallo,

Ich habe factor scores aus einer Faktorenanalyse vorliegen die ich nun mit der Zielvariablen per Regression analysieren möchte.
Nur weiss ich nicht ob ich hier ein einfaches lineares Modell wählen soll oder z.B. logistische Regression anwenden sollte, die ja eigentlich für
binäre Daten da ist. In einem Paper dass ich als Vorlage verwende haben die Autoren eben diese scores per log Reg analysiert, wobei sie ein glm benutzten.
Das sagt mir methodisch leider wenig. Sollte ich die Prozentwerte der AV vorab transormieren oder logarithmieren?

Danke schonmal!
Trout
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 10. Nov 2015, 09:36
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon PonderStibbons » Do 10. Dez 2015, 12:46

Wie kommst Du auf Logarithmieren? Ist die AV sehr schief verteilt?
Oder bewegen sich Prozentwerte eher im erweiterten mittleren
Bereich? Und vor allem, wie groß ist die Stichprobe?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Trout

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon Trout » Do 10. Dez 2015, 13:58

Das Thema logarithmieren hatte ich nur in einem Forum als Möglichkeit gelesen, scheint aber keine Lösung zu sein. Ich habe 4 verschiedene datensätze mit jeweils 291, 228, 86 und 88 Fällen. Erstere beiden sind laut Kolmogorov-Smirnov normalverteilt, die beiden mit geringeren Stichproben dagegen nicht. Schiefe und kurtosis der der Datensätze:

291 228
Schiefe 0,689237721 -0,090143105
Kurtosis -0,484566889 -1,202212061

86 88
Schiefe 1,778669664 0,634422728
Kurtosis 3,134928183 -0,41277799

Frage wäre, ob ich eine logistische Regression mit intervallskalierten Daten durchführen kann...
Trout
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 10. Nov 2015, 09:36
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon PonderStibbons » Do 10. Dez 2015, 14:40

Ich habe 4 verschiedene datensätze mit jeweils 291, 228, 86 und 88 Fällen. Erstere beiden sind laut Kolmogorov-Smirnov normalverteilt,

Das kann normalerweise nicht stimmen. Ist aber erstmal nicht weiter von Belang, weil in einer linearen
Regressionsanalyse keine Normalverteilung der abhängigen Varable verlangt ist. Allenfalls sollten die
Residuen des Regressionsmodells aus einer normalverteiltem Grundgesamtheit stammen, aber mit
Stichproben wie hier > 80 ist auch das vernachlässigbar.

Frage wäre, ob ich eine logistische Regression mit intervallskalierten Daten durchführen kann...

Welchen Sinn sollte das ergeben? Die ist für 0/1-Daten. Hast Du in Deinen Datensätzen viele 0-Werte
bzw. viele 100%-Werte?
Oder geht es um eine ordinale logistische Regression? Deren Sinn könnte ich allerdings ebenfalls nicht
unmittelbar erkennen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Trout

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon bele » Do 10. Dez 2015, 15:17

Hi!

Ich vermute, er will Werte unter 0% und über 100% verhindern und deshalb eine sigmoide Zielkurve haben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon Trout » Do 10. Dez 2015, 16:33

hi,
danke für die flotten antworten! Nein, die prozentwerte sind soweit schon ok, die meisten im mittleren bereich, null- und leerwerte sind auch keine da.
Wie gesagt ich habe die vorgehensweise per log Regression aus ner VÖ die da schreibt:

The resulting 4 factors in the EFA, and the variables therein, were then analyzed separately in more detail. The influence of separate
variables on [Zielvariable] was investigated using logistic regression (glm with binomial error distribution).

Na und das versteh ich einfach nicht, wobei mir der sinn eines glm wie einer log Regression wenn nicht lineare zusammenhänge zu erwarten sind bewusst ist.
Am end kann ich s zunächst mal mit ner einfachen linearen oder wenn ich mehrere scores mit ner multiplen probieren? :?

Danke u. liebe grüße

PS: das paper ist bei interesse hier runterzuziehn: https://dl.dropboxusercontent.com/u/209 ... euthe1.pdf
Trout
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 10. Nov 2015, 09:36
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon PonderStibbons » Do 10. Dez 2015, 17:11

Das hat mit nichtlinear nichts zu tun. Die abhängige Variable war binär (survival ja/nein).
Entweder hast Du eine andere Zielvariable, oder Du begehst gerade fundamentale
Auswertungsfehler.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Trout

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon Trout » Do 10. Dez 2015, 17:18

Meine Zielvariable ist die (%) Verlustrate, deren ZV war % Überlebensrate pro Gelege (immer mehrere tausend Eier), also doch im prinzip nichts anderes.
In den Stichproben kommt es immer zu % Eiverlusten, mal mehr oder weniger, das ist nicht binarisierbar denke ich.
Trout
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 10. Nov 2015, 09:36
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon bele » Do 10. Dez 2015, 17:27

Hi,

ich hab das Paper jetzt nicht gelesen aber Fig. 5 ganz rechts zeigt eine logistische Regression, weil die Kurve super zu den Punkten passt.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
Trout

Re: Welche Regressionsmethode bei prozentwerten?

Beitragvon Trout » Do 10. Dez 2015, 17:33

Ja richtig, da haben die scheinbar die einzelnen Variablen der wichtigsten faktoren teils näher angeguckt. mich interessiert aber zunächst die generelle aussage zu den korrelationen der faktoren zu der ZV "Überlebensrate" (eyed eggs) wie in fig. 1 zusammengefasst, also die R-Werte zu den einzelnen faktoren (meine 6-7 faktoren haben je 3-7 variablen) die best. varianzanteile erklären. ergo der Satz "Values on the right represent estimates of regression coefficients of factors 1–4 and the dependant variable and the R2 value for this regression model"
Trout
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 10. Nov 2015, 09:36
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron