Multiple Lineare Regression-Regressoren

Alle Verfahren der Regressionanalyse.

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Do 3. Dez 2015, 21:27

Zu deinem Vorschlag bzgl. bivariater Analysen: Ist es "erlaubt" oder sogar sinnvoll, für jede Variable ein anderes Verfahren anzuwenden?

Ist so denkbar.
Also bspw. für ordinale Regressoren Spearman's Rangkorrelationskoeffizient und für nicht ordinale Regressoren eine multinominale logistische Regression?
Falls Du bivariate Zusammenhänge betrachten willst, schießt Du mit multinomialer logistischer Regression mit Kanonen auf Spatzen. Zusammenhänge zwischen kategorialen Variablen kann enfach ein Chi² Test analysieren, von kategorialen mit ordinalen Variablen ein U-Test oder H-Test.
Vlt. wäre aber auch eine geordnete Probit Regression am geeignetsten, dann müsste ich nur den Regressanten ordinal skalieren, sehe ich das richtig?

Nein und nein.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Di 8. Dez 2015, 19:55

Hallo ich bin's wieder. Mein Professor hat sich mal endlich gemeldet, lehnt eine Serie bivariater Analysen aber leider ab (ohne Angabe von Gründen :-( )

Jetzt frage ich mich, was es noch für Möglichkeiten gibt. Was spricht denn gegen eine geordnete probit Regression. Meine AV ist ordinal, kategorial (4 mögliche Ausprägungen) und meine UV sind ebenfalls kategorial, aber nicht sämtlichst ordinal. Oder gehen probit Regressionen nur mit einer UV? Wird dann eine multivariate probit regression notwendig?
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Di 8. Dez 2015, 22:47

Ach so, anscheinend geht es um ordinale Regression?
Das grundlegende Problem, viele Prädiktoren + wenige Stichprobenelemente = overfitting,
bleibt bestehen, egal welche Form der multiplen Regression man wählt. Wenn Dein Betreuer aber
auf sowas steht, dann beibt Dir anscheinend nicht viel übrig.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Mi 9. Dez 2015, 17:37

Angenommen ich konstruiere meine AV so, dass sich ihre Ausprägung aus dem Mittelwert einer Reihe von Quantilen ergibt, gilt sie dann als diskret?

Zum Beispiel: Meine Stichprobe besteht aus 35 Dark Pools. Dark Pool XY ist bei Total Volume im 80% Quantil, bei Average Trade Size im 60% Quantil und bei #of Trades im 70% Quantil. Der Mittelwert hieraus ergibt 70%, was wiederum verglichen mit den anderen 34 Pools im 65% Quantil liegt.
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Fr 18. Dez 2015, 18:07

Hallo Leute,

in mir kriecht mittlerweile die kalte Angst hoch, habe mich mit dieser Arbeit völlig übernommen. In 3 Tagen ist Abgabe und ich habe den Eindruck, dass nichts von dem was ich die letzten 2 Monate gemacht habe wirklich Sinn ergibt. Ich muss es jetzt irgendwie retten was zu retten ist.

Ich habe mittlerweile meine Variablen bestimmt. Die unabhängigen Variablen sind alle latent ordinal und können 3 Werte annehmen (1-3, stellvertretend für niedrig - hoch).
Meine abhängige Variable basiert auf einem scoring-system. Jede Beobachtung wird auf gewisse Punkte getestet und erhält dann einen score. Diese Scores reichen von -1,15 bis 4,75. Mein ursprünglicher Plan bestand darin,eine probit regression durchzuführen, deshalb habe ich den Datensatz nach den Ergebnissen des Scores aufgeteilt und daraus 3 Kategorien gebildet. Kurz: Erzielt Beobachtung A einen score, der im Vergleich zu den anderen Beobachtungen in den niedrigsten 33% liegt, fällt die Beobachtung in Kategorie 1, wenn der Score zu den höchsten 33% gehört, fällt die Beobachtung in Kategorie 3. Ein score im mittleren Drittel führt demnach zu Kategorie 2.

Damit habe ich eine probit regression durchgeführt, die zu riesigen standardfehlern von >50% führt und deren Regressionskoeffizienten ich nicht wirklich sinnvoll deuten kann. Ich bin bei der Interpretation dieser Anleitung gefolgt: http://faculty.washington.edu/cadolph/mle/topic4.p.pdf , aber ich denke dass die Art und Weise, wie ich die AV konstruiert habe, keine wirklich brauchbaren Ergebnisse liefert.

Jetzt sitze ich hier und überlege, ob ich die Einteilung des Scores in 3 Kategorien nicht einfach weglassen soll und direkt den Einfluss der ordinalen UV auf den Score untersuche, viel schlechtere Ergebnisse als die erste Methode kann das kaum bringen. Allerdings erschlägt mich R mit den ganzen Möglichkeiten ziemlich. Weiß irgendjemand, welche Funktion sich hier anbietet? wie kann ich die UV so kodieren, dass R sie als latent ordinal erkennt?

Ich bin jedem zutiefst dankbar, der mir in irgendeiner Form hilft.
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Fr 18. Dez 2015, 19:45

Ich habe jetzt einfach mal eine lineare Regression gemacht, das Ergebnis seht ihr hier. Ganz schlau bin ich noch nicht daraus geworden, wie kann zb OT einen standarderror von 60% haben und trotzdem hochsignifikant sein? Kann mir jemand bei der Interpretation helfen? Was mir etwas Hoffnung macht, ist der kleine p-value. Darf ich daraus schließen, dass meine UV tatsächlich meine AV beschreiben?

Residuals:
Min 1Q Median 3Q Max
-3.2523 -0.4069 -0.0924 0.6857 2.3324

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.27303 0.99896 0.273 0.78662
ot 2.63768 0.64666 4.079 0.00034 ***
mp -0.88381 0.50445 -1.752 0.09072 .
cr 0.82759 0.57411 1.442 0.16053
il -0.08596 0.27361 -0.314 0.75572
ag 0.05783 0.41367 0.140 0.88982
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.359 on 28 degrees of freedom
Multiple R-squared: 0.5174, Adjusted R-squared: 0.4312
F-statistic: 6.003 on 5 and 28 DF, p-value: 0.0006799

Edit: Tut mir leid, ich versuche seit 10 Minuten diese Tabelle einzufügen, ohne dass alles verrutscht. Wie bekomme ich eine Datei aus R am besten hier hochgeladen?
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste