multiple Regressionsanalyse??

Alle Verfahren der Regressionanalyse.

multiple Regressionsanalyse??

Beitragvon ChrisD27 » Do 1. Sep 2011, 13:31

Hallo zusammen,
ich bin recht neu hier beim StatistikBoard- und allgemein gesprochen bei der Statistik auch.
Wie ich dem Board hier entnehmen kann kennen sich wohl eine vielzahl von Leuten mit der Regressionsanalyse aus,
zu diesen zähle ich leider nicht.
Ich habe mir das Buch "Einführung in die multivariate Datenanalyse" bestellt und stehe dort bei dem Beispielen
zur multiplen Regressionsanalyse ein wenig auf dem Schlauch. (Dies soll jetzt keine Werbung oder Kritik an dem Buch sein).
Hier würde es mich sehr freuen wenn mir jemand von Euch bei den Beispielen dort weiterhelfen könnte.

Wenn sich jemand meldet versuche ich die Beispielaufgaben hier zu posten oder via Mail / p-Nachricht weiterzuleiten.
(Möchte hier nicht unnötig Platz sprengen in dem ich jetzt schon Aufgaben hier hochlade).

Bei der Funktion der Regressionsanalyse, habe ich - zumindest grundlegend denke ich - die Funktion des Regressionskoeffizienten verstanden- z.b. wie man die Werte b1 und b0 berechnet. Bei einer multiplen Regressionsfunktion erschließt sich mir die Funktion zur berechnung der Regressionskoeffizienten b2...bis bn (oder bj) leider nicht.
Ich habe die Formeln zwar hier stehen, und auch aus dem Buch ein Beispiel, nur verstehe ich den Zwischenschritt nicht, da dieser dort nicht aufgeführt ist.

Würde mich über Antworten und eine Hilfe sehr freuen. (Das Buch bezieht sich auch großteils auf SPSS mit diesem Programm habe ich aber bis dato noch keine Erfahrung)

Liebe Grüße !
Chris
ChrisD27
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 1. Sep 2011, 13:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: multiple Regressionsanalyse??

Beitragvon ChrisD27 » Do 1. Sep 2011, 19:08

Hallo nochmal zur Ergänzung bei der von mir genannten Aufgabe
(habe sie wie gesagt mit Lösung, nur der Rechenschritt ist unklar)
handelt es sich um ein Beispiel eines Produktes zum Verkauf.
Man hat also eine Tabelle mit den Angaben:
Menge des Produktes verkauft bei Vertretetbesuchen (so und so) , Maßnahmen zur Verkaufsförderung (so und so), Preis pro (karton). Laut Wiki löst man es mathematisch mit Y^(Dach)= b0 + b1 mal x, + b2 mal x, + b3 mal usw.
(Kann zur weiteren Erklärung , wenn es erlaubt ist, hier auch im Anhang noch die entsprechenden Seiten einscannen und im Anhang hier beifügen).
ChrisD27
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 1. Sep 2011, 13:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: multiple Regressionsanalyse??

Beitragvon daniel » Fr 2. Sep 2011, 10:29

Was genau verstehst Du denn nicht?

Laut Wiki löst man es mathematisch mit Y^(Dach)= b0 + b1 mal x, + b2 mal x, + b3 mal usw.


Das ist die Regressionsgleichung, nicht die Lösung. Unter Lösung versteht man i.d.R. die Berechnung des b Vektors. Das ist in Matrixschreibweise relativ kompakt darstellbar.

Du einen Spaltenvektor y, der die Werte des outcomes für jede Beobachtung enthält.

Du hast weiterhin eine Matrix X, die Werte der Kovariaten für jede Bebachtung enthält. Die erste Spalte der X Matrix besteht aus 1en, die sind wichtig um die Konstante zu berechnen (b0).

Du willst nun eine möglichts gute lineare Approximation von y schätzen. Du willst also

y = Xb

Nun definierst Du gut als minimale Abweichung der vorhergesagten Werte zu den beobachteten Werten. Diesen Differenzenvektor nennst Du e.

e = (y - Xb)

Da es sowohl Über- als auch Unterschätzungen gibt, quadrierst Du die Fehler, damit sie sich nicht zu Null summieren (das ist wilkürlich, Du könntst auch den Betrag nehmen). Die Funktion nennst Du S(b).

S(b) = e'e

(e'e ist die aufsummierte Fehlerquadratsumme). Einsetzen und Matirxalgebra (die muss man eben einfach hinnehmen, so wie Du i.d. R. nicht nachfragst warum 2*2 = 4 sind)

(y - Xb)'(y - Xb) = y'y - 2y'Xb + b'X'Xb

Diese Funktion minimierst Du indem Du die erste Ableitung (nach b)

-2(X'y - X'Xb)

Null setzt und auflöst. Das Ergebnis ist die analytische Lösung zur Berechnung des b Vektors

b = X'X^(-1)X'y

Wenn Du die Werte in Deiner Aufgabe einsetzt, dann solltest Du auf die Werte der bs kommmen.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 10 Gäste