Dummykodierung

Alle Verfahren der Regressionanalyse.

Dummykodierung

Beitragvon farngarten » So 28. Jul 2013, 10:14

hallo,
kann mir jemand helfen, die Ergebnisse einer Dummykodierung /Parameterschätzung zu verstehen?

Datensatz besteht aus 5 Daten: Studenten untersch. Fachrichtungen u ihre erzielten Punkte bei einer Stat-Klausur (BWLer 34 Punkte , noch ein BWLer 78 Punkte . VWLer 64 und noch ein VWLer 71 Punkte. Sonstige Fachrichtung 30 Punkte)
Die Dummy-Kodierung
BWL : X1 wird mit 1 kodiert, X2 mit Null
VWL: X1 = Null , X2 wird mit 1 kodiert
Sonstige ist Referenzkat. und wird beides mit Null

Soweit klar.

Ergebnis
BWL: yDach = aDach + b1Dach * 1 + b2Dach * 0 = 62.800 + 1.083 = 63.883
VWL: yDach = aDach + b1Dach * 0 + b2Dach * 1 = 62.800 + (-6.229) = 56.571
Sonstige: yDach = aDach + b1Dach * 0 + b2Dach * 0 = 62.800

Ich verstehe nicht : Wie kommen die auf diese Zahlen????

Wäre für Hilfe seeeehr dankbar. Gruß Martin
farngarten
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Do 27. Jun 2013, 09:27
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummykodierung

Beitragvon bele » So 28. Jul 2013, 11:45

Wahrscheinlich haben sie die Daten in ein Statistik-Computerprogramm gefüttert und das hat diese Zahlen ausgespuckt. Geeignete Programme wären SPSS, SAS, Statistica, R, S-Plus, ...

Wie man die Daten da rein füttert hängt sehr davon ab, welches Programm man nimmt. Oder worum geht es in der Frage genau?
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Dummykodierung

Beitragvon bele » So 28. Jul 2013, 11:56

Ah, jetzt verstehe ich das Problem. Mit diesen fünf Werten komme ich auch auf deutlich andere a-und b-Dächer:
Code: Alles auswählen
klausur <- read.table(header=TRUE, sep=",", text=
"BWL, VWL, Punkte
  1 ,  0 ,  34
  1 ,  0 ,  78
  0 ,  1 ,  64
  0 ,  1 ,  71
  0 ,  0 ,  30")

lm(Punkte ~ BWL + VWL, data=klausur)

führt zu
Code: Alles auswählen
Call:
lm(formula = Punkte ~ BWL + VWL, data = klausur)

Coefficients:
(Intercept)          BWL          VWL 
       30.0         26.0         37.5 


also .

Hilft das bei Deinem Problem?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Dummykodierung

Beitragvon farngarten » Mo 29. Jul 2013, 14:00

Hallo Bernhard,
Selbst mit dem a-Dach und b1-Dach von Dir, komme ich nicht auf die Zahlen 62.800 + 1.083 = 63.883 (für BWL) oder 62.800 + (-6.229) = 56.571

Kann man das überhaupt mit dem Taschenrechner ausrechnen oder geht das nur mit SPSS ? Mir ist völlig schleierhaft, wie es zu diesen Zahlen kommt.

Gruß und danke für Deine Mühe
Martin

Das ist ein Rechenbeispiel von der Fernuni Hagen (Kurs Stat / Psychologie)
farngarten
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Do 27. Jun 2013, 09:27
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummykodierung

Beitragvon farngarten » Mo 29. Jul 2013, 14:11

hab ich vielleicht auch die Bezeichnung falsch verstanden?

Ich hatte oben geschrieben:
Die Dummy-Kodierung
BWL : X1 wird mit 1 kodiert, X2 mit Null
VWL: X1 = Null , X2 wird mit 1 kodiert
Sonstige ist Referenzkat. und wird beides mit Null

Muss es nicht vielleicht auch heißen, dass
BWL mit 1 koderiert wird (dazu gehört x1 = 1 , x2 = 0 )
VWl mit 2 Kodiert wird (dazu x1 = 0 , x2 = 1)
Sonstige mit 3 Kodiert (x1 und x2 sind Null)

das würde aber nix an meinem eigentlichen Problem ändern....
farngarten
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Do 27. Jun 2013, 09:27
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Dummykodierung

Beitragvon bele » Mi 31. Jul 2013, 16:12

Hallo farngarten,

ich habe meine Zahlen gepostet, weil sie denen Deines Beispiels widersprechen. Ich komme also auf andere Zahlen als Deine Musterlösung. Dein Problem scheint aber früher anzusetzen. Wir lassen mal die Dächer weg und gehen davon aus, dass folgender linearer Zusammenhang angenommen wird:



Dabei ist a eine Konstante, nämlich der Durchschnitt der anderen Studierenden. b1 und b2 geben an, wieviel Punkte ein BWLer und ein VWLer normalerweise darüber liegen (wenn sie unter dem Schnitt liegen, dann wird b negativ). ist die Abweichung der wirklichen Ergebnisse von unserer Schätzung und soll möglichst klein sein.

Sowas nennt man eine lineare Regression und normalerweise rechnet man sowas mit einem Computer oder mit einem Taschenrechner, der mit Matrizen umgehen kann. Zur Rechenmethode im Normalfall siehe http://de.wikipedia.org/wiki/Lineare_Re ... ffizienten

In Deinem Fall ist die Rechnung aber wegen der wenigen Teilnehmer auch anders möglich. Der einzige Nicht-BWLer und Nicht-VWLer hat 30 Punkte erzielt. Also ist der einzig vernünftige Wert für

weil Epsilon möglichst klein sein soll: a=30.

So, nun wissen wir von den BWLern, dass sie im Schnitt (34+78)/2=56 Punkte erreichen. In unsere Gleichung eingesetzt ergibt sich:

Das kannst Du auflösen und wenn Epsilon 0 werden soll ergibt sich b1=26.

Dasselbe kannst Du mit b2 machen.

Du siehst, in Deinem speziellen Fall geht es ohne Taschenrechner, sehr schnell aber wird es so kompliziert, dass man besser ein Statistikprogramm wie z. B. R ( http://www.r-project.org ) oder SPSS verwendet.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 15 Gäste

cron