bitte steinigt mich nicht. Meine letzte Statistik-Vorlesung ist 30 Jahre her und da war es auch nicht unbedingt mein Lieblingsfach.
Folgendes Problem. Ich möchte mit Excel eine Conjoint-Analyse machen. Ziel ist es, 6 Abo-Varianten miteinander zu vergleichen. Dazu habe ich die Daten entsprechend aufbereitet. Die Ausprägungen der Variablen habe ich in 0/1 Variablen verwandelt. Die sehen jetzt so aus:
Choiceset Abo VK 0 VK 2,99 VK 4,99 Rabatt 0 Rabatt 5 Rabatt 10 Laufzeit 0 Laufzeit 6 Laufzeit 12 Invest 0 Invest 10 Choice
1 1 1 0 0 1 0 0 0 1 0 0 1 1
1 2 0 0 1 0 0 1 0 0 1 1 0 0
2 1 1 0 0 1 0 0 0 1 0 0 1 0
2 3 0 1 0 0 1 0 0 1 0 0 1 1
3 1 1 0 0 1 0 0 0 1 0 0 1 1
3 4 0 0 1 0 1 0 1 0 0 1 0 0
4 1 1 0 0 1 0 0 0 1 0 0 1 1
4 5 1 0 0 1 0 0 0 0 1 1 0 0
5 1 1 0 0 1 0 0 0 1 0 0 1 0
5 6 0 1 0 0 0 1 1 0 0 0 1 1
6 2 0 0 1 0 0 1 0 0 1 1 0 0
6 3 0 1 0 0 1 0 0 1 0 0 1 1
7 2 0 0 1 0 0 1 0 0 1 1 0 0
7 4 0 0 1 0 1 0 1 0 0 1 0 1
8 2 0 0 1 0 0 1 0 0 1 1 0 0
8 5 1 0 0 1 0 0 0 0 1 1 0 1
9 2 0 0 1 0 0 1 0 0 1 1 0 0
9 6 0 1 0 0 0 1 1 0 0 0 1 1
10 3 0 1 0 0 1 0 0 1 0 0 1 1
10 4 0 0 1 0 1 0 1 0 0 1 0 0
11 3 0 1 0 0 1 0 0 1 0 0 1 1
11 5 1 0 0 1 0 0 0 0 1 1 0 0
12 3 0 1 0 0 1 0 0 1 0 0 1 1
12 6 0 1 0 0 0 1 1 0 0 0 1 0
13 4 0 0 1 0 1 0 1 0 0 1 0 1
13 5 1 0 0 1 0 0 0 0 1 1 0 0
14 4 0 0 1 0 1 0 1 0 0 1 0 0
14 6 0 1 0 0 0 1 1 0 0 0 1 1
15 5 1 0 0 1 0 0 0 0 1 1 0 0
15 6 0 1 0 0 0 1 1 0 0 0 1 1
Sorry, kann keine Datei anhängen. Dann wäre es sicher hübscher. Also wir haben 6 Abos mit je 4 Eigenschaften (VK, Rabatt, Laufzeit und Invest) wobei 3x3 Ausprägungen und 1x2 Ausprägungen vorkommen. Die Kunden sollen die 6 Abos jeweils paarweise vergleichen. Das ergibt 15 "ChoceSets". Um das ganze zu testen, habe ich in der letzten Spalte mal ein Dummy-Choice gemacht.
Um die direkte Abhängigkeit raus zu nehmen, wurden jeweils 1 Variable gelöscht.
Dann bleibt das übrig:
Choiceset Abo VK 0 VK 2,99 Rabatt 0 Rabatt 5 Laufzeit 0 Laufzeit 6 Invest 0 Choice
1 1 1 0 1 0 0 1 0 1
1 2 0 0 0 0 0 0 1 0
2 1 1 0 1 0 0 1 0 0
2 3 0 1 0 1 0 1 0 1
3 1 1 0 1 0 0 1 0 1
3 4 0 0 0 1 1 0 1 0
4 1 1 0 1 0 0 1 0 1
4 5 1 0 1 0 0 0 1 0
5 1 1 0 1 0 0 1 0 0
5 6 0 1 0 0 1 0 0 1
6 2 0 0 0 0 0 0 1 0
6 3 0 1 0 1 0 1 0 1
7 2 0 0 0 0 0 0 1 0
7 4 0 0 0 1 1 0 1 1
8 2 0 0 0 0 0 0 1 0
8 5 1 0 1 0 0 0 1 1
9 2 0 0 0 0 0 0 1 0
9 6 0 1 0 0 1 0 0 1
10 3 0 1 0 1 0 1 0 1
10 4 0 0 0 1 1 0 1 0
11 3 0 1 0 1 0 1 0 1
11 5 1 0 1 0 0 0 1 0
12 3 0 1 0 1 0 1 0 1
12 6 0 1 0 0 1 0 0 0
13 4 0 0 0 1 1 0 1 1
13 5 1 0 1 0 0 0 1 0
14 4 0 0 0 1 1 0 1 0
14 6 0 1 0 0 1 0 0 1
15 5 1 0 1 0 0 0 1 0
15 6 0 1 0 0 1 0 0 1
Nun habe ich die Regression via Excel laufen lassen mit folgendem Ergebnis:
AUSGABE: ZUSAMMENFASSUNG
Regressions-Statistik
Multipler Korrelationskoeffizient 0,683130051
Bestimmtheitsmaß 0,466666667
Adjustiertes Bestimmtheitsmaß 0,272222222
Standardfehler 0,40824829
Beobachtungen 30
ANOVA
Freiheitsgrade (df) Quadratsummen (SS) Mittlere Quadratsumme (MS) Prüfgröße (F) F krit
Regression 7 3,5 0,5 4,2 0,004449678
Residue 24 4 0,166666667
Gesamt 31 7,5
Koeffizienten Standardfehler t-Statistik P-Wert Untere 95% Obere 95% Untere 95,0% Obere 95,0%
Schnittpunkt 0,4 0,316227766 1,264911064 0,218048021 -0,252662031 1,052662031 -0,252662031 1,052662031
VK 0 0 0 65535 #ZAHL! 0 0 0 0
VK 2,99 0,3 0,316227766 0,948683298 #ZAHL! -0,352662031 0,952662031 -0,352662031 0,952662031
Rabatt 0 0,2 0,25819889 0,774596669 0,446142653 -0,332896317 0,732896317 -0,332896317 0,732896317
Rabatt 5 0,3 0,182574186 1,643167673 0,113386965 -0,0768146 0,6768146 -0,0768146 0,6768146
Laufzeit 0 0,1 0,182574186 0,547722558 0,588940669 -0,2768146 0,4768146 -0,2768146 0,4768146
Laufzeit 6 0 0 65535 #ZAHL! 0 0 0 0
Invest 0 -0,4 0,25819889 -1,549193338 #ZAHL! -0,932896317 0,132896317 -0,932896317 0,132896317
Um es kurz zu machen, das sieht nicht gut aus.
Da die Eigenschaften alle skalierbar sind, habe ich das gleiche Modell ohne die 0/1 Variablen gemacht. Dann sieht das so aus:
Abo Variante Versandkosten € Rabatt Laufzeit Monate Sparplan / Invest € Preferenz
Abo 1 0 0% 6 10 3
Abo 2 4,99 10% 12 0 1
Abo 3 2,99 5% 6 10 1
Abo 4 4,99 5% 0 0 4
Abo 5 0 0% 12 0 3
Abo 6 2,99 10% 0 10 3
AUSGABE: ZUSAMMENFASSUNG
Regressions-Statistik
Multipler Korrelationskoeffizient 0,984973658
Bestimmtheitsmaß 0,970173108
Adjustiertes Bestimmtheitsmaß 0,850865538
Standardfehler 0,472971134
Beobachtungen 6
ANOVA
Freiheitsgrade (df) Quadratsummen (SS) Mittlere Quadratsumme (MS) Prüfgröße (F) F krit
Regression 4 7,276298307 1,819074577 8,131697837 0,256481338
Residue 1 0,223701693 0,223701693
Gesamt 5 7,5
Koeffizienten Standardfehler t-Statistik P-Wert Untere 95% Obere 95% Untere 95,0% Obere 95,0%
Schnittpunkt 6,461133847 0,777856427 8,306332144 0,076275612 -3,422469175 16,34473687 -3,422469175 16,34473687
Versandkosten € -0,524670648 0,214063904 -2,451000089 0,246614428 -3,244610442 2,195269146 -3,244610442 2,195269146
Rabatt 2,737156448 9,164165226 0,29868039 0,815223846 -113,7046032 119,1789161 -113,7046032 119,1789161
Laufzeit Monate -0,273240081 0,052356075 -5,218880136 0,120523142 -0,938487091 0,39200693 -0,938487091 0,39200693
Sparplan / Invest € -0,212585452 0,057963167 -3,667595508 0,169460391 -0,949077323 0,523906419 -0,949077323 0,523906419
Das sieht zumindest nicht ganz schlecht aus.
Vielleicht kann mir jemand von Euch ein wenig auf die Sprünge helfen? Hier meine Fragen:
Müssten die beiden Varianten nicht wenigstens annähernd ähnliche Ergebnisse liefern?
Die Eigenschaften sind untereinander nicht unabhängig. Ich dachte, das wäre das Problem. Aber die Ergebnisse erscheinen mir fast willkürlich. Welcher Ansatz wäre Eurer Meinung nach richtiger?
Wenn der 2. zu bevorzugen ist, wie interpretiere ich dann die Koeffizienten bezüglich der Eigenschaften?
Ich würde mich riesig freuen, wenn mir jemand einen Tipp geben kann, wie ich die Sache angehen sollte. Vielleicht ist die Conjoint / Regression auch völlig ungeeignet für das Modell?
[Könnt Ihr es möglichst so erklären, dass es auch ein Schulkind versteht?

Vielen Dank!