Auswertung eines Fragebogens

Alle Verfahren der Regressionanalyse.

Re: Auswertung eines Fragebogens

Beitragvon ocrammarco » Mi 30. Jan 2013, 12:40

Hoi Daniel

die b's sollen Schätzer darstellen. Ich will also zum Beispiel sagen: Die Servicequalität hat einen signifikanten/starken Einfluss auf die Gesamtzufriedenheit (im wahren Modell)

Gruss Marco
ocrammarco
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Di 29. Jan 2013, 14:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Auswertung eines Fragebogens

Beitragvon daniel » Mi 30. Jan 2013, 12:53

Mir ist klar, dass die bs Schätzer sind. Du kennst aber bereits den exakten Einfluss jedes einzelnen Items auf den Gesamtwert, weil der Gesamtwert von Dir gebildet wird. Du setzt alle b = 1 und zählst die Werte der einzelen Items zusammen. Das ist de facto Dein "wahres" Modell. Dieses Modell ist deterministisch. Der Gesamtwert ergibt sich als (ungewichtete, was einer Gewichtung mit dem Faktor 1 entspricht) Summe der Einzelwerte. Was willst Du da noch schätzen?

btw. ein "wahres" Modell gibt es nicht, aber das ist ein anderes Thema.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Auswertung eines Fragebogens

Beitragvon bele » Mi 30. Jan 2013, 13:48

ocrammarco hat geschrieben:Da die ebenfalls erfragt "Gesamtzufriedenheit" stark mit dieser Gesamtpunktzahl zusammenhängt, kann ich auch die Korrelation zu dieser Gesamtzufriedenheit berechenen?


@daniel: Das klingt für mich so, als ob "Gesamtzufriedenheit" nicht die Summe der Items sondern tatsächlich eine brauchbare abhängige Varialbe ist: Erhoben und nicht gebildet.

Falls ich dann auch ein normales multiples Regressionsmodell machen kann: Das Regressionsmodell hätte ich mir dann so vorgestellt, dass die Gesamte Zufriedenheit mit dem Unternehmen durch die einzelnen Fragen erklärt wird


@ocrammarco: Was erhoffst Du Dir von einem multiplen Regressionsmodell, was die Korrelationen nicht leisten?
Tiefere Einsichten in das Antwortverhalten der Befragten? Da hilft Dir eine Faktorenanalyse oder eine Hauptkomponentenanalyse im Zweifel besser weiter.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Auswertung eines Fragebogens

Beitragvon ocrammarco » Mi 30. Jan 2013, 14:05

Hallo zusammen,

ok, vielleicht bin ich zu stark auf das Regressionsmodell fixiert.

@ Bernhard: Ich habe sowohl ein Item (also eine Frage im Fragebogen), die nach der Gesamtzufriedenheit auf einer 4 Stufigen Skala fragt. Ich wollte jedoch die Anzahl Punkte pro Umfrageteilnehmer zusammenzählen und so einen "Summenwert" bilden, der der erfragten Gesamtzufriedenheit ähnelt. Dies in der Hoffnung, dann eine normale multiple Regression machen zu dürfen (Weil die abhängige Variable dann der Summenwert wäre und nicht mehr das 4Stufige Item Gesamtzufriedenheit. Erklärende Variablen wären immer die anderen 15 Fragen, welche auch auf derselben 4stufigen Skala erfragt werden).

Ich seh aber euren Punkt: Es würde mir reichen, wenn ich die Korrelation zwischen jeder der 15 Fragen und entweder der erfragten Gesamtzufriedenheit oder dem "Summenwert" darstellen könnte. Weiter möchte ich dann noch eine Aussage machen, dass z.B. ein signifikanter positiver Zusammenhang besteht.

--> Was brächte ich denn nun hier für eine Methode?
15 Spearman-Korrelationen zwischen der "Gesamtzufriedenheit"
und den einzelnen Merkmalen

? oder
Faktorenanalyse oder eine Hauptkomponentenanalyse

oder den Koeffizienten Kendalls Tau?
Wie kann ich dann Aussagen über Signifikanz machen?

Mein Auftraggeber ist methodisch nicht anspruchsvoll, d.h. es darf durchaus eine einfache Analyse sein. Ich will aber natürlich saubere Arbeit machen, etwas Statistik zeigen und keinen Mist liefern..

Kann man solche Sachen im Excel machen? Oder muss ich mich ins R einarbeiten?

Vielen Dank, Marco
ocrammarco
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Di 29. Jan 2013, 14:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Auswertung eines Fragebogens

Beitragvon daniel » Mi 30. Jan 2013, 14:10

Ich habe das hier nicht ganz aufmerksam verfolget, bezog mich mit meiner Anmerkung aber explizit auf

Das Modell sähe dann so aus: (Summenwert aus den 15 Fragen, wobei 2 Smileys 3 Punkte geben, 2 unglückliche Gesichter 0 Punkte) = b0 + b1*(Punkte aus Item Kulanz) + b2*(Punkte aus Item Servicequalität) + etc.


Mir scheint, Marco versteht mich immer noch nicht. Vielleicht bildest Du mal Deinen Summenscore und regressierst ihn auf seine Bestandteile, dann sollte sichtbar werden, worauf ich hinaus will.

Eine multiple Regression würde ich einzelnen Korrelationen allerdings in jedem Fall vorziehen. Was interessiert ein Unternehmen die triviale Aussage, dass das Kulanzverhalten im einen bivariaten Zusammenhang mit der Gesamtbewertung steht, wenn man eventuell zeigen kann, dass unter Kontrolle der Serviceleistungen das Kulanzverhalten keinerlei Effekte mehr hat?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

folgende User möchten sich bei daniel bedanken:
ocrammarco

Re: Auswertung eines Fragebogens

Beitragvon PonderStibbons » Mi 30. Jan 2013, 14:38

Wie kann ich dann Aussagen über Signifikanz machen?

Nota bene ist inferenzstatistische Signifikanz überhaupt nicht das, was man
sich wünscht, erhofft oder denkt, was es wäre, nämlich eine Aussage zur
Relevanz/Wichtigkeit eines Effekts (z.B. einer Korrelation). Sondern nur eine
Aussage darüber, ob der Effekt (in der Grundgesamtheit, aus der die Daten stammen)
als = 0.0000000000 angenommen werde sollte, oder ob man diese Nullhypothese
verwerfen kann.
Mein Auftraggeber ist methodisch nicht anspruchsvoll, d.h. es darf durchaus eine einfache Analyse sein.

Eine multiple Regression (selbst wenn durchführbar) mit 15 Variablen wird im Ergebnis
a) vermutlich von vornherein sehr schwer interpretierbar sein und b) auf die fehlenden
93% nur sehr fraglich übertragbar.

Daher wäre ich geneigt zu empfehlen, die 15 Komponenten mit der Gesamtzufriedenheit
zu korrelieren und der Höhe des Zusammenhangs nach zu ordnen, das gibt robuste und
eingängige Ergebnisse und gestattet sogar hübsche Grafiken.

Vorher oder parallel schaust Du Dir noch die Interkorrelationen der 15 Komponenten
an, alles mit rho > 0.8 ist redundant (auch wieder was zum Präsentieren).

Falls Du das hinkriegst, dann sattele für den Aha-Efekt noch wie empfohlen eine
Faktoenanalyse oder Hauptkomponentenanalyse drauf, die müsste dann aber in aller
Vorsicht mehr so als Denkanstoß präsentiert werden.

Just my 2pence

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
ocrammarco

Re: Auswertung eines Fragebogens

Beitragvon ocrammarco » Mi 30. Jan 2013, 14:47

Hallo Daniel,

ich kapiers wirklich nicht: Ich habe ein Beispiel gemacht:
x1 x2 x3 summenwert
1 2 1 4
2 0 0 2
1 1 1 3
2 1 1 4
0 0 1 1
2 3 1 6
1 0 0 1
3 2 1 5

codierung: 0= :( :( 1= :( 2= :) 3= :) :)
x1 könnte z.B. Zufriedenheit mit Service, x2 Zufriedenheit mit Mitarbeiter sein. Summieren tue ich dann pro Befragtem (richtig?).

Dann mach ich eine multiple Regression mit diesen Daten und bekomm im Excel folgendes:

Koeffizienten Standardfehler t-Statistik P-Wert Untere 95% Obere 95%
Schnittp 0.469879518 0.338351924 1.38873015 0.23724033 -0.469536025 1.409295061
x1 0.686746988 0.166363977 4.127978899 0.014517767 0.224846537 1.148647438
x2 1.108433735 0.173761507 6.379052257 0.003098319 0.625994449 1.590873021
x3 0.670682731 0.370872173 1.808393242 0.144817589 -0.359023498 1.70038896

Was stimmt nun daran nicht? Die Koeffizienten sind doch nicht alle 1?

Vielen Dank, Marco
ocrammarco
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Di 29. Jan 2013, 14:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Auswertung eines Fragebogens

Beitragvon daniel » Mi 30. Jan 2013, 15:07

Die Gewichte sind empirisch in diesem Fall nicht 1, aber inhaltllich schlicht unsinnig. Du sagst der Software

1. Berechne mir eine neue Variable nach dem Modell neu = b1 * x1 + b2* x2 + b3 * x3, wobei b1 = b2 = b3 = 1.
2. Jetzt rate mal, was ich für b gesetzt habe?

Du kennst das "wahre" Modell. Da die Werte im Summenscore deterministisch sind, aber auf unterschiedliche Weise zustande kommen (z.b. 4 = 1+ 1+ 2 = 0 + 1 + 3), bekommst Du Artefarkte angezeigt. Die "wahren" b sind alle 1, da gibt es nichts zu schätzen. Du erhällst eben dieses Ergebniss, indem Du Dir drei normalverteile Variablen erzeugst, deren Summe berechnest und diese wieder auf die Bestandteile regressierest. Dein Ergebnis ist das Resultat einer geringen Anzahl distinkter Werte der (wie angenommen: metrischen) Variablen in der Stichprobe, die zur Bildung des Scores herangezogen werden.

Die Verwirrgun geht zum Großteil auf meine ungenügend explizit gemachte Trennung zwischen empirisch im Einzelfall vorliegender Stichprobe und theoretischem Hintergrund zurück. Sorry dafür.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Auswertung eines Fragebogens

Beitragvon ocrammarco » Mi 30. Jan 2013, 16:50

Hallo Ponderstibbons

Vorher oder parallel schaust Du Dir noch die Interkorrelationen der 15 Komponenten
an, alles mit rho > 0.8 ist redundant (auch wieder was zum Präsentieren).


Das heisst, wenn ich zwei Items haben, die rho > 0.8 haben, kann ich ein Item weglassen, oder?

Eine multiple Regression (selbst wenn durchführbar) mit 15 Variablen wird im Ergebnis
a) vermutlich von vornherein sehr schwer interpretierbar sein und b) auf die fehlenden
93% nur sehr fraglich übertragbar.


Ok, aber kann ich dann, wenn ich nur Korrelationen der 15 Items mit der "Gesamtzufriedenheit" berechne, auf die "fehlenden 93%" Schliessen. Ich meine: Falls ich keine Zufallsstichprobe habe, kann ich dann statistisch überhaupt noch etwas machen?

Ich vesuche im Moment, dein Vorschlag im R umzusetzen.. Geht voran, wenn auch sehr langsam..

Grüsse Marco
ocrammarco
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Di 29. Jan 2013, 14:59
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Auswertung eines Fragebogens

Beitragvon PonderStibbons » Mi 30. Jan 2013, 17:18

Die Koeffizienten einer Regression mit 15 interkorrelierten Prädiktoren bei
nur 280 Fällen werden sehr stichprobensensibel und schwer übertragbar sein,
deswegen war ich für den robusteren Weg.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

VorherigeNächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron