Hallo,
ich möchte eine Kundenzufriedenheitsbefragung auswerten, bin im Bereich der Statistik eher ein Neuling und würde gerne von Euch Feedback bekommen.
Ich habe eine Kundenzufriedenheitsbefragung vorgenommen, bei der einerseits die Gesamtzufriedenheit sowie auch einige Attribute, die die Gesamtzufriedenheit beeinflussen, auf einer fünfstufigen Likert-Skala abgefragt wurden.
Mein Anliegen ist nun neben einer rein deskriptiven Beschreibung der Daten auch explorativ vorzugehen.
Dabei hatte ich in der Literatur ein interessantes Verfahren entdeckt, das versucht die Wichtigkeit der Attribute zu identifizieren, wenn die Gesamtzufriedenheit hoch bzw. wenn die Gesamtzufriedenheit niedrig ist.
Das erste Verfahren ist im Prinzip eine multiple lineare Regression und wird als Penalty-Reward-Contrast-Analysis bezeichnet. Die Attribute (fünfstufig skaliert) werden in Dummyvariablen zerlegt. Dabei entstehen für jedes Attribut 2 Dummyvariablen.
Beispiel:
Dummyvariable für positive Wahrnehmung wird codiert:
• Werte 4-5 -- > 1
• Werte 1-3 -- > 0
Dummyvariable für negative Wahrnehmung wird codiert:
• Werte 1-2 -- > 1
• Werte 3-5 -- > 0
Anschließend wird mit den Dummyvariablen eine multiple lineare Regression auf die Gesamtzufriedenheit durchgeführt. Die Regressoren sollen dann den Einfluss des Attributs auf die Gesamtzufriedenheit bei positiver und negativer Wahrnehmung darstellen.
Das Problem ist jetzt jedoch, dass die Regression nicht vernünftig ausgeführt werden kann, da leider für einige Dummy-Variablen die Varianzen 0 sind bzw. die Variablen aus mir unerklärlichen Gründen rausgeschmissen werden.
Da ich jedoch trotzdem irgendwie gerne eine Aussage über die Wichtigkeit der einzelnen Attribute in Bezug auf die Gesamtzufriedenheit machen möchte, habe ich es mit einer „einfachen“ multiplen linearen Regression versucht. D.h. die Attribute und die Gesamtzufriedenheit genommen und in SPSS mittels Regression ausgeben lassen. Das Problem ist jedoch, dass obwohl jedes der Attribute mit der Gesamtzufriedenheit korreliert ist (teils deutlich), einige Regressionskoeffizienten ein negatives Vorzeichen haben und damit für meinen Zweck nicht vernünftig interpretierbar sind. Mir geht es ja gerade den Einfluss der Attribute festzustellen und nicht die Gesamtzufriedenheit vorherzusagen.
Dieses Problem scheint mir auf das Problem der Multikollinearität zurückzuführen zu sein, da die Variablen teils deutlich untereinander korreliert sind.
Da ich jedoch gerne irgendwie Hypothesen bzw. Handlungsempfehlungen aus den Daten ableiten möchte, habe ich nun die einfache Korrelation zwischen Attribut und Gesamtzufriedenheit berechnet. Dies funktioniert auch gut, jedoch lasse ich dabei jegliche Korrelation der Attribute untereinander außer Acht!
Ich würde daher gerne von Euch wissen, ob dies eine „halbwegs“ vernünftige Herangehensweise an die explorative Datenanalyse ist bzw. was Ihr dabei als Probleme seht. Glaubt Ihr mit einer einfachen Korrelationen von Attributen und Gesamtzufriedenheit, bei der ich die Korrelationen der Attribute untereinander außer Acht lasse, erhalte ich trotzdem vernünftig interpretierbare Ergebnisse?
Vielleicht gibt es ja auch alternative Herangehensweisen.
Ich bin für jeden Hinweis dankbar. In meiner Arbeit würde ich nämlich ungern falsche bzw. unsinnige Interpretationen vornehmen. Davon gibt’s ja bereits genügend im Internet.
Vielen Dank
Thomas