Hallo liebe Helfer,
ich schreibe gerade an meiner Masterarbeit und stecke bei der Auswertung der Daten fest. Vielleicht kann mir jemand helfen?
Um eine Theorie zu testen habe ich eine Mobilitätserhebung durchgeführt (N=122). Hier habe ich für verschiedene Verhaltensweisen (insgesamt 3 (Fuß, Rad, ÖPNV)) die tatsächliche Zeit an 7 Tagen gemessen und mit einem Fragebogen interne und externe Variablen erfasst. Nun wollte ich mit einer Regression die Theorie bzw. die Vorhersagekraft auf eine bestimmte Verhaltensweise überprüfen. Nachfolgend liste ich meine Vorgehensweise auf.
AV - durchschnittliche Minuten am Tag für die Verhaltensweise (Gehen, Radfahren, ÖPNV)
UV - direkte Determinanten der Theorie auf das Verhalten + Störvariablen
1. Die AV's sind metrisch und die UV's sind dichotom und metrisch. Deshalb habe ich mich für eine multivariate lineare Regression entschieden. Also für jedes Verhalten eine Regression.
2. Da jedoch die Verhaltensweisen von anderen Variablen (Störvariablen) nach der Literatur determiniert werden, habe ich mich für die hierarchische multivariate lineare Regression entschieden. 1 Schritt: Störvariablen 2. Schritt: Störvariablen + direkten Determinanten der Theorie auf das Verhalten.
3.Die Auswertung des zu Fuß Gehens hat auch gut funktioniert. Alle Voraussetzungen sind erfüllt. Bei den beiden Anderen Rad und ÖPNV, sind die Daten etwas eingeschränkt. Hier ist das Problem, dass nicht alle Probanden diese Verkehrsmittel benutzten. D.h. ich habe beim Rad 59 Probanden mit 0 Minuten und beim ÖPNV 74 Probanden mit 0 Minuten. Weshalb die AV-Rad und AV-ÖPNV nicht normalverteilt sind.
AV-Rad
4.Wenn ich also die gleiche Vorgehensweise auswähle wie beim zu Fuß gehen, habe ich bei der AV Rad direkt in der ANOVA-Tabelle im ersten Schritt keine Signifikanz und im zweiten Schritt schon. Außerdem haben die Daten nach der Graphik keine Homoskedastizität. Zumindest nehme ich das an, weil die Punkte nicht gleich verteilt sind und es ist zusätzlich quasi eine dunkle Punkte-Linie zu erkennen. Die Residuen sind annährend normalverteilt. (1AV und 11 UV's)
5. Wenn ich die Anzahl der unabhängigen Variablen auf 6 reduziere werden in der ANOVA-Tabelle beide Schritte signifikant. Fehlende Homoskedastizität bleibt jedoch.
6. Wenn ich nur die Probanden anschaue die tatsächlich auch Rad gefahren sind (N=63) entsteht bei der Prüfung auf Homoskedastizität ein Muster, dass ich nicht eindeutig beurteilen kann. Vor Allem, wenn es möglich ist würde ich schon gerne die anderen Probanden mit 0 Minuten einschließen.
AV-ÖPNV
7. Hier sind beide Schritte in der ANOVA signifikant. Jedoch zeigt hier die Graphik eine Art zwei Klumpen an (horizontal oben und unten). Der Klumpen oben sieht annährend nach Homoskedastizität aus der unten hat wieder eine Art Punkt-Linie drin.
8. Wenn ich hier nur die Probanden anschaue die tatsächlich auch ÖPNV gefahren sind (N=48) entsteht bei der Prüfung auf Homoskedastizität ein Muster, dass ich nicht eindeutig beurteilen kann. Die Punkte rechts sind dichter (mehr Pkt als links). Vor Allem, wenn es möglich ist würde ich schon gerne die anderen Probanden mit 0 Minuten einschließen.
weitere Theorieüberprüfung
Um die Theorie weiter zu überprüfen, weil es Determinanten gibt, die nicht direkt das Verhalten beeinflussen, muss ich weitere Regressionen durchführen. Hier ist die abhängige Variable eine mit dem Fragebogen erfragte latente singel Variable (unipolare Likert-Skala 1-5). Unabhängige Variablen sind: Störvariablen + weitere Determinanten der Theorie.
9. Man hat mir gesagt, dass man in den Sozialwissenschaften Likert-Skalen als metrisch ansehen darf. Gilt es auch für Ein-Item-Variablen?
10. Wenn ich hier gleich vorgehe wie in Pkt. 1 und 2 , klappt es super (Angenommen, man darf diese Variable als metrische bezeichnen). Allerdings kann mir niemand sagen, ob das Muster homoskedastisch ist oder nicht. Es sieht so aus: fünf schräge Linien von links oben nach rechts unten. Wenn man es wie eine Art Rechteck anschaut, würde ich sagen, es ist ok. Leider habe ich davon keine Ahnung und keine Erfahrung damit. Deshalb kann ich es nicht beurteilen.
11. Wenn die Annahme in 10 nicht korrekt ist, welches Regressionsmodell müsste ich dann anwenden?
Sonstiges
Gibt es in SPSS Test für die Berechnung der Homoskedastizität?
Wie kann man sich sicher sein, dass es es Homoskedastizität ist oder nicht? Gibt es konkrete feste Regeln?
So nun meine Fragen bzw. mein Anliegen an euch Lieben.
Es wäre echt so lieb von euch, wenn ihr mir sagen könnt inwiefern ich richtig oder falsch mit meiner Vorgehensweise liege. Aufgrund der Derzeit vorliegenden Unsicherheit - was ist richtig, was ist falsch - und dem Zeitdruck, würde es mich echt weiterbringen.
Für eure Mühe bereits an dieser Stelle 1000 Dank und liebe Grüße