Hallo liebe Forengemeinde,
ich habe eine Frage die mich umtreibt und zu der ich leider bislang keine geeignete Antwort gefunden habe. Ich komme in der Hoffnung, dass mich ggf. jmd auf den richtigen Weg führen kann
Zunächst kurz zum Kontext:
Ich analysiere derzeit im Rahmen meiner Abschlussarbeit Angebots- und Transaktionspreise von Wohnimmobilien. Ich habe einen Datensatz erhoben (n=1476) der den prozentualen Abschlag - also der Abschlag von X% der beim Kauf gewährt wird - mit anderen beschreibenden Variablen wie Wohnfläche, Jahr der Transaktion, Stadtbezirk der Transaktion usw. verknüpft.
Meine Forschungshypothesen sind neben anderen:
a) Der Transaktionsabschlag unterscheidet sich in den Stadtbezirken signifikant
b) Der Transaktionsabschlag unterscheidet sich zwischen den Transaktionsjahren signifikant (hat sich verringert; bspw. infolge gestiegenem Nachfragedruck)
Nun habe ich zunächst eine multiple ANOVA ins Auge gefasst, um die Unterschiede zwischen den Faktorstufen zu beleuchten. Die Voraussetzung der Varianzhomogenität habe ich über den Levene-Test für beide Kategorien überprüft (p=0,064 & p=0,084), weshalb ich von Varianzhomogenität ausgehe. Darüber hinaus habe ich die Normalverteilung der Residuen über Kolmogorov-Smirnov und Shapiro-Wilk getestet, die auf keine Normalverteilung der Daten schließen lassen. Das Ergebnis habe ich über einen Q-Q-Plot überprüft. Auch hier würde mein (unerfahrendes) Auge von keiner Normalverteilung ausgehen, da insbesondere an den Rändern starke Abweichungen zu sehen sind, zusätzlich auch eine kurvige Verteilung im Trendbereinigten Q-Q-Plot mit recht bedeutsamen Abweichungen. Auch wenn sich die ANOVA wohl Stellenweise robust gegen Abweichungen von der Normalverteilungsannahme zeigt habe ich mich, aufgrund zusätzlich verschieden großer Stichprobengrößen innerhalb der Faktorstufen, für das Abstellten auf ein nichtparametrisches Testverfahren entschieden (hier: Kruskal-Wallis-Test). Entsprechend meiner Recherche habe ich hierbei keine Voraussetzungen und der Test ist auch robust gegen die Abweichenden Gruppenstärken meiner Stichprobe.
Insofern stütze ich mich derzeit im Zuge der Überprüfung meiner Hypothesen (a) und (b) jeweils auf die Ergebnisse des Kruskal-Wallis-Tests. In beiden Fällen wird der Test nicht signifikant (Asymptotische Signifikanzen =0,149 & =0,534).
Meine Fragestellung ist dementsprechend, gibt es etwas auszusetzen an meinem Vorgehen?
Insbesondere bei der Anwendung des t-Tests zur Überprüfung von Unterschiede wird auf die ANOVA verwiesen, da hierbei keine Adjustierung des Signifikanzniveaus nötig wird. Auch bei der "mehrfachen" Anwendung der einfaktoriellen ANOVA erschaffe ich "weniger relevante" Aussagen, wie eine multiple ANOVA. Deshalb Frage ich mich, ob das Abarbeiten meiner beiden Forschungsfragen mithilfe meiner gewählten Methodik adäquat abgebildet ist.
Auf die Unterstützung meines Betreuers kann ich im vorliegenden Fall nicht bauen (nicht mein Professor), da er nach eigener Aussage selbst keine verbindlichen Aussagen zur Methodik treffen kann.
Insofern, ggf. hat der Eine oder Andere eine Anregung für mich.
Bis dahin, einen schönen Sonntag Abend
Grüße.
P.S. Bei Bedarf kann ich natürlich alles noch konkretisieren.