Hallo zusammen,
ich sitze aktuell an meiner Masterarbeit und werte eine Umfrage mit geringer Stichprobe (N zwischen 7 und 9 pro Professionalisierungsgruppe) aus und habe einige Fragen. Da ich in diesem Forum bereits viele engagierte und hilfsbereite Beiträge gelesen habe, dachte ich, ich versuche mal mein Glück.
Kontext zum Verständnis meiner Daten: Ziel meiner Umfrage ist es vor allem, wahrgenommene und bewertete Relevanz von Nachhaltigkeit in drei verschiedenen Professionalisierungsgruppen (G1, G2, G3) zu untersuchen. Hauptteil meiner Umfrage besteht daher aus circa 20 Items, welche die bewertete Relevanz von Bereichen der Nachhaltigkeit (z.B. Ressourcennutzung) auf einer Skala von 1 (gar nicht relevant) bis 6 (sehr relevant) abfragen (keine neutrale Antwort, stattdessen "keine Antwort"-Option). Grundlegend wären diese Items meinem Verständnis nach also likert-skalierte Items, ist das korrekt?
Die bewertete Relevanz der Bereiche ist, wie zu erwarten, laut Kolmogorov für die meisten Bereiche nicht normalverteilt. Bei einem Bereich wird die Nullhypothese der Normalverteilung beibehalten (Sig = 0,181), jedoch würde ich auf Grundlage des Konstrukts in diesem Fall dennoch gegen eine Normalverteilung sprechen. Dies führt zu meiner zweiten Frage: Ist diese Argumentation schlüssig oder müsste ich dennoch von einer Normalverteilung in einem von ~20 Bereichen ausgehen?
Meine Ausführung bezüglich Cronbachs Alpha würden denke ich den Rahmen sprengen, ich denke, dass ich da aber gut mit meinen Betreuer*innen drüber sprechen kann bzgl. der inneren Konsistenz.
Jetzt habe ich über den Exakten Test nach Fisher erstmal nach Abhängigkeiten zwischen den Professionalisierungsgruppen geguckt und in ein paar wenigen Items diese auch gefunden. Mittels Mann-Whitney-U-Test habe ich dann geguckt, in wie fern diese Unterschiede paarweise signifikant sind und diese auch größtenteils signifikant (Teils nur asymp. mit geringer Stichprobe, also auch diskussionswürdig je nach Literatur) nachweisen können. Sind diese Testverfahren mit meinen obigen Annahmen die korrekten gewesen?
Bis hier hin bin ich mir eigentlich relativ sicher mit meinem Vorgehen (obgleich ich gerne, soweit möglich, Bestätigung hätte natürlich). Nun bin ich aber an einem Punkt, an dem ich methodisch zwei Sachen bisher nicht (zumindest mit SPSS) umsetzen kann:
1.) Ich habe mir die Mittelwerte aller Bereiche einzeln angeguckt und den Gesamtmittelwert aller ~20 Bereiche über alle Probanden. Ein Bereich liegt hierbei mit dem Mittelwert außerhalb des 95%igen Konfidenzintervalls um den allgemeinen Mittelwert. Bedeutet in Zahlen grob: Ich habe den allgemeinen Mittelwert bei circa 5 mit einer Standardabweichung von ~0,6 und der Mittelwert für einen Bereich liegt bei circa 3.8. Folgerung für mich wäre hierbei, dass dieser Mittelwert und somit die bewertete Relevanz dieses Bereiches signifikant vom allgemeinen Mittelwert und somit von der allgemein bewerteten Relevanz aller Bereiche abweicht, was zudem passend für eine meiner Hypothesen wäre. Hier bin ich mir jedoch recht unsicher jetzt: Kann ich so mit likert-skalierten Items umgehen (Stichpunkt: Ordinalskala mit Median vs. Mittelwert)? Gibt es eine Möglichkeit diese händische Variante mit einem SPSS Befehl zu überprüfen? Alles, was ich online finde, bezieht sich meistens auf einen Mittelwertvergleich unter Betrachtung einer Gruppierungsvariable (also suche ich quasi einen Mann-Whitney-U-Test ohne Gruppierung glaube ich, vermutlich irgendeine Kreuztabelle und ich stehe mega auf dem Schlauch...).
Jetzt sehe ich zudem viele potentielle Möglichkeiten, likert-skalierte Items über die Summe intervallskaliert zu nutzen. Wofür wäre das zum Beispiel gut?
2.) Habe ich in meiner Umfrage ein Ranking von verschiedenen Möglichkeiten durchführen lassen, Nachhaltigkeitsthemen stärker einzubinden. Datenoutput sind dementsprechend 10 Variablen (Rank 1 bis Rank 10), wobei jeder Proband einzelne Antwortmöglichkeiten (A1 bis A10) zugeordnet hat und eben die "beste" Möglichkeit, z.B. A5 bei der Variable Rank 1 eingetragen hat und so weiter. Wie könnte ich diese Daten transformieren, um sie vergleichbar zu machen? Müsste ich für jede Antwortmöglichkeit eine Variable konstruieren, die den jeweiligen (invertierten) Rank der Probanden beinhaltet, über welche ich dann Mittelwerte bilden und vergleichen könnte? Und wenn ja, gibt es dafür einen "schnellen" Weg mit SPSS oder muss ich das für jede Antwortmöglichkeit separat durchführen?
Okay ich glaube vorerst wären das alle Fragen, die mir so im Kopf rumschwirren. Verzeiht, wenn einzelne meiner Fragen für die erfahrenen Statistiker unter euch "dumm" sind, ich habe zwar einen mathematischen Hintergrund, bin jedoch eher stochastisch als statistisch ausgebildet worden.
PS: Die explorative Faktorenanalyse lief eher so geht so, wer da also Tipps und Tricks hat gerne her damit - das nur am Rande.