Hallo zusammen,
ich bin neu hier und hoffe, dass ihr mich bei der Auswertung meiner Daten im Rahmen meiner derzeit in Bearbeitung befindlichen Bachelorarbeit (ca. 20 Seiten Methodenteil) voranbringen könnt. 8)
Was ich erreiche möchte / Was mein Ziel ist:
Meine Hypothesen zielen darauf ab, herauszufinden inwieweit Informationsüberflutung (UV) und Burnout (AV) allgemein (ohne die Einflüsse von Alter, Geschlecht etc.) zusammenhängen, und welchen Einfluss die Resilienz, als persönliche schützende Ressourcen, auf diesen Zusammenhang als Moderator ausübt; ggf. auch, ob abgesehen von dieser Moderation ein Zusammenhang ziwschen den genannten Variablen und der Resilienz besteht. Dazu stehen mir die Daten zweier Erhebungen zur Verfügung:
Erhebung 1: wurde von meiner Betreuerin durchgeführt (welche mir freundlicherweise ihre Daten bereitgestellt hat) und soll für eine erste Prüfung eines Zusammenhangs von Informationsüberflutung und Burnout herhalten (die Resilienz ist hier noch nicht drin!)
Erhebung 2: Wurde von mir selbst durchgeführt und bringt neben den zwei anderen Faktoren noch die Resilienz mit ein
Folgende Instrumente habe ich eingesetzt:
Instrument 1: Das Maslach Burnout Inventory (MBI; nach Maslach, 1981) = skaliert von 0 bis 5
Instrument 2: Die Perceived Information Overload Scale (PIOS; nach Misra & Stokols, 2012) = skaliert von 0 bis 4
Instrument 3: Die Resilienzskala 11 (RS-11; nach Schumacher et al., 2005) = skaliert von 1 bis 7
Was ich bislang gemacht habe:
1. Ich habe ich in jeder der beiden Erhebungen und für jedes Instrument eine neue Variable mit den Itemmittelwerten pro Fall berechnet. Meine Betreuerin schlug mir dieses Vorgehen über die Mittelwerte vor um die Werte besser miteinander vergleichen zu können.
2. Bisherige Auswertung - Allgemein für Erhebung 1 & 2
Allgemein: Berechnung von Häufigkeiten (z.B. wie viele Männer und Frauen) für die Beschreibung der Stichprobenzusammensetzung
Für die zusammengefassten Variablen in beiden Erhebungen: Allgemeine Lage und Streuungsmaße (Varianz, Mittelwerte, Standardabweichungen etc., Boxplotdiagramme zur Identifkation von Ausreißern, Histogramme und Kolmogorvo Smirnov (KS) Test zur Überprüfung der Normalverteilung (dazu unten mehr, 3. / 4.), Berechnung von Steilheit/Schiefe und Kurtosis, Streudiagramme zur groben Bestimmung der interessierenden Zusammenhänge (die vorhanden sind, die Werte verteilen sich in einem Korridor von links unten nach rechts oben; positive Korr.). Bis hierhin also alles gut.
3. Weitere Auswertung - Erhebung 1
Für die Erhebung stehen nach allen Bereinigungen noch n=216 verwertbare Datensätze zur verfügung; die Burnout-Variable ist graphisch wie rechnerisch (KS) normalverteilt, die Variable für Informationsüberflutung ist streng genommen nicht normalverteilt (etwas wüste, aber noch vertretbare graphische Aufteilung; Notwendiger Wert im KS Test knapp verpasst) wird aber dennoch im großen und ganzen als normalverteilt betrachtet, da 216 Datensätze auch eine ganze Menge ist (Stichwort: Grenzwertsatz). Entsprechend wurde mit den beiden Variablen eine Korrelation nach Pearson berechnet (zur Sicherheit auch nochmal Spearman).
4. Weitere Auswertung - Erhebung 2 und für Studie 2 kann ich n=169 Datensätze heranziehen.
Für die Erhebung stehen nach allen Bereinigungen noch n=169 verwertbare Datensätze zur verfügung; PROBLEM: Keine der interessierenden Variablen ist normalverteilt, weder rechnerisch nach dem KS Test noch grafisch (würde ich mich selbst nicht mehr mit wohlfühlen, das als normalverteilt zu deklarieren... ); dennoch habe ich vorerst wie gehabt Pearson und Spearman Korrelation berechnet...
Die Folgenden Fragen habe ich nun:
A. Das Problem den nicht normalverteilten Variablen in Erhebung kumuliert sich: Wie soll ich ein Moderatormodell, was ja auf die lineare Regression fußt, erstellen ohne eine der wichtigsten Grundvoraussetzungen dafür (die Normalverteilung zu erfüllen)? Wie transformiere ich meine Daten am sinnvollsten um oder was kann ich tun, wenn das auch nichts hilft? Oder brauche ich keine Normalverteilung, weil ich mit der Anzahl von 169 Datensätzen argumentieren kann (Stichwort: Grenzwertsatz)?
B. Ist eine jeweilige Standardisierung dieser drei neuen Variablen aufgrund unterschiedlicher Skalierungen (MBI = 0-5 / PIOS = 0-6 / RS-11 = 1-7) erforderlich? (m.E. nein, da ja unterschiedliche Konstrukte gemessen werden und weil bei allen drei Fragebögen hohe Werte für eine hohe Merkmalsausprägungen stehen; bevor ich weitermache und alles für die Katz ist )
B. Wie genau kann ich das (Nicht-)Vorliegen von Varianzhomogenität grafisch an einem Streudiagramm erkennen/interpretieren - so eines zu erstellen ist ja an sich kein Problem? Gibt es hierzu online eine Übersicht und ein paar Beispiele oder eine gute Quelle? Ist ja auch eine wichtige Voraussetzung für die Regression etc.
C. Ist mein Vorgehen allgemein schlüssig und logisch? Habe ich irgendwas vergessen? Hab irgendwie ein ganz mieses Gefühl...
Mich interessiert, wie gesagt, jeweils nur das große Ganze, d.h. ich will keine Gruppen (z.B. Alter, Beruf, Geschlecht) vergleichen oder deren jeweilige Unterschiede berichten sondern global und banal in der Auswertung vorgehen. Andererseits scheint es, dass viele Verfahren eben erst durch den Vergleich einzelner Gruppen einer Stichprobe möglich werden, z.B. der t-Test - der aber in Anbetracht meiner Vorgehensweise als nicht relevant erscheint...
Falls ihr zudem valide Quellen zu den jeweiligen Antworten kennt wäre das bombastisch!
Vielen Dank im Voraus für eure Hilfe, ich habe schon so viele Quellen angezapft, dass ich den Statistik-Wald vor lauter Bäumen nicht mehr sehe...
Liebe Grüße
der DoofeDunkleZwerg