Hallo zusammen,
ich lese gerade eine englischsprachige Studie (diese erläutere ich nicht näher, da deren Inhalt für das Verständnis und meine Frage nicht relevant ist). Leider sind bei dieser Studie die erhobenen Daten nicht angehängt worden, sodass man Berechnungen nicht eigenständig nachvollziehen kann. Ebenso geht diese Studie leider auch nicht im Text näher auf die deskriptive Statistik ein, sondern erst auf die Inferenzstatistik, dennoch werden in einem Table sämtliche Daten rund Mean, Std Error Mean und SD kommentarlos ausgeworfen (vermutlich eine Ergebniskopie aus einem Statistikprogramm). Ich wollte nun gerne abschätzen, ob die Angabe zweier Mittelwerte der Stichprobe unter Berücksichtigung der SD (es geht um eine Messwiederholung bei denselben Probanden) für die Grundgesamtheit repräsentativ ist.
Die Werte sind wie folgt:
time 1: Mean: 4.92, SD: 1.22
time 2: Mean: 4.79, SD: 1.22
Zunächst einmal kam mir die Streuung sehr groß vor, da bei Befragung der Probanden eine Rating- bzw. Likert-Skala benutzt wurde mit den Antwortmöglichkeiten 1-7.
Da ich aber nicht weiß, ob ich damit richtig liege, die SD im Verhältnis zur verwendeten Skala bzw. Maßeinheit so zu bewerten (Frage 1: oder kann ich das so tun?), fiel mir ein, dass ja zumindest bei normalverteilten Daten die Faustregel gilt, dass 68% der Daten im Bereich -1 SD bis + 1 SD liegen und 95% aller Werte im Bereich -2 SD bis + 2 SD. Das würde hier dann ja bedeuten, dass z.B. für Messung 1 gilt, 4.92 -/+ 1.22 = 68% der Daten liegen im Bereich 3.7 bis 6.14, sodass man argumentieren könnte, dass die Streuung doch insgesamt viel zu groß ist
Frage 2: Ist eine solche Schlussfolgerung an sich richtig? Oder wie gelingt es mir alternativ, die Größe einer Streuung gemessen an der verwendeten Skala und dem angegebenen Mittelwert zu bewerten?
Frage 3: Dabei ist mir aufgefallen, dass bei diesen Daten 2 SD schon außerhalb der möglichen maximalen Antwort liegen, da es ja nur eine 7-stufige Likertskala ist: 4.92 + ( 2 x 1.22) = 7.36. Kann ich daher für diese Daten daraus schließen, dass es sich nicht um normalverteilte Daten handelt (z.B. weil Ausreißer die Verteilung schief werden lassen), weil ja die Faustregel (68% der Daten befinden sich im Bereich -1 bis + 1 SD und 95% der Daten im Bereich -2 SD bis + 2 SD) eine Normalverteilung voraussetzt? Da in der Studie wie gesagt keinerlei Daten zur Berechnung beigefügt sind, könnte ich so zumindest etwas über die Verteilung aussagen.
Ist ein bisschen langatmig erklärt, hoffe, ich konnte meine Fragen verständlich rüber bringen.