folgendes Problem liegt mir bei der Überprüfung eines Datensatz auf Normalverteilung (in SPSS) vor
Wozu willst Du das überprüfen? Normalverteilung von Daten, besser gesagt von
Variablen, ist für kein gängiges statistisches Verfahren die Voraussetzung,
außer bei dem Signifikanztest der Pearson-Korrelation. Bei kleinen Stichproben
(n < 30) kann es sein, dass die Verteilung der Vorhersagefehler (Residuen) für den
Signifikanztest von Belang ist. Notabene die Verteilung in der Grundgesamtheit,
nicht in der Stichprobe.
Die Tests (Kolmogorov-Smirnow - und Shapiro-Wilk-Test) zeigen mir, dass die Daten keine Normalverteilung folgen.
Nein, die zeigen Dir, dass die Stichprobendaten aus einer Grundgesamtheit stammen,
die nicht normalverteilt ist.
Allerdings kann man z.B. beim Q-Q-Diagramm erkennen, dass die meisten Punkten nahezu der Gerade (erwartete Normalgerade) folgen, weshalb man auf Normalverteilung schließen kann.
Erstens ist das eine Beschreibung der Stichprobendaten, nicht der Grundgesamtheit
(und um die geht es wie gesagt bei Normalverteilungsbetrachtungen). Zweitens folgen
Deine Stichprobendaten offenbar ebenfalls nicht exakt der Normalverteilung.
Wenn die Stichprobe groß ist, dann wird ohne weiteres die Hypothese "diese
Stichproben-Werte (Stichproben-Residuen) stammen aus einer Grundgesamtheit,
deren Verteilung von der Normalverteilung um 0,00000000000 abweicht" verworfen,
weil es in den meisten Wissenschaften vermutlich nichts gibt, das exakt normalverteilt
ist, so dass es lediglich eine Frage der Stichprobengröße ist, bis das zuverlässig sichtbar
wird. Da spielt es auch keine Rolle, ob diese Abweichung groß/wesentlich/wichtig sein
könnte, sondern nur, ob eine Abweichung um mehr als 0,00000 vorliegen könnte. Wenn
die Stichprobe dagegen klein ist, wird die Normalverteilungs-Hypothese in der Regel
nicht verworfen, aber nur mangels ausreichender statistischer power des Signifikanztests
bei zu kleinen Stichproben. Letztlich sind diese Tests sinnlos.
Mit freundlichen