Hallo,
ich habe eine Frage zur Alpha-Fehler-Kumulierung, zu der es ja dann kommt, wenn an einer Stichprobe mehrere Tests durchgeführt werden.
Folgendes Beispiel:
Insgesamt werden 1000 Datensätze erhoben; es gibt drei Variablen: Variable A (zwei Merkmalsausprägungen: A1 und A2), Variable B (drei Merkmalsausprägungen: B1, B2 und B3) und Variable C (drei Merkmalausprägungen: C1, C2 und C3).
Für Variable A zeigt sich folgende Verteilung:
A1 = 700
A2 = 300
Es ist nun relevant, wie für A1 und wie für A2 die Variable B aussieht:
für A1 (insgesamt 700):
B1 = 250
B2 = 300
B3 = 150
für A2 (insgesamt 300):
B1 = 50
B2 = 50
B3 = 200
Hier könnte ja nun durch einen Chi-Square-Test auf statistische Signifikanz betreffend der Unterschiede in den B-Ausprägungen getestet werden.
---
Es werden nun die Ergebnisse für B überprüft, im Hinblick auf C (insgesamt 1000):
Für B1 (insgesamt 300)
C1: 100
C2: 150
C3: 50
für B2 (insgesamt 350)
C1: 50
C2: 50
C3: 250
für B3 (insgesamt 350)
C1: 25
C2: 125
C3: 200
Meine Frage ist nun Folgende: Wenn ich nun vergleiche, ob die unterschiedliche Verteilung von C1, C2 und C3 (hinsichtlich B1 vs. B2) statistisch signifikant ist, ist das nun ein Fall, wo es zur Alpha-Fehler-Kumulierung kommt, weil ich vorher bereits einen Test für A1 und A2 gemacht habe? Ich habe etwas Probleme mit dem Begriff der Stichprobe/Grundgesamtheit; ist die Stichprobe immer noch die selbe (eben die 1000 von Anfang), oder ist es hier praktisch eine andere, weil sich die zweite Auswertung ja nur die die B1 und B2 Fälle bezieht ?