Hallo,
ich habe eine kurze Frage und würde mich freuen, wenn mir jemand einen Tipp geben könnte. Ich poste mal hier in "Allgemein" da ich nicht sicher bin, ob das von mir verwendete Verfahren überhaupt passend ist.
Meine Statistik-Vorlesungen sind schon einige Zeit her und nun stehe ich vor einem kleinen Problem:
Im Rahmen einer Arbeit habe ich 4 relativ simple Werte ermittelt. Leider habe ich nun beim berechnen der Signifikanz so meine Schwierigkeiten und ich hänge fest.
Vereinfacht sieht das ganze so aus:
Bundesweit wurden 250.000 Leuten eine Frage gestellt. Davon antworteten 225.000 mit NEIN und 25.000 mit JA.
Aus diesem großen Datenbestand wurden nun die Leute extrahiert, welche die Frage nur in der Region Freiburg beantwortet haben:
Regional in Stuttgart waren es 3.000 befragte, davon antworteten 2.715 mit NEIN und 285 mit JA.
Zusammengefasst:
Bundesweit alle -> 250.000 befragt -> 225.000 NEIN -> 25.000 JA
regional Stuttgart -> 3.000 befragt -> 2.715 NEIN -> 285 JA
Im ersten Fall sagen also 10% der befragten JA und im zweiten Fall 9,5%.
Um nun herrauszustellen, dass es kein signifikanter Unterschied ist, habe ich den Chi-Quadrat-Test durchgeführt. Das Signifikanzniveau ist, wie ich schon vermutet hatte nur bei 82%, also ist in diesem Fall der Unterschied für mich nicht signifikant. Da wähnte ich mich noch in Sicherheit
Jetzt kam mir aber ein Gedanke, der mich aus der Bahn geworfen hat -> Die "regional Stuttgart" Befragten sind mit Ihren Antworten ja auch in dem bundesweiten Daten mit enthalten, darf ich dann überhaupt einen chi-quadrat Test machen? Oder verfälscht das das ganze Vorhaben?
Ich habe nun lange gegoogelt und vergleichbare Beispiele gesucht, konnte aber leider nichts finden und würde mich daher sehr freuen, wenn mir jemand einen Wink in die richtige Richtung geben könnte!
Viele Grüße,
Peter