Hallo Kara,
wenn man sich die "Ausgezeichnet" und "Gut"-Werte anschaut, dann divergieren deren Anteile in der Originalstudie erheblich und sind quasi gleich in Deiner Erhebung. Damit ist quasi ein Augenscheinbeweis erbracht, der eigentlich keines p-Wertes mehr bedarf. Du darfst getrost von Unterschiedlichkeit ausgehen.
Unabhängig davon kann es sein, dass Du für Deine Prüfer beweisen musst, dass Du statistisch testen kannst oder es kann sein, dass irgendein Reviewer nicht versteht, dass Wissenschaftlichkeit nicht dasselbe ist wie das Vorliegen eines p-Wertes.
In Der Originalstudie beträgt der Anteil der "schlechten" 100 von 7420, also etwa 1,3 Prozent. Du hast 207 Menschen befragt, würdest also 2,8 Menschen in der Kategorie "schlecht" erwarten. Das ist sehr wenig und deshalb sind Näherungsverfahren wie der klassische Chiquadrat-Unabhängigkeitstests mit der Chiquadratverteilung hier unzuverlässig.
Eine Alternative könnte darin bestehen, auf die Approximation an die Chiquadratverteilung zu verzichten und stattdessen mit einem Monte-Carlo-Verfahren eine Verteilung für Deine Zahlen zu erwürfeln.
Ich weiß nicht, welches Statistikprogramm Du nutzt und wie man das dort macht. Wenn Du R benutzt, könntest Du das so machen:
- Code: Alles auswählen
kara <- matrix(c(87, 2588, 83, 4027, 37, 805, 0, 100), nrow = 2)
print(kara)
chisq.test(kara, simulate.p.value = TRUE, B = 1e6)
citation()
Der so aus Simulation entstandene p-Wert ist jedes Mal ein winziges bisschen anders aber jedes Mal weit unter 0,05, nämlich in der Größenordnung p-value = 0.00025
Die Autoren der R Funktion berufen sich dabei auf folgende Publikation:
Hope, A. C. A. (1968). A simplified Monte Carlo significance test procedure. Journal of the Royal Statistical Society Series B, 30, 582–598. doi: 10.1111/j.2517-6161.1968.tb00759.x.
https://www.jstor.org/stable/2984263. :
Otherwise the p-value is computed for a Monte Carlo test (Hope, 1968) with B replicates.
In the contingency table case simulation is done by random sampling from the set of all contingency tables with given marginals, and works only if the marginals are strictly positive. Continuity correction is never used, and the statistic is quoted without it. Note that this is not the usual sampling situation assumed for the chi-squared test but rather that for Fisher's exact test.
R gibt es kostenlos of
www.r-project.org.
HTH,
Bernhard