Hallo Community,
ich stehe etwas auf dem Schauch bei der Auswertung eines Fragebogens, bei dem Inhalte unterschiedlich visuell dargestellt und im Anschluss abgefragt wurden.
Es ergibt sich, dass je Formatierung eine Spalte mit Richtig oder Falsch (beantwortet) stehend je Zeile.
Als Beispiel die Formatierung Grau und Rot:
Grau 0 1 1 1 1 1 1 1 1
Rot 0 1 0 0 0 0 1 0 0
Ich habe erst mit einem nichtparametrischen Mann-Withney-U bzw. Wilkox-Test das ganze einseitig getestet. Rot solle halt besser sichtbar sein und zu besseren Antworten führen.
Hierfür erhalte ich dann auch entsprechende Signifikante Ergebnisse, die ich rein logisch anhand der Zählungen und Stichprobengrößen auch nachvollziehen kann.
Nun möchte ich jedoch auch eine Teststärke (1-Beta) bzw auch Effektstärke (bspw. d) ermitteln.
Diese fällt selbst bei 300 Messungen durchweg schlecht aus und liegt kaum bei den avisierten 0,80.
Ich führe dies darauf zurück, dass die StdAbw ja stehts bei dem Binären Daten (0 oder 1) sehr hoch ist.
Damit sinkt natürlich die Effektstärke.
Nun habe ich die richtigen und falschen Antworten mal gezählt und in eine Chi Quadrat Tabelle geworfen.
Falsch Richtig
Grau 1 8
Rot 7 2
Rein vom den p-Werten her komme ich eigentlich zu fast den selben Ergebnissen.
Hingegen weiß ich nicht, wie ich Test- und Effektstärke ermitteln kann (G-Power verstehe ich hierbei nicht).
Eigentlich nahm ich an, dass diese Auswertung eine recht leichte sei.
Erst das Heranziehen der Test- und Effektstärken verwirrt mich nun, sodass ich nichtmal weiß, ob die Verfahren überhaupt richtig wären.
Weiß jemand, wie ich hier zu verfahren habe?
Vielen Dank