In meinem Experiment sind n=27 Probanden eine Strecke in einem Fahrsimulator gefahren. Dabei mussten sie nebenbei noch ein Touchscreen Tablet bedienen. Es gibt 4 Treatment Fahrten wo die App auf dem Tablet jedes mal anders aufgebaut war. Ich möchte nun untersuchen ob eine dieser Apps eine bessere Fahrperformance verursacht.
Am Ende der Fahrten sollten sie die 4 Apps (Treatments) ranken hinsichtlich 3 Kriterien:
Bestes Insgesamt, Sicherstes, Benutzerfreundlichstes. 1 ist die beste Note, 4 die schlechteste, jede Note darf nur 1 mal vergeben werden.
D.h. als Beispiel hat Proband 1 folgende Wertungen vergeben:
Beste Insgesamt
App1 - 2
App2 - 3
App3 - 1
App4 - 4
Benutzerfeundlichste
App1 - 3
App2 - 4
App3 - 2
App4 - 1
Sicherste
App1 - 2
App2 - 3
App3 - 1
App4 - 4
Ich habe den Mittelwert und die Standardabweichung berechnet und die Sachen in einen Graphen gepackt.
Allerdings sind die Daten ja vmtl. eher ordinalskaliert? Weshalb ich nicht glaube, dass ich das hätte machen dürfen.
Hier mal die Grafik:
Link zum Bild
https://i.stack.imgur.com/yubye.jpg
Ich möchte Aussagen darüber treffen, welche App von den Benutzer als Beste, sicherste, benutzerfreundlichste eingestuft wird.
Und auch einzelne Vergleiche:
"App1 wird als sicherer eingestuft als App2". (Wilcoxon - Signed Rank ?)
Ich danke euch für eure Hilfe