ich habe durch Web Analyse einen Datenbestand gesammelt, der auf vier Gruppen aufgeteilt ist. Hier ist zum Beispiel enthalten, die Dauer die Personen einer Gruppe eine bestimmte Seite besucht haben. Jetzt wollte ich den Unterschied zwischen den Gruppen auf Signifikanz prüfen. (Welche Gruppe ist auf einer bestimmten Seite am längsten im Vergleich zu den anderen Gruppen?)
Eine Frage gleich vorweg: Ist es legitim, dass ich von den Gruppen die durchschnittliche Verweildauer pro Seite nehme und diese dann mit dem Durchschnitt der Verweildauer der Gruppe auf allen Seiten vergleiche, damit ich Aussagen darüber treffen kann, ob eine Seite besonders lange oder weniger lange im Vergleich zu anderen Seiten besucht wurde?
Bei dem Vergleich der Gruppen untereinander stellen sich einige Probleme:
1. Die Stichprobe ist nicht immer gleich groß, da unterschiedlich viele Nutzer die Seiten besucht haben. Lösungsidee: Randomisierte Auswahl der Daten für eine Gruppe in Höhe des gewünschten Stichprobenumfangs. - Ist das der richtige Weg?
2. Normalverteilung ist nicht immer gegeben: Lösungsidee: Verwendung des Kruskal-Wallis Tests, damit eine Normalverteilung nicht gegeben sein muss. - AUch hier die Frage, funktioniert es damit?
2. Teilweise keine Nutzer, oder sehr wenige: Die Anzahl der Nutzer ist teilweise sehr niedrig, d.h. es sind durch die starke Segmentierung manchmal nur 2 Nutzer auf einer Seite, oder aber auch keine. - Das ist die wohl größte Hürde. Und hierzu die Frage, was kann ich mit solchen Daten überhaupt anfangen, kann damit eine Aussage getroffen werden?
Wenn keines der Verfahren anwendbar ist, gibt es andere Möglichkeiten Aussagen über die Daten zu treffen?
Vielen Dank für die Hilfe!
Hier noch ein Beispiel zur Verdeutlichung des Datenbestands:
