Hallo,
ich habe Usage-Daten eines Internet-Services mit 3 unabhängigen Gruppen. Die Gruppen haben unterschiedliche Varianten des Internet-Services genutzt.
Die Daten sind stark logarithmisch verteilt. Insgesamt bilden die Daten recht gut die 1%-Regel ab -> https://de.wikipedia.org/wiki/Ein-Prozent-Regel_(Internet)
Wir haben also in jeder Gruppe ein paar Ausreißer, die ziemlich viel gemacht haben und in jeder Gruppe eine große Masse an Nutzer die wenig oder nix gemacht haben.
Mein Mittelwert ist daher in allen Gruppen bei 2 -> bzw. nahe bei 0 und nicht wirklich aussagekräftig, da ich eine extrem hohe Streuung habe. Mich interessieren vor allem die Unterschiede der Ausreißer in den Gruppen.
Allerdings möchte ich die Daten nicht einfach irgendwo abschneiden.
- Kann mir jemand einen Rat geben, wie ich die Daten transformieren muss, damit ich unterschiede zwischen den Gruppen deskriptiv und mit Tests sinnvoll auswerten und interpretieren kann?
Danke