Hallo ihr Lieben
Nach einem halben Senester Statistik in der Uni bin ich noch etwas unsicher was meine aktuelle Belegaufgabe angeht und würde mich über Hilfe freuen!
Es wurden Werte für die Anzahl der täglich bearbeiteten Aufträge für verschiedene Plätze in einem Unternehmen über einen Zeitraum von 8Wochen erfasst (2 unterschiedliche Monate).
Je Platz gibt es 38 Werte, die anderen beiden Tage sind Feiertage und es erfolgte keine Auftragsbearbeitung.
1. Ich halte eine Klasseneinteilung eigentlich für sinnvoll, da sich die Werte stark unterscheiden. Auch nach Berechnung wäre das sinnvoll. Aber selbst nachdem die offensichtlichen Ausreißer im Vorfeld entfernt wurde bleiben einige die wahrscheinlich Ausreißer sind. Dann ist doch eine Klasseneinteilung eigentlich ungünstig, weil ich später alles nochmal neu machen muss? Oder gibt es eine Möglichkeit nach erfolgter Klasseneinteilung einfach die Ausreißer zu entfernen? Da müsste ja dann eigentlich eine komplett neue Klasseneinteilung her weil die Spannweite viel geringer ist?
2. das gleiche Problem habe ich bei der 5-Punkte-Zusammemfassung und Box-Plot.
Dadurch dass die viel zu hohen Werten noch drin sind ist die Box immer stark zum Minimum verschoben, nach ausreißerentfernung wäre das nicht mehr der fall weil das Maximum viel geringer ist. Wäre es da legitim erstmal auf Ausreißer zu prüfen, gegebenenfalls die 5-Punkte-Zusammenfassung anzupassen und erst dann das Box-Plot zu erstellen?
3. Ausreißeridentifizierung
Es fällt auf dass die Auftragslage nach den Feiertagen deutlich höher ist. Ist ja verständlich, weil sich Aufträge aufgestaut haben. Sind diese Werte dann auch Ausreißer wenn sie außerhalb der Zäune liegen? Einerseits sind sie natürlich unüblich aber vielleicht sollte man sie doch berücksichtigen?
Ich wäre über Meinungen sehr dankbar, da wir neben der Theorie leider wenige Anwendungsbezogene Aufgaben gemacht haben :/
Vielen Dank!!