ausreissererkennung

Fragen, die sich auf kein spezielles Verfahren beziehen.

ausreissererkennung

Beitragvon lele24 » Do 14. Mär 2013, 18:27

hallo
ich muss einen datensatz auswerten und weiss nicht, wie (und ob) ich ausreisser erkennen kann.
der datensatz besteht aus wurfdaten, d.h. 19 Teilnehmer mussten 3 x 16 mal mit einem ball auf eine zielscheibe werfen. von diesem vielen wurfdaten ist schon von blossem auge zu erkennen, dass einige versuche total misslungen sind (wohl aufgrund fehlender konzentration der teilnehmer). wie kann ich festlegen, welche werte ausreisser sind und welche nicht? und muss ich die ausreisser über alle versuche oder pro person berechnen?

als beispiel die werte einer vp
47.1444
50.64064
66.39577
66.45975
69.9567
86.59472
86.9285
114.8051
117.3575
122.408
123.8141
123.8494
123.9439
132.2668
135.5991
136.3946
139.4341
146.1442
151.7587
159.5432
164.2244
164.921
169.161
173.4621
179.1337
181.4122
183.4678
186.5805
186.8305
191.0132
193.188
196.7311
200.8343
220.9118
223.1343
225.8523
232.1207
253.8683
258.092
282.7827
291.4319
326.9523
341.7686
353.8629
771.2061

merci im voraus für eure antworten!!
lele24
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 14. Mär 2013, 18:05
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: ausreissererkennung

Beitragvon aziz » Do 14. Mär 2013, 19:28

Hallo lele24,

da die meisten Ausreißertests normalverteilte Daten benötigen, würde ich zuerst die Häfugikeitsverteilung der Daten in einem Histogramm und/oder mir ein Normal-Q-Q-Plot anschauen. Sind keine Verletzungen der Normalverteilungsannahme erkennbar bzw. vernachläsigbar, so würde ich den Grubbs-Test oder sein robustes Pandan den Hampel-Test verwenden. Deine Stichprobenumfänge je Versuchsperson sind 48 Beobachtungen, oder? Die beiden erwähnten Tests werden nämlich für Stichproben größer 30 empfohlen.

Im Falle nicht-normalverteilter Daten fällt mir spontan der Walsh-Test ein. Hier wird keine konkrete Verteilungsannahme benötigt. Das Problem hier ist aber, das der Walsh-Test, in Abhängigkeit des Signifianzniveaus, große Stichprobenumfänge benötigt. Deine Stichproben dürften herfür zu klein sein. Alternativ könntest du explorative Verfahren verweden. Hier fallen mir der [latex]4s[/latey]-Bereich und das Graf-Henning-Verfahren ein. Die Signifikanzgrenze nach David, Hartley und Pearson könntest du benutzen, falls es sich um symmetrische Verteilungen handelt. Dieser Test liefert in jener Situation noch verlässliche Ergebnisse, obwohl er eigentlich für normalverteilte Daten entwickelt worden ist.

Ansonsten könntest du in folgende Quelle schauen, hier werden meines Wissens, weitere Nicht-parametrische Ausreißer Tests vorgestellt:

Barnett, V. und Lewis, T. (1994), Outliers in Statistical Data, 3. Auflage, John Wiley & Sons, Chichester.

Gruß
A.
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

folgende User möchten sich bei aziz bedanken:
lele24

Re: ausreissererkennung

Beitragvon lele24 » Do 14. Mär 2013, 22:19

Hallo A.
zuerst einmal vielen Dank für die schnelle und ausführliche Antwort!!!!! Ich habe die Stichprobe auf Normalverteilung untersucht, das Histogramm zeigt eine Verteilung ähnlich einer Normalverteilung, der Kolmogorov-Smirnov-Test hat allerdings ergeben, dass die Verteilung keine Normalverteilung ist. Kann ich trotzdem von einer Normalverteilung ausgehen, da die Verteilung auf 19 (Teilnehmer) x 48 Versuche = 912 Versuchen beruht?
Und habe ich das richtig verstanden, muss ich den Ausreissertest pro Person durchführen (und nicht über alle Versuche aller Personen)?
Gruss L.
lele24
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 14. Mär 2013, 18:05
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: ausreissererkennung

Beitragvon aziz » Do 14. Mär 2013, 22:51

lele24 hat geschrieben:Hallo A.
zuerst einmal vielen Dank für die schnelle und ausführliche Antwort!!!!! Ich habe die Stichprobe auf Normalverteilung untersucht, das Histogramm zeigt eine Verteilung ähnlich einer Normalverteilung, der Kolmogorov-Smirnov-Test hat allerdings ergeben, dass die Verteilung keine Normalverteilung ist.

Da ich denke, dass du Die Stichprobe entstammt einer Normalverteilung gegen Die Stichprobe enstammt keiner Normalverteilung getestet hast, ergibt sich als Interpretation aus dem K-S-Test, dass keine Aussage getroffenen werden kann. Die Nullhypothese kann nicht verworfen werden. Dies spricht erstmal nicht gegen die Normalverteilungsannahme.

lele24 hat geschrieben:Kann ich trotzdem von einer Normalverteilung ausgehen, da die Verteilung auf 19 (Teilnehmer) x 48 Versuche = 912 Versuchen beruht?

Naja, das ist nicht wirklich eine notwendige Vorraussetzung, das die Stichprobe normalverteilt ist. Du kommst vermutlich wegen des großen Stichprobenumfangs auf die Idee das sie dadurch gegen eine Normalverteilung kovergieren könnte. Das ist nicht der Fall. Bei manchen Tests, die auf der Normalverteilungsannahme beruhen, kann ab einer gewissen Stichprobengröße auf normalverteilte Daten verzichtet werden. Das hat aber etwas andere Gründe.
lele24 hat geschrieben:Und habe ich das richtig verstanden, muss ich den Ausreissertest pro Person durchführen (und nicht über alle Versuche aller Personen)?
Gruss L.

Das kommt darauf an, was deine Forschungshypothese ist. Ich hatte es Eingangs so verstanden, dass du jede Stichprobe auf Ausreißer testen möchtest. Ist dies nicht der Fall (falls du es als eine große Stichprobe betrachtest), so sollte der Stichprobenumfang für den Walsh-Test groß genug sein, sodass du dir um Verteilungsannahmen keine gedanken machen musst.

Gruß
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: ausreissererkennung

Beitragvon PonderStibbons » Do 14. Mär 2013, 22:55

ich muss einen datensatz auswerten und weiss nicht, wie (und ob) ich ausreisser erkennen kann.

Mach' 19 box-and-whisker plots, gegebenenfalls
alle 19 in einer Grafik beieinander, und fordere dabei
die Ausweisung von Ausreißern und Extremwerten an.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11372
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: ausreissererkennung

Beitragvon lele24 » Mo 18. Mär 2013, 16:50

merci für eure antworten!!!
ich habe jetzt 19 box plots erstellt, welche mir die ausreisser anzeigen. was mach ich nun mit ihnen, kann ich sie z.B. einfach mit dem höchsten bzw. niedrigsten Normalwert ersetzen???
mfg lele
lele24
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 14. Mär 2013, 18:05
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: ausreissererkennung

Beitragvon aziz » Mo 18. Mär 2013, 19:49

Hallo Lele,

falls Ausreißer vorliegen, so muss geklärt werden wie weiter vorgegangen wird. Soweit bist du ja nun auch :D .

In der Praxis existiert diesbezüglich kein einheitliches Vorgehen. So ist beispielsweise denkbar, dass der Wert ersatzlos gestrichen oder durch einen Schätzer (z. B. arithmetische Mittel, Median oder wie du vorgeschlagen hast mit dem niedrigsten oder größten "Normalwert") ersetzt wird.

Allgemein gilt: In den Berichten zu den Analysen muss daraufhin gewiesen werden, dass Ausreißer identifiziert worden sind und wie weiter vorgegangen worden ist (Stichwort: Reproduzierbarkeit der Analyse).

Gruß
Aziz
aziz
 
Danke gegeben:
Danke bekommen: mal in Post

Re: ausreissererkennung

Beitragvon PonderStibbons » Mo 18. Mär 2013, 20:27

ich habe jetzt 19 box plots erstellt, welche mir die ausreisser anzeigen. was mach ich nun mit ihnen, kann ich sie z.B. einfach mit dem höchsten bzw. niedrigsten Normalwert ersetzen???

Wenn es ungütlige Versuche sind, sind sie zu streichen.
Wenn es keine ungültigen Versuche sind, dann sind sie
im Zweifel so zu belassen, wie sie sind. Da der Zweck
der Datenauswertung nicht bekannt ist bzw. was weiter
mit den Daten passieren soll, ist es kaum zu beantworten.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11372
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron