Auswertung von Wiederholungsmessungen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Auswertung von Wiederholungsmessungen

Beitragvon Ruffy50 » Mi 5. Apr 2017, 16:03

Hallo zusammen,

ich bin in der Statistik leider unbeholfen und ersuche mir deshalb Hilfe in diesem Forum. Ich habe folgendes Problem:

Ich habe in einer Messreihe den Durchmesser von Kugeln bestimmt. Dazu habe ich die Schieblehre pro Kugel mind. 40 Mal in ihrer Position verändert und den Durchmesser notiert. Über diese 40 Messungen habe ich den Mittelwert und die Standardabweichung berechnet. Das Prozedere habe ich für 30 Kugeln wiederholt, sodass mir nachher insgesamt 30 Mittelwerte vorliegen. Die Kugeln sind Präzisionskugeln, die alle annähernd (+/- 0,02 mm) den gleichen Durchmesser von 2,5 mm aufweisen sollen.

Nun möchte ich herausfinden, ob es unter den Daten Ausreißer gibt. Gemäß meines Wissens, teste ich hierzu zunächst auf Normalverteilung. Leider ergibt sich bei verschiedenen Tests (Wahrscheinlichkeitsnetz, Anderson-Darling, Shapiro-Wilk) das Ergebnis, dass die Daten nicht normalverteilt sind. Dies könnte m. E. daran liegen, dass die Werte zu ähnlich sind (wenn ich im Wahrscheinlichkeitsnetz einfach mal spaßeshalber 30 Mal den gleichen Wert eintrage, ergibt sich kein normalverteilter Zusammenhang).
Meine Frage wäre nun, wie man mit solchen Datensätzen umgeht, um Ausreißer zu identifizieren bzw. eine einigermaßen sinnvolle statistische Auswertung durchzuführen. Ein beispielhafter Datensatz sieht so aus:

Mess-Nr. Durchmesser Stabw
in mm in mm
1 2,56 0,0404
2 2,49 0,0351
3 2,47 0,0355
4 2,45 0,0343
5 2,48 0,0312
6 2,62 0,1561
7 2,46 0,0389
8 2,47 0,0421
9 2,58 0,1036
10 2,46 0,0449
11 2,57 0,0807
12 2,45 0,0320
13 2,47 0,0329
14 2,48 0,0362
15 2,46 0,0331
16 2,44 0,0426
17 2,46 0,0344
18 2,47 0,0340
19 2,48 0,0371
20 2,45 0,0357
21 2,46 0,0365
22 2,47 0,0348
23 2,45 0,0340
24 2,49 0,0354
25 2,46 0,0345
26 2,45 0,0291
27 2,47 0,0380
28 2,47 0,0347
29 2,54 0,0849
30 2,57 0,0978

Mittelwert: 2,49; Standardabweichung des Mittelwertes: 0,0085

Es wäre super, wenn mir dabei jemand auf die Sprünge helfen könnte. Vielen Dank schonmal im Voraus!
Ruffy50
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 5. Apr 2017, 15:42
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Wiederholungsmessungen

Beitragvon PonderStibbons » Do 6. Apr 2017, 08:40

Nun möchte ich herausfinden, ob es unter den Daten Ausreißer gibt.

Warum? Wozu? Wie definiert? Wie lautet die eigentliche Fragestellung?
Gemäß meines Wissens, teste ich hierzu zunächst auf Normalverteilung.

Beziehst Du Dich dabei auf die 30 Mittelwerte? Ob man
für die Ausreißerermittlung unbedingt die Annahme einer
Normalverteilung braucht, weiß ich nicht, aber bei
zufälliger Größenvariation desselben Produkts ist die
Annahme dieser Verteilung wohl plausibel. Außer wenn
in der Fertigungstechnik dafür noch andere Verteilungen
bekannt sein sollten.
Leider ergibt sich bei verschiedenen Tests (Wahrscheinlichkeitsnetz, Anderson-Darling, Shapiro-Wilk) das Ergebnis, dass die Daten nicht normalverteilt sind.

Präzise gesagt, man testet nicht, ob die Daten normalverteilt sind, sondern ob die
Nullhypothese zurückzuweisen ist, dass die Daten aus Deiner Stichprobe (n=30 nehme
ich an) aus einer exakt normalverteilten Grundgesamtheit stammen.

Die Geschichte wird allerdings widersprüchlich: WENN markante Werte
außerhalb dessem liegen, was bei einer Normalverteilung erwartet
werden kann, dann muss die Normalverteilungsannahme zwangsläufig
zurückgewiesen werden.
Dies könnte m. E. daran liegen, dass die Werte zu ähnlich sind

Nein, das hat damit nichts zu tun. Mach Dir mal ein Histogramm.
(wenn ich im Wahrscheinlichkeitsnetz einfach mal spaßeshalber 30 Mal den gleichen Wert eintrage, ergibt sich kein normalverteilter Zusammenhang).

Dass 30mal derselbe Wert keiner Verteilung folgt, liegt wohl auf der Hand.
Meine Frage wäre nun, wie man mit solchen Datensätzen umgeht, um Ausreißer zu identifizieren bzw. eine einigermaßen sinnvolle statistische Auswertung durchzuführen.

Und wie gesagt, was verstehst Du unter Ausreißern und wozu willst Du
sie identifizieren?

Mit freundlichen Grüßen

PonerStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Ruffy50

Re: Auswertung von Wiederholungsmessungen

Beitragvon Ruffy50 » Do 6. Apr 2017, 09:17

Hallo PonderStibbons,

vielen Dank für deine Antwort.
Ich möchte den Datensatz auf Ausreißer überprüfen, da es zwischendurch ja theoretisch zu Fehlmessungen kommen kann. Ich kenne den tatsächlichen Wert des Durchmessers der Kugeln (2,5 mm +/- 0,02 mm) und möchte diesen mit meinen Messergebnissen vergleichen, um dadurch sozusagen die Präzision meiner Messung zu validieren.
Die Normalverteilung habe ich für die 30 Mittelwerte überprüft. Im Wahrscheinlichkeitsnetz sieht es für den angegebenen Fall nach einer Mischverteilung aus. Wenn ich mir meine Messdaten mal grafisch darstelle (inklusive eingezeichnetem "tatsächlichem" Durchmesser mit Intervall +/- 0,02 mm) sehe ich bei manchen Werten, dass sie "augenscheinlich" als Fehlmessungen interpretiert werden müssen/können. Das Ganze möchte ich nur irgendwie auch- nach Möglichkeit statistisch - belegen können.

Ich habe nun auch mal als Schnelltest auf Normalverteilung den David-Test ausgeführt, welcher das Vorliegen einer Normalverteilung bejaht. Allerdings ist dieser Test laut dem, was ich so gelesen habe, nicht wirklich statistisch signifikant.

Ich habe mal die Diagramme unter Folgendem Link bereitgestellt: https://www.dropbox.com/sh/2ockjkx6lh7o ... Scpsa?dl=0
Vielleicht kannst du dir das ja mal anschauen, das wäre sehr nett!
Ruffy50
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 5. Apr 2017, 15:42
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Wiederholungsmessungen

Beitragvon PonderStibbons » Do 6. Apr 2017, 09:44

Wie gesagt, ein Histogramm wäre mir lieber. Was ist Wahrscheinlichkeitsnetz, ein P-P-plot?

Alas, wenn Du markante Ausreißer hast, ist es folgerichtig, dass der Test auf Normalverteilung
die Nullhpothese zurückweist; Nicht-Zurückweisung kann nur auf zu kleiner Stichprobe
beruhen und/oder einem zu unsensitiven Testverfahren. Insofern ist der Test auf
Normalverteilung wohl eher widersinnig.

Wenn Messfehler normalverteilt sind (wovon ich ausgehe, aber in Fertigungstechnik
kenne ich mich wie gesagt nicht aus), dann geh von dieser Annahme ohne Test aus
und identifiziere die "Ausreißer" nach den in Deinem Bereich gängigen Kriterien.

Just my 2pence

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Ruffy50

Re: Auswertung von Wiederholungsmessungen

Beitragvon Ruffy50 » Do 6. Apr 2017, 10:01

Hallo PonderStibbons,

ja, das Wahrscheinlichkeitsnetz = Q-Q Plot.
Bei der Erstellung des Histogramms ist die Frage, wi ich meine Klassen einteile. Ich habe mal gelernt, dass es gängig ist, sich den maximalen Wert und den minimlen Wert der Messwrte zu berechnen und dann die Intervallbreite zwischen den Klassen dann durch

(max-min)/Anzahl Messungen

zu berechnen. Allerdings sieht das Histogramm dann nicht wirklich gut aus (hab es mal in der Exceldatei in dem Ordner vom vorherigen Beitrag erstellt). Wenn ich mir nur 3 Klassen definiere, wirkt es auch nicht besser...wie kann man sowas dann am besten darstellen?

Wenn ich nicht auf Normalverteilung teste, wie kann ich dann Ausreißer dieser Messreihe sinnhaft begründen? Schaut man sich das Bild der Messergebnisse an, so sind die 5 rot markierten Werte ja auf den ersten Blick sehr verdächtig, da deren Standardabweichung sehr sehr groß ist im Gegensatz zu den restlichen Messungen. Bei einemes Ausreißertest werden die Standardabweichungen ja aber nie berücksichtigt, sondern nur die berechneten Mittelwerte, weshalb ich hier in einem Dilemma stecke...

Ich habe in der Literatur auch was zum zentralen Grenzwertsatz der Statistik gelesen, der ja besagt, dass bei genügend Wiederholungsmessungen eine Normalverteilung vorliegen wird (schon meist bei n >10). Ich kann doch aber eigentlich nicht den Satz anweden, wenn mir jeder andere Test das Gegenteil sagt, also Rückweisung der Nullhypothese, dass Normalverteilung vorliegt, oder?
Gängige Kriterien für Ausreißer gibt es leider nicht.

Ich bin da leider etwas verwirrt udn weiß nicht, wie ich da vorgehen muss :-/
Ruffy50
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 5. Apr 2017, 15:42
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Wiederholungsmessungen

Beitragvon PonderStibbons » Do 6. Apr 2017, 12:47

Wenn ich nicht auf Normalverteilung teste, wie kann ich dann Ausreißer dieser Messreihe sinnhaft begründen?

Dass es in der Fertigungstechnik keine Standards bzw. Normen dafür geben sollte, überrascht mich.

Schaut man sich das Bild der Messergebnisse an, so sind die 5 rot markierten Werte ja auf den ersten Blick sehr verdächtig, da deren Standardabweichung sehr sehr groß ist im Gegensatz zu den restlichen Messungen.

Ein einzelner Wert hat keine Standardabweichung. Womöglich meinst Du, dass dieser
Werte stark vom Schwerpunkt Verteilung oder der Spannweite der übrigen Werte
abweichen.
Bei einemes Ausreißertest werden die Standardabweichungen ja aber nie berücksichtigt, sondern nur die berechneten Mittelwerte, weshalb ich hier in einem Dilemma stecke...

Verstehe ich nicht. Ein denkbares Verfahren wäre zu sagen: "alle Werte, die 5 [oder was auch immer]
Standardabweichungen vom Mittelwert entfernt sind, geherören nicht zur Verteilung, sind Ausreißer."
Ich habe in der Literatur auch was zum zentralen Grenzwertsatz der Statistik gelesen, der ja besagt, dass bei genügend Wiederholungsmessungen eine Normalverteilung vorliegen wird (schon meist bei n >10).

Da geht es nicht um die Verteilung von Daten, sondern um die Verteilung von Mittelwerten.
Ich bin da leider etwas verwirrt udn weiß nicht, wie ich da vorgehen muss

Entweder, Du treibst eine DIN-Norm oder Lehrbuchvorschriften oder sonstwas aus der
Fertigungstechnik auf, oder Du machst es ganz krude mit einem box-and-whisker-Plot.
Mehr weiß ich leider nicht zu sagen, nicht zuletzt aufgrund des Ausbleibens von
Kontextinformation und nachvollziehbarer Fragestellung.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Auswertung von Wiederholungsmessungen

Beitragvon Ruffy50 » Do 6. Apr 2017, 14:12

Hallo PonderStibbons,

zunächst geht es bei mir nicht um Fertigungstechnik, sondern viel mehr um die Validierung der Messmethode.
Ein einzelner Wert hat keine Standardabweichung. Womöglich meinst Du, dass dieser
Werte stark vom Schwerpunkt Verteilung oder der Spannweite der übrigen Werte
abweichen.

Dabei handelt es sich schon um die gebildeten Mittelwerte über die 40 Wiederholungsmessungen einer einzigen Kugel. Um mein Messvorgehen noch einmal zu verdeutlichen: ich nehme eine Kugel in die Hand, vermesse diese 40 Mal mit einem Messschieber und bilde daraus den Mittelwert und logischerweise die Standardabweichung. Das Ganze mache ich für insgesamt 30 Kugeln ( die allesamt laut Hersteller einen Durchmesser von 2,5 mm +/- 0,02 mm aufweisen). Aus diesen 30 Mittelwerten bilde ich mir dann einen einzigen Mittelwert (mit Standardabweichung des Mittelwertes). Nun möchte ich sehen, ob bei meinen 30 Mittelwerten Ausreißer vorliegen, d. h., habe ich in einer Messreihe eine/mehrere Fehlmessung/en gemacht.


Verstehe ich nicht. Ein denkbares Verfahren wäre zu sagen: "alle Werte, die 5 [oder was auch immer]
Standardabweichungen vom Mittelwert entfernt sind, geherören nicht zur Verteilung, sind Ausreißer."


Das funktioniert doch aber nur, wenn ich im Vorfeld eine Verteilung zu Grunde legen kann. Und genau da liegt das Problem...

Da geht es nicht um die Verteilung von Daten, sondern um die Verteilung von Mittelwerten.

Wie oben beschrieben, handelt es sich bei den Werten ja um Mittelwerte.
Ruffy50
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mi 5. Apr 2017, 15:42
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Auswertung von Wiederholungsmessungen

Beitragvon PonderStibbons » Do 6. Apr 2017, 15:18

zunächst geht es bei mir nicht um Fertigungstechnik, sondern viel mehr um die Validierung der Messmethode.

Eine Messmethode ist dann reliabel, wenn wiederholte Messungen am demselben Objekt
zum möglichst identischen Ergebnis führen.
Nun möchte ich sehen, ob bei meinen 30 Mittelwerten Ausreißer vorliegen, d. h., habe ich in einer Messreihe eine/mehrere Fehlmessung/en gemacht.

Ok, die Kugeln selbst können nicht stark vom Rest abweichen?
Große Abweichungen liegen dann nur daran, dass beim Messverfahren
bei 40 Wiederholungen Fehler begangen wurden?

Die hohen Standardabweichungen bei den Kugeln mit den sehr hohen Mittelwerten
könnten dadurch verursacht sein, dass innerhalb der 40 Durchgänge bei diesen
betroffenen Kugeln eine oder mehrere Messungen sehr stark vom Rest abwichen.

Man könnte nun die Reliabiltät der Messungen für die 30 einzelnen Kugeln
bestimmen und dann eventuell geeignet aggregieren, oder man sucht
ein Verfahren, dass die Reliabilität berechnet für den gesamten Datensatz
(30 Objekte jeweils 40mal gemessen) in einem Aufwasch.

Wie oben beschrieben, handelt es sich bei den Werten ja um Mittelwerte.

Sei es, wie es wolle, Normalverteilung hätte ich ohnedies zugrundegelegt.
Wenn die Ausreißerbesteimmung statt Reliabilitätsberechnung zum Ziel
der Analyse führt, kann man auf der Basis ja arbeiten.


Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Ruffy50


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 3 Gäste

cron