Ich versuche gerade diagnostische Daten auszuwerten und bin dabei auf eine Methode gestoßen, die ich hinterfragen wollte. Es wird oft als Schwellenwert die µ+3 sigma Werte genommen.
Jetzt habe ich bei meiner Recherche folgendes Paper gefunden:
Schmid, H. & Huber, A. Measuring a Small Number of Samples, and the 3v Fallacy: Shedding Light on Confidence and Error Intervals. IEEE Solid-State Circuits Mag. 6, 52–58 (2014).
Dort wird eben diese Methode in Frage gestellt. Ich bin selbst kein Statistiker aber ambitionierte Naturwissenschaftler, der allerdings nicht alles in dem Paper versteht.
Ich wollte die Rechnungen der Autoren nachverfolgen komme dabei an meine Grenzen:
Frage: Wie berechnen die Autoren die Werte:
- Code: Alles auswählen
µx =-3.3966–2.5791, sigmax = 5.4994–9.9256,
Dafür nutzen sie diese Formeln basierend auf der t-Verteilung
Die Ausgangswerte sind wie folgt
- Code: Alles auswählen
µx = - 0.4088, sigmax = 7.0758
Bitte nicht einfach vorrechnen sondern ich möchte verstehen.
Es ist klar das wir die t-Verteilung nehmen da wir die echte Sigma nicht kennen wir haben nur eine Stichprobe und nicht die Grundgesamtheit. Die Mittelwerte in dem paper entstanden aus 24 Einzel-Werten also df=23. Ich weiß auch das man dann aus der t-Verteilung den Multiplikator für die 95% Konfidenzintervalle findet mit 2,069. Ich weiß auch, dass ich die 95% Konfidenzintervalle für den Mittelwert mittels SPSS berechnen kann.
Jetzt wird die Chi-QuadratVerteilung für die Sigma Berechnung genutzt. Diesen Teil verstehe ich nicht.
Die neue Methode, die angeblich besser sein soll geht wie folgt: Man kann jenachdem wieviele Stichprobenwerte man hat und wie das Konfidenzintervall sein soll bestimmte Werte einfach bei der Berechnung ignorieren.
Dafür haben sie eine Tabelle erstellt. Die Formel auf der diese Aussagen basieren sieht wie folgt aus:For example, if you have ten samples and need a 75% confidence interval for M, Table 1 says three, meaning that the interval x3gx8 is a 75% (or better) confidence inter- val. The most extreme data, x1,2,9,10, are simply dropped.
Kann mir bei dieser zweiten Formel jemand alles erklären. Ich habe keinen Plan, will aber nicht einfach neue Methoden ungeprüft übernehmen. Leider konnte ich auch keine weiteren Artikel in diesem Zusammenhang finden.
Fazit des Artikels ist es also, das man sehr vorsichtig sein sollte mit der µ+3*Sigma Regel geschweige den mit der 6Sigma Version.
Ich hoffe mich verständlich ausgedrückt zu haben.
Danke euch
Andreas