rechnerische Lösung bei nicht Normalverteilten Messwerten

Fragen, die sich auf kein spezielles Verfahren beziehen.

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Fr 9. Aug 2013, 08:49

Ja, ich hab es probiert und diese Tests sind ziemlich stabil gegenüber Ausreißern.

Ist es möglich den Kruskal-Wallis Test auch auf, nach Shapiro-Wilks normalverteilten Stichproben anzuwenden?

Nochmal zu dem Wilcox-Test, damit kann ich nur 2 Samples mit einander vergleichen? Und wenn da der p-Wert unter 0,05 ist kann man von einer signifikanten Abweichung sprechen?


Jein. Kann man. Aber wenn die Daten keine echten Größenunterschiede enthalten, dann wird trotzdem in jedem 20. Fall ein signifikantes Ergebnis herauskommen. Wenn Du also viele Tests durchführst, dann wirst Du auch viele falsch als signifikant finden. Also ja: In diesem Fall weichen die Daten deutlich von "gleich groß" ab. Das kann aber immer noch Zufall sein. Wenn Du sehr viele Tests durchführst, kommen sicher zufällig-signifikante Ergebnisse heraus. Wie schlimm wäre es, falsch-signifikante Ergebnisse zu haben? Wenn es schlimm wäre, solltest Du die Versuchsreihen, die signifikante Unterschiede zeigen, im Zweifel wiederholen und schauen, ob sie bei einem zweiten Durchgang auch noch so deutliche Ergebnisse zeigen.
[/quote]

Ich dachte mir das so, dass ich mit der grafischen BEtrachtung (Boxplots) eine Auswahl treffen kann. Daraus erkennt man ja wie sich einzelne Konfigurationen verhalten. Und dann kann man dies ja rechnerisch unterlegen mit dem Wilcox Test.
Weiterführende Untersuchungen mit den herausgefunden Konfigs müssten dann später gemacht werden. Aber um diese erstmal zu finden wäre diese Variante ja ok???

LG
Tim
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Fr 9. Aug 2013, 13:17

stumper77 hat geschrieben:Ja, ich hab es probiert und diese Tests sind ziemlich stabil gegenüber Ausreißern.

Ist es möglich den Kruskal-Wallis Test auch auf, nach Shapiro-Wilks normalverteilten Stichproben anzuwenden?


Ja, Du kannst den Kruskal-Test auch auf normalverteilte Stichproben anwenden. Normalverteilung kann die Tür zu weiteren Tests öffnen, die vielleicht etwas schneller Unterschiede erkennen (höhere Power), aber wenn Dir die Power von Kruskal-Wallis und Wilcoxon reicht, dann kannst Du die anwenden.
Wenn Du Dein Methodenspektrum erweitern willst, dann bist Du mit R gut bedient, aber eher nicht mit dem Forum. Dann solltest Du vielleicht erst mal mit einem guten Buch mehr über Statistik lernen. Deine Grundlagenkenntnisse scheinen noch nicht besonders ausgeprägt zu sein.

Ich dachte mir das so, dass ich mit der grafischen BeEtrachtung (Boxplots) eine Auswahl treffen kann. Daraus erkennt man ja wie sich einzelne Konfigurationen verhalten. Und dann kann man dies ja rechnerisch unterlegen mit dem Wilcox Test.


Das ändert nichts am Grundproblem: Wenn Du häufig misst, dann können ziemlich unwahrscheinliche Dinge auftreten. Wenn Du oft genug Lotto spielst, dann hast Du auch irgendwann einen Sechser im Lotto. Ob Du im Boxplot guckst oder in der Teststatistik ändert daran nichts.

Weiterführende Untersuchungen mit den herausgefunden Konfigs müssten dann später gemacht werden. Aber um diese erstmal zu finden wäre diese Variante ja ok???

Klar. Du kannst am großen Kuchen mit Boxplot und/oder mit multiplen Tests die Kandidaten heraus suchen, die Du dann später nochmal untersuchst. Nur der reproduzierbare Effekt zählt dann wirklich. Wenn es zu viele signifikante werden kannst Du notfalls die Grenze für den p-Wert herab setzen. Es wäre nicht ungewöhnlich, die Grenze bei p=0.01 statt 0.05 zu ziehen. Dann sind von eigentlich zufälligen Verteilungen nicht mehr 5% falsch signifikant sondern nur noch 1%.


LG,
Bernhard


PS: Du kannst den Shapiro-Wilk-Test natürlich auch in R machen. Die zugehörige Funktion in R heißt shapiro.test().
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Fr 9. Aug 2013, 13:25

Vielen Dank für deine Hilfe!
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Di 13. Aug 2013, 13:48

Hallo bele,

ich hab noch eine Frage :)

Wenn ich 2 Samples mit dem Wilcoxon Test vergleiche, wie muss ich die Hypothesen in meinem Fall wählen ist das einseitig oder zweiseitig?

Wie es mit R funktioniert weiß ich, nur hab ich einige Bücher gelesen und da ist de Wilcoxon Test ziemlich kompliziert erklärt... Ich will nur wissen wie er funktioniert.

Viele Grüße
Tim
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Di 13. Aug 2013, 14:56

Hallo Tim,

unabhängig davon, ob Du den Wilcoxon-Test oder einen anderen nimmst gibt es fast keine Situation, in der 1-seitiges Testen angebracht wäre. Ok, es gibt sicher Situationen, in denen man verschiedener Meinung sein kann, aber ich empfehle Dir zweiseitiges Testen.

Wenn Du die Tests für jemand anderen machst oder jemand anderem vorstellen musst, dann musst Du bei einseitigem Testen mit unangenehmen Rückfragen rechnen, auf die Du derzeit keine gute Antwort hast. Wenn Du für Dich selbst testest, dann kannst Du den Test strenger oder weniger streng gestalten, indem Du die Grenze für den p-Wert anpasst.

Es ist kein Zufall, dass zweiseitiges Testen die Voreinstellung in R ist.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
stumper77

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Di 13. Aug 2013, 15:26

Vielen Dank!

Bele ich hab im R ein Shapiro Test gemacht und im Netz nochmal mit anderen "online Tests" verglichen und bekommen unterschiedliche Ergebnisse raus? Im R sagt gibt er mir einen P-Wert = 0,04335 somit Normalverteilung. und im Netz (http://sdittami.altervista.org/shapirot ... oTest.html) lehnt die Normalverteilung ab? Weißt du warum?
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Di 13. Aug 2013, 15:57

Ein kleiner p-Wert im Shapiro-Wilk-Test spricht gegen eine Normalverteilung. Wenn man also, wie üblich, als Grenze p=0,05 annimmt, dann lehnen sowohl R als auch der online-Rechner die Normalverteilungshypothese ab.


Im Übrigen herrscht bei R absolute Klarheit, wie der Test gerechnet/genähert wird. Wenn Du in der R-Konsole help(shapiro.test) eingibst, dann findest Du den Verweis zum genauen Algorithmus.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Di 13. Aug 2013, 16:23

Ich bin in meinen Hypothesen in der Theorie verrutscht. :-P sorry! Danke, due gute alte Statistik. Da ist man dankbar für dieses Forum und helfende Menschen!

Viele Grüße
Tim
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Di 13. Aug 2013, 16:40

Das passiert. Denk dran, dass Du bei Methoden die Normalverteilung voraussetzen in der Regel auch den schönen Schutz gegen Ausreißer los bist.

Eine graphische Prüfung auf Normalverteilung erlaubt ein Q-Q-Plot
http://www.bb-sbl.de/tutorial/verteilungen/qqplot.html
http://de.wikipedia.org/wiki/Quantile-Quantile-Plot

In R bekommst Du den für die Frage nach Normalverteilung wie folgt:
Code: Alles auswählen
qqplot(Sample1)
qqline(Sample1)


im lauffähigen Beispiel
Code: Alles auswählen
Sample <- rt(30,2)

qqnorm(Sample)
qqline(Sample)


LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
stumper77

Vorherige

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 18 Gäste

cron