rechnerische Lösung bei nicht Normalverteilten Messwerten

Fragen, die sich auf kein spezielles Verfahren beziehen.

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Mi 7. Aug 2013, 14:40

ich erstelle die Boxplots mit Excel. Ich hab da leider nicht die möglichkeit diese Test durchzuführen.
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Mi 7. Aug 2013, 14:47

Ok, Excel ist ein Fehler. Natürlich lässt sich damit auch ein Kruskall-Wallis-Test durchführen:
http://www.real-statistics.com/one-way- ... llis-test/

Trotzdem ist Excel nicht das richtige Programm für sowas.

Wenn Du Lust hast, poste mal Deine Original-Werte, es wird sich schon jemand finden, der die Tests rechnet. Am besten postest Du sowas wie

Sample 1: 23.3, 24.5, 12.0, ...
Sample 2: 44.5, 32.0, 11.0, ...
Sample 3: 24.3, 24.5, 12.9, ...

Wenn Du die Daten nicht hier posten kannst, dann musst Du es mit der oben verlinkten Anleitung machen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
stumper77

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Mi 7. Aug 2013, 15:04

Vielen Dank Bernhard.

Könnte mir bitte jemand mit diesen Samples einen Kruskall-Wallis Test durchführen?

Sample 1: 0.023, 0.023, 0.023, 0.023, 0.024, 0.024, 0.024, 0.025, 0.025, 0.026, 0.026, 0.026, 0.027, 0.028, 0.028, 0.029, 0.030, 0.031, 0.032, 0.032

Sample 2: 0.021, 0.023, 0.023, 0.023, 0.024, 0.024, 0.024, 0.025, 0.025, 0.025, 0.025, 0.025, 0.027, 0.027, 0.028, 0.028, 0.032, 0.035, 0.036, 0.053

Sample 3: 0.022, 0.022, 0.023, 0.023, 0.023, 0.024, 0.024, 0.025, 0.025, 0.025, 0.025, 0.026, 0.026, 0.027, 0.027, 0.027, 0.027, 0.029, 0.036, 0.038

Sample 4: 0.023, 0.023, 0.024, 0.024, 0.025, 0.025, 0.025, 0.025, 0.025, 0.026, 0.026, 0.026, 0.026, 0.026, 0.026, 0.027, 0.027, 0.027, 0.028, 0.028

Sind diese Daten normalverteilt?
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Mi 7. Aug 2013, 15:26

Hi Stumper,

eine Software die sowas gut macht und kostenlos ist ist R von http://www.r-project.org .

Sie kommt erstmal ohne graphische Benutzeroberfläche. Man tippt Anweisungen in der Regel ein. Deine Daten könnte man wie folgt eingeben:

Code: Alles auswählen
Sample1 <- c( 0.023, 0.023, 0.023, 0.023, 0.024, 0.024, 0.024, 0.025, 0.025,
              0.026, 0.026, 0.026, 0.027, 0.028, 0.028, 0.029, 0.030, 0.031,
              0.032, 0.032 )

Sample2 <- c( 0.021, 0.023, 0.023, 0.023, 0.024, 0.024, 0.024, 0.025, 0.025,
              0.025, 0.025, 0.025, 0.027, 0.027, 0.028, 0.028, 0.032, 0.035,
              0.036, 0.053 )

Sample3 <- c( 0.022, 0.022, 0.023, 0.023, 0.023, 0.024, 0.024, 0.025, 0.025,
              0.025, 0.025, 0.026, 0.026, 0.027, 0.027, 0.027, 0.027, 0.029,
              0.036, 0.038 )

Sample4 <- c( 0.023, 0.023, 0.024, 0.024, 0.025, 0.025, 0.025, 0.025, 0.025,
              0.026, 0.026, 0.026, 0.026, 0.026, 0.026, 0.027, 0.027, 0.027,
              0.028, 0.028 )

Den Kruskal-Wallis test kann man danach so anfordern:
Code: Alles auswählen
kruskal.test( list( Sample1, Sample2, Sample3, Sample4 ) )

R antwortet dann mit
Code: Alles auswählen
        Kruskal-Wallis rank sum test

data:  list(Sample1, Sample2, Sample3, Sample4)
Kruskal-Wallis chi-squared = 0.4553, df = 3, p-value = 0.9286

Ein p-Wert der größer als 0.05 ist bedeutet, dass keine signifikanten Unterschiede vorliegen. Auch wenn in Deinen Stichproben unterschiedliche Mediane herausgekommen sind kannst Du also nicht behaupten, dass in einem der Samples klar höhrere Werte heraus kommen als in einem der anderen.

Du kannst das alles nachvollziehen, indem Du Dir R herunter lädst, die obigen Zeilen per copy&paste in R kopierst. Einzelvergleiche zwischen den Samples kannst Du mit dem xilcox.test machen, etwa so:

Code: Alles auswählen
> wilcox.test(Sample1, Sample2)

        Wilcoxon rank sum test with continuity correction

data:  Sample1 and Sample2
W = 205.5, p-value = 0.8916
alternative hypothesis: true location shift is not equal to 0

Warnmeldung:
In wilcox.test.default(Sample1, Sample2) :
  kann bei Bindungen keinen exakten p-Wert Berechnen


Auch hier ist die p-value deutlich größer als 0.05 (war aber aufgrund des kruskal.test() nicht anders zu erwarten).

Einen Boxplot mit Notches und mit überlagerten Punkten für die Originalwerte erhälst Du so:
Code: Alles auswählen
boxplot( Sample1, Sample2, Sample3, Sample4, color="grey", notch=T )
points(jitter(as.numeric(gl(4,20))),
       c(Sample1, Sample2, Sample3, Sample4), pch=16 )


Die "rechnerische" Auswertung ergibt also: Im Kruskal-Wallis-Test keine signifikanten Unterschiede zwischen den vier Gruppen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Mi 7. Aug 2013, 15:31

Fast vergessen: Die Frage nach der Normalverteilung ist uninteressant: Auch in der Ancova ergeben sich keine Signifikanzen für die Sample-Koeffizienten)
Code: Alles auswählen
Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  0.0264500  0.0009979  26.507   <2e-16 ***
sample2      0.0012000  0.0014112   0.850    0.398   
sample3     -0.0002500  0.0014112  -0.177    0.860   
sample4     -0.0008500  0.0014112  -0.602    0.549   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.004463 on 76 degrees of freedom
Multiple R-squared: 0.02853,    Adjusted R-squared: -0.009816
F-statistic: 0.744 on 3 and 76 DF,  p-value: 0.5291


LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Mi 7. Aug 2013, 15:37

Das werde ich heut gleich mal probieren! Vielen, vielen Dank Bernhard! Das Ergebnis hab ich mir schon gedacht, dass es nicht signifikant ist nur muss es ja auch bewiesen werden ;) Ich hatte schon mal etwas von dem R gelesen aber wusste nicht wie man das programmiert...

Ok, also wird die Signifikanz untersucht und diese Aussage ist die, die ich brauch um dies zu bewerten.

nochmals Danke!!!
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Do 8. Aug 2013, 09:03

Guten morgen Bernhard,

das ist ja echt ein sehr hilfreiches Tool!

Ich hab noch eine Frage: Bei einer Auswertung ist der p Wert extrem klein, was hat das zu bedeuten?

HIer ein Auszug:

data: list(Sample1, Sample2, Sample3, Sample4)
Kruskal-Wallis chi-squared = 23.5627, df = 3, p-value = 3.082e-05

NOchmal zu dem Wilcox-Test, damit kann ich nur 2 Samples mit einander vergleichen? Und wenn da der p-Wert unter 0,05 ist kann man von einer signifikanten Abweichung sprechen?

LG
Tim
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Do 8. Aug 2013, 15:11

stumper77 hat geschrieben:data: list(Sample1, Sample2, Sample3, Sample4)
Kruskal-Wallis chi-squared = 23.5627, df = 3, p-value = 3.082e-05

Das müssen dann aber andere Samples sein als die, von denen Du bisher gesprochen hast. In diesem Fall muss es Unterschiede zwischen den Gruppen geben. Es reicht, wenn ein Sample aus den anderen heraus fällt.

Nochmal zu dem Wilcox-Test, damit kann ich nur 2 Samples mit einander vergleichen? Und wenn da der p-Wert unter 0,05 ist kann man von einer signifikanten Abweichung sprechen?


Jein. Kann man. Aber wenn die Daten keine echten Größenunterschiede enthalten, dann wird trotzdem in jedem 20. Fall ein signifikantes Ergebnis herauskommen. Wenn Du also viele Tests durchführst, dann wirst Du auch viele falsch als signifikant finden. Also ja: In diesem Fall weichen die Daten deutlich von "gleich groß" ab. Das kann aber immer noch Zufall sein. Wenn Du sehr viele Tests durchführst, kommen sicher zufällig-signifikante Ergebnisse heraus. Wie schlimm wäre es, falsch-signifikante Ergebnisse zu haben? Wenn es schlimm wäre, solltest Du die Versuchsreihen, die signifikante Unterschiede zeigen, im Zweifel wiederholen und schauen, ob sie bei einem zweiten Durchgang auch noch so deutliche Ergebnisse zeigen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon stumper77 » Do 8. Aug 2013, 15:46

Das mit den kleinen Werten sind 8 Samples mit verschiedenen Kombinierten Einstellungen. Von der Theorie her und dem grafischen ist es der Fall das es zwischen den Gruppen Unterschiede gibt.
Wie werden Ausreißer bei diesem Test beachtet?
Sind solche kleinen P-Werte realistisch oder sind die zu klein?

Viele Grüße
Tim

P.S. die Versuche kann ich leider nicht wiederholen
stumper77
Beobachter
Beobachter
 
Beiträge: 17
Registriert: Di 9. Jul 2013, 12:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: rechnerische Lösung bei nicht Normalverteilten Messwerte

Beitragvon bele » Do 8. Aug 2013, 17:42

stumper77 hat geschrieben:Wie werden Ausreißer bei diesem Test beachtet?

Beide Tests verhalten sich vernünftig und lassen sich von Ausreißern nicht besonders beeindrucken. Du kannst ja mal versuchsweise Deine Ausreißer durch näherlilegende Werte ersetzen. Du wirst sehen, da passiert nicht viel.

Sind solche kleinen P-Werte realistisch oder sind die zu klein?

p-Werte sind komische Tierchen. Nur weil ein p-Wert nur noch ein hunderstel ist heißt das nicht, dass die Unterschiede hundert mal so groß sind. Durch die absolute Größe von p-Werten muss man sich nicht beeindrucken lassen und wenn die Unterschiede in der graphischen Darstellung wirklich deutlich sind, dann können p-Werte in der Größenordnung auftreten.

die Versuche kann ich leider nicht wiederholen

Dann hast Du ein Problem, wenn Du zu viel an Deinen Werten herum testest. Du musst jedem p-Wert ein wenig misstrauen. Das ist kein Fehler des Tests. Wenn man viel misst, dann kommen halt auch unwahrscheinliche Zufälle vor.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

VorherigeNächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 19 Gäste