Kreuztabelle mit nicht normalverteilte Daten

Kreuztabelle mit nicht normalverteilte Daten

Beitragvon Biologe » Fr 26. Jun 2015, 06:10

Hallo Statistiker

Ich bin Forscher und benutze Statistik (und R) nur als Mittel zum Zweck und wuerde mich selber als Anfaenger bezeichnen, hatte schoen muehe das richtige Forum fuer meine Frage zu finden :D

Ich hab ein Experiment bezueglich Korallenbleiche (Bleichen der Korallen entspricht mehr oder weniger dem Tod der Korallen). Dazu hab ich die Korallen mit zwei verschiedenen Substanzen (A und B) behandelt und geschaut wie schnell die Korallen bleichen (sterben). Das Bleichen beginnt meist an einem Ende und breitet sich dann (mit einer klahren Grenze) aus. Ich hab dies mit Prozent werten erfasst: z.B. 0% => gesund, 100%=> total gebleicht, 40%=> knapp die Haelfte der Koralle gebleicht. Es wurden jeweils 6 Korallen behandelt. Die ersten 2 Behandlungstage waren alle gesund und am 4. Tag brach ich das Experiment ab. Dies sind meine Daten (sorry fuer die Dahrstellung, kam aber mit dem Tabellengenerator nicht zurecht):

Tag 3
Code: Alles auswählen

Neg:   0, 0, 0, 0, 0, 0
A:       0, 0, 0, 0, 0, 0
B:       20, 20, 20, 0, 0, 0
A+B:   100, 100, 100, 0, 0, 0


(jeder Wert ist eine Koralle)

Tag 4
Code: Alles auswählen
Neg:  40, 0, 0, 0, 0, 0
A:      10, 0, 0, 0, 0, 0
B:      100, 100, 100, 100, 40, 0
A+B:  100, 100, 100, 100, 100, 90


Ich moechte prinzipiell zeigen dass i) B von Neg und ii) B von A+B signifikant unterschiedlich ist. Normalerweise wuerde ich hier den t-Test verwenden, da die Daten aber nicht normalverteilt sind (sondern eher zu den Extremwerten 0 und 100 tendieren) bin ich ueberfragt. Gibt es eine statistische Methode um diese Daten auf signifikanz zu ueberpruefen?

Besten Dank fuer eure Auskunft.

PS. Sorry fuer die Umlaute, aber die habens hier in Borneo nicht so mit deutschen Tastaturen.
Biologe
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 26. Jun 2015, 05:46
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon PonderStibbons » Fr 26. Jun 2015, 08:53

Mann-Whitney U-Test wäre geeignet.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Biologe

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon bele » Fr 26. Jun 2015, 12:34

@Biologe:

Code: Alles auswählen
library(exactRankTests)

tag.4.neg <- c(40,0,0,0,0,0)
tag.3.b  <- c(20,20,20,0,0,0)
tag.3.ab <- c(100,100,100,0,0,0)
tag.4.b  <- c(100,100,100,100,40,0)
tag.4.ab <- c(100,100,100,100,100,90)

wilcox.exact(tag.4.neg, tag.4.b, alternative="two.sided")$p.value
wilcox.exact(tag.4.neg, tag.4.b, alternative="less")$p.value
wilcox.exact(tag.3.b, tag.3.ab, alternative="less")$p.value
wilcox.exact(tag.4.b, tag.4.ab, alternative="less")$p.value


...oder mit Ergebnissen:
Code: Alles auswählen
> wilcox.exact(tag.4.neg, tag.4.b, alternative="two.sided")$p.value
[1] 0.02813853
> wilcox.exact(tag.4.neg, tag.4.b, alternative="less")$p.value
[1] 0.01406926
> wilcox.exact(tag.3.b, tag.3.ab, alternative="less")$p.value
[1] 0.2564935
> wilcox.exact(tag.4.b, tag.4.ab, alternative="less")$p.value
[1] 0.2272727


Der Unterschied zwischen B und A+B wird nicht signifikant, der zwischen Negativ und B nur scheinbar: Auch wenn hier p<0,05 ist, hast Du Dir natürlich ganz schon viel "researcher's degree of freedom" genommen, indem Du Dir vorher anschaust, an welchen Tagen die Werte schön sind und nur die testest, die schön geworden sind und bei all dem Auswahlverfahren keine p-Wertadjustierung machst. Wenn Du eine machen würdest, wäre sie verheerend.
Also Glückwunsch zum p<0,05 aber stütze nicht Deine Lebenspläne für die nächsten Jahrzehnte darauf, dass dieses Ergebnis signifikant geworden ist.

@PonderStibbons: Aus Neurgierde und Unkenntnis: Könnte man eine Art "Messwiederholungs-logistische-Regression" machen um die Information aller Tage in ein Modell einfließen zu lassen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon PonderStibbons » Fr 26. Jun 2015, 13:47

Vielleicht'n GEE. Oder einfache eine Survivalanalyse, wenn man hier einen terminal event defnieren kann.

Was das vergleichen angeht, wenn die Auswahl der beiden Vergleiche tatsächlich nicht a priori erfolgte, sondern erst nach Inspektion der Stichprobendaten, dann hat man in der Tat verzerrte Ergebnisse, da stimme ich zu. Ich dachte auch daran, zuerst einen H-Test zu empfehlen, um alle 4 Bedingungen gleichzeitig zu testen, vermutete dann aber eben vorab festgelegte Vergleiche.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon bele » Fr 26. Jun 2015, 15:49

Danke für den Hinweis. Werde mal nachlesen, was GEEs sind. Meine Unterstellung bezüglich der Vergleiche beruht auf der Annahme, dass ein Biologe 6 Korallen nur dann mit A behandeln würde, wenn er auch die Wirkung von A auf die Korallen auswerten will. Ich will aber auch nicht so tun, als ob an die p-Adjustierung glauben würde oder als ob es üblich wäre, die Auswertung der Daten ohne Blick in die Daten festzulegen oder, oder, oder... Es geht mir nicht um einen erhobenen Zeigefinger sondern nur um den Hinweis, das p-Werte nicht die universelle Antwort auf die Auswertungsfragen sind.

In diesem Sinne wünsche ich Euch allen ein schönes sonniges Wochenende,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon Biologe » Sa 27. Jun 2015, 08:35

Ihr seit echt super! Vielen Dank für eure Hilfe.

Keine Angst ich werde nicht die Arbeit der naechsten Jahrzehnte darauf aufbauen ohne vorher verfeinerte Experimente durchzufuehren. Rein subjektiv habe ich auch das Gefuehl, dass es zwischen B und AB einen Unterschied gibt ich werde dies weiterhin untersuchen.

Ich habe festgestellt, dass in den meisten Labors, die Kentnisse über Statistik leider sehr begrenzt sind, wenn überhaupt wird einfach fuer alles der t-Test verwendet. Ich habe mir vorgenommen - falls ich Zeit finde - mich vermehrt mit Statistik zu befassen. Es kann also gut sein das ihr noch von mir hoeren werdet :)

Mit lieben Gruessen
Der Biologe
Biologe
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 26. Jun 2015, 05:46
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon Biologe » Sa 27. Jun 2015, 09:02

@bele

Darf ich dir trotzdem noch ne Frage stellen? Wieso hast du wilcox.exact und nicht den "normalen" wilcox.test verwendet. Was ich per Google rausgefunden habe, ist das der "wilcox.exact" auch bei gebundenen Daten den p-Wert berechnen kann, der "wilcox.exact" aber schon. Was genau sind diese "Bindungen" und weshalb sind meine Daten gebunden?

Besten dank fuer deine Auskunft.
Biologe
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Fr 26. Jun 2015, 05:46
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Kreuztabelle mit nicht normalverteilte Daten

Beitragvon bele » So 28. Jun 2015, 13:02

Hallo Biologe,

ich würde das gerne mit zwei Links beantworten, die das brauchbar aber kurz genug beschreiben:
http://www.faes.de/Basis/Basis-Statisti ... coxon.html
http://www.fernuni-hagen.de/ksw/neuesta ... _32935.pdf
wilcox.test() ist in aller Regel die richtige Funktion, aber weil es hier so ausgeprägte Bindungen gibt bin ich vorsichtshalber auf eine exakte Funktion ausgewichen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Biologe


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 12 Gäste

cron