Sidak Adjustierung - richtige Formel?

Sidak Adjustierung - richtige Formel?

Beitragvon Leoncia » Fr 23. Jan 2015, 13:47

Hallo,
habe ein kleines Problem. Ich soll die Sidak Korrektur in R implementieren und finde (glaube ich) nicht die richtige Formel. Im Internet ist ja diese zu finden:

(1-(1-p.wert)^N) Wobei N die Anzahl der multiplen Tests sein soll. Ich weiß allerdings nicht, was das jetzt bei meinem Beispiel ist.

Wenn ich zB in einem Experiment eine Kontrollgruppe und 4 Behandlungsgruppen habe und jede Behandlungsgruppe gegen die Kontrolle teste (Wilcoxon Test).
Jede Gruppe hat jetzt 1700 Werte-Zeilen, das heißt nach dem Wilcoxon Test habe ich 1700 p-Werte mal 4 Gruppen (6800 insgesamt in vier Spalten). Sind nun diese 1700 mein N, oder die 4 Behandlungsgruppen, weil ich da vier mal die Nullhypothese teste?

Bin sehr verwirrt.

Habe bis jetzt das gemacht: (1-(1-p.wert)^1700), allerdings werden danach dann nur noch 15 von 1700 signifikant.. Ganz schön krass.
Bei (1-(1-p.wert)^4) bleiben natürlich mehr übrig. Aber was ist richtig?
Hoffe, ich habe es gut erklärt..
Leoncia
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 14. Jan 2015, 13:26
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Sidak Adjustierung - richtige Formel?

Beitragvon bele » Fr 23. Jan 2015, 15:16

Hallo Leoncia,

erkläre bitte nochmal, wie Du auf die 1700 p-Werte kommst. Normalerweise stellt man die Fälle in Zeilen und die Gruppen in Spalten. Wenn Du jetzt eine Kontrollgruppe gegen 4 Behandlungsgruppen testest, dann sind das 4 Tests und 4 p-Werte, unabhängig davon, wieviele Individuen in den Gruppen sind. Wenn Deine Zeilen je etwas zu testendes enthalten, dann musst Du das genauer erklären.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5925
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Sidak Adjustierung - richtige Formel?

Beitragvon Leoncia » Fr 23. Jan 2015, 15:28

Also ich habe eine Spotliste, mit Proteinspots aus der 2D-Gelelektrophorese.
Das sind dann also 1700 Zeilen und 4 Behandlungsgruppen mit Messwerten und eine Kontrollgruppe mit Messwerten.
Ich bestimme dann also für jeden Spot, ob er signifikant verändert ist im Vergleich zur Kontrolle. Also zeilenweise Wilcoxon Test.
Somit habe ich 1700 p-Werte für jede Behandlungsgruppe.
In jeder Zeile stehen also die Messwerte zu einem Spot und in den Spalten die Behandlung.

Hier habe ich auch etwas gefunden: http://www.ats.ucla.edu/stat/stata/code/sidak_holm.htm

Die sortieren zuerst und bestimmen das N dann für jede Zeile einzeln.. Ist Sidak-Holm das gleiche wie "einfach Sidak"?
Leoncia
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 14. Jan 2015, 13:26
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Sidak Adjustierung - richtige Formel?

Beitragvon Leoncia » Mi 28. Jan 2015, 12:22

Ok, da sich da wohl niemand hineinversetzen kann, habe ich hier noch ein kleines Beispiel generiert.


...........Kontrollwert | Behandlungswert | p-Wert | sidak-Wert
Protein1...........200 | 300............... | 0.1 .... | ?
Protein2...........560 | 800............... | 0.004 .. | ?
Protein3...........220 | 350............... | 0.08 .... | ?
Protein4...........100 | 999............... | 0.0004 ..| ?
Protein5...........209 | 200............... | 0.99 .....| ?
Protein6...........600 | 710............... | 0.89 .... | ?

Also auf jede Zeile einzeln wurde ein p-Wert berechnet. Ist das N nun 6? Oder 1, da es nur eine Behandlungsgruppe gibt? Sorry wegen der Punkte, aber der Table Generator ist mir zu kompliziert :P
Leoncia
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 14. Jan 2015, 13:26
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Sidak Adjustierung - richtige Formel?

Beitragvon PonderStibbons » Do 29. Jan 2015, 12:05

Wieso 1700 einzelne Vergleiche - welche Erkenntnisse sollen damit gewonnen werden,
wie ergibt sich das aus der Fragestellung? Wie es aussieht, muss man entweder hohe
Risikien für Fehler 1. Art oder hohe Risken für Fehler 2. Art eingehen, welcher relevanter
sein könnte, ist nicht zu erkennen. Nebenbei, wieso Wilcoxon Test und wie groß ist die
Stichprobe?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Leoncia

Re: Sidak Adjustierung - richtige Formel?

Beitragvon Leoncia » Fr 30. Jan 2015, 12:31

Ich weiß nicht wirklich, was das bringt, jetzt ganz genau die Daten zu beschreiben. Reicht es nicht zu wissen, dass es 1700 p-Werte gibt? Wenn ihr wisst, was man für das N in der Formel einsetzt, müsste das doch reichen. Sind das nun die Anzahl der p-Werte?
Warum Wilcoxon-Test? Weil meine Betreuer das seit Jahren so machen. Ich schreibe nur eine Bachelor Arbeit und keine Doktorarbeit, betreibe also keine Grundlagenforschung ;) Außerdem ist die Verteilung der Daten nicht genau bekannt, darum ein parameterfreier Test.
Der Hintergrund ist, dass man zu jedem Spot-Wert testet, ob er differenziell exprimiert ist - ich bezweifle, dass euch das nun den entscheidenden Hinweis liefert... Das Beispiel war natürlich nur ein kleiner Ausschnitt zur Verdeutlichung, der wahre Datensatz hat 100 Spalten und 1700 Zeilen.
Leoncia
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 14. Jan 2015, 13:26
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Sidak Adjustierung - richtige Formel?

Beitragvon PonderStibbons » Fr 30. Jan 2015, 13:38

Reicht es nicht zu wissen, dass es 1700 p-Werte gibt?

Du hast beklagt, dass eine Korrektur so viele "unsignifikante" Ergebnisse erzeugt.
Um eine Strategie vorzuschlagen, braucht man schon etwas Information. Zum
Beispiel, warum nie erstmal ein Globaltest (Friedmann) gerechnet wird, immer
gleich Einzelvergleiche. Aber wenn Du sagst, Du machst es so wie ehedem,
dann müsstest Du halt mit 6800 (? jedenfalls der Gesamtzahl der Tests)
korrigieren.

Der Hintergrund ist, dass man zu jedem Spot-Wert testet, ob er differenziell exprimiert ist - ich bezweifle, dass euch das nun den entscheidenden Hinweis liefert...

Eigentlich ist das der entscheidende Hinweis, aber offensichtlich sind
Dir die Hände für sinnvolles Vorgehen gebunden (keine Ironie), also
müsstest Du vielleicht Deinen Betreuer/gutachter fragen.

Noch gutes Gelingen!

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Sidak Adjustierung - richtige Formel?

Beitragvon Leoncia » Fr 30. Jan 2015, 16:49

Ich habe jetzt das Ganze mal mit Bonferroni gemacht und das gleiche Ergebnis.. Also auch nur sehr wenige signifikante Werte nach der Adjustierung. Wenn ich dem Internet glauben darf, sind sich Bonferroni und Sidak sehr ähnlich, also vertraue ich jetzt einfach meiner Formel :)

Muss man mit leben, dass es so wenige gibt.
Trotzdem danke für eure Hilfe! (Meine Betreuer sind allesamt reine Biologen und wissen da leider auch nicht bescheid, darum kann ich da niemanden fragen)..
Leoncia
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mi 14. Jan 2015, 13:26
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Nichtparametrische Tests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron