Hallo,
mir wurde aufgetragen, meine Versuchsergebnisse statistisch abzusichern. Leider kenne ich mich bisher relativ wenig mit statistischen Tests aus und hoffe ihr könnt mir weiterhelfen.
Ich denke, früher oder später werde ich wohl noch einen Statistikkurs besuchen müssen =)
Ich habe untersucht, ob sich ein bestimmter Typ von Retroposons (DNA-Elemente, die Kopien von sich selbst 'zufällig' an einer anderen Stelle wieder in die DNA einbauen) in der DNA GC- oder AT-reiche Regionen bevorzugen.
(GCAT = 4 DNA Basen).
Dazu habe ich jeweils einen Bereich von etwa 2000 Basenpaaren um die Einbaustelle des Retroposons untersucht und den GC-Gehalt errechnet. Ich habe also für jedes Retroposon einen Prozentwert, wieviele G und C Basen sich in der Umgebung befinden. Insgesamt habe ich um die 10.000 Retroposons untersucht.
Zusätzlich habe ich 10.000 zufällige Positionen im Genom ausgewählt und von diesen Positionen ebenfalls 2000 Basenpaar lange DNA-Sequenzen extrahiert. Hier habe ich ebenfalls den GC-Gehalt errechnet.
Die Ergebnisse habe ich in R geplottet (densityplot s.Screenshot). Die blaue Kurve zeigt den GC-Gehalt der Retroposon-Umgebung, die rote Kurve den GC-Gehalt der Zufallsregionen.
In Retroposon-Umgebung ist der GC-Gehalt also leicht höher als der durchschnittliche GC-Gehalt im Genom.
Wie kann ich dieses Ergebnis nun statistisch untermauern / widerlegen? Welche Tests sind hier sinnvoll?
Bin um jede Hilfe dankbar =/
LG
Philipp