Hallo,
danke fuer Deine Antwort.
wenn Du eine Korrelationskoeffizienten über die zwei ´Werte´-Vars über die gesamte Stichprobe berechnet hast, fehlt der offensichtliche Bezug zu jeweils einem Gen bzw. einem Paralog.
Ja, genau deswegen ich so verwirrt und weiss nicht so recht, wie ich das nun anstellen soll.
I.
Die Datei sortieren nach gen_id und dann zunächst nur die ersten Beobachtungen, die sich auf gen_id <E01> beziehen mit den dazugehörigen paralog_values vergleichen bzw. korrelieren oder plotten.
Das gleiche dann für die darauffolgenden gen_id´s mit <E02> u.s.w.
II.
Dann die Datei sortieren nach paralog_id und dann genau wie oben, nur dass mit der kleinsten Sortierung nach paralog_id begonnen wird.
Das ist leider aus dem Grund nicht so praktikabel, dass es sich um mehrere tausend verschiedene IDs handelt. Ausserdem weiss ich nicht, wie ich eine Korrelation berechnen koennte zwischen den Werten. Es hat ja jedes Gen immer denselben Wert. Aber jedes Gen hat mindestens ein oder mehrere andere Gene zugeordnet, die dann auch andere Werte haben. Hmm, das mit n:n habe ich wohl verwirrend bis falsch geschrieben.
Also ein neues Beispiel zur Veranschaulichung:
Gen1 hat Wert 0,543
Paraloge dazu sind:
Gen50 mit Wert 0,423
Gen52 mit Wert 0,512
Gen53 mit Wert 0,198
Und ich soll jetzt feststellen, ob es generell eine Tendenz gibt, dass ein Gen immer einen aehnlichen "Wert" wie alle seine Paraloge hat (fuer wie gesagt mehrere tausend Gene).
Wobei dann noch als Zusatzproblem hinzukommt, dass quasi jeder Eintrag in der Tabelle doppelt vorhanden ist (gespiegelt). Denn jedes Paralog ist ja auch ein Gen. Und hat dann wieder die jeweiligen Paraloge:
Gen50 hat Wert 0,432
Paraloge dazu sind:
Gen1 mit Wert 0,543
Gen52 mit Wert 0,512
Gen53 mit Wert 0,198
usw.
Also jedes Gen kommt quasi mindestens einmal links und mindestens einmal rechts in der Tabelle vor.
Da die Information dann ja redundant ist, muesste ich wohl vorerst meine Tabelle diesbezueglich bereinigen, oder?
Sorry, bin gerade ziemlich verwirrt (und krank, sollte lieber heim gehen).