Untersuchen ob Werte sich immer aehnlich sind

Fragen, die sich auf kein spezielles Verfahren beziehen.

Untersuchen ob Werte sich immer aehnlich sind

Beitragvon Nadita » Mi 18. Jan 2012, 10:51

Hallo,

es geht um Folgendes: Ich habe eine Liste von Genen. Diese Gene stehen teilweise in Beziehung zueinander. In dem Fall handelt es sich um Paraloge, aber das ist nicht so wichtig, ich versuche es auch fuer nicht-Biologen zu erklaeren:
Fuer jedes Gen gibt es in einer Tabelle einen zugehoerigen Wert und einen oder mehrere Paraloge (die auch gleichzeitig wieder Gene sind) und ich soll nun ueberpruefen, ob Gene, die Paraloge zueinander sind (also zueinander in Beziehung stehen), immer einen aehnlichen Wert haben, oder nicht.

Die Tabelle sieht beispielsweise so aus (Auszug):

Code: Alles auswählen
gene_id    gene_value     paralog_id    paralog_value
E09         0.24154        E01          0.01475
E13         0.35402        E11          0.26154
E13         0.35402        E88          0.34745
E13         0.35402        E89          0.41254
E40         0.24153        E07          0.31421
E40         0.24153        E79          0.12345


Wie kann ich das am Besten untersuchen? Ich arbeite mit R und bin bezueglich des generellen Konzepts wie ich mir das ansehen koennte, unsicher.

Lg
Nadita
Nadita
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 9. Jan 2012, 11:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon strukturmarionette » Mi 18. Jan 2012, 11:02

Hi,

nun ueberpruefen, ob Gene, die Paraloge zueinander sind (also zueinander in Beziehung stehen), immer einen aehnlichen Wert haben, oder nicht.


zeigt Deine Tabelle diese Zuordnung denn bereits her (also Zeile-1 Spalte-1 der Tabelle -E09- ist eine Paraloge zu Spalte-3 -E01-)
oder
soll diese Zurodnung erst anhand der Werte ermittelt werden?

S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4355
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon Nadita » Mi 18. Jan 2012, 11:28

Hallo,

ja, die Tabelle hat das "Wissen" ueber die Zuordnung. Ich soll nun sehen, ob es einen Zusammenhang zwischen den Werten fuer die Gene mit ihren zugehoerigen Paralogen gibt. Ich habe jetzt einfach einmal die Tabelle so verwendet wie sie ist und mir die Werte geplottet. Da sieht man schon recht schoen einen Zusammenhang (Punkte entlang bzw. in der Naehe der Diagonalen). Dann habe ich noch den Korrelationskoeffizienten berechnet und da kommt auch eine mittlere Korrelation heraus. Aber ich frage mich, ob das so so gut ist, denn die Beziehung ist ja hier sozusagen n:n. Jedes Gen kann mehrere Paraloge haben, und jeder Paralog kann auch mehreren Genen zugehoeren, laut Tabelle. Also sowohl in den ersten beiden Spalten wie auch in den letzten beiden Spalten gibt es Mehrfach-Eintraege. Deswegen bin ich ein wenig unsicher. Ich weiss nicht genau, wie man hier normalerweise untersucht, ob ein Zusammenhang zwischen den Werten der Gene und zugehoeriger Paraloge besteht.
Nadita
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 9. Jan 2012, 11:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon strukturmarionette » Mi 18. Jan 2012, 13:35

Hi,

wenn Du eine Korrelationskoeffizienten über die zwei ´Werte´-Vars über die gesamte Stichprobe berechnet hast, fehlt der offensichtliche Bezug zu jeweils einem Gen bzw. einem Paralog.

unsicher. Ich weiss nicht genau, wie man hier normalerweise untersucht, ob ein Zusammenhang zwischen den Werten der Gene und zugehoeriger Paraloge besteht.


Was hier ´normlalerweise´ bedeute, weiß ich auch nicht.

Man könnte aber folgendes tun:

I.
Die Datei sortieren nach gen_id und dann zunächst nur die ersten Beobachtungen, die sich auf gen_id <E01> beziehen mit den dazugehörigen paralog_values vergleichen bzw. korrelieren oder plotten.
Das gleiche dann für die darauffolgenden gen_id´s mit <E02> u.s.w.

II.
Dann die Datei sortieren nach paralog_id und dann genau wie oben, nur dass mit der kleinsten Sortierung nach paralog_id begonnen wird.

Das wär zumindest eine Möglichkeit.

S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4355
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon Nadita » Mi 18. Jan 2012, 14:04

Hallo,

danke fuer Deine Antwort.

wenn Du eine Korrelationskoeffizienten über die zwei ´Werte´-Vars über die gesamte Stichprobe berechnet hast, fehlt der offensichtliche Bezug zu jeweils einem Gen bzw. einem Paralog.


Ja, genau deswegen ich so verwirrt und weiss nicht so recht, wie ich das nun anstellen soll.

I.
Die Datei sortieren nach gen_id und dann zunächst nur die ersten Beobachtungen, die sich auf gen_id <E01> beziehen mit den dazugehörigen paralog_values vergleichen bzw. korrelieren oder plotten.
Das gleiche dann für die darauffolgenden gen_id´s mit <E02> u.s.w.

II.
Dann die Datei sortieren nach paralog_id und dann genau wie oben, nur dass mit der kleinsten Sortierung nach paralog_id begonnen wird.


Das ist leider aus dem Grund nicht so praktikabel, dass es sich um mehrere tausend verschiedene IDs handelt. Ausserdem weiss ich nicht, wie ich eine Korrelation berechnen koennte zwischen den Werten. Es hat ja jedes Gen immer denselben Wert. Aber jedes Gen hat mindestens ein oder mehrere andere Gene zugeordnet, die dann auch andere Werte haben. Hmm, das mit n:n habe ich wohl verwirrend bis falsch geschrieben.

Also ein neues Beispiel zur Veranschaulichung:

Gen1 hat Wert 0,543

Paraloge dazu sind:
Gen50 mit Wert 0,423
Gen52 mit Wert 0,512
Gen53 mit Wert 0,198

Und ich soll jetzt feststellen, ob es generell eine Tendenz gibt, dass ein Gen immer einen aehnlichen "Wert" wie alle seine Paraloge hat (fuer wie gesagt mehrere tausend Gene).

Wobei dann noch als Zusatzproblem hinzukommt, dass quasi jeder Eintrag in der Tabelle doppelt vorhanden ist (gespiegelt). Denn jedes Paralog ist ja auch ein Gen. Und hat dann wieder die jeweiligen Paraloge:

Gen50 hat Wert 0,432

Paraloge dazu sind:
Gen1 mit Wert 0,543
Gen52 mit Wert 0,512
Gen53 mit Wert 0,198

usw.

Also jedes Gen kommt quasi mindestens einmal links und mindestens einmal rechts in der Tabelle vor.
Da die Information dann ja redundant ist, muesste ich wohl vorerst meine Tabelle diesbezueglich bereinigen, oder?
Sorry, bin gerade ziemlich verwirrt (und krank, sollte lieber heim gehen).
Nadita
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 9. Jan 2012, 11:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon PonderStibbons » Mi 18. Jan 2012, 15:23

und ich soll nun ueberpruefen, ob Gene, die Paraloge zueinander sind (also zueinander in Beziehung stehen), immer einen aehnlichen Wert haben, oder nicht

Wieso berechnest Du da Korrelationen? Du bildest die Differenzen und schaust dann,
wie un/ähnlich sich die Werte der Paare sind, falls ein Kriterium zur Kategorisierung
als ähnlich oder nicht existiert, oder Du schaust Dir zumindest deskriptiv die
Verteilung (Häufigkeitstabelle, kumulative Häufigkeiten) und die wichtigsten
Parameter (Mittelwert, Median, Streuung) der Differenzwerte an.

Je nach weiterführender Fragestellung kannst Du das dann auch noch nach den
beteiligten Genen aufschlüsseln / vergleichen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon Nadita » Mi 18. Jan 2012, 15:32

Du bildest die Differenzen und schaust dann,
wie un/ähnlich sich die Werte der Paare sind,


Ja aber ist das nicht eher unklug, wenn es sich doch eigentlich gar nicht um echte "Paare" handelt? Da geht ja gewisse Information verloren, wenn ich die Werte einfach als Paare betrachte, so wie sie in der Tabelle stehen. Es gibt ja zu jedem Wert eines Genes nicht immer nur einen Wert eines Paralogs, sondern sehr oft mehrere. Ich bin mir irgendwie nicht sicher, ob ich das dann einfach so machen kann ... ? Oder ich denke viel zu kompliziert und man kann die Werte wirklich ganz simpel als Paerchen betrachten ... ?
Nadita
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 9. Jan 2012, 11:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon PonderStibbons » Mi 18. Jan 2012, 16:56

Wenn Du Dir unsicher bist, wie die Frage
ob Gene, die Paraloge zueinander sind (...), immer einen aehnlichen Wert haben, oder nicht

genau zu interpretieren ist, dann ist wohl eher der Aufgabensteller der Ansprechpartner.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Untersuchen ob Werte sich immer aehnlich sind

Beitragvon Nadita » Mi 18. Jan 2012, 17:07

Sprachlich/biologisch gesehen verstehe ich die Fragestellung. Ich bin mir bezueglich der Umsetzung unsicher. Sollte es nicht bei der Untersuchung ob es eine solche Tendenz gibt, einen Unterschied machen, ob ich jetzt zu einem Gen 15 Paraloge habe, oder zB. nur einen? Ich bin mir eben unsicher, ob ich diese Tatsache einfach so "unter den Tisch fallen lassen kann" und ob die paarweise Betrachtung nicht eventuell zu simpel ist, da es biologisch gesehen ja meist keine Paare sind.

Ich koennte ja zum Beispiel auch pro Gen fuer jeweils alle seine Paraloge einen Mittelwert bilden, dann haette ich einen richtigen paarweisen Vergleich: Wert des Gens und Durchschnittswert aller Paraloge des Gens. Aber ob das so gut ist, weiss ich auch nicht ... vielleicht war auch meine Frage danach, wie man so etwas "normalerweise" loest eher bloed, weil es da vielleicht einfach kein "normalerweise" gibt ...
Nadita
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 9. Jan 2012, 11:16
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron