Falls Du paarweise Korrelationen berechnen willst (das wären dann allerdings 52.040 Stück), dann kommt bei 0/1-Daten vielleicht der Phi-Koeffizient für Dich in Frage.
Letztendlich möchte ich jedes Gen mit jedem anderen Gen korrelieren, da mein Chef anscheinend keine Hypothese hat, welches Gen "Einfluss" auf welches andere Gen haben könnte. Ich erhoffe mir das folgendermaßen: Ich gebe die Tabelle in ein Programm wie z.B. SPSS ein und dann (nach langem rechnen durch die Software) sollen mir die stärksten Korrelationen ausgegeben werden. Dann muss ich durch Recherche beurteilen, an welchen starken Korrelationen man forschen könnte und welche komplett sinnfrei sind
.
Deinen Vorschlag mit dem Phi-Koeffizienten kann ich aus meiner Sicht nicht verwenden (korrigiert mich ruhig, wenn ich falsch liege). Wie ich eben erlesen habe, handelt es sich um Kreuztabellen, bei denen man die 1 und 0 in jede Richtung summiert.
Es lässt sich mit meinem bescheidenen Wortschatz schwer erklären, aber die "Positionen" der 1er und 0er bezüglich des Bakterienstammes sind bei der Auswertung sehr wichtig.
Bsp:.............Gen1 Gen2 Gen3 Gen4 Gen5 Gen6
StammA..........1......0......0.....0.....1..... 1
StammB..........1......1......0.....1.....1..... 1
StammC..........0......1......1.....1.....0..... 1
StammD..........0......1......1.....1.....0..... 0
StammE..........1......0......1.....0.....1..... 0
Dieses Bsp sollte es ganz gut zeigen. Würde ich die 1 summieren, dann zähle ich für jedes Gen die Summe 3 und ich erhalte keinen Erkenntnisgewinn. Mir ist aber wichtig: Wenn Gen1 "positiv=1" ist in einem Stamm, dann ist auch Gen5 "positiv=1" im selbigen Stamm. Im gezeigten Beispiel ist das eine immer zutreffende Korrelation. Ich bin natürlich auch an 90%igen Korrelationen u. a. interessiert.
Eine Explorative Faktorenanalyse könnte helfen, miteinander assoziierte Gengruppen zu finden.
Da muss ich mich noch schlau machen... Das sagt mir bisher noch gar nix
Danke schonmal für die raschen Antworten!