Liebe Alle
Ich schreibe zur Zeit an einer Hausarbeit in der Archäologie und bräuchte ein bisschen Hilfe bei einer Studie, die ich nicht ganz nachvollziehen kann. Hoffentlich ist meine Anfrage nicht zu frech und ihr könnt mir weiterhelfen. Da ich normalerweise nicht so viel (eigentlich nie) mit Statistiken arbeite stecke ich ein wenig fest. Natürlich habe ich bereits versucht selber zu recherchieren und das Problem zu lösen, aber einige Dinge sind mir immer noch etwas unklar.
Es geht um folgendes:
In besagter Studie wurden Skelettpopulationen von verschiedenen Friedhöfen untersucht. Es handelt sich um altägyptische und nubische (heutiger Sudan) Populationen. Insgesamt gab es 4 Skelettserien: Ägyptisch, Nubisch und zwei Gruppen, die beide zwar in Nubien lagen, aber man sich nicht sicher war, ob es sich nun um immigrierte Ägypter handelt oder einheimische Nubier. Diese Gruppenzuordnungen basieren auf Fundort (Ägypten oder Nubien) sowie der Art der Bestattung (beide Gruppen haben sehr unterschiedliche Bestattungssitten).
Mittels Messungen am Skelett wurde eine Hauptkomponentenanalyse durchgeführt die aufzeigen sollte, anhand welcher Messungen die Skelette am besten zu unterscheiden sind. Die Grundannahme ist dabei, dass sich die genetische Distanz (bzw. der Grad an Verwandtschaft) in der biologischen (d.h. der morphologischen Ähnlichkeit) widerspiegeln soll. Dabei kamen 2 signifikante Faktoren heraus. Anhand der scores plot ist aber zu sehen, dass grosse Überlappungsbereiche herrschen und die Gruppen einfach leicht gegeneinander verschoben sind. Mittels dieser Faktoren als unabhängige Variablen wurde dann eine logistische Regression durchgeführt um eine Gruppenzugehörigkeitsprognose zu erstellen. Die zwei Gruppen (abhängige Variable) waren entweder ägyptisch oder nubisch (die ersten beiden Gruppen von oben). Man muss gleich dazu sagen, dass diese Zuordnung aus archäologischer Sicht zwar Sinn macht, aber natürlich nie eine 100% Sicherheit herrscht, sie basiert auf Art der Bestattung, Beigaben, Ort usw.
Nun bin ich unsicher was die Ergebnisse anbelangt. Kurz eine Auflistung: 1 wäre hier "ägyptisch", 0 wäre "nubisch". Die ägyptische Probe (von der ja ausgegangen wird, dass es sich nur um Ägypter handelt) wurden zu rund 85% richtig zugeordnet, die nubische wurde gleichmässig auf 1 und 0 verteilt, die anderen beiden sind auch mehr oder weniger gemischt.
Ich bin jetzt bezüglich der Interpretation nicht sicher. Daher habe ich mal versucht meine Fragen zu formulieren:
- Wenn die ägyptische Probe zu 85% richtig zugeordnet wurde - bedeutet das nun, dass meine Faktoren nicht ganz perfekt für eine Zuordnung sind ODER dass wirklich nur 85% dabei sind?
- Macht es überhaupt Sinn eine logistische Regression durchzuführen, wenn die Gruppenzugehörigkeiten von Beginn an nicht 100% sicher sind?
- Müsste eine logistische Regression nicht auf unabhängigen Erfahrungswerten beruhen? Also z.B. einer Population die 100% bestimmt wurde, aber nicht in der Studie enthalten ist?
- Die Scores Plot überschneiden sich stark, die Mittelwerte sind aber leicht verschieden - reicht das überhaupt aus? Zudem liegen die Werte zwische -2 und +2 (Skala geht von -4 bis +4). Meines Wissens nach sollte ein Wert von 0 doch bedeuten, dass keine Korrelation zwischen dem Faktor und dem Individuum besteht, oder?
- die "nubische" Gruppe wurde sogar leicht mehr als 50% als "ägyptisch" eingeordnet. In der Hauptkomponentenanalyse betrachtete man sie aber als sicher "nubisch" - was sagt mir dieses Ergebnis nun? Heisst das, dass meine Faktoren aus der PCA nicht genügend gut sind, oder dass die Probe bereits verunreinigt (z.B. durch Durchmischung) ist?
- Eine vierte Gruppe war im Fokus. Es ging, wie oben gesagt, um die Frage ob es sich eher um eine nubische oder ägyptische Population handelt. Gemäss der logistischen Regression war das Ergebnis ähnlich wie bei der "nubischen" Gruppe - ca. 50% als "ägyptisch" und 50% als "nubisch" bestimmt. Die Autoren schlossen aus den Ergebnissen, dass es sich auch um eine "gemischte" Bevölkerung handelte.
Oje ich hoffe man versteht das. Ich habe versucht die Angaben so genau wie möglich zu machen, damit ihr das ganze nachvollziehen könnt.
Ich würde das Paper ja gerne hochladen, bin aber unsicher was die Datenschutzgründe angeht. Ausserdem möchte ich ja auch nicht, dass ihr die ganze Arbeit für mich macht während ich faul rumsitze.
Über eure Hilfe wäre ich sehr dankbar.
Ganz liebe Grüsse
Mangubs