von Grünschnabel_ » Fr 29. Jan 2016, 16:15
Du hast Recht, leider ist meine Darstellung ein ziemliches Durcheinander. Ich würde es gerne noch ein letztes mal versuchen.
Folgender vereinfachter Fall:
Wir haben Beobachtungen folgender Art:
- Sie sind gekennzeichnet durch den Schüler, den Test und das Jahr. Verschiedene Kombinationen sind enthalten, z.B.
Schüler1/Jahr1/Test1
Schüler1/Jahr1/Test2
Schüler1/Jahr2/Test2
Schüler2/Jahr1/Test1
Schüler2/Jahr1/Test3
usw.
- Enscheidend ist dabei, dass Schüler in verschiedenen Jahren verschiedene Tests ablegen können (jedoch legt nicht jeder Schüler in jedem Jahr jeden Test ab)
Die abhängige Variable ist die Testpunktzahl und diese soll mittels eines Regressionsmodells erklärt werden (erklärende Variablen z.B. Anzahl gelernter Stunden)
Nun wird beispielsweise mit allen Beobachtungen aus Jahr1 eine Regression durchgeführt. Die Koeffizienten werden dann auf die tatsächlichen Ausprägungen der erklärenden Variablen in Jahr2 angewendet, um die erwartete Testpunktzahl für Jahr2 zu schätzen.
Nehmen wir an, es gäbe in Jahr2 100 Beobachtungen. Diese würden dann entsprechend der (durch das Regressionsmodell) geschätzten Testpunktzahl von gut nach schlecht geordnet. Jeweils die (erwarteten) besten und schlechtesten 10 werden ausgewählt.
Dann wird die tatsächlich in Jahr2 erreichte Testpunktzahl der ausgewählten Beobachtungen betrachtet. Sofern das Modell "gut" ist, sollten die obersten 10 im Durchschnitt eine höhere Testpunktzahl erreicht haben als die untersten 10. Dies möchte ich nun mittels eines t-tests überprüfen.
Das Problem ist, dass hier ja theoretisch derselbe Schüler (für einen anderen) Test sowohl im oberen als auch im unteren Dezil sein kann. Genauso ist es auch möglich, dass für denselben Test manche Schüler im oberen und manche im unteren Dezil sind.
Andererseits kann man auch nicht jeder Beobachtung im oberen Dezil konkret eine Beobachtung im unteren Dezil zuordnen. Deswegen weiß ich nicht, ob es sich um abhängige oder unabhängige Stichproben handelt.
Die erste Frage wäre also, ob man bzw. du mir das für den konkreten Fall sagen kannst?
Die zweite Frage wäre, ob es eine Regel gibt, wie man im Zweifelsfall vorgehen sollte. Ist beispielsweise eins der Testverfahren strenger und man sollte dies im Zweifelsfall anwenden?