Hallo!
Ich war mir nicht ganz sicher wohin damit, es geht um folgendes:
Ich habe
- zwei Kohorten (jeweils Vollerhebung), "Neulinge" und "Fortgeschrittene" (=UV)
- einen Haufen (abhängige) Variablen (alle mindestens intervallskaliert)
- eine Kontrollvariable/Kovariate, die ich "herausrechnen" soll
- Unterschiedshypothesen bezogen auf Unterschiede zwischen den Kohorten
- Zusammenhangshypothesen bezogen auf verschiedene Variablenpaare
und
- Hypothesen, die sich auf Unterschiede der Höhe dieser Zusammenhänge zwischen den Kohorten beziehen. (Ich vergleiche also die Korrelationskoeffizienten in der einen Kohorte mit den entsprechenden der anderen Kohorte)
Mein Problem:
Die Daten in fast allen Variablen sind nicht normalverteilt.
Bei einer, allerdings der wichtigsten, sind die Varianzen in den Kohorten deutlich unterschiedlich.
Die Kohorten haben unterschiedlichen Umfang: 212 vs. 105
Einerseits sind also die Voraussetzungen für Ancova bzw. t-test nicht optimal, andererseits auch die für den Vergleich der Korrelationen nicht wegen der unterschiedlichen Stichprobengröße. (Oder ist das vielleicht gar kein Problem?)
Was ist der bessere Weg:
1. Bei den Variablen, bei denen es problematisch ist, auf andere Verfahren ausweichen bzw. irgendwelche Korrekturrechnungen verwenden? Was mache ich dann mit der Kontrollvariable/Kovariate bei den Unterschiedshypothesen?
oder
2. Eine Zufallsstichprobe aus der größeren Gruppe ziehen? --> Müsste die dann genauso groß sein wie die andere Gruppe? Oder bis zu 1,5 mal so groß (liest man manchmal in Faustregeln)? Kennt jemand dazu irgendwo irgendeine zitierfähige Literatur?
oder
3. Kennt jemand noch eine andere mögliche Lösung?
Liebe Grüße!
Pfeffa M.