Liebes Team vom Statistik Forum,
lieber PonderStibbons (toller Name, ich mag Terry Pratchett^^),
ich würde mich über Rückmeldung zu meinen Überlegungen freuen.
Es geht um meine Masterthesis.
Mein Dozent kann leider keine Email-Betreuung anbieten und
wegen externen Umständen kann ich leider nur sehr eingeschränkt zum Thesis-Kurs gehen.
Es würde mich sehr freuen, wenn jemand so lieb wäre mir weiter zu helfen.
Ich verfüge über einen großen Datensatz einer Langzeitstudie mit etwa 330 Fällen in den Jahrgängen, die für mich Relevant sind.
Das Ziel ist ein Effektgrößen Vergleich zwischen zwei Thesen.
Konkret: Arbeitslosigkeit (Alo) und Gesundheit (G). Kausalitäts- oder Selektionshypothese welcher Effekt zeigt sich stärker?
Kausalitätshypothese: Alo macht krank.
Selektionshypothese: Kranke werden vermehrt Alo.
Mir stehen dafür folgende (relevante) Variablen zur Verfügung:
Für G - 3 Testverfahren, welche über einen intervalskalierten Gesamtscore Verfügen sowie ein ordinal skaliertes Item
Die Merkmale sind in allen Fällen in der Population nicht Normalverteilt (mehr Gesunde als Kranke).
Es besteht eine hohe Korrelation zwischen den Scores (z.B. Angst und Depression).
Für Alo - je nachdem wie ich die vorhandenen Daten nutze, kann ich es unterschiedlich skaliert schreiben:
Binär (z.B. war bisher Alo; war in diesem Jahr Alo; zum Testzeitpunkt Alo)
Ordinal (bisher nicht Alo/war schon einmal Alo/war mehrfach Alo)
oder in gewissen Weise Intervallskaliert "Wie viele Wochen Alo im Jahr y" (vorhandene Werte 0 bis 12)
-----Nun zum eigentlichen-----
Ich habe folgendes gefunden:
Kausalität sollte gut mit MANOVA zu rechnen sein.
UV – Alo; in Form von „War im Jahr x Alo ja/nein“ - dies war meine beste Lösung um noch ausreichende Gruppengrößen zu erhalten (über 25); dies was sonst ein Problem.
AV - G intervallskaliert (ohne das Item)
Selektion könnte so mit ANOVA gehen:
UV - G muss hier Nominal oder Ordnial werden. Ich könnte hier künstlich Gruppen bilden, um so die Skalierung von der Intervallskalierung zu reduzieren.
AV - Alo muss hier Intervallskaliert sein. Ich nutze dann die genannten "Wie viele Wochen im Jahr y"
Ich muss so ja doch etwas mehr herummodeln (Skalierung ändern) - wäre der Aufbau, wie hier vorgeschlagen, ok?
Sind die Effekte dann - nach all dem - vergleichbar?
Oder sollte ich z.B. für die Kausalität eine andere Methode wählen? Wenn ja, welche?
Ich hatte schon überlegt für die Kausalität vielleicht eine multiple oder logistische Regression zu wählen,
das geht aber nicht, da in G die Interkorrelation so hoch ist...
Vielen Dank alleine fürs Lesen bis hierher.
Ganz liebe Grüße,
Otja.