Multiple Regression mit messwiederholtem Kriterium

Alle Verfahren der Regressionanalyse.

Multiple Regression mit messwiederholtem Kriterium

Beitragvon Bergauda » So 19. Jun 2022, 20:55

Schönen guten Abend

Ich sitze an meiner Masterarbeit und befasse mich mit der Frage, welche Vorhersage Homesickness und Friendsickness auf das Zugehörigkeitserleben bei Studienanfänger*innen liefern.
Dafür habe ich Daten zu t0 und t1 erhoben, leider haben aber nur 17 Personen an beiden Messzeitpunkten teilgenommen.

Nun wollte ich eigentlich zwei multiple Regressionen rechnen:
Homesickness und Friendsickness als Prädiktoren für das Zugehörigkeitserleben zu t0 und noch einmal zu t1.
(also: HS0 + FS0 auf Zgh0 und HS1 + FS1 auf Zgh1)

Jetzt habe ich aber drei Fragen:
1. Kann ich zu t1 als Kontrollvariable auch das Zugehörigkeitserleben zu t0 mitaufnehmen? Oder wäre das nicht erlaubt bzw. üblich?
2: Wäre es sonst möglich, den t1-Wert des Zugehörigkeitserlebens mit dem t0-Wert zu kombinieren, also z.B. eine Vorhersage von HS und FS auf die Differenz der beiden Werte?
2. Wäre ein anderes Verfahren statt einer multiplen Regression besser geeignet, evtl. ein nonparametrisches wegen der niedrigen Stichprobengröße? Ich habe auch über Pfadanalysen nachgedacht, habe da aber noch gar keine Erfahrungen.

Schon jetzt vielen Dank für die Antwort :)
Bergauda
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 13. Jun 2022, 21:05
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon bele » So 19. Jun 2022, 22:24

Hallo B,
ich habe noch nicht verstanden, was genau der Gedanke hinter der Wiederholung zu t1 war. Was war die Theorie oder die Fragestellung dazu?
LG, Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon Bergauda » Mo 20. Jun 2022, 00:09

Hall Bernhard,

eine berechtigte Frage:
In einer vorangegangenen Hypothese habe ich bereits getestet, inwieweit sich das Zugehörigkeitserleben über die Zeit signifikant verändert.
Zugehörigkeitserleben speist sich aus Kompetenzen, Möglichkeiten, Motivation und Selbstwahrnehmungsprozessen (die in der Theorie alle interagieren).

FS + HS bedienen für dieses Modell am direktesten den Anteil der Selbstwahrnehmungsprozesse, die natürlich nicht immer stabil sind - insbesondere bei Studienanfänger*innen.
Deshalb interessiert es mich, a) ob diese beiden Faktoren Zugehörigkeitserleben zu beiden Zeitpunkten vorhersagen können und ggf. b) ob es dabei Unterschiede gibt je nach Messzeitpunkt.
Für t1 erschien es mir deshalb sinnvoll den Einfluss vom t0-Erleben zu kontrollieren, damit nur der Einfluss von FS und HS betrachtet werden kann.

Ergänzend noch: das Zugehörigkeitserleben splittet sich nochmal auf in 6 verschiedene Kontexte für Möglichkeiten (z.B. Uni-Kurse, Stadt).
Dementsprechend würde ich das alles 6x rechnen. Mit einem in die Regression aufgenommen t0 von Zugehörigkeit verändern sich aber natürlich die Modellgleichungen stark, sodass ich entsprechend bei der Interpretation eine ganz andere Richtung einschlagen müsste.

Deshalb hatte ich auch schon überlegt (gerade auch im Hinblick meiner kleinen Stichprobe) wirklich nur je eine multiple Regression mit HS + FS zu t0 und t1 zu rechnen.
Gleichzeitig hab ich mich aber an dieser Stelle dann gefragt, ob ich damit nicht bewusst "wegschaue" und stattdessen meine eigentlich vorhandenen Daten nicht doch stärker mit #einbeziehen sollte.

Ich hoffe, ich konnte meine Herangehensweise jetzt ein bisschen besser beschreiben.
Gerne beantworte ich weitere aufkommende Fragen so gut es geht
Seht es mir bitte nach, wenn ich nicht ganz sattelfest bin - ist meine erste Masterarbeit ;)

Guten Start in die neue Woche
Bergauda
Bergauda
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 13. Jun 2022, 21:05
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon bele » Mo 20. Jun 2022, 09:37

Hallo Bergauda,

Bergauda hat geschrieben:Seht es mir bitte nach, wenn ich nicht ganz sattelfest bin - ist meine erste Masterarbeit ;)


Sieh mir bitte nach, wenn ich dumme Fragen stelle - ist nicht mein Fachgebiet. Zum Beispiel verstehe ich nicht, wo in

FS + HS bedienen für dieses Modell am direktesten den Anteil der Selbstwahrnehmungsprozesse

nicht, wo jetzt Selbswahrnehmungsprozesse herkommen oder ob das schon genannte Größen in dem Modell beschreibt oder hier was neues ist.


In einer vorangegangenen Hypothese habe ich bereits getestet, inwieweit sich das Zugehörigkeitserleben über die Zeit signifikant verändert.

Ohne vielleicht den Rest richtig verstanden zu haben: Das einfachste und am wenigsten Freiheitsgrade schluckende (wir haben nur wenig Beobachtungen) wäre doch die Differenz des Zugehörigkeitserlebens zwischen den beiden Messzeitpunkten zur unabhängigen Variable zu machen, oder?

Zugehörigkeitserleben speist sich aus Kompetenzen, Möglichkeiten, Motivation und Selbstwahrnehmungsprozessen (die in der Theorie alle interagieren).

Das sind alles unbeobachtete Variablen, richtig? Oder sind das alles gemessene Prädiktoren, die mit ins Modell sollen?

Deshalb interessiert es mich, a) ob diese beiden Faktoren Zugehörigkeitserleben zu beiden Zeitpunkten vorhersagen können
Klingt erstmal nach einem Regressionsmodell und ggf. b) ob es dabei Unterschiede gibt je nach Messzeitpunkt.

Bedeutet b) die Frage, ob sich das Zugehörigkeitserleben, das HS und das FS zwischen den Messzeitpunkten verändern oder ob die Vorhersagekraft sich zwischen den Messzeitpunkten verändert?

Für t1 erschien es mir deshalb sinnvoll den Einfluss vom t0-Erleben zu kontrollieren, damit nur der Einfluss von FS und HS betrachtet werden kann.

Das erscheint mir schwierig: in t0 steckt ja wahrscheinlich reichlich Information über FS0 und HS0 drin. Wenn wir davon ausgehen dürfen, dass FS0 mit FS1 und HS0 mit HS1 korrellieren, dann laufen wir in Schwierigkeiten hinein.

Ergänzend noch: das Zugehörigkeitserleben splittet sich nochmal auf in 6 verschiedene Kontexte für Möglichkeiten (z.B. Uni-Kurse, Stadt).
Dementsprechend würde ich das alles 6x rechnen.

Ohje, da steuern wir aber mit Vollgas auf ein Problem mit Alphafehlerkummulierung zu (6 Versuche à 5% falsch signifikante führen zu 26% zu mindestens einem falsch signifikanten Ergebnis). Mit n = 17 wird jedes Modell selbst bei großer Effektstärke nur sehr knapp signifikant werden können und dann fehlt jeder Spielraum um für Alphafehlerkummulation zu kontrollieren. Wäre es denkbar, aus den 6 Kontexten mittels PCA eine Hauptkomponente zu berechnen die "Zugehörigkeitserleben allgemein" beschreibt und mit der zu rechnen oder braucht es 6 verschiedene Antworten um die Fragestellung zu untersuchen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon Bergauda » Mo 20. Jun 2022, 13:34

Hallo Bernhard,

Sieh mir bitte nach, wenn ich dumme Fragen stelle - ist nicht mein Fachgebiet.

ich freue mich eher über die klugen Nachfragen. Sie zeigen mir ja auch, an welchen Stellen ich Denklücken oder mich nicht eindeutig ausgedrückt habe.
Offensichtlich gibt es das an manchen Stellen - deshalb schon bis hierhin ein Danke ;)
Das einfachste und am wenigsten Freiheitsgrade schluckende (wir haben nur wenig Beobachtungen) wäre doch die Differenz des Zugehörigkeitserlebens zwischen den beiden Messzeitpunkten zur unabhängigen Variable zu machen, oder?

An dieser Stelle bin ich mir nicht ganz sicher, ob ich dich richtig verstehe. Die Bildung eines Differenzwertes für das Zugehörigkeitserleben hatte ich auch schon angedacht. Wäre dieser dann nicht eher die AV bzw. das Kriterium in der Regression?
Für Hypothese 1 hätte ich ganz klassisch t-Tests mit verbundenen Stichproben gerechnet.
Für Hypothese 2 würde ich dann schlicht mit HS + FS (beide mit t0) einmal das Zgh zu t0 und einmal die Differenz des Zgh vorhersagen.
Zugehörigkeitserleben speist sich aus Kompetenzen, Möglichkeiten, Motivation und Selbstwahrnehmungsprozessen

das ist tatsächlich nur das Modell in der Theorie. Die einzigen Prädiktoren bleiben Homesickness und Friendsickness - die den Selbstwahrnehmungsprozessen zugeschrieben werden in der Studie (zugegeben nicht ganz einleuchtend, das wird auch in der Arbeit noch diskutiert).
Bedeutet b) die Frage, ob sich das Zugehörigkeitserleben, das HS und das FS zwischen den Messzeitpunkten verändern oder ob die Vorhersagekraft sich zwischen den Messzeitpunkten verändert?

Die Veränderung zwischen den Messzeitpunkten berechne ich ja - zumindest für Zgh - in Hypothese 1.
Deshalb würde es um eine Veränderung der Vorhersagekraft zwischen den Messzeitpunkten gehen (inhaltlich also z.B. dass Heimweh zu t1 einen weniger starken Einfluss auf das Zugehörigkeitserleben hat als zu t0). Aber einfach zwei Regressionen je Messzeitpunkt rechnen und dann die Konstanten und Koeffizienten vergleichen, das wird ja vermutlich nicht funktionieren wegen der hohen Korrelationen und der Messwiederholungen. Da würde vermutlich auch gelten:
...dann laufen wir in Schwierigkeiten hinein.

Der Vergleich der Vorhersagekraft ist aber auch nicht ganz essenziell. Zur Not lasse ich den weg.
Wäre es denkbar, aus den 6 Kontexten mittels PCA eine Hauptkomponente zu berechnen die "Zugehörigkeitserleben allgemein" beschreibt und mit der zu rechnen

Hinsichtlich der Alphafehlerkumulierung wäre natürlich die Rechnung mit einem Gesamt-Kriterium deutlich besser
Ich hätte ganz stupide einfach alle Items kombiniert und dann daraus Zgh-Gesamt berechnet.
Mit der PCA würde ich stattdessen eine Hauptkomponente bilden , der sich aus allen Items mit einem Eigenwert >1 zusammensetzt (wenn man das als Kriterium annimmt). Dadurch bündele ich ja praktisch die Informationen aus den entsprechenden Items. Ganz blöd gefragt: Gegenüber einer Gesamtvariable aus allen Items hat die Hauptomponente dann den Vorteil, dass sie das Konstrukt Zgh sparsamer - oder gar präziser? - einfängt? Oder erschließt sich mir da ein statistischer Vorteil noch nicht?
braucht es 6 verschiedene Antworten um die Fragestellung zu untersuchen?

Tatsächlich wären die einzelnen Rechnungen pro Kontext dennoch schon relevant, um - bei einer größeren Stichprobe - Schlüsse auf die Relevanz von HS + FS je Kontext ziehen zu können.
Ich hätte vermutlich a) mit dem Gesamtwert bei normalem Alphafehlerniveau und dann b) 6x für die Kontexte bei Korrektur auf 1% gerechnet.
Für b) hätte ich begründet à la "wegen des explorativen Vorgehens und der kleinen Stichprobengröße ist nur eine geringe Teststärke zu erwarten." Dementsprechend wäre ich bei der Interpretation der Ergebnisse eher vorsichtig.

Guten Start in die Woche
Bergauda
Bergauda
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 13. Jun 2022, 21:05
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon bele » Mo 20. Jun 2022, 14:24

Hallo Bergauda,

Bergauda hat geschrieben:Die Bildung eines Differenzwertes für das Zugehörigkeitserleben hatte ich auch schon angedacht. Wäre dieser dann nicht eher die AV bzw. das Kriterium in der Regression?
Für Hypothese 1 hätte ich ganz klassisch t-Tests mit verbundenen Stichproben gerechnet.


Wenn Hypothese 1 die Veränderung des Zugehörigkeitserlebens über die Zeit ist und mit einem t-Test für verbundene Stichproben beantwortet werden kann, dann ist ja gut. Der t-Test für verbundene Stichprobene entspricht dem Bilden von Differenzwerten und anschließendem t-Test zur Frage, ob die Differenz Null sein kann.


Für Hypothese 2 würde ich dann schlicht mit HS + FS (beide mit t0) einmal das Zgh zu t0 und einmal die Differenz des Zgh vorhersagen.

Ok, ich verstehe nicht ganz, was Hypothese zwei ist und wie Du zwei Rechnungen für eine Hypothese machst, aber es klingt so, als ob Du da einen Plan hättest.

Bedeutet b) die Frage, ob sich das Zugehörigkeitserleben, das HS und das FS zwischen den Messzeitpunkten verändern oder ob die Vorhersagekraft sich zwischen den Messzeitpunkten verändert?


Im Prinzip könnte man also testen, ob sich das R^2 zwischen der Regression mit den t0-Werten und der mit den t1-Werten unterscheidet? Oder ist das nochmal anders gemeint?

Ich hätte ganz stupide einfach alle Items kombiniert und dann daraus Zgh-Gesamt berechnet.


Wenn das für Deinen Fragebogen so beschrieben ist, wäre das natürlich das einfachste.

Gegenüber einer Gesamtvariable aus allen Items hat die Hauptomponente dann den Vorteil, dass sie das Konstrukt Zgh sparsamer - oder gar präziser? - einfängt? Oder erschließt sich mir da ein statistischer Vorteil noch nicht?


Ich weiß ja nicht, ob alle Deine Zugehörigkeitsgefühle zu einem zusammengefasst werden können. Vielleicht verhält sich ja das Zugehörigkeitsgefühl zum örtlichen Radiosender ander als das Zugehörigkeitsgefühl zum örtlichen Fußballclub. Ich weiß aber auch nicht, ob man mit 17 Leuten eine PCA überhaupt rechnen sollte. Dafür stecke ich da auch zuwenig drin. Ich wollte die nur zur Dimensionsreduktion einsetzen. Letztlich handelst Du Dir mit der PCA mit so wenigen Leuten vielleicht auch mehr Probleme ein als mit einer vorsichtigen Interpretation der sechs Einzelregressionen.

Viel Erfolg,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Bergauda

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon Bergauda » Mo 20. Jun 2022, 17:00

Hallo Bernhard,

Genau. Hypothese 1 ist relativ einfach rechenbar.

Für Hypothese 2 gibt es für mich zwei Möglichkeiten und ich bin mir nicht sicher, welche die statistisch 'richtigere' wäre - auch wenn sich die Fragen inhaltlich etwas unterscheiden.
Letzten Endes möchte ich den Einfluss von HS + FS aufs Zugehörigkeitserleben auch längsschnittlich bestimmen können.
Hypothese 2a) wäre also einfach die Multiple Regression zu t0 (also hier noch nichts längsschnittliches).
Bei Hypothese 2b) (ich hatte das für mich einfach so geframt, aber man könnte auch Hypothese 3 sagen) bin ich unsicher:

- teste ich einfach alles für t1 nochmal und vergleiche z.B. das R² mit t0 ODER
- berechne ich den Zeitdifferenzwert t1-t0 für Zgh und rechne damit eine Regression mit den t0-Werten von HS + FS?

Meine Tendenz wäre zweiteres, da ich da weniger die Sorge hätte, in Schwierigkeiten zu geraten (z.B. wegen all der Korrelationen und der Messwiederholung).

Ich weiß aber auch nicht, ob man mit 17 Leuten eine PCA überhaupt rechnen sollte.

Tatsächlich hatte ich auch im Kopf, dass es bei der Hauptkomponentenanalyse auch eher eine größere Stichprobe bräuchte. Dann lassen wir das mal lieber :D

Wenn das für Deinen Fragebogen so beschrieben ist, wäre das natürlich das einfachste.
Ich weiß ja nicht, ob alle Deine Zugehörigkeitsgefühle zu einem zusammengefasst werden können.

Der Fragebogen wurde allgemein entwickelt, ich habe ihn dann wiederum auf verschiedene Kontexte übertragen.
Ich führe dann auf Basis verschiedener Kontexte alles wieder zusammen. Dadurch ist dan Konstrukt natürlich stark von den von mir aufgenommenen Kontexten abhängig.
Ich glaube zwar, dass die einzelnen Kontexte das Konstrukt Zgh ganz gut abdecken, aber ganz sauber ist das nicht.
Ist aber auch nicht weiter tragisch, das diskutiere ich dann einfach mit - Gibt ja ein paar Dinge, die sich diskutieren lassen.

Mir ist für die Arbeit einfach wichtig, möglichst keine größeren oder kleineren statistischen Abwege zu betreten.
Deshalb wollte ich da noch eine zweite (natürlich auch gerne noch dritte...) Meinung zu meinen Überlegungen einholen von Menschen, die sich besser (oder zumindest lieber) mit diesem Thema auseinandersetzen ;) Deshalb auch jetzt schonmal bis hierhin ein großes DANKE an dich, Bernhard!

Schönen Nachmittag,
Bergauda
Bergauda
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 13. Jun 2022, 21:05
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression mit messwiederholtem Kriterium

Beitragvon bele » Mo 20. Jun 2022, 17:06

Hallo Bergauda,

Bergauda hat geschrieben:... ich bin mir nicht sicher, welche die statistisch 'richtigere' wäre - auch wenn sich die Fragen inhaltlich etwas unterscheiden.


Das ist ja aber doch das Pferd von hinten aufgezäumt. Du solltest doch primär eine Frage haben und dann die Statistik danach anpassen. Im ersten Fall ist es wichtig, dass Du HS und FS zu zwei Zeitpunkten erhoben hast, im zweiten Fall brauchst Du nur die t0-Werte von HS und FS.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 6 Gäste