Stichprobenumfang bei Multipler Regression

Alle Verfahren der Regressionanalyse.

Stichprobenumfang bei Multipler Regression

Beitragvon Maren_Stata » Mo 24. Feb 2020, 10:54

Hallo zusammen,

ich rechne gerade eine multiple Regression und frage mich, ob mein Stichprobenumfang ausreichend ist für die Anzahl der Variablen, die ich betrachte. In der Literatur habe ich hierzu unterschiedliche Auffassungen gefunden von n>5xAnzahl der exogenen Variablen bis n>50+8xAnzahl der exogenen Variablen.

Mein Modell sieht wie folgt aus:

n=136
F(23, 112)=9.46, p<0.00

Ich untersuche den Effekt der folgenden Variablen auf meine metrische AV:

Unabhängige Variablen:
- 3 unabhängige metrische Variablen

Kontrollvariablen:
- 3 metrische Kontrollvariablen
- 3 dichotome Kontrollvariablen (Dummy-Variablen)
- 1 ordinale Kontrollvariable mit 11 Ausprägungen
- 1 ordinale Kontrollvariable mit 5 Ausprägungen


Wenn ich die oben genannte Regel in Bezug auf die exogenen Variablen anwende, betrachte ich dann jede Ausprägung meiner UV, d.h. in meinem Fall insgesamt 28? Folge ich der Logik, würde ich einen Stichprobenumfang von mind. 5x28=140 bzw. 50+8x28=274 benötigen. Würde das im Umkehrschluss bedeuten, dass ich die Anzahl der Kontrollvariablen reduzieren sollte?

Ich würde mich über eine Einschätzung sehr freuen!

Mit freundlichen Grüßen
M.
Maren_Stata
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mo 13. Jan 2020, 19:22
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Stichprobenumfang bei Multipler Regression

Beitragvon PonderStibbons » Mo 24. Feb 2020, 11:04

Maren_Stata hat geschrieben:- 1 ordinale Kontrollvariable mit 11 Ausprägungen

Das ist ungewöhnlich, Was hat es damit auf sich?
Ich würde mich über eine Einschätzung sehr freuen!

Was sind denn Thema, Fragestellung, gemessene Variablen bei dieser Studie?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Stichprobenumfang bei Multipler Regression

Beitragvon Maren_Stata » Mo 24. Feb 2020, 12:01

Hallo PonderStibbons,

vielen Dank für die Antwort!

Ich untersuche die Nutzungsbereitschaft technischer Assistenzsysteme und habe dazu eine papierbasierte Umfrage durchgeführt.

Dazu untersuche ich den Einfluss folgender Variablen auf die Nutzungsbereitschaft: n=136

Unabhängige Variablen: 3 unabhängige metrische Variablen im Rahmen eines Technologieakzeptanzmodells
1) Wahrgenommener Nutzen
2) Einfachheit der Nutzung
3) Sozialer Druck


Kontrollvariablen:
1) Wahgenommener Pflegebedarf
2) Wahrgenommenes Sturzrisiko
3) Alter (chronologisch)
4) Geschlecht (0/1)
5) Besitz eines technischen Assitenzsystems (0/1)
6) Lebenssituation: alleine lebend/mit anderen leben (0/1)
7) Wahgenommener Gesundheitszustand (5 Ausprägungen)
8) Erhebunsort (11 Ausprägungen)


PonderStibbons hat geschrieben:Das ist ungewöhnlich, Was hat es damit auf sich?


Ich habe meine Daten an 11 verschiedenen Orten erhoben und möchte mit dieser Variable auf den möglichen Einfluss des Erhebungsortes kontrollieren. Dieser ist jedoch weder in der bivariaten noch in der multivariaten Regression signifikant.

Mit freundlichen Grüßen
M.
Maren_Stata
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mo 13. Jan 2020, 19:22
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Stichprobenumfang bei Multipler Regression

Beitragvon Maren_Stata » Mo 24. Feb 2020, 13:29

Hier noch ein weiterer Gedanke zu dem Tehma:

Eigentlich sehe ich gerade zwei Möglichkeiten mit dem geringen Stichprobenumfang und der Variablenanzahl umzugehen:
1) Ich schließe z.B. die Variablen Location (11 Ausprägungen) und Gesundheitszustand (5Ausprägungen) aus. In diesem Fall würde ich dann mit gängigen Faustregeln (z.B. 10 Beobachtungen pro UV oder 104 Beobachtungen+Anzahl der UV übereinstimmen. Im Methodenteil meiner Masterarbeit würde ich dann argumentieren, dass aufgrund der statistischen Power hier die Anzahl der Kontrollvariablen aufgrund des geringen Stichprobenumfangs limitiert wurde, zukünftige Studien jedoch ggf. noch weitere relevante Variablen berücksichtigen sollten.

2) Ich behalte die Auswahl der Kontrollvariablen so bei und argumentiere, dass mein Stichprobenumfang eigentlich nicht ausreichend ist, ich jedoch trotzdem einen Beitrag für den wissenschaftlichen Prozess leiste (z.B. weil ich mögliche Erkenntnisse beitrage, die im Rahmen einer Metaregression verwendet werden können).

Gäbe es noch eine weitere sinnvolle Möglichkeit und welche dieser beiden wäre aus statistischer Sicht zu bevorzugen?

Vielen Dank und freundliche Grüße
Maren_Stata
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mo 13. Jan 2020, 19:22
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Stichprobenumfang bei Multipler Regression

Beitragvon PonderStibbons » Mo 24. Feb 2020, 14:25

Wohnort ist nicht ordinal, sondern kategorial.

Ich kann nicht nachvollziehen, wieso Wohnort und Alleinleben als Kontrollvariablen bei der Vorhersage
von Nutzungsberetschaft von Assistenzsystemen herhalten sollen. Es kommt mir sehr beliebig vor. Sollten
diese Variablen tatsächlich substanziell mit der AV sowie mindestens einer UV assoziiert sein?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Stichprobenumfang bei Multipler Regression

Beitragvon Maren_Stata » Mo 24. Feb 2020, 14:34

Wohnort ist nicht ordinal, sondern kategorial.


Das stimmt natürlich!

Ich kann nicht nachvollziehen, wieso Wohnort und Alleinleben als Kontrollvariablen bei der Vorhersage
von Nutzungsberetschaft von Assistenzsystemen herhalten sollen. Es kommt mir sehr beliebig vor. Sollten
diese Variablen tatsächlich substanziell mit der AV sowie mindestens einer UV assoziiert sein?


Die Lebenssituation ist inhaltlich insofern relevant, da das Assistenzsytem, ein Hausnotrufsystem, vor allem von alleine lebenden Menschen genutzt wird und es somit sein kann, dass die Ausprägung "alleine lebend" - "mit anderen Personen zusammenlebend" relevant ist.

Den Erhebungsort habe ich mit aufgenommen, da ich die Daten im Rahmen verschiedener Freizeitkreise erhoben habe (Spieletreff, Tanzrunde, Leserunde). Es kann somit sein, dass der jeweilige Freizeittreff Menschen mit unterschiedlichen Charakteristika anspricht (Tanzrunde ist ggf. physisch mobiler als Leserunde), was wiederum einen Einfluss auf die Nutzungsbereitschaft eines Hausnotrufsystems haben kann.

Während die Lebenssituation auch in der Literatur als relevant erachtet wird, habe ich den Erhebungsort der Daten aus eigenem Interesse aufgenommen.

Mit freundlichen Grüßen
M.
Maren_Stata
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mo 13. Jan 2020, 19:22
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post

Re: Stichprobenumfang bei Multipler Regression

Beitragvon PonderStibbons » Di 25. Feb 2020, 11:00

Für meine Begriffe sind es zu viele Prädiktoren und es wäre zu überlegen, ob nicht zumindest
die 10 dummies entbehrlich sind, die für den Erhebungsort stehen. Du solltest in dem Punkte
mit Deinem Betreuer Rücksprache halten.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Maren_Stata

Re: Stichprobenumfang bei Multipler Regression

Beitragvon bele » Di 25. Feb 2020, 12:49

Könnte man das nicht teilweise entschärfen, wenn man den Erhebungsort als random effect betrachtet? Es bleiben immer noch wenige Daten für viele Koeffizienten aber wenn ich das in meinem Laienverständnis richtig behalten habe, belastet der Random effect nur mit 2 Freiheitsgraden (Mittelwert und Standardabweichung) anstelle von 10. Oder bin ich da auf dem Holzweg?

Ob man "wahrgenommenen Pflegebedarf" braucht, wenn man "Gesundheitszustand" hat?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
Maren_Stata

Re: Stichprobenumfang bei Multipler Regression

Beitragvon Maren_Stata » Do 27. Feb 2020, 11:46

Hallo zusammen,

vielen Dank für die Anregungen!
Ich habe nun den Erhebungsort und den Gesundheitszustand erst einmal aus dem Modell genommen und bespreche es heute noch einmal mit meiner Betreuerin.

Mit freundlichen Grüßen
Maren
Maren_Stata
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Mo 13. Jan 2020, 19:22
Danke gegeben: 7
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron