Sehr dringende Frage zur Korrelation vs. Regression

Fragen, die sich auf kein spezielles Verfahren beziehen.

Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon Statistiker123 » Mo 10. Mär 2014, 23:43

Hallo liebe Forumsmitglieder,

ich habe 5 sehr dringende Fragen bezüglich Statistik.
Konkret: Ich habe Korrelationen gebildet, wovon viele der UVs mit meiner AV korrelieren, ein Großteil der UVs allerdings nicht mehr in meiner logistischen Regression signifikant auftauchen um meine AV vorherzusagen. Jetzt weiß ich nicht genau, wie ich meine Hypothesen interpretieren soll (kann ich sie ablehnen oder bestätigen).

Meine Fragen sind jetzt:
1. Kann ich aufgrund der Korrelationen bereits meine Hypothesen egal welchen Typs bestätigen/ablehnen ohne im Anschluss eine Regression durchzuführen? Oder: Kann ich nur die bivariaten Zusammenhänge bestätigen? (Je desto-Beziehungen zwischen 2 Variablen)

2. Was ist, wenn eine UV signifikant mit der AV korreliert, allerdings dann nicht in der Regression auftaucht. Muss ich die Hypothese dann ablehnen, teilweise bestätigen oder kann ich sie trotz nicht signifikanter Regression trotzdem bestätigen?

3. Können aufgrund nicht signifikanter Korrelationen, UVs für die anschließende Regression bereits aufgrund ihrer Nicht-Signifikanz von der Regressionsanalyse vorab ausgeschlossen werden?

4. Was ist mit Interaktionsvariablen/Moderationsvariablen (z.B. Einfluss der UV auf AV wird durch andere UV moderiert), können diese überhaupt durch Korrelationen bestätigt bzw. abgelehnt werden oder muss ich dafür in die Regression (welche multivariat ist) schauen?

5. Ich habe Interaktionsvariablen für die Moderationseffeke gebildet, damit ich diese in der Regression testen kann, z.B. "WW-(Wechselwirkung)-zwischen-Alter-und-Nutzungsregelmäßigkeit". Diese Variable ist in der Regression nicht signifkant. Die UV "Alter" alleine ist aber sehr wohl signifikant um die AV zu prognostizieren. Wie interpretiere ich das?

Vielen lieben Dank im Voraus!!!

Viele Grüße
Zuletzt geändert von Statistiker123 am Di 11. Mär 2014, 12:39, insgesamt 1-mal geändert.
Statistiker123
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 10. Mär 2014, 23:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon PonderStibbons » Di 11. Mär 2014, 11:14

1. Kann ich aufgrund der Korrelationen bereits meine Hypothesen egal welchen Typs bestätigen/ablehnen ohne im Anschluss eine Regression durchzuführen? Oder: Kann ich nur die bivariaten Zusammenhänge bestätigen? (Je desto-Beziehungen zwischen 2 Variablen)

Das kommt auf die Hypothesen an.
2. Was ist, wenn eine UV signifikant mit der AV korreliert, allerdings dann nicht in der Regression auftaucht. Muss ich die Hypothese dann ablehnen, teilweise bestätigen oder kann ich sie trotz nicht signifikanter Regression trotzdem bestätigen?

Welche Hypothese denn konkret?
3. Können aufgrund nicht signifikanter Korrelationen, UVs für die anschließende Regression bereits aufgrund ihrer Nicht-Signifikanz von der Regressionsanalyse vorab ausgeschlossen werden?

Das kommt auf die Umstände an. In der Praxis lässt man sie meist raus,
aber es gibt Modelle, bei denen es sinnvoll sein kann, sie aufzunehmen
(z.B. wenn man Suppressoreffekte annimmt).

Durch die Vorselektion der Variablen bekommt man allerdings p-Werte,
die zu optimistisch sind, d.h. wenn man viel anhand von Tests selektiert
und hat eine nur überschaubar große Stichprobe, sind die Ergebnisse häufig nicht
übertragbar. An sich soll man sich besser aufgrund theoretischer Überlegungen
sein Modell bauen und testen.

Anzahl Prädiktoren, Stichprobengröße, und Anzahl eventuell auszusondernder
Variablen sind aber leider nicht angegeben.
4. Was ist mit Interaktionsvariablen/Moderationsvariablen (z.B. Einfluss der UV auf AV wird durch andere UV moderiert), können diese überhaupt durch Korrelationen bestätigt bzw. abgelehnt werden oder muss ich dafür in die Regression (welche multivariat ist) schauen?

Eine Interaktion ist durch eine Korrelationsanalyse doch überhaupt nicht testbar.
5. Ich habe Interaktionsvariablen für die Moderationseffeke gebildet, damit ich diese in der Regression testen kann, z.B. "WW-(Wechselwirkung)-zwischen-Alter-und-Nutzungsregelmäßigkeit". Diese Variable ist in der Regression nicht signifkant. Die UV "Alter" alleine ist aber sehr wohl signifikant um die AV zu prognostizieren. Wie interpretiere ich das?

Dass die Wirkung von Alter auf die AV auf den verschiedenen Leveln von
Nutzungshäufigkeit dieselbe ist. Ich gehe davon aus, dass Alter und
Nutzungshäufigkeit in derselben Regressionsgleichung wie die Interaktion
enthalten sind.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon Statistiker123 » Di 11. Mär 2014, 11:56

PonderStibbons hat geschrieben:
1. Kann ich aufgrund der Korrelationen bereits meine Hypothesen egal welchen Typs bestätigen/ablehnen ohne im Anschluss eine Regression durchzuführen? Oder: Kann ich nur die bivariaten Zusammenhänge bestätigen? (Je desto-Beziehungen zwischen 2 Variablen)

Das kommt auf die Hypothesen an.


z.B. "Je attraktiver (UV = Attraktivität) Rekrutierungskanälen sind, desto höher ist die Bereitschaft sich zu beweben (AV)"
-> das wäre doch bivariat und anhand einer signifikanten Korrelation könnte ich doch die Hypothese bestätigen oder nicht?

z.B. "Stellanzeigen in Zeitungen (UV) haben einen größeren Einfluss auf die Bewerbungsabsicht (AV) als Stellenanzeigen im Internet (UV)"
Hinweis: Zeitungen n.s. und Internet aber signifikant in Korrelation

z.B. "Die zusätzliche Nutzung des Internets (neben Zeitungen), hat einen positiven Einfluss auf die Bewerbungsabsicht"
Hinweis: Zeitungen n.s. und Internet aber signifikant in Korrelation


2. Was ist, wenn eine UV signifikant mit der AV korreliert, allerdings dann nicht in der Regression auftaucht. Muss ich die Hypothese dann ablehnen, teilweise bestätigen oder kann ich sie trotz nicht signifikanter Regression trotzdem bestätigen?

Welche Hypothese denn konkret?


z.B. die Moderationsvariable "Alter*Rekrutierungskanal" ist nicht signifikant in der Regression bzgl. der Bewerbungsabsicht. Das "Alter" alleine als UV und nicht als Interaktionsvariable ist aber signifikant in der Regression und in der Korrelation. Das Alter erklärt folglich alleine ohne Moderationseffekt die Bewerbungsabsicht.
(H: Einfluss von Rekrutierungskanälen (UV) auf die Bereitschaft sich zu bewerben (AV), wird positiv beeinflusst durch das Alter)


Vielen Dank nochmals soweit!
Statistiker123
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 10. Mär 2014, 23:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon PonderStibbons » Di 11. Mär 2014, 12:01

"Je attraktiver (UV = Attraktivität) Rekrutierungskanäle sind, desto höher ist die Bereitschaft sich zu beweben (AV)"

In einer Korrelationsanalyse gibt es streng genommen keine AV und UV.
Auch inhaltlich sind solche je-desto-Beziehungen schwierig. Oder hast Du
Attrakitivität experimentell manipuliert?
-> das wäre doch bivariat und anhand einer signifikanten Korrelation könnte ich doch die Hypothese bestätigen oder nicht?

Ja, Du kannst aussagen, ob die Assoziation besteht oder nicht.
z.B. die Moderationsvariable "Alter*Rekrutierungskanal" ist nicht signifikant in der Regression bzgl. der Bewerbungsabsicht.
Das "Alter" alleine als UV und nicht als Interaktionsvariable ist aber signifikant in der Regression und in der Korrelation. Das Alter erklärt folglich alleine ohne Moderationseffekt die Bewerbungsabsicht.

Sieht so aus.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Statistiker123

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon Statistiker123 » Di 11. Mär 2014, 12:51

Nein die Attraktivität habe ich nicht experimentell manipuliert.
Okay also so wie ich das jetzt sehe, kommt es vor allem auf die Regression an, um Hypothesen interpretieren zu können.

Was mir jetzt noch unklar ist:

- kann ich die Hypothese mit der Attraktivität jetzt bestätigen, teilweise bestätigen oder muss ich sie ablehnen? (Attraktivität korreliert signifikant mit Bewerbungsabsicht, ist in Regression alleine wie auch als Interaktionsvariable mit Internetkanälen jedoch nicht signifikant. Hypothese lautet nochmals: Je attraktiver Gestaltung von Internetkanälen ist, desto höher ist die Bewerbungsabsicht)

- Nimmt man signifikant korrelierte Kontrollvariablen auch in die Regression mit auf? (Sie haben nichts mit dem Modell bzw. den Hypothesen an sich zu tun und sind auch nicht durch Ausreißer etc. verzerrt)

- Ich habe z.B. das Alter als UV und eine Moderationsvariable "Alter*Internetstellenanzeige*. Würdest du die Moderationsvariable auch in die Korrelation packen neben der Regression? Das Alter und die Internetstellenanzeige habe ich bereits in der Korrelation.

- Die Stellenzeigen in Zeitungen waren n.s. in der Korrelation. Ich will zeigen, dass Stellenanzeigen im Internet einen größeren Einfluss haben als in Zeitungen.
Würdest du die nicht signifkant korrelierte Variable "Stellenazeige in zeitungen" in die Regression mit reinnehmen oder nicht?

Nochmals herzlichen Dank!
Statistiker123
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 10. Mär 2014, 23:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon PonderStibbons » Di 11. Mär 2014, 13:19

(Attraktivität korreliert signifikant mit Bewerbungsabsicht, ist in Regression alleine wie auch als Interaktionsvariable mit Internetkanälen jedoch nicht signifikant. Hypothese lautet nochmals: Je attraktiver Gestaltung von Internetkanälen ist, desto höher ist die Bewerbungsabsicht)

In der Regressionsgleichung hast Du bei den Prädiktoren vielleicht welche,
die ihrerseits mit Attraktivität korreliert sind und die abhängige Variable
so gut vorhersagen, dass für Attraktivität nichts mehr übrigbleibt. Die
Interkorrelationen der Prädiktoren sollte man sich jedenfalls mal ansehen.
Es gibt auch sowas wie Mediatoreffekte oder Drittvariableneffekte.
Was man eben sagen kann, unter "Konstanthaltung" weiterer Variablen
lässt sich ein eigenständiger Effekt von Attraktivität nicht mehr nachweisen.
- Nimmt man signifikant korrelierte Kontrollvariablen auch in die Regression mit auf? (Sie haben nichts mit dem Modell bzw. den Hypothesen an sich zu tun und sind auch nicht durch Ausreißer etc. verzerrt)

Die Frage ist etwas sehr allgemein gestellt.
-
Ich habe z.B. das Alter als UV und eine Moderationsvariable "Alter*Internetstellenanzeige*. Würdest du die Moderationsvariable auch in die Korrelation packen neben der Regression?

Was sollte das für einen Sinn ergeben?
- Die Stellenzeigen in Zeitungen waren n.s. in der Korrelation. Ich will zeigen, dass Stellenanzeigen im Internet einen größeren Einfluss haben als in Zeitungen.
Würdest du die nicht signifkant korrelierte Variable "Stellenazeige in zeitungen" in die Regression mit reinnehmen oder nicht?

Du solltest bedenken, dass mir fast keine Informationen über die Studie,
das Modell oder die Auswertungsziele zur Verfügung stehen, deswegen
kann ich dazu nichts sagen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon Statistiker123 » Di 11. Mär 2014, 15:20

PonderStibbons hat geschrieben:
(Attraktivität korreliert signifikant mit Bewerbungsabsicht, ist in Regression alleine wie auch als Interaktionsvariable mit Internetkanälen jedoch nicht signifikant. Hypothese lautet nochmals: Je attraktiver Gestaltung von Internetkanälen ist, desto höher ist die Bewerbungsabsicht)

In der Regressionsgleichung hast Du bei den Prädiktoren vielleicht welche,
die ihrerseits mit Attraktivität korreliert sind und die abhängige Variable
so gut vorhersagen, dass für Attraktivität nichts mehr übrigbleibt. Die
Interkorrelationen der Prädiktoren sollte man sich jedenfalls mal ansehen.
Es gibt auch sowas wie Mediatoreffekte oder Drittvariableneffekte.
Was man eben sagen kann, unter "Konstanthaltung" weiterer Variablen
lässt sich ein eigenständiger Effekt von Attraktivität nicht mehr nachweisen.
- Nimmt man signifikant korrelierte Kontrollvariablen auch in die Regression mit auf? (Sie haben nichts mit dem Modell bzw. den Hypothesen an sich zu tun und sind auch nicht durch Ausreißer etc. verzerrt)

Die Frage ist etwas sehr allgemein gestellt.
-
Ich habe z.B. das Alter als UV und eine Moderationsvariable "Alter*Internetstellenanzeige*. Würdest du die Moderationsvariable auch in die Korrelation packen neben der Regression?

Was sollte das für einen Sinn ergeben?
- Die Stellenzeigen in Zeitungen waren n.s. in der Korrelation. Ich will zeigen, dass Stellenanzeigen im Internet einen größeren Einfluss haben als in Zeitungen.
Würdest du die nicht signifkant korrelierte Variable "Stellenazeige in zeitungen" in die Regression mit reinnehmen oder nicht?

Du solltest bedenken, dass mir fast keine Informationen über die Studie,
das Modell oder die Auswertungsziele zur Verfügung stehen, deswegen
kann ich dazu nichts sagen.

Mit freundlichen Grüßen

P.



Also die Attraktivität korreliert höchst signifikant mit 5 anderen UVs. Das würde deine These stützen. Jetzt bleibt nur noch die Frage ob ich die Hypothese teilweise bestätigen oder vollständig bestätigen kann?

Zu den Kontrollvariablen: Ich habe Kontrollvariablen z.B. Einstellung gegenüber Internetkarriereseiten an sich gebildet. Dies korreliert signifikant mit der Bewerbungsabsicht. Die KV kommt allerdings in keiner meiner Hypothesen vor bzw. soll geprüft werden. Deshalb weiß ich jetzt nicht, ob ich diese auch in die Regression nehmen soll.

Das Forschungsziel ist aufzuzeigen, welchen Einfluss Internetkarriereseiten auf die Bewerungsabsicht haben. Meine H1 lautet z.B.: Stellenanzeigen in Zeitungen haben einen größeren Einfluss auf die Bewerbungsabsicht als Stellenanzeigen auf Karriereseiten im Internet. Da "Stellenanzeigen Zeitungen" nicht signifikant mit der Bewerbungsabsicht korrelieren, weiß ich nicht ob ich diese für die Regression verwenden soll.


Nochmals vielen Dank für die kompetenten und schnellen Antworten!
Statistiker123
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 10. Mär 2014, 23:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Sehr dringende Frage zur Korrelation vs. Regression

Beitragvon PonderStibbons » Di 11. Mär 2014, 15:49

Attraktivität korreliert höchst signifikant mit 5 anderen UVs.

Ob signifikant oder seehr signifkant, ist hierbei wumpe, wichtig
ist die Höhe der Korrelation. Wenn eine Variable sehr hoch
mit anderen korreliert, bedeutet das Redundanz innerhalb
des Modells und auch möglicherweise erratische Ergebnisse
(Stichwort Multikollinearität).
Zu den Kontrollvariablen: Ich habe Kontrollvariablen z.B. Einstellung gegenüber Internetkarriereseiten an sich gebildet. Dies korreliert signifikant mit der Bewerbungsabsicht. Die KV kommt allerdings in keiner meiner Hypothesen vor bzw. soll geprüft werden. Deshalb weiß ich jetzt nicht, ob ich diese auch in die Regression nehmen soll.

Was Kontrollvariablen darstellen und wozu sie da sind, ist Dir
ja vermutlich bekannt, daraus kannst Du womöglich ableiten,
ob sie Dir nutzen oder nicht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 14 Gäste

cron