Aussagekraft einer RA

Alle Verfahren der Regressionanalyse.

Aussagekraft einer RA

Beitragvon mcrj19 » Do 27. Dez 2012, 19:19

Hallo zusammen,
vielleicht weiß einer von euch etwas zu der Aussagekraft von Regressionsanalysen.

Ich habe ein Set von 368 Items, von diesen will ich 5 Werte nutzen, um einen anderen Wert ausrechnen zu können.
Leider finde ich keine Informationen, ab welche Punkt ein Modell eine wirklich Aussagekraft hat (Schwellenwert).
Ist das reiner Interpretationssache (ich denke nicht, oder)?

Ich würde mich über Feedback zum Beispiel sehr freuen!
Dateianhänge
RegXing.pdf
BeispielRegression
(9.75 KiB) 100-mal heruntergeladen
mcrj19
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 11. Aug 2012, 02:35
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Aussagekraft einer RA

Beitragvon PonderStibbons » Do 27. Dez 2012, 21:15

Ist das reiner Interpretationssache (ich denke nicht, oder)?

Ja, es ist Interpretationssache. Und Interpretationen sind nicht
beliebig. Solange der Kontext und der Gegenstand und der
Zweck eine konkreten Analyse nicht bekannt sind, lässt sich
zur Bedeutung von dabei ermittelten Kennwerten allerdings
nicht viel sagen sagen. Wenn es um Leben und Tod geht, kann
eine kleine Varianzaufklärung bereits wichtig sein, die in
anderen Kontexten inakzeptabel erscheint.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
mcrj19

Re: Aussagekraft einer RA

Beitragvon Holgonaut » Fr 28. Dez 2012, 13:13

Hi,

Ponder hat ja schon auf das R-Quadrat hingewiesen.

Viel zentraler für eine Aussagekraft (wofür eigentlich?) ist die Spezifikation des Modells. Ich rate einfach mal, dass es hier um die Nutzung von Xing geht.

Als Prädiktoren hast du ein paar demografische Variablen und Linkedin. Letzteres hat auch noch den größten Effekt. Diese Variable als Prädiktor drin zu haben
macht nur dann Sinn. wenn der Zusammenhang zwischen der Nutzung von Linkedin und Xing kausal bedingt ist. Das ist, glaub ich, Käse. Stattdessen werden bestimmte Ursachen dazu führen, dass ich generell solche Netzwerke häufiger nutze - d.h. beides sind abhängige Variablen.

Das nun bei Kontrolle der relevanten vermuteten Einflüsse (z.B. Demografie) immer noch ein dicker Zusammenhang zwischen Linkedin und Xing besteht, zeigt, dass wesentliche (gemeinsame) Ursachen im Modell fehlen (sonst würde der Zusammenhang verschwinden). Folge ist ein omitted variable bias der übrigen Koeffizienten. Das schwächt das ganze erheblich. Omitted variable bias und generell Endogenität ist immer eine Gefahr, nur weiß man es halt häufig nicht. Hier liegen allerdings Indizien vor.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

folgende User möchten sich bei Holgonaut bedanken:
mcrj19

Re: Aussagekraft einer RA

Beitragvon mcrj19 » Fr 28. Dez 2012, 13:40

Hallo PonderStibbons,
danke für das Feedback.
Das ergibt im Kontext Sinn (wenn ich schon andere Faktoren weiß, bzw. die Ergebnisse einordnen kann, kann eine RA auch mit einem kleine R² Sinn ergeben).
Danke!
mcrj19
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 11. Aug 2012, 02:35
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Aussagekraft einer RA

Beitragvon mcrj19 » Fr 28. Dez 2012, 15:23

Holgonaut hat geschrieben:Hi,
Ponder hat ja schon auf das R-Quadrat hingewiesen.
Viel zentraler für eine Aussagekraft (wofür eigentlich?) ist die Spezifikation des Modells. Ich rate einfach mal, dass es hier um die Nutzung von Xing geht.
Als Prädiktoren hast du ein paar demografische Variablen und Linkedin. Letzteres hat auch noch den größten Effekt. Diese Variable als Prädiktor drin zu haben
macht nur dann Sinn. wenn der Zusammenhang zwischen der Nutzung von Linkedin und Xing kausal bedingt ist. Das ist, glaub ich, Käse. Stattdessen werden bestimmte Ursachen dazu führen, dass ich generell solche Netzwerke häufiger nutze - d.h. beides sind abhängige Variablen.

Das nun bei Kontrolle der relevanten vermuteten Einflüsse (z.B. Demografie) immer noch ein dicker Zusammenhang zwischen Linkedin und Xing besteht, zeigt, dass wesentliche (gemeinsame) Ursachen im Modell fehlen (sonst würde der Zusammenhang verschwinden). Folge ist ein omitted variable bias der übrigen Koeffizienten. Das schwächt das ganze erheblich. Omitted variable bias und generell Endogenität ist immer eine Gefahr, nur weiß man es halt häufig nicht. Hier liegen allerdings Indizien vor.
Grüße
Holger


Hallo Holger,
Wofür eigentlich ist eine gute Frage (die Aussage mein Betreuer wollte es so wäre zu pauschal).
Mir würde es darum gehen herauszufinden, ob ich mit meinen ganzen Werten auch ein Modell aufstellen kann, was z.B. die Nutzungsintensität von Xing/LinkedIn (geschäftlichen Netzwerken) eingrenzen kann (wie gesagt, es sind 368 Items, basierend auf einer Sozialstrukturanalyse - die habe ich auf das Internet transferiert und nun suche ich nach "Findings" - Grundlagenforschung wäre wohl das richtig Wort :-D).
Zwischen beiden Netzwerken besteht auch eine Korrelation von +0,511 (also von einander abhängig). Wie würde eine kausale Verbindung aussehen?

Lt. deiner Aussage wäre es eher so etwas, dass z.B. der Studienabschluss zu der Nutzung von Xing/LinkedIn führt?
Von den demographischen Daten korreliert keine über +0,1 mit Xing/LinkedIn (außer dem Studienabschluss und Haushaltseinkommen).
Bei einem RA Test mit SPSS konnte auch keiner der Demowerte das r² deutlich verbessern.
Also würde mich das darauf schließen lassen, dass es noch etwas unbekanntes gibt, was ich nicht erhoben habe... (da ich nur Nutzer von sozialen Netzwerken befragt habe, könnte also der Willen zur Nutzung z.B. so ein Wert sein?)? Das omitted variable bias wäre dann, dass ich vermute, dass noch andere Variablen vorliegen. Die Endogenität nicht ist gegeben, dass der Wert des Schätzers so hoch ist?
An welchen Indizien würde man es den festlegen, dass weitere Forschungen notwendig sind und eine genau und fehlerfreie Aussage nicht möglich ist?
mcrj19
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 11. Aug 2012, 02:35
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Aussagekraft einer RA

Beitragvon Holgonaut » Fr 28. Dez 2012, 15:51

Hi,

das ist alles etwas ungezielt. Grundlagenforschung heißt ja nicht, dass man völlig theorielos vorgeht. Anstatt jetzt die 368 "items" (hier ist schon die Frage, ob es alles einzelne Merkmale sind, oder ob nicht mehrere items das Gleiche messen) in die Regression zu packen, wäre es halt sinnvoller, aufgrund von Theorien oder schon bestehender Forschung, gezielt Merkmale auszuwählen.

Weitere Möglichkeit: Instrumente zu finden - d.h. Variablen, die nur mit Deinen UVs zu korrelieren, aber nicht mit der AV, wenn die UV auspartialiert ist (also nur einen indirekten Effekt über die UV haben) und dann two-stage-least-squares zu nutzen.

Zumindest würde ich versuchen, solche Prädiktoren mit einzubauen, die den "Effekt" von linkedin zerstören.

Dir fehlt aber generell - glaub ich - etwas Grundlagenwissen über Regressionsanalyse. Ich möchte nicht unbedingt erklären müssen, was ein omitted variable bias ist ;)

Ich befürchte, das ist dir alles keine große Hilfe. Am besten, du bist pragmatisch und orientierst dich an den Vorschlägen Deines Betreuers.

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Aussagekraft einer RA

Beitragvon mcrj19 » Fr 28. Dez 2012, 16:14

Holgonaut hat geschrieben:Hi,

das ist alles etwas ungezielt. Grundlagenforschung heißt ja nicht, dass man völlig theorielos vorgeht. Anstatt jetzt die 368 "items" (hier ist schon die Frage, ob es alles einzelne Merkmale sind, oder ob nicht mehrere items das Gleiche messen) in die Regression zu packen, wäre es halt sinnvoller, aufgrund von Theorien oder schon bestehender Forschung, gezielt Merkmale auszuwählen.

Weitere Möglichkeit: Instrumente zu finden - d.h. Variablen, die nur mit Deinen UVs zu korrelieren, aber nicht mit der AV, wenn die UV auspartialiert ist (also nur einen indirekten Effekt über die UV haben) und dann two-stage-least-squares zu nutzen.

Zumindest würde ich versuchen, solche Prädiktoren mit einzubauen, die den "Effekt" von linkedin zerstören.

Dir fehlt aber generell - glaub ich - etwas Grundlagenwissen über Regressionsanalyse. Ich möchte nicht unbedingt erklären müssen, was ein omitted variable bias ist ;)

Ich befürchte, das ist dir alles keine große Hilfe. Am besten, du bist pragmatisch und orientierst dich an den Vorschlägen Deines Betreuers.

Grüße
Holger


Hallo Holger,
bei den Items selber messen einige die gleichen Funktionen, bzw. korrelieren so stark, dass man von einer starken Ähnlichkeit ausgehen kann.
Ansonsten sind die Items stark gefächert (das ist schon vernünftig aufbereitet - Struktur wäre bei bei einer Census Untersuchung, nur mit Medien, Konsum und Onlineverhalten).
An bestehenden Forschungen haben ich dazu ein Paper aus Shanghai gefunden, eines aus England und eines aus Deutschland (ansonsten hast du natürlich Massenweise Umfragen von Accenture o.ä. - aber richtige Grundlagen gibt es keine, bzw. gab es keine [Stand Mai 2012]), wobei die Papers nur einen Teilbereich (Onlinegaming, Onlinekonsum) untersuchen.

Der Vorschlag meines Betreuers war: Eine Regressionsanalyse wäre nicht schlecht (also sagen wir mal lieber, ich habe hier keinen Betreuer, der Ahnung davon hat - da fängt der an zu stottern und sagt, dass eine RA halt schön wäre...) ;-). Der hilft mir leider aus Erfahrung nicht weiter.
Ich lese mich dann mal etwas in die RA mit OVB etc. rein :-).
Habe ja etwas Puffer ;).

Ansonsten wird es halt eine explorative Arbeit :).
mcrj19
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Sa 11. Aug 2012, 02:35
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste