STATISTIK-FORUM.de

mcrj19 · von **mcrj19** » Do 27. Dez 2012, 19:19

Hallo zusammen,
vielleicht weiß einer von euch etwas zu der Aussagekraft von Regressionsanalysen.

Ich habe ein Set von 368 Items, von diesen will ich 5 Werte nutzen, um einen anderen Wert ausrechnen zu können.
Leider finde ich keine Informationen, ab welche Punkt ein Modell eine wirklich Aussagekraft hat (Schwellenwert).
Ist das reiner Interpretationssache (ich denke nicht, oder)?

Ich würde mich über Feedback zum Beispiel sehr freuen!

PonderStibbons · von **PonderStibbons** » Do 27. Dez 2012, 21:15

Ist das reiner Interpretationssache (ich denke nicht, oder)?

Ja, es ist Interpretationssache. Und Interpretationen sind nicht
beliebig. Solange der Kontext und der Gegenstand und der
Zweck eine konkreten Analyse nicht bekannt sind, lässt sich
zur Bedeutung von dabei ermittelten Kennwerten allerdings
nicht viel sagen sagen. Wenn es um Leben und Tod geht, kann
eine kleine Varianzaufklärung bereits wichtig sein, die in
anderen Kontexten inakzeptabel erscheint.

Mit freundlichen Grüßen

P.

folgende User möchten sich bei PonderStibbons bedanken:
mcrj19

Holgonaut · von **Holgonaut** » Fr 28. Dez 2012, 13:13

Hi,

Ponder hat ja schon auf das R-Quadrat hingewiesen.

Viel zentraler für eine Aussagekraft (wofür eigentlich?) ist die Spezifikation des Modells. Ich rate einfach mal, dass es hier um die Nutzung von Xing geht.

Als Prädiktoren hast du ein paar demografische Variablen und Linkedin. Letzteres hat auch noch den größten Effekt. Diese Variable als Prädiktor drin zu haben
macht nur dann Sinn. wenn der Zusammenhang zwischen der Nutzung von Linkedin und Xing kausal bedingt ist. Das ist, glaub ich, Käse. Stattdessen werden bestimmte Ursachen dazu führen, dass ich generell solche Netzwerke häufiger nutze - d.h. beides sind abhängige Variablen.

Das nun bei Kontrolle der relevanten vermuteten Einflüsse (z.B. Demografie) immer noch ein dicker Zusammenhang zwischen Linkedin und Xing besteht, zeigt, dass wesentliche (gemeinsame) Ursachen im Modell fehlen (sonst würde der Zusammenhang verschwinden). Folge ist ein omitted variable bias der übrigen Koeffizienten. Das schwächt das ganze erheblich. Omitted variable bias und generell Endogenität ist immer eine Gefahr, nur weiß man es halt häufig nicht. Hier liegen allerdings Indizien vor.

Grüße
Holger

folgende User möchten sich bei Holgonaut bedanken:
mcrj19

mcrj19 · von **mcrj19** » Fr 28. Dez 2012, 13:40

Hallo PonderStibbons,
danke für das Feedback.
Das ergibt im Kontext Sinn (wenn ich schon andere Faktoren weiß, bzw. die Ergebnisse einordnen kann, kann eine RA auch mit einem kleine R² Sinn ergeben).
Danke!

mcrj19 · von **mcrj19** » Fr 28. Dez 2012, 15:23

Holgonaut hat geschrieben:Hi,
Ponder hat ja schon auf das R-Quadrat hingewiesen.
Viel zentraler für eine Aussagekraft (wofür eigentlich?) ist die Spezifikation des Modells. Ich rate einfach mal, dass es hier um die Nutzung von Xing geht.
Als Prädiktoren hast du ein paar demografische Variablen und Linkedin. Letzteres hat auch noch den größten Effekt. Diese Variable als Prädiktor drin zu haben
macht nur dann Sinn. wenn der Zusammenhang zwischen der Nutzung von Linkedin und Xing kausal bedingt ist. Das ist, glaub ich, Käse. Stattdessen werden bestimmte Ursachen dazu führen, dass ich generell solche Netzwerke häufiger nutze - d.h. beides sind abhängige Variablen.

Das nun bei Kontrolle der relevanten vermuteten Einflüsse (z.B. Demografie) immer noch ein dicker Zusammenhang zwischen Linkedin und Xing besteht, zeigt, dass wesentliche (gemeinsame) Ursachen im Modell fehlen (sonst würde der Zusammenhang verschwinden). Folge ist ein omitted variable bias der übrigen Koeffizienten. Das schwächt das ganze erheblich. Omitted variable bias und generell Endogenität ist immer eine Gefahr, nur weiß man es halt häufig nicht. Hier liegen allerdings Indizien vor.
Grüße
Holger

Hallo Holger,
Wofür eigentlich ist eine gute Frage (die Aussage mein Betreuer wollte es so wäre zu pauschal).
Mir würde es darum gehen herauszufinden, ob ich mit meinen ganzen Werten auch ein Modell aufstellen kann, was z.B. die Nutzungsintensität von Xing/LinkedIn (geschäftlichen Netzwerken) eingrenzen kann (wie gesagt, es sind 368 Items, basierend auf einer Sozialstrukturanalyse - die habe ich auf das Internet transferiert und nun suche ich nach "Findings" - Grundlagenforschung wäre wohl das richtig Wort :-D

).
Zwischen beiden Netzwerken besteht auch eine Korrelation von +0,511 (also von einander abhängig). Wie würde eine kausale Verbindung aussehen?

Lt. deiner Aussage wäre es eher so etwas, dass z.B. der Studienabschluss zu der Nutzung von Xing/LinkedIn führt?
Von den demographischen Daten korreliert keine über +0,1 mit Xing/LinkedIn (außer dem Studienabschluss und Haushaltseinkommen).
Bei einem RA Test mit SPSS konnte auch keiner der Demowerte das r² deutlich verbessern.
Also würde mich das darauf schließen lassen, dass es noch etwas unbekanntes gibt, was ich nicht erhoben habe... (da ich nur Nutzer von sozialen Netzwerken befragt habe, könnte also der Willen zur Nutzung z.B. so ein Wert sein?)? Das omitted variable bias wäre dann, dass ich vermute, dass noch andere Variablen vorliegen. Die Endogenität nicht ist gegeben, dass der Wert des Schätzers so hoch ist?
An welchen Indizien würde man es den festlegen, dass weitere Forschungen notwendig sind und eine genau und fehlerfreie Aussage nicht möglich ist?

Holgonaut · von **Holgonaut** » Fr 28. Dez 2012, 15:51

Hi,

das ist alles etwas ungezielt. Grundlagenforschung heißt ja nicht, dass man völlig theorielos vorgeht. Anstatt jetzt die 368 "items" (hier ist schon die Frage, ob es alles einzelne Merkmale sind, oder ob nicht mehrere items das Gleiche messen) in die Regression zu packen, wäre es halt sinnvoller, aufgrund von Theorien oder schon bestehender Forschung, gezielt Merkmale auszuwählen.

Weitere Möglichkeit: Instrumente zu finden - d.h. Variablen, die nur mit Deinen UVs zu korrelieren, aber nicht mit der AV, wenn die UV auspartialiert ist (also nur einen indirekten Effekt über die UV haben) und dann two-stage-least-squares zu nutzen.

Zumindest würde ich versuchen, solche Prädiktoren mit einzubauen, die den "Effekt" von linkedin zerstören.

Dir fehlt aber generell - glaub ich - etwas Grundlagenwissen über Regressionsanalyse. Ich möchte nicht unbedingt erklären müssen, was ein omitted variable bias ist

Ich befürchte, das ist dir alles keine große Hilfe. Am besten, du bist pragmatisch und orientierst dich an den Vorschlägen Deines Betreuers.

Grüße
Holger

mcrj19 · von **mcrj19** » Fr 28. Dez 2012, 16:14

Holgonaut hat geschrieben:Hi,

das ist alles etwas ungezielt. Grundlagenforschung heißt ja nicht, dass man völlig theorielos vorgeht. Anstatt jetzt die 368 "items" (hier ist schon die Frage, ob es alles einzelne Merkmale sind, oder ob nicht mehrere items das Gleiche messen) in die Regression zu packen, wäre es halt sinnvoller, aufgrund von Theorien oder schon bestehender Forschung, gezielt Merkmale auszuwählen.

Weitere Möglichkeit: Instrumente zu finden - d.h. Variablen, die nur mit Deinen UVs zu korrelieren, aber nicht mit der AV, wenn die UV auspartialiert ist (also nur einen indirekten Effekt über die UV haben) und dann two-stage-least-squares zu nutzen.

Zumindest würde ich versuchen, solche Prädiktoren mit einzubauen, die den "Effekt" von linkedin zerstören.

Dir fehlt aber generell - glaub ich - etwas Grundlagenwissen über Regressionsanalyse. Ich möchte nicht unbedingt erklären müssen, was ein omitted variable bias ist

Ich befürchte, das ist dir alles keine große Hilfe. Am besten, du bist pragmatisch und orientierst dich an den Vorschlägen Deines Betreuers.

Grüße
Holger

Hallo Holger,
bei den Items selber messen einige die gleichen Funktionen, bzw. korrelieren so stark, dass man von einer starken Ähnlichkeit ausgehen kann.
Ansonsten sind die Items stark gefächert (das ist schon vernünftig aufbereitet - Struktur wäre bei bei einer Census Untersuchung, nur mit Medien, Konsum und Onlineverhalten).
An bestehenden Forschungen haben ich dazu ein Paper aus Shanghai gefunden, eines aus England und eines aus Deutschland (ansonsten hast du natürlich Massenweise Umfragen von Accenture o.ä. - aber richtige Grundlagen gibt es keine, bzw. gab es keine [Stand Mai 2012]), wobei die Papers nur einen Teilbereich (Onlinegaming, Onlinekonsum) untersuchen.

Der Vorschlag meines Betreuers war: Eine Regressionsanalyse wäre nicht schlecht (also sagen wir mal lieber, ich habe hier keinen Betreuer, der Ahnung davon hat - da fängt der an zu stottern und sagt, dass eine RA halt schön wäre...) ;-)

. Der hilft mir leider aus Erfahrung nicht weiter.
Ich lese mich dann mal etwas in die RA mit OVB etc. rein :-)

.
Habe ja etwas Puffer

.

Ansonsten wird es halt eine explorative Arbeit

.

STATISTIK-FORUM.de

Aussagekraft einer RA

Aussagekraft einer RA

Re: Aussagekraft einer RA

Re: Aussagekraft einer RA

Re: Aussagekraft einer RA

Re: Aussagekraft einer RA

Re: Aussagekraft einer RA

Re: Aussagekraft einer RA

Wer ist online?