Regressionsanalys mit Grundgesamtheit

Alle Verfahren der Regressionanalyse.

Regressionsanalys mit Grundgesamtheit

Beitragvon kuhline » Do 12. Mai 2016, 17:07

Hallo,
meine Analyse beschäftigt sich mit Einflussfaktoren auf den Fleischkonsum (kg/Kopf/Jahr) in 33 Ländern über 31 Jahre.
Ich habe 5 UV, jeweils original und quadriert (also 10 UV) und mache eine multiple lineare Regression. Ich habe 4 Modelle: mit gepoolten Daten (1), ersten Differenzen (2), logarithmierten Daten (3) und logarithmierten ersten Differenzen (4).

Meine Fragen:

1. Kann ich hier annehmen, dass die Daten meine "Grundgesamtheit" sind? Oder muss ich ganz normal die p-Werte beachten?
2. Wenn Daten=GG, muss/soll ich die Modellvoraussetzungen überprüfen? Beim Modell 1 und 3 habe ich natürlich Probleme mit Multikollinearität und Autokorrelation, dafür NV. Bei Modell 2 und 4 habe ich teilweise MK (wegen der quadrierten Variablen) und keine NV. Bei jedem Modell habe ich einige Ausreißer. Wie soll ich mit keine NV umgehen, wenn ich annehme, dass die Daten eine Stichprobe sind?
3. Wenn Daten=GG, muss/soll ich die Signifikanzwerte für ANOVA und Koeffizienten beachten?
kuhline
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 12. Mai 2016, 16:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon strukturmarionette » Do 12. Mai 2016, 17:13

Hi,

1. Kann ich hier annehmen, dass die Daten meine "Grundgesamtheit" sind?

- Was meinst du damit?
- Wenn die Frage ernstgemeint ist, dann kannst Du das nur selber beantworten.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon kuhline » Do 12. Mai 2016, 17:49

Die Frage ist leider ernst gemeint, ich war bei 2 Statistikprofis und bekam 2 unterschiedliche Antworten... der eine meinte, das ist die GG und ich muss weder Modellvoraussetzungen anschauen noch Signifikanz beachten und brauche nur ne gepoolte Regression machen, die andere meinte, ich soll eben die 4 Modelle aufstellen und die Signifikanz ist superwichtig...

Meine Ansicht ist ja: Da ich ja mit Länderdaten arbeite, sind das ja erstmal keine Stichprobendaten. Aber ich könnte ja theoretisch was prognostizieren wollen oder das Modell auf andere Länder umlegen.
Und ich frage mich auch, "funktioniert" die Regression, wenn ich weder die Voraussetzungen noch die Signifikanzwerte beachte?
kuhline
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 12. Mai 2016, 16:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon mango » Mi 18. Mai 2016, 12:24

Das ist begrifflich gar nicht so ohne. Die Frage ist, was du als Grundgesamtheit betrachtest und das ist letztendlich von deinem Forschungsinteresse abhängig. Angenommen, du machst eine Vollerhebung in dem Sinne, dass du Schüler einer Schule untersuchst und dich dazu entschließt, nicht nur eine Stichprobe zu befragen sondern jeden einzelnen Schüler. Dann sind deine Regressionsschätzungen insofern völlig sicher, dass sie deskriptiv auf deine Grundgesamtheit zutreffen und es gibt keine Unsicherheit darüber, wie der Zusammenhang in der Grundgesamtheit ist.

Andererseits kann es natürlich theoretisch trotzdem vorkommen, dass du nicht-signifikante Ergebnisse bekommst (auch wenn die Zahl der Schüler so groß ist, dass Effekte schon extrem klein sein müssen, um nicht signifikant zu werden). Was bedeutet das nun inhaltlich? Siehst du deine Erhebungsgesamtheit (die im Rahmen deines Forschungsdesign die Grundgesamtheit darstellt) als Zufallsstichprobe aus einer größeren Population an, ist der Zusammenhang nicht als überzufällig anzusehen. Formal gesehen bezieht sich das auf jede Grundgesamtheit, für die deine Erhebungsgesamtheit eine Zufallsstichprobe darstellt. Interpretieren könntest du das in Bezug auf mein Beispiel z. B. dadurch, dass die Gesamtheit der Schüler zum Zeitpunkt t ja nur ein Ausschnitt aus allen Schülern, die Jahr für Jahr dort eingeschult werden, ist. Unter der Voraussetzung, dass sich die Eigenschaften der Schüler nicht verändern sondern diese immer durch den gleichen latenten Prozess "erzeugt" werden, ist deine Erhebungsgesamtheit dann eine Zufallsstichprobe aus dieser Population.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon kuhline » Do 9. Jun 2016, 12:37

Danke, mango, das verstehe ich schon, aber es geht mir um die volkswirtschaftliche Sichtweise: Ich arbeite mit volkswirtschaftlichen Länderdaten, im Sinne der Statistik wäre das streng genommen die GG, im Sinne der Ökonometrie tut man so, als wäre das eine SP, für die man sich eine "theoretische GG" zusammen"konstruiert", weil man von einem theoretischen Modell ausgeht, das man an der "Wirklichkeit" überprüft und daher also schaut, stimmt das Modell für die realen Werte - so habe ich das jetzt nach einiger Lektüre mir zusammengereimt... D.h. ich würde im Sinne der Ökonometrie ganz normal mit Signifikanz arbeiten, allerdings Ausreißer etc. nur nach theoretischer Überlegung ausschließen, da keine Mess- und Datenfehler vorhanden sein können (zumal die Daten von FAO, Worldbank und OECD stammen). Ist das so korrekt?

Ach ja, noch eine Frage: Wenn ich mehrere Regressionmodelle vergleiche, sollten dann jeweils dieselben Ausreißer ausgeschlossen sein, also z.B. alle Ausreißer aller Modelle in allen Modellen? Oder für jedes Modell die Ausreißer für das spezifische Modell? Oder lieber alle Ausreißer einschließen, da es sich um keine "fehlerhaften" Werte handeln kann? Allerdings verzerren die Ausreißer das Ergebnis der Regression zum Teil erheblich...
kuhline
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 12. Mai 2016, 16:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon PonderStibbons » Do 9. Jun 2016, 13:46

im Sinne der Statistik wäre das streng genommen die GG

Im Sinne der Statistik sind Deine Daten als Realisierungen von Variablen
anzusehen. Ob Du Deine Betrachtung nur auf die vorhandenen Daten beschränken
möchtest, oder aber testen willst, ob die vorgefundenen Beziehungen allein durch
Zufallsvariation erklärbar oder überzufällig sein könnten, das bleibt Dir überlassen,
dazu schreibt die Statistik nichts vor.

weil man von einem theoretischen Modell ausgeht, das man an der "Wirklichkeit" überprüft und daher also schaut, stimmt das Modell für die realen Werte

Ja, das ergibt Sinn.

Ausreißer etc. nur nach theoretischer Überlegung ausschließen,

Eigentlich in aller Regel gar nicht, wenn es kein Messfehler ist.
Allerdings verzerren die Ausreißer das Ergebnis der Regression zum Teil erheblich...

Dann sind vielleicht die Modelle schlecht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kuhline

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon kuhline » Do 9. Jun 2016, 14:21

Danke, PonderStibbons! D.h. ich kann guten Gewissens die Ausreißer komplett ignorieren? Das Modell ist bestimmt Unfug, wurde aber von Wissenschaftler_innen vor mir bereits so oder so ähnlich durchgeführt, ich zeig eigentlich indirekt auf, dass die da Unfug fabriziert haben :D
kuhline
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 12. Mai 2016, 16:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon PonderStibbons » Do 9. Jun 2016, 14:58

D.h. ich kann guten Gewissens die Ausreißer komplett ignorieren?

Nö, die sind ja vielleicht informativ. Mehr kann ich in Unkenntnis der Sutinedetails und der Daten nicht sagen.
Da wäre ein Vortrag vor und Gespräch mit dem Betreuer von Belang.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Regressionsanalys mit Grundgesamtheit

Beitragvon kuhline » Do 9. Jun 2016, 16:44

Das Problem ist, dass sich der Betreuer auch eher wenig auskennt ;) Aber ich werde einfach mind. ein Modell mit ausgeschlossenen Ausreißern diskutieren.
Sollte man das am besten mit multivariaten Ausreißern machen? Oder bivariaten? Oder reichen die univariaten Ausreißer? Nur die der abhängigen Variablen?
kuhline
Mitglied
Mitglied
 
Beiträge: 20
Registriert: Do 12. Mai 2016, 16:41
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 15 Gäste

cron