STATISTIK-FORUM.de

Wanderfalke · von **Wanderfalke** » Mi 13. Mär 2013, 10:07

Guten Morgen,
ich möchte einen Datensatz analysieren und soll dabei betrachten wie die Zufriedenheit im Job und die Ausbildung das Einkommen beeinflussen.

Dabei ist das Einkommen kontinuierlich verteilt, die beiden anderen Variablen sind ordinal.

Wie könnte ich dabei nun vorgehen, wenn ich ein Model vorhersagen will?

Das Einkommen ist nicht-normal verteilt, sondern wie man erwartet nach links schief verteilt. Um mögliche Outlier aus dem Datensatz zu entfernen würde ich gerne den Datensatz in eine Normalverteilung bringen, die Outlier entfernen und dann wieder zurückrechnen. Ist sowas statistisch sinnvoll?

Welchen Ansatz könnte ich allgemein wählen? SOllte man da mit einer Regression anfangen? Korrelation? Diskriminanten Analyse?

Könnt ihr mir vielleicht ein paar Tipps geben?

Vielen Dank schonmal!!

PonderStibbons · von **PonderStibbons** » Mi 13. Mär 2013, 11:07

Dabei ist das Einkommen kontinuierlich verteilt, die beiden anderen Variablen sind ordinal.

In einer multiplen linearen Regression können ordinale Variablen
mit k Stufen als Prädiktoren verwendet werden, wenn man aus
ihnen k-1 dummy-Variablen bildet. Wie sinnvoll das ist, hängt u.a.
von der Zahl der Stufen und der Stichprobengröße ab.

Das Einkommen ist nicht-normal verteilt, sondern wie man erwartet nach links schief verteilt. Um mögliche Outlier aus dem Datensatz zu entfernen würde ich gerne den Datensatz in eine Normalverteilung bringen, die Outlier entfernen und dann wieder zurückrechnen. Ist sowas statistisch sinnvoll?

Nein.

Mit freundlichen Grüßen

P.

Wanderfalke · von **Wanderfalke** » Mi 13. Mär 2013, 11:32

Danke

Ich hab jetzt verschiedene Tests gemacht.

Bei einer Korrelation erhalte ich, dass Ausbildung mit einem Wert von 0.096 mit Einkommen korreliert.
Zufriedenheit mit 0.292.

Wenn ich mit diesen Werten eine lineare Regression durchführe komme ich auf ein Modell, das leider nur einen R^2 Wert von 0.102 hat.
So gut scheint das Modell nicht zu sein :/

Ich kriege bis jetzt damit leider nur raus, dass Ausbildung das Einkommen weniger beeinflussen als die Zufriedenheit.

Gibt es eine Möglichkeit da irgendwie noch mehr über die Daten auszusagen?

daniel · von **daniel** » Mi 13. Mär 2013, 11:48

Das Problem mit dem Modell ist, dass die Zufriedenheit auch vom Einkommen abhängen kann. Damit hast Du hier ein Endogenitätsproblem, dass nicht leicht zu lösen ist.

Ich kriege bis jetzt damit leider nur raus, dass Ausbildung das Einkommen weniger beeinflussen als die Zufriedenheit.

Wie hast Du das denn herausgefunden? Ich hoffe nicht aufgrund der Korrelationen, oder standardiserter Koeffizienten. Wenn nämlich die Variablen, wie Du sagst tatsächlich ordinal behandelt werden sollen, dann ist weder die Korrelation noch die Standardisierung zulässig.

Gibt es eine Möglichkeit da irgendwie noch mehr über die Daten auszusagen?

Was ist denn die Forschungsfrage? Plump würde ich sagen: ja -- indem Du theoretische Modelle in bezug auf die Forschungsfrage aufstellst und Dir die Daten dann in Bezug auf abgeleitete Hypothesen anschaust. Regressionsanalysen sind eigentlich nicht dazu gedacht, mal in die Daten zu schauen, und explorativ herumzuprobieren.

Wanderfalke · von **Wanderfalke** » Mi 13. Mär 2013, 12:11

darf ich die Spearman-Korrelation nicht verwenden für ordinal-skalierte Daten?

Naja die Frage ist wie das Einkommen durch Ausbildung und Zufriedenheit bestimmt wird. Basieren tut das auf dem Datensatz demo.sav, der ja wohl als Standarddatensatz in jedem SPSS mitgeliefert wird (?).

Wie kann ich denn theoretische Modelle aufbauen?
Postuliert man da schon feste mathematische Zusammenhänge, oder wie geht man da vor?

daniel · von **daniel** » Mi 13. Mär 2013, 13:38

darf ich die Spearman-Korrelation nicht verwenden für ordinal-skalierte Daten?

Ja.

die Frage ist wie das Einkommen durch Ausbildung und Zufriedenheit bestimmt wird

Wie gesagt halte ich den zweiten implizierten kausalen Effekt (eine Änderung der Zufriendenheit bewrikt/verursacht eine Veränderung des Einkommens) für sehr unplausibel. Ansonste würde ich sagen, die Frage ist relativ vage, und bestimmte Aspekte lassen sich bereits mit dem von Dir geschätzen Modell klären. Wie die Ergebnisse einer linearen Regression interpretiert werden ist hoffentlich bereits klar.

Wie kann ich denn theoretische Modelle aufbauen?

Das kommt auf die Fachdisziplin an. Es bietet sich an, in der Literatur nach Studien zu Deinem Thema zu suichen. Dort werden i.d.R. theoretische Ansätze zumindest skizziert. Ansonsten kannst Du Dich an allgemeine Modelle Deiner Disziplin halten.

Postuliert man da schon feste mathematische Zusammenhänge, oder wie geht man da vor?

Ich weiß nicht, was genau Du unter "mathematisch" verstehst, aber ein Funktionaler Zusammenhang der einzelnen Variablen der Theorie ist sicher erstebenswert. Fehlt ein solcher (wie dies z.B. in sehr vielen "Theorien" der Sozialwissenschaften der Fall ist) lassen sich kaum präzise und empirisch Prüfbare Hypothesen ableiten.

Wanderfalke · von **Wanderfalke** » Mi 13. Mär 2013, 20:05

Guten Abend,
ich habe gerade eine Anova durchgeführt und dabei einen Levene's Test gemacht.
Der war leider signifikant, womit die Heteroscedadizität nicht gegeben ist.

Damit dürfte ich doch eigentlich keine Anova durchführen. Kann man das durch irgendeine Annahme irgendwie umgehen? Bzw. welchen Test könnte man stattdessen nutzen?

Schönen Abend.

Wanderfalke · von **Wanderfalke** » Do 14. Mär 2013, 10:24

Guten Morgen,

tut mir Leid, wenn ich so schnell noch einmal nachhake, aber

was tue ich, wenn der Levene's test signifikant ist?

Gibt es andere Testverfahren / ... ?

Vielen Dank!!

STATISTIK-FORUM.de

Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildung)

Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildung)

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Re: Datenanalyse (Einkommen, Zufriedenheit im Job, Ausbildun

Wer ist online?