Hallo zusammen,
ich habe ein Dataset vorliegen, dass die 500 vermögendsten Individuen erfasst. Dabei liegt mir ihr Vermögen in Euro und ihre Branche, in der sie tätig sind, vor. Insgesamt sind es 14 Branchen. Diese Daten habe ich für zwei Jahre.
Die Researchfrage lautet nun: “Which sectors are apparently most successful for climbing up the ladder of the wealthiest individuals?”
Ich habe in einem ersten Schritt die Daten zusammengefasst, sodass ich auf einem Blick sehen kann, wie hoch das Gesamtvermögen pro Branche ist und wie sich die Branchen auf die 500 Individuen aufteilen, sprich wie viele sind in Branche 1 usw..
Zudem ist mir bekannt, wer der 500 Individuen auch im darauffolgenden Jahr noch unter den 500 ist. Daher habe ich zwei Datasets erstellt, einmal nur mit Daten von Individuen, die in beiden Jahren unter den 500 sind (='Panel') und einmal mit Daten, die einfach die 500 reichsten Individuen auflistet (='repeated cross-sectional data').
Ich dachte daran, das ganze mit Anova zu lösen. Allerdings haben wir das in der Vorlesung nicht behandelt... Ich vermute daher stark, dass das ganze mit einer Variation der Regression zu lösen ist. Ich möchte SPSS anwenden.
Hier also meine Frage:
Da in der Researchfrage nicht nach Individuen gefragt ist, aber nach der besten Branche, schätze ich, dass ich das zweite aufbereitete Dataset verwenden sollte, da das den Fokus mehr auf die Branche legt. Allerdings habe ich jetzt Probleme, die Daten so in Form zu bringen, dass sie für SPSS geeignet sind. Ich habe es mit Dummy Variablen versucht, aber mir ist dann aufgefallen, dass ich fast nur unabhängige Variablen habe, die nominal-skaliert sind. Zudem weiß ich nicht genau, wie ich die Zu-/ und Abgänge unter bringe. Ist das eine Multi-level Regression? Wie wende ich das an?
Könnt ihr mir helfen?
Vielen Dank im Voraus!