Moin,
ich möchte eine ordinal logistische Regression durchführen und prüfe gerade die dazugehörigen Anwendungsvoraussetzungen. Dabei hat sich heraus gestellt, dass es zwischen einigen Variablen Multikollinearität gibt (reicht von 0,1 bis 0,5). Dazu einige Fragen:
1. ab welchem Wert liegt Multikollinearität vor?
2. inwiefern ist sie problematisch? Ist sie auch problematisch bei zwei Variablen, wo die Korrelation überhaupt nicht überraschend ist, z.B. "Alter" und "in Rente"; oder "arbeitslos" und "Bezug von Sozialleistungen"? Denn hier kann es ja gar nicht anders sein, als dass diese Variablen miteinander korrelieren...
3. wie verfährt man mit diesen Variablen? Gibt es ein Verfahren dies hinterher zu 'bereinigen' oder soll man eine der beiden Variablen 'rauskicken'? Oder zwei getrennte Modelle rechnen, in denen je nur eine der beiden Variablen integriert wird? Helfen vllt Interaktionseffekte?
4. Vllt liege ich total falsch, aber würde es Sinn machen mittels einer Hauptkomponentenanalyse herauszufinden, welche Variablen am 'besten' für die Analyse geeignet sind?
Bin für jede Antwort dankbar.
Besten Gruß,
Marnie