Guten Abend zusammen,
ich möchte mithilfe einer multiplen, linearen Regressionsanalyse den Zusammenhang zwischen der wahrgenommenen Qualität ("perceived performance") von insgesamt 30 Standorteigenschaften (UV) und der Gesamtattraktivität des Standorts (AV) analysieren.
Die Befragung wurde an fünf verschiedenen Standorten (Stadtteilen) durchgeführt. Die Stichprobengrößen an den Standorten unterscheiden sich und umfassen für Standort A 600 Personen, für Standort B 250, Standort C 220, Standort D 180 und Standort E 100 Personen.
Ich würde gerne die fünf Standorte in einem Regressionsmodell untersuchen, da ich nicht nur mögliche Treiber der Attraktivität der einzelnen Stadtteile erklären möchte, sondern mir eine "allgemeingültigere" Lösung verspreche. Berichtigt mich bitte, wenn ich hier einen Denkfehler habe.
Bei der Auseinandersetzung mit den Voraussetzungen der Regressionsanalyse bin ich u.a. auf die Bedeutung der Unkorreliertheit der Residuen gestoßen. Diese Voraussetzung scheint insbesondere bei Cluster-Stichproben häufig nicht gegeben (Bsp. Analyse der Determinanten der Leistung von Schülern in verschiedenen Schulklassen). Als Lösung wird hier meist die Mehrebenenanalyse empfohlen.
Mir ist nicht ganz klar, ob bei meinem Anwendungsfall wirklich eine solche Verletzung der Unabhängigkeitsannahme vorliegt bzw. wahrscheinlich ist und unbedingt kontrolliert werden muss.
Ich habe mich bereits mit dem Prozedere der Mehrebenenanalyse beschäftigt, hier allerdings (ehrlicherweise) größere Verständnisprobleme und frage mich, ob ich diese Komplexität in mein Modell aufnehmen muss oder ob es nicht auch eine pragmatischere Lösungen gibt.
Wäre es nicht beispielsweise auch denkbar, für die fünf Standorte dummy-codierte Kontrollvariablen in das Modell aufzunehmen? Ich habe auf der "Ebene" der Stadtteile keine weiteren Prädiktoren, die ich untersuchen möchte, meine 30 unabhängigen Variablen (Einzelmerkmale) sind für alle fünf Standorte identisch.
Über euer Feedback wäre ich dankbar.