UV in Teilstichproben z.T. unterschiedlich

Alle Verfahren der Regressionanalyse.

UV in Teilstichproben z.T. unterschiedlich

Beitragvon #Kilian » Mo 22. Feb 2021, 23:23

Hallo zusammen,

in einem Regressionsmodell möchte ich den Zusammenhang zwischen der wahrgenommenen Qualität von insgesamt 30 Standorteigenschaften (UV) und der Gesamtattraktivität (AV) analysieren.

Die Befragung wurde insgesamt an zwei verschiedenen Standorttypen durchgeführt. Während ein Großteil der 30 UV an beiden Standorttypen erhoben wurden, wurden einige wenige Kriterien aufgrund standortspezifischer Besonderheiten jeweils nur an dem einen bzw. nur an dem anderen erhoben.

Meine Frage:

Spricht etwas dagegen alle 30 Variablen in einem Modell zu analysieren oder ist es sinnvoller die Analysen zu trennen? Ist ein Einfluss auf die Modellgüte zu erwarten?

Die Stichprobengröße ist bei beiden Standorten jeweils 300.

Vielen Dank.
#Kilian
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Di 12. Jan 2021, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: UV in Teilstichproben z.T. unterschiedlich

Beitragvon strukturmarionette » Di 23. Feb 2021, 01:34

Hi,

Spricht etwas dagegen alle 30 Variablen in einem Modell zu analysieren oder ist es sinnvoller die Analysen zu trennen?


- das resultiert hauptsächlich daraus

1.) wie Deine fachliche Fragestellung formuliert ist (ggfs Arbeitshypothesen)
(wie lautet sie?)

2.) inwieweit die statistischen Vorausetzungen jeweils erfüllt sind.
(Variablentypen, Skalenniveaus, Anzahlen und Verteilung der Fehlenden Werte)

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: UV in Teilstichproben z.T. unterschiedlich

Beitragvon bele » Di 23. Feb 2021, 08:54

Als erste Faustregel sind größere Modelle eher besser. Man kann dann die Koeffizienten vieler Standortfaktoren nicht nur aus 300 sondern aus 600 Beobachtungen bestimmen. Immer vorausgesetzt, dass Du annimmst, dass gemeinsame Koeffizienten für die Standortfaktoren sachlich sinnvoll sind. Unmittelbare Nähe einer Autobahn mag für ein Forstgrundstück positiv sein, weil sich Maschinen leicht heran- und Holz leicht wegschaffen lässt, für ein Wohngebiet bedeutet Nähe zur Autobahn dann eher Lärmbelästigung. Das solltest Du primär theoriefundiert angehen, kannst Du aber natürlich auch testen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: UV in Teilstichproben z.T. unterschiedlich

Beitragvon #Kilian » Di 23. Feb 2021, 14:07

Danke für die Antworten.

Meine Frage zielte v.a. darauf ab, ob das Modell dann überhaupt noch "stimmt", oder ob z.B.

... die Beta-Koeffizienten von denjenigen UV, die nur für einen der beiden Standorttypen erhoben wurden, verzerrt oder falsch wiedergegeben werden, weil für etwa die Fälle hier keine Daten vorliegen. (im Prinzip sollte der Koeffizient dann nur für die Fälle berechnet werden, wo es auch Daten gibt)

... die p-Werte nicht mehr stimmen

@ Bernhard: ja, vollkommene Zustimmung. Wenn aber die "unmittelbare Nähe zur Autobahn" nur bei Standorttyp 1 abgefragt wird, und sich dort bspw. herausstellt, dass ein stark positiver Einfluss auf die Gesambewertung besteht, möchte ich dann aber in meinem globalen Modell, in dem alle Faktoren berücksichtigt sind, nicht, dass dieser Effekt dann gemittelt oder verzerrt wird, nur weil diese Variable nicht für allen Fällen erhoben wurde.

@strukturmarionette
1.) welchen Einfluss hat die Erfüllung / Qualität von verschiedenen Standorteigenschaften auf die wahrgenommene Gesamtattraktivität eines Standortes?

Hypothesen wären u.a. "je größer die wahrgenommene Erfüllung / Qualität der Standorteigenschaften, desto größer die Gesamtattraktivität" oder "je mehr Eigenschaften erfüllt sind, desto größer die Gesamtattraktivität"

2.) UV: vier Skalenpunkte, Intervallskalierung und Äquidistanz wird angenommen
AV: sieben Skalenpunkte, Intervallskalierung und Äquidistanz wird angenommen

Für 20 UV gibt es keine fehlenden Werte
Für 5 UV Variablen gibt es fehlende Werte bei den Fällen 1-300
Für 5 UV Variablen gibt es fehlende Werte bei den Fällen 301-600
#Kilian
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Di 12. Jan 2021, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: UV in Teilstichproben z.T. unterschiedlich

Beitragvon bele » Di 23. Feb 2021, 15:01

Hallo Kilian,

ich habe Dir oben ganz bewusst mit einer groben Faustregel geantwortet. Ich habe schon den Eindruck, dass man bei Deiner Fragestellung sehr ins Detail gehen sollte um zu klären,
- was will ich eigentlich mit der Regression erreichen? Geht es mir um die p-Werte als Beweis eines Zusammenhangs und wenn ja, um welche p-Werte genau. Geht es mir darum, Gesamtattraktivität vorherzusagen?
- was bedeuten die 20 UV ohne fehlende Werte in beiden Gruppen? Ist es sinnvoll zu erwarten, dass sie in beiden Gruppen gleich sind, oder wäre es auch bei diesen scheinbar so einfachen sinnvoll, sie analog zu meinem Autobahnbeispiel getrennt pro Gruppe zu verstehen.
- was wäre im Blick auf dieses Ziel gewonnen, wenn man alle Daten zusammensteckt, was wäre dadurch gefährdet. Was wäre im Blick auf dieses Ziel gewonnen, wenn man die Daten getrennt auswertet, was gefährdet?

Ich glaube, man sollte das sehr mit Blick auf die dahinterstehende Fragestellung und darin sehr detailverliebt abwägen. Das passt nicht in einen einzelnen Forumsthread.Nötigenfalls rechnet man beides mal durch und schaut, wie gut die Daten zusammen passen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron