Antwortkategorie "weiß nicht" bei intervallskalierten UV

Alle Verfahren der Regressionanalyse.

Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon #Kilian » Mi 24. Feb 2021, 23:39

Hallo zusammen, ich bräuchte nochmal eure Hilfe.

Folgende Thematik:

Ich möchte im Rahmen einer multiplen, linearen Regressionsanalyse den Zusammenhang zwischen ca. 30 UV und einer AV untersuchen.

Die unabhängigen Variablen besitzen durchgängig jeweils 4 Skalenpunkte (1,2,3,4), für die Äquidistanz und Intervallskalierung angenommen wird. Zusätzlich gibt es noch die Antwortkategorie "weiß nicht".
Die AV besitzt 7 Skalenpunkte, Äquidistanz und Intervallskalierung wird ebenfalls angenommen.

Welchen Ansatz würdet ihr empfehlen, um die UV in das Regressionsmodell aufzunehmen?

Mein Problem besteht darin, dass durch die zusätzliche Antwortkategorie "weiß nicht" meine eigentlich intervallskalierten UV dadurch Nominalskalenniveau erreichen und ich somit mit Dummy-Variablen arbeiten müsste, oder sehe ich das falsch? Dadurch würden aus den 30 Variablen allerdings 120 Dummy-Variablen, wenn ich das richtig verstanden haben.

Alternativ könnte man die Antworten der "weiß nicht" - Kategorie als fehlende Werte definieren, allerdings würd sich dann, zumindest bei einem listenweisen Ausschluss, die Stichprobe deutlich reduzieren, da nur noch Fälle übrig bleiben, die für keine der 30 UV die Kategorie "weiß nicht" angeklickt haben.

Wie würdet ihr mit diesem Problem umgehen?
#Kilian
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Di 12. Jan 2021, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon strukturmarionette » Mi 24. Feb 2021, 23:58

Hi,

- N?
- Zustandenkommen /Herkunft der Stichprobe?

Die unabhängigen Variablen besitzen durchgängig jeweils 4 Skalenpunkte (1,2,3,4),

- Bei 30 Prädiktoren zum Ausprobieren wären zunächst die Bedeutungen ( Itemtexte /Polungen, ggfs Maßeinheiten ggfs Maßeinheitenkategorisierungen /Antwortencodierungen jeweils ) zu inspizieren.

Die AV besitzt 7 Skalenpunkte

- ?

Welchen Ansatz würdet ihr empfehlen, um die UV in das Regressionsmodell aufzunehmen?

- da unterschieden sich die Möglichkeiten je nach Programmiersprache
- zu empfehlen ist zunächst immer eine fachlich begründete Prädiktorenauswahl (aktueller Forschungsstand; es sei denn es handelt sich um wissenschaftliches Neuland)


Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon #Kilian » Do 25. Feb 2021, 00:32

strukturmarionette hat geschrieben:- N?
- Zustandenkommen /Herkunft der Stichprobe?


N = 1500
Online-Befragung über ein Konsumentenpanel
Es wird der Einfluss der wahrgenommen Qualität von 30 Standorteigenschaften auf die Gesamtattraktivität des Standortes analysiert.
Ein listenweiser Ausschluss aller Fälle, welche bei mind. bei einer UV weiß nicht angeklickt haben würde Stichprobe auf N = 400 reduzieren.

strukturmarionette hat geschrieben:- Bei 30 Prädiktoren zum Ausprobieren wären zunächst die Bedeutungen ( Itemtexte /Polungen, ggfs Maßeinheiten ggfs Maßeinheitenkategorisierungen /Antwortencodierungen jeweils ) zu inspizieren.

Die Prädiktoren haben 4 Skalenpunkte (vereinfacht gesagt: wahrgenommene Erfüllung von 0 = gar nicht erfüllt bis 100 % = voll und ganz erfüllt)

strukturmarionette hat geschrieben:- ?


Die Gesamtattraktivität hat 7 Ausprägungen, von 0 = völlig unattraktiv bis 7 = außerordentlich attraktiv (Äquidistanz wird angenommen).

strukturmarionette hat geschrieben:- da unterschieden sich die Möglichkeiten je nach Programmiersprache

Die Auswertung wird mit SPSS gemacht.

strukturmarionette hat geschrieben:- zu empfehlen ist zunächst immer eine fachlich begründete Prädiktorenauswahl (aktueller Forschungsstand; es sei denn es handelt sich um wissenschaftliches Neuland)


Das ist mir bewusst, wurde auch berücksichtigt. Ich verstehe allerdings nicht ganz, inwiefern dies eine Rolle spielt für mein Problem, dass mir unklar ist wie ich mit der "weiß nicht"-Kategorie in der Regression umgehen soll.

Danke.
#Kilian
Beobachter
Beobachter
 
Beiträge: 12
Registriert: Di 12. Jan 2021, 12:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon strukturmarionette » Do 25. Feb 2021, 01:49

Hi,

Die Prädiktoren haben 4 Skalenpunkte (vereinfacht gesagt: wahrgenommene Erfüllung von 0 = gar nicht erfüllt bis 100 % = voll und ganz erfüllt)

- sorry, versteh ich nicht.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon bele » Do 25. Feb 2021, 11:07

Hallo Kilian,

#Kilian hat geschrieben:N = 1500


Das ist ja nicht wenig. Grundsätzlich käme es bei so großem N auch infrage, 120 Dummyvariablen im Modell zu belassen.

da nur noch Fälle übrig bleiben, die für keine der 30 UV die Kategorie "weiß nicht" angeklickt haben.


Du solltest mal analysieren, wie oft das wo passiert. Vielleicht passiert das immer bei derselben von den 30 UV, weil die schlecht formuliert war? Vielleicht ist das bei 29 von 30 UV die ganz große Ausnahme und von Deinen 1500 bleiben immer noch 1400 übrig? Dann käme statt listenweisem Ausschluss auch ein Spaltenausschluss durchaus infrage.
Vielleicht passiert es auch nur selten und mehr oder weniger über alle 30 UV hinweg gleich verteilt. Dann wäre eine Imputation zu erwägen. Zwar fühlt sich das immer etwas komisch an, wenn man einfach Antwortet dazu erfindet, die gar nicht gegen sind, aber Imputation ist genau dafür da: Damit nicht wenige fehlende Informationen zum Verlust vieler vorhandener Informationen führt.

Zuletzt könnte ich mir folgendes Vorstellen: Man erfindet pro Item zwei Zusatzvariablen: Weiss und WeissNicht, die entweder den Wert Null oder Eins annehmen. WeissNicht geht als eigene UV ins Modell ein, Weiß nur als Interaktionsterm multipliziert mit der Prozentzahl des jeweils zugeordneten Items. In dem Fall würden alle die Fälle, in denen eine Prozentzahl angekreuzt wurde in die Berechnung des Koeffizienten für die Prozentzahl eingehen und für alle die, in denen WeissNicht angekreuzt wurde, würde stattdessen eine gemeinsame Konstante geschätzt.

Ich weiß nicht, ob so ein Vorgehen einen Namen hat und auch nicht, wie kompliziert die Umsetzung in SPSS wäre, ich sehe aber nicht, warum das nicht funktionieren sollte. Die Zahl der zu schätzenden Koeffizienten wird immer noch verdoppelt aber nicht mehr vervierfacht.

Die Gesamtattraktivität hat 7 Ausprägungen, von 0 = völlig unattraktiv bis 7 = außerordentlich attraktiv (Äquidistanz wird angenommen).


Ich kann nachvollziehen, dass Du Äquidistanz bei den UV annehmen möchtest, wenn die als 0 % - 33 % - 67% - 100 % beschriftet sind und so viele sind. Für die eine abhängige könnte man aber auch eine ordinale Regression machen, wenn man so viele Beobachtungen hast.

Die Auswertung wird mit SPSS gemacht.


Zu dem Aspekt kann ich nichts beitragen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Antwortkategorie "weiß nicht" bei intervallskalierten UV

Beitragvon PonderStibbons » Do 25. Feb 2021, 11:50

Man kann das auch als 5 stufige kategoriale Variablen betrachten (weiß nicht, 1, 2, 3, 4) und jeweils 4 dummys bilden.
Ergäbe allerdings 120 Prädiktoren. Da der konkrete Zweck der Analyse nicht angegeben ist, lässt sich nicht sagen,
ob das nicht passend wäre. Jedenfalls hätte man Unfug wie "4 Skalenpunkte (1,2,3,4), für die Äquidistanz und
Intervallskalierung angenommen wird" vom Hals.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron