Logistische Regression mit AIC und BIC (rückwärts)

Alle Verfahren der Regressionanalyse.

Logistische Regression mit AIC und BIC (rückwärts)

Beitragvon Badeentchen_007 » Mo 28. Mär 2016, 20:25

Hallo zusammen,

ich verzweifel gerade ein wenig ... :cry: :cry: :cry:

Ich teste für meine Masterarbeit, welchen Einfluss Sport Sponsoring auf die Markenbekanntheit eines unternehmens hat. Dazu habe ich nu Daten gesammelt; die Markenbekanntheit ist meine AV (ordinal mit "nicht vorhanden", "gering","stark"), meine UV sind z.B. ist der Akteur Fan (nominal), wie oft guckt er Spiele von einem bestimmten Sportverein (ordinal) etc.

Mein Plan war nun in der Auswertung eine Korrelationsanalyse als erstes um zu schauen, ob es hier ggf. schon Hinweise geben könnte, auf welche "Kombi" ich achten muss. Im zweiten Schritt wollte ich nun eine ordinale Regression machen und dann rückwärts UVs aus dem Modell entfernen und dabei dann schauen, wie sich das Modell verändert.

Frage 1) Fehlt hier irgendein Schritt oder ist dieses Vorgehen so an sich schon mal für die Tonne?!
Frage 2) Gibt es bestimmte Vorgaben, nach welchen ich das Modell "ausdünne"? Ich habe dazu in der Literatur das BIC und AIC gefunden, muss dazu aber auch sagen, ich bin der absolute Statistik-Honk ... gäbe es da eine Alternative? Oder gibt es ein komplett alternatives Vorgehen, wie ich die Abhängigkeiten mir anschauen kann?

Ich werte das ganze mit SPSS aus und da stellt sich die BIC/ AIC - Variante gerade so ein wenig als "unlösbar" dar.

Ich würde mich wahnsinnig über ne Antwort freuen ...

Danke und LG!
Zuletzt geändert von Badeentchen_007 am Fr 1. Apr 2016, 17:53, insgesamt 1-mal geändert.
Badeentchen_007
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 28. Mär 2016, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Ordinale Regression mit AIC und BIC

Beitragvon mango » Di 29. Mär 2016, 00:02

Hallo, was ist denn dein Problem mit dem AIC? Das lässt sich doch recht einfach für jedes der Modelle berechnen.

Die Frage wäre natürlich, ob du so etwas überhaupt brauchst. Mir ist nicht ganz klar, was du da für ein Set von UVs hast, dass du dir so unsicher darüber bist, welches du mit in dein Modell nehmen sollst. Du hast doch eine Theorie, die du empirisch überprüfen möchtest. Was an UVs zu deiner Theorie gehört, nimmst du mit rein, was nicht, lässt du draußen. Ist nicht klar, welche der UVs gut in deine Theorie passen, mach doch z. B. mal eine Faktorenanalyse. Ansonsten kannst du ja in der Regression sehen, welche Variable wie viel Varianzaufklärung leistet.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Ordinale Regression mit AIC und BIC

Beitragvon PonderStibbons » Di 29. Mär 2016, 08:49

Frage 1) Fehlt hier irgendein Schritt oder ist dieses Vorgehen so an sich schon mal für die Tonne?!

Automatisierte schrittweise Variablenselektion führt zu überangepassten und daher ncht
gneralisierbaren Modellen. Das Problem wird noch verschärft, wenn Prädiktoren aus einem
größeren Pool anhand von statistischen Kennwerten (Koeffizienten, p-Werten) ausgesiebt
werden, weil das Regressionsverfahren dies nicht "weiß".

meine UV sind z.B. ist der Akteur Fan (nominal), wie oft guckt er Spiele von einem bestimmten Sportverein (ordinal) etc.

Wieviele Variablen sind es, und vor allem, wie groß ist die Stichprobe.

Frage 2) Gibt es bestimmte Vorgaben, nach welchen ich das Modell "ausdünne"?

Ein Modell nach theoretischen Überlegungen bzw. Erkenntnissen aus der
Literatur aufstellen. Und erst nochmal Gedanken darüber machen, was Du da
denn aus welchem Grund modellieren willst. Zum Beispiel, wieso genau Du Variablen
wie "ist der Akteur Fan" oder "wie oft guckt er Spiele" etc. zur Beantwortung Deiner
Forschungsfrage heranziehen willst/musst, welche Rolle sie spielen (konfundierende
Variablen, die für Scheinkorrelationen sorgen? Erklärende Variablen?
Moderatorvariablen? Mediatoren und Suppressorvariablen?).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Ordinale Regression mit AIC und BIC

Beitragvon Badeentchen_007 » Do 31. Mär 2016, 19:38

Hi :)

Danke schon mal für die Antworten!!!

Ich habe mittlerweile mein Modell noch mal überdacht :D

Folgender Hintergrund: Ich teste an einem realen Beispiel, wie sich Sport Sponsoring auf die Brand Awareness eines Unternehmens auswirkt.
Meine Stichprobe ist bei n=500 (sollte groß genug sein ...? ;) ) und ich habe glaube ich knapp 25 UV, die meistens dichotom sind (Kennen Sie unsere Bandenwerbung -> Ja, nein, Sind Sie Fan --> ja,nein, ....).

Meine "Hauptthemen", die EInfluss auf meine AV haben (sollen), habe ich der Theorie entnommen. Ich habe aber halt nicht abgefragt "Kennen Sie ein oder mehrere unserer Kommunikationsmaßnahmen" sondern konkret nach den einzelnene Maßnahmen. Dadurch ergibt sich die hohe Anzahl an UV aber ich bin hier auch der Meinung das ist nicht verkehrt weil "feinmaschiger".

Ich habe zudem meine AV nicht mehr als ordinal skaliert betrachtet sondern ebenfalls eine dichotome Variable daraus gemacht (gibt es eine hohe Brand Awareness oder gibt es keine Brand Awareness). Hat auch Sinn gemacht, weil die dritte Option (die beim ordinalen drin war) macht gar keinen Sinn.

Ich hätte jetzt in einem ersten Schritt eine ganz normale log. Regression gemacht mit ALLEN Variablen und dann im zweiten Schritt eine log. Regression iterativ Rückwärts anhand vom Wald-Wert. Dann sollte ich ja ein Modell rausbekommen, was mir zeigt, welche Einflussfaktoren scheinbar relevant sind und dadurch kann ich dann meine Hypothesen (stimmt die Theorie ja oder nein) stützen oder verwerfen.

Macht das jetzt mehr Sinn? :)
Badeentchen_007
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 28. Mär 2016, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Ordinale Regression mit AIC und BIC

Beitragvon mango » Fr 1. Apr 2016, 10:19

Was wäre denn deiner Meinung nach der Vorteil gegenüber einer Regression auf alle Einzelmaßnahmen und der Betrachtung der Koeffizienten und ihrer p-Werte?
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts

Re: Ordinale Regression mit AIC und BIC

Beitragvon Badeentchen_007 » Fr 1. Apr 2016, 12:51

Ich verstehe jetzt die Frage nicht ganz - "Regression auf alle Einzelmaßnahmen"? Sprich, einfach nur eine Korrelation angucken? Oder meinst du eine lineare Regression?

Die logistische Regression wähle ich doch deshalb, weil meine AV durch wahrscheinlich mehr als eine IV beschrieben wird. Ich könnte natürlich vorab schauen, bei welchen AV-IV Kombinationen es zusammenhänge gibt und nur diese dann mit ins Modell zu nehmen?!
Badeentchen_007
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 28. Mär 2016, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Ordinale Regression mit AIC und BIC

Beitragvon bele » Fr 1. Apr 2016, 15:33

Ich verstehe die Frage so: Wenn Du alle 25 Prädiktoren ins Modell nimmst, dann hast Du mit etwa 20 Befragten pro UV ein ordentliches Zahlenverhältnis. Warum willst Du die Zahl der UVs danach noch reduzieren und nicht einfach betrachten, welche UVs den größten Einfluss haben?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Ordinale Regression mit AIC und BIC

Beitragvon Badeentchen_007 » Fr 1. Apr 2016, 17:53

Wenn ich alle 25 UVs mit ins Modell nehme dann habe ich nur eine einzige Variable, die Ansatzweise signifikant ist. Die macht aus praktischer Interpretationssicht noch nicht einmal Sinn. Wenn ich jetzt aber rückwärts nach LR Variablen selektiere habe ich hinterher ein Modell mit ca. 6 UVs, die alle sowohl statistisch gesehen als auch praktisch gesprochen Einfluss haben.

Wie soll ich sonst bei einer dichotomen AV den Einfluss bestimmen? Einfache/ lineare Regression fällt da doch raus oder verstehe ich das komplett falsch?

Meine ursprünglichen Hypothesen lauten z.B. "Akteure, die BVB Fan sind, haben eine hohe Brand Awareness". Mit den Variablen, die hinterher im Modell übrig geblieben sind, würde ich diese einzelnene Hypothesen dann stützen oder verwerfen wollen. Ist die UV "BVB_Fan" nicht mehr im Modell, so kann ich die Hypothese verwerfen.

Ich werde die ganze Zeit das Gefühl nicht los, dass ich da irgendwie mit der logistischen Regression am falschen Ende ansetzte :D
Badeentchen_007
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 28. Mär 2016, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Ordinale Regression mit AIC und BIC

Beitragvon mango » So 3. Apr 2016, 01:32

Badeentchen_007 hat geschrieben:Ich verstehe jetzt die Frage nicht ganz - "Regression auf alle Einzelmaßnahmen"? Sprich, einfach nur eine Korrelation angucken? Oder meinst du eine lineare Regression?

Die logistische Regression wähle ich doch deshalb, weil meine AV durch wahrscheinlich mehr als eine IV beschrieben wird. Ich könnte natürlich vorab schauen, bei welchen AV-IV Kombinationen es zusammenhänge gibt und nur diese dann mit ins Modell zu nehmen?!

Mein Vorschlag war: Mach eine (bei einer dichotomen AV natürlich logistische) Regression mit allen relevanten UVs. Dann schau dir die Ergebnisse an und gib an, welche UVs welchen Einfluss haben. Wenn die meisten der AVs, wie du berichtest, in so einem Modell nicht signifikant sind, einzeln genommen aber klar signifikant werden, liegt das daran, dass sie im wesentlichen das Gleiche messen. Das ist meiner Meinung nach wiederum etwas, was du theoretisch verarbeiten musst. Dass eine bestimmte UV ein wenig mehr Varianz erklärt als eine andere, ist ja kein Grund, erstere als für deine Theorie relevant zu betrachten und letztere unter den Tisch fallen zu lassen; du hast als Forschende/r die Aufgabe, die Ursachen möglichst treffend zu beschreiben. Daher mein Hinweis auf die Faktorenanalyse am Anfang: Deine verschiedenen Variablen bilden nicht notwendigerweise 1:1 Kandidaten für Ursachen ab.
mango
Elite
Elite
 
Beiträge: 330
Registriert: Fr 2. Mai 2014, 16:55
Danke gegeben: 3
Danke bekommen: 55 mal in 55 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste