Vergleichbarkeit verschiedener Regressionsmodelle

Alle Verfahren der Regressionanalyse.

Vergleichbarkeit verschiedener Regressionsmodelle

Beitragvon Stilo » Di 3. Sep 2024, 09:19

Hallo Zusammen,

ich bräuchte euren Rat bzgl. der Vergleichbarkeit von verschiedenen Regressionsmodellen. Im Zuge meiner BA habe ich die Auswirkung verschiedener Faktoren auf die Wirtschaftlichkeit einer Anwendung untersucht hinsichtlich der erzielbaren Umsätze bzw. Profite. Dabei handelte es sich um jeweils ein multiples Regressionsmodell, wobei ich versucht habe "die ordinale Relevanz" (sry, falls der Ausdruck nicht ganz korrekt ist) anhand der standardisierten Regressionskoeffizienten zu bestimmen. Also verschiedene Effekte damit vergleichbar zu machen und einzuordnen.

Im Folgenden möchte ich gerne meine Ergebnisse mit denen einer Publikation vergleichen, welche leider nur nicht standardisierte Koeffizienten abbildet, sowie die SD des Regressors und die SD des Features im Datensatz. Ist die nachträgliche Berechnung möglich, um die Effekte zwischen der Studie und meiner Arbeit grob zu vergleichen und wie sinnvoll wäre dies?

Vielen Dank vorab!
Stilo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Di 5. Mär 2024, 16:03
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleichbarkeit verschiedener Regressionsmodelle

Beitragvon bele » Di 3. Sep 2024, 12:55

Hallo Stilo,

meine primäre Sorge wäre eine ganz andere: Das mit den standardisierten Regressionskoeffizienten funktioniert gut, wenn die verschiedenen Prädiktoren ("Features") untereinander kaum korreliert sind. Wenn Du beispielsweise "Alter eines Mitarbeiters" und "Dauer der Betriebszugehörigkeit" als Prädiktoren einbringst, dann steckt in beiden Prädiktoren ein Teil der Vorhersagekraft von "Alt-Sein" und dann verteilt das Modell den Einfluss von "Alt-Sein" auf beide Prädiktoren und der standardisierten Regressionskoeffizient von Alter sinkt durch die Hinzunahme der Dauer der Betriebszugehörigkeit. Vor allem, wenn Du sehr viele Prädiktoren/Features im Modell hast, passiert das sehr leicht. Wenn Du nur wenige hast kannst Du vielleicht theoretisch ausschließen, dass dieses Problem besteht.

Das Umrechnen von standardisierten zu nicht-standardisierten Koeffizienten ist ok. Das kannst Du machen. Beim anschließenden Vergleich musst Du halt vorsichtig sein, dass Effekte wie der oben genannte und auch abweichende Grundgesamtheiten und abweichende Stichprobenfehler richtig eingeschätzt werden. Du schreibst vom "grob" vergleichen - ich deute das so, dass Du Dir der Schwierigkeiten eines solchen Vergleichs bewusst bist.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

Re: Vergleichbarkeit verschiedener Regressionsmodelle

Beitragvon Stilo » Di 3. Sep 2024, 14:26

Hallo Bernhard,

danke für die schnelle Antwort :)

Das Problem bzgl. der möglichen Multikollinearität wurde vom Autor der Studie und mir bereits durch eine bivariate Korrelationsanalyse gelöst, wobei Prädiktoren mit einem hohen Pearson r entfernt wurden. Somit ist die Sorge nicht so groß. Mir würde es im Folgenden auch eher darum gehen die Unterschiede grob anzudiskutieren, da es nur ein Teil der finalen Diskussion wird und nicht ein Hauptbestandteil meiner Arbeit repräsentiert.

Ich hatte mich nur gewundert, dass die Umrechnung anhand der Formel beta = (SD(X)/SD(Y))*b für eine multiple Regression, die kontinuierliche und nominale Dummy-Variablen enthält, möglich ist.
Stilo
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Di 5. Mär 2024, 16:03
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleichbarkeit verschiedener Regressionsmodelle

Beitragvon bele » Di 3. Sep 2024, 14:39

Hallo Stilo,

Stilo hat geschrieben:Das Problem bzgl. der möglichen Multikollinearität wurde vom Autor der Studie und mir bereits durch eine bivariate Korrelationsanalyse gelöst, wobei Prädiktoren mit einem hohen Pearson r entfernt wurden.


Da würde ich gegen einwenden, dass bivariate Korrelationen immer nur paarweise Kollinearität aber eben keine Multikollinearität aufdecken können. Ich denke, das könntest Du eleganter lösen wenn das VIF anstelle von Pearsons r verwendest. In der Regel hat man halt eine Vorstellung davon, was ein großes und was ein kleines r ist aber nicht unbedingt, was ein großes und was ein kleines VIF ist und diese Cutoffs, die da so kursieren, die würde ich nicht zu hoch aufhängen wollen. Ist nur so eine Anregung wie Du die Arbeit statistisch vielleicht noch ein klein wenig aufwerten könntest, mit Deiner eigentlichen Frage hat das ja nichts zu tun.

Mir würde es im Folgenden auch eher darum gehen die Unterschiede grob anzudiskutieren


Das klingt vernünftig. Bezüge zur Literatur liest man beim Bewerten von Arbeiten immer gern.

Ich hatte mich nur gewundert, dass die Umrechnung anhand der Formel für eine multiple Regression, die kontinuierliche und nominale Dummy-Variablen enthält, möglich ist.


Ich hatte das auch nicht aus dem Stegreif parat und deshalb habe ich den Link gesetzt.

Dann wünsche ich jetzt viel Erfolg mit der Arbeit!
LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

folgende User möchten sich bei bele bedanken:
NotMe


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast