Overfitting erkennen?

Alle Verfahren der Regressionanalyse.

Overfitting erkennen?

Beitragvon AND5 » Di 7. Jan 2025, 16:50

Hallo zusammen,

Ich habe eine parallele Mediationsanalyse mit PROCESS im Rahmen meiner Abschlussarbeit durchgeführt und konnte die hypothesierten Zusammenhänge alle nachweisen.
Jedoch stellt sich mir die Frage, ob potenziell ein Overfitting vorliegen könnte. Mein Stichprobe umfasst 142 Teilnehmer. Ich habe eine metrische UV, zwei metrische Mediatoren, 3 metrische Kontrollvariablen sowie 5 dichotom nominal-skalierte Kontrollvariablen.

Besteht hier die Gefahr eines Overfittings? Wie könnte ich das gegebenfalls feststellen?

Vielen Dank im Voraus.
AND5
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 5. Nov 2024, 12:50
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Overfitting erkennen?

Beitragvon bele » Di 7. Jan 2025, 18:52

Worum geht es Dir denn in der Analyse? Wenn es, wie geschrieben, um den Nachweis von Effekten geht, dann stütz Dich auf die Signifikanztestung.

Wenn es bei der Regression um Vorhersagekraft in neuen Daten geht, dann kann es schlau sein, eine Kreuzvalidierung und ggf regularisierte Regressionen zu rechnen.

JMTC,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Overfitting erkennen?

Beitragvon AND5 » Di 7. Jan 2025, 19:39

bele hat geschrieben:Worum geht es Dir denn in der Analyse? Wenn es, wie geschrieben, um den Nachweis von Effekten geht, dann stütz Dich auf die Signifikanztestung.

Wenn es bei der Regression um Vorhersagekraft in neuen Daten geht, dann kann es schlau sein, eine Kreuzvalidierung und ggf regularisierte Regressionen zu rechnen.

JMTC,
Bernhard


Vielen dank für die schnelle Antwort.

In meiner Arbeit geht es rein um den Nachweis von Effekten. Speziell möchte ich prüfen, ob der Zusammenhang zwischen der UV und der AV über Mediator 1 und Mediator 2 vermittelt. Hierzu habe Hypothesen formuliert, die ich anhand meiner Stichprobe testen möchte. Spielt dann für mich quasi Overfitting eher weniger eine Rolle? Ist das eher relevant bei Machine Learning?
AND5
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 5. Nov 2024, 12:50
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Overfitting erkennen?

Beitragvon bele » Di 7. Jan 2025, 21:18

Ich würde die Grenze nicht zwischen Statistik und Maschinenlernen ziehen. Diese Grenze ist viel zu schwammig, wenn es sie überhaupt gibt.

Die Unterscheidung in Inferenz und Vorhersage macht da mehr Sinn. Overfitting bedeutet, dass Du die Details eines spezifischen Datensatzes zu ernst nimmst und deshalb schlechter in der Vorhersage wirst, Signifikanz sagt Dir, wie unwahrscheinlich Deine Daten wären, wenn eine Nullhypothese gälte. Das sind zwei verschiedene Fragestellungen. Bloß, weil es eine Mediation gibt ist ja noch nicht gesagt, dass die Dir wesentlich bei der Prädiktion hülfe, wenn Du eine machen wolltest.

Vielleicht verstehe ich Deine Sorge besser, wenn Du erklärst, worum genau Du Dir Sorgen machst.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
AND5

Re: Overfitting erkennen?

Beitragvon AND5 » Di 7. Jan 2025, 22:57

bele hat geschrieben:Ich würde die Grenze nicht zwischen Statistik und Maschinenlernen ziehen. Diese Grenze ist viel zu schwammig, wenn es sie überhaupt gibt.

Die Unterscheidung in Inferenz und Vorhersage macht da mehr Sinn. Overfitting bedeutet, dass Du die Details eines spezifischen Datensatzes zu ernst nimmst und deshalb schlechter in der Vorhersage wirst, Signifikanz sagt Dir, wie unwahrscheinlich Deine Daten wären, wenn eine Nullhypothese gälte. Das sind zwei verschiedene Fragestellungen. Bloß, weil es eine Mediation gibt ist ja noch nicht gesagt, dass die Dir wesentlich bei der Prädiktion hülfe, wenn Du eine machen wolltest.

Vielleicht verstehe ich Deine Sorge besser, wenn Du erklärst, worum genau Du Dir Sorgen machst.

LG,
Bernhard


Im Endeffekt mache ich mir darüber Sorgen, dass ich möglicherweise zu viele Kontrollvariablen für eine zu geringe Stichprobengröße einbezogen habe, und inwiefern sich dies möglicherweise auf meine Ergebnisse ausgewirkt hat, wobei ich meine hypothesierten Zusammenhänge eigentlich alle nachweisen konnte.

Schönen Abend noch!
AND5
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Di 5. Nov 2024, 12:50
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: Overfitting erkennen?

Beitragvon bele » Mi 8. Jan 2025, 15:55

Dagegen sollte Dich die Signifikanztestung (und darin das Konzept der Freiheitsgrade) schützen. Das Signal-Rausch-Verhältnis scheint groß genug zu sein um mit 142 Datensätzen "Beweise" zu führen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron