geringe Stichprobengröße ohne Normalverteilung

Alle Verfahren der Regressionanalyse.

geringe Stichprobengröße ohne Normalverteilung

Beitragvon Honig » Di 17. Mär 2020, 10:56

Hallo liebe Gemeinde,

ich hoffe, es geht euch gut.

In Anlehnung an dieses Thema (http://www.statistik-forum.de/allgemeine-fragen-f5/reproduzieren-fester-werte-mit-statistischen-methoden-t11371.html) habe ich noch ein paar Fragen bezüglich der Auswertung.
Wer sich da nicht durchwühlen will, hier ein TL;DR:
Ich habe drei Filterbauteile (A, B, C), wobei eines davon (C) die Kombination aus den anderen beiden ist. Zu allen dazu habe ich Daten aus dem Prüfstand (Partikelanzahl). Daraus habe ich die Effizienz berechnet und Regressionsanalysen durchgeführt. Abhängige Variable waren hierbei die Effizienzwerte von C, unabhängige Variablen die Effizienzwerte von A und B sowie die Partikelgröße.

Meine bisherige Betrachtungsweise war rein mathematischer/physikalischer Natur. Es ging mir nicht darum, eine Hypothese zu widerlegen oder Prognosen zu treffen. Ich wollte anhand verschiedener Regressionsanalysen mit verschiedenen Ansätzen eine möglichst exakte Reproduktion der Werte der abhängigen Variable erzeugen. Das hat auch geklappt und ich habe einen passendes Ergebnis gefunden.
Mein Hauptaugenmerk lag dabei auf den durch die Regression erzeugten Werte und auf deren Abweichung vom Originalwert und nicht auf den statistischen Parametern. Der Vollständigkeit halber will ich diese hier aber auch noch erwähnen: p-Wert liegt bei weit unter 0,05 und R sowie R² haben einen Wert von knapp unter 1.

Aufgrund der Tatsache, dass meine Anzahl an "Stichproben" so gering ist (in meinem Fall habe ich nur maximal 22 Werte der abhängigen Variablen) ist eine Normalverteilung nicht mehr erkennbar, weder bei den Werten selbst, noch bei den Residuen. Nach erst kürzlich hier im Forum gelesenen Beiträgen bin ich mir nun nicht mehr sicher, was die statistische Aussagen der Ergebnisse meiner Regressionsanalysen angeht, also ob ich überhaupt eine Regressionsanalyse hätte durchführen "dürfen" und ob ich in diese Ergebnisse sinnvoll interpretieren kann.

Ohne weitere Umschweife hier die Frage:

Was sollte man bei der Interpretation der Ergebnisse einer Regressionsanalyse beachten oder auch erwähnen, wenn n<25 und keine Normalverteilung der Residuen vorliegt, insbesondere unter dem Gesichtspunkt der mathematischen/physikalischen Betrachtungsweise?

Vielen Dank für euren Input!

Viele Grüße und bleibt gesund

Honig


P.S. Die Suchfunktion war leider nicht sinnvoll, da Suchbegriffe nicht über 14 Zeichen lang sein können und auch unter dem Begriff "Normalverteilung" zu viele Ergebnisse gekommen wären, sodass mir die Suchfunktion eine Fehlermeldung ausgespuckt hat.

P.P.S. Gerade aufgrund eures Feedbacks in meinen letzten Themen habe ich versucht, mich so klar wie möglich auszudrücken. Bei Unklarheiten bitte einfach Bescheid sagen, dann gebe ich mein Bestes, diese zu aus dem Weg zu räumen.
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: geringe Stichprobengröße ohne Normalverteilung

Beitragvon PonderStibbons » Di 17. Mär 2020, 11:19

Aufgrund der Tatsache, dass meine Anzahl an "Stichproben" so gering ist (in meinem Fall habe ich nur maximal 22 Werte der abhängigen Variablen) ist eine Normalverteilung nicht mehr erkennbar, weder bei den Werten selbst, noch bei den Residuen.

Die Annahme, dass die Residuen des Regressionsmodella aus einer normalverteilten Grundgesamtheit stammen,
ist nicht für die Qualität des Modells selber relevant, sondern für die Zuverlässigkeit des statistischen Signfikanztests.
Wenn Du keine Inferenzstatistik betreiben möchtest, musst Du Dich mit der Verteilungsform der Vorhersagefehler nicht
beschäftigen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Honig

Re: geringe Stichprobengröße ohne Normalverteilung

Beitragvon Honig » Di 17. Mär 2020, 13:19

Danke für die schnelle Antwort, das hilft mir auf jeden Fall weiter!

Kennst Du zufällig ein Buch/eine Veröffentlichung, in der das gut dargelegt wird?
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: geringe Stichprobengröße ohne Normalverteilung

Beitragvon bele » Di 17. Mär 2020, 13:37

Honig hat geschrieben:Mein Hauptaugenmerk lag dabei auf den durch die Regression erzeugten Werte und auf deren Abweichung vom Originalwert


Die OLS Regression führt zu einer Minimierung der Summe der quadrierten Abweichungen. Das steht nun in jedem Text zu linearen Regression. Wenn es Dir nur darum geht, diese Abweichung klein zu kriegen, dann sind kleinste Abweichungsquadrate ein sinnvoller Ansatz.


also ob ich überhaupt eine Regressionsanalyse hätte durchführen "dürfen" und ob ich in diese Ergebnisse sinnvoll interpretieren kann


Du lebst in einem weitgehend freien Land und Du darfst Regressionen mit allem durchführen. Das weißt Du, und deshalb hast Du "dürfen" in Anführungszeichen gesetzt. Das scheint mir aber Ort und Zeit zu sein zu hinterfragen, was genau Du mit diesen Anführungszeichen gemeint hast. Gleiches gilt für die Frage nach dem sinnvollen interpretieren. Wir wissen nicht, zu welcher Interpretation Du Dich hast hinreißen lassen und was in Deinem Kontext eine sinnvolle Interpretation ist.


Also: Innerhalb der von Dir gemessenen Werte findet die lineare Regression immer die Gerade (Fläche, Raum,...) die die geringsten Residuenquadrate hat. Schließende Statistik, p-Werte, werden erst interessant, wenn Du aus Deinen Messungen auf die Welt, auf mögliche weitere Messungen in der Zukunft rückschließen willst.
Ich wollte anhand verschiedener Regressionsanalysen mit verschiedenen Ansätzen eine möglichst exakte Reproduktion der Werte der abhängigen Variable erzeugen.

Das hast Du erreicht. Da Du aber jetzt nach "Interpretation" fragst, willst Du anscheinend doch mehr. "Reproduktion" und "Interpretation" sind nicht dasselbe.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
Honig

Re: geringe Stichprobengröße ohne Normalverteilung

Beitragvon Honig » Di 17. Mär 2020, 17:07

bele hat geschrieben:Du lebst in einem weitgehend freien Land und Du darfst Regressionen mit allem durchführen. Das weißt Du, und deshalb hast Du "dürfen" in Anführungszeichen gesetzt. Das scheint mir aber Ort und Zeit zu sein zu hinterfragen, was genau Du mit diesen Anführungszeichen gemeint hast. Gleiches gilt für die Frage nach dem sinnvollen interpretieren. Wir wissen nicht, zu welcher Interpretation Du Dich hast hinreißen lassen und was in Deinem Kontext eine sinnvolle Interpretation ist.

Also: Innerhalb der von Dir gemessenen Werte findet die lineare Regression immer die Gerade (Fläche, Raum,...) die die geringsten Residuenquadrate hat. Schließende Statistik, p-Werte, werden erst interessant, wenn Du aus Deinen Messungen auf die Welt, auf mögliche weitere Messungen in der Zukunft rückschließen willst.
[...]
Das hast Du erreicht. Da Du aber jetzt nach "Interpretation" fragst, willst Du anscheinend doch mehr. "Reproduktion" und "Interpretation" sind nicht dasselbe.



Auch Dir herzlichen Dank für die Antwort!

Interpretation in dem Sinne, als dass es vielleicht Regeln oder Sachverhalte gibt, die es zu beachten oder anzugeben gilt, wenn man, wie ich, auf eine Reproduktion aus ist.



Kennst Du vielleicht Literatur, in der so etwas wie von Euch geschrieben steht?
Honig
Beobachter
Beobachter
 
Beiträge: 10
Registriert: Mo 6. Jan 2020, 22:01
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 1 Gast

cron