KEINE PERFEKTE LINEARITÄT

Alle Verfahren der Regressionanalyse.

KEINE PERFEKTE LINEARITÄT

Beitragvon asil1 » Sa 13. Feb 2021, 11:45

Ich habe die Vorrausetzungen für eine multiple Regression geprüft. Bei einer uv kam mir der Zusammenhang nicht perfekt linear vor. Anstatt diese zu transformieren gab mir mein Dozent folgenden Rat:

ich sehe in den Diagrammen kein Ausschlusskriterium für die Regression. Ich würde die Annahmen diskutieren.Eine Art, mit nicht exakt erfüllten Annahmen umzugehen, ist auch, die Interpretation nicht überzustrapazieren. Oft geht es ja nicht um dezimalstellengenaue Koeffizienten und Modellformeln, sondern etwas allgemeiner um Zusammenhänge, Hypothesentests.


Ich frage mich nur was er genau damit mein. Ich goolge schon die ganze Zeit was ich hier diskutieren könnte. Bei einer nicht perfekten Normalverteilung gibt es den zentralen Grenzwertsatz, weshalb man trotzdem die Normalverteilung annehmen kann. Aber wie verargumentiert man, dass man eine nicht perfekt linearen Zusammenhang als linear bewertet.

Hier die Bilder des Zusammenhangs:

https://ibb.co/hd1L4W1

https://ibb.co/MSR50qV

https://ibb.co/1J53Qcc
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon PonderStibbons » Sa 13. Feb 2021, 12:56

Bei einer nicht perfekten Normalverteilung gibt es den zentralen Grenzwertsatz, weshalb man trotzdem die Normalverteilung annehmen kann

Der Stichprobenmittelwerte. Nicht die der Daten.

Ich frage mich nur was er genau damit meint.

Genau das, was er sagt. Die Beziehungen kann man in etwa als linear betrachten. In einem Fall ist
der Zusammenhang ohnedies sehr gering, ob linear der nicht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon bele » Sa 13. Feb 2021, 14:14

Ich würde gerne zwei Dinge beitragen:
  • Ich finde Deine Grafiken schlecht. Es drängt sich total der Verdacht auf, dass hinter manchen der schwarzen Punkten nur ein Befragter steht und hinter anderen mehrere, vielleicht sogar viele. Durch sogenanntes Overplotting kann die Realität total verzerrt werden. Es gibt eine Vielzahl von Möglichkeiten, so etwas aufzulösen. Von Punkten die nicht opaque sind, sondern eine durchscheinende Farbe haben über das Hinzufügen kleiner Schwankungen (verjittern), unterschiedlich große Punkte je nach Anzahl der Befragten bis hin zum guten alten Sunflowerplot.
  • Ich denke, es geht um den Begriff des Modells, speziell um die Eigenschaften, auf die sich das berühmte Zitat bezieht
    "All models are wrong" is a common aphorism in statistics; it is often expanded as "All models are wrong, but some are useful". It is usually considered to be applicable to not only statistical models, but to scientific models generally. The aphorism recognizes that statistical or scientific models always fall short of the complexities of reality but can still be of use.

    The aphorism is generally attributed to the statistician George Box, although the underlying concept predates Box's writings.
    Vielleicht lohnt sich als Denkeinstieg tatsächlich der Wikipedia-Eintrag, aus dem ich dieses Zitat entnommen habe: https://en.wikipedia.org/wiki/All_models_are_wrong Ebenfalls in der englischen Wikipedia findet sich ein Eintrag zu "Statistical model" der eröffnet wird mit folgendem Satz
    A statistical model is a mathematical model that embodies a set of statistical assumptions concerning the generation of sample data (and similar data from a larger population). A statistical model represents, often in considerably idealized form, the data-generating process.
    "Considerably idealized" ist auch die Vorstellung, man könnte Kaufbereitschaft und Einstellung je auf einer zensierten und diskreten Skala erfassen und dann einen perfekt linearen Zusammenhang mit normalverteilten Residuen erwarten. Trotzdem kann das nützlich sein.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon asil1 » Mo 15. Feb 2021, 18:57

Vielen Dank für deine ausführliche Antort.
Ich hab deinen Rat befolgt und habe nun ein Streudiagramm erstellt, bei welchem die identischen Werte gestapelt werden.

Diese sehen nun so aus:
https://ibb.co/CHVG9CV

https://ibb.co/9ZDvv1W

Leider kann ich keine Anpassungslinie einfügen. Würde man nun eher von einem linearen Zusammenhang ausgehen?
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon bele » Mo 15. Feb 2021, 19:36

So würde ich die Grafiken druckfähig finden. Ich würde da ggf auch eine Gerade durchlegen, auch wenn Linearität was anderes ist.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon asil1 » Mo 15. Feb 2021, 19:41

auch wenn Linearität was anderes ist


Würdest du das nicht als Linear bezeichnen? Also hier die Voraussetzung der Linearität für die Regression nicht erfüllt?
asil1
Mitglied
Mitglied
 
Beiträge: 28
Registriert: So 1. Nov 2020, 15:13
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: KEINE PERFEKTE LINEARITÄT

Beitragvon bele » Di 16. Feb 2021, 19:23

Ich weiß nicht, wie Du Dir eine Gerade vorstellst. Ich sehe da ein Rechteck, bei dem die linke obere Ecke fehlt. Dennoch kann die bestpassende Gerade ein sinnvolles Modell sein um zu zeigen, dass größere Attraktivität mit größerer Kaufbereitschaft einher geht.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste