Schiefe und Kurtosis berechnen nötig?

Univariate Statistik.

Schiefe und Kurtosis berechnen nötig?

Beitragvon GlockiGlocksen » Mo 10. Aug 2020, 14:58

Hallo!

Ich werte aktuell eine Umfrage aus, die Stichprobengröße ist n=194.
Ich habe in mehreren Quellen gelesen, dass bei "großen" Stichproben aufgrund des zentralen Grenzwertsatzes die Normalverteilung angenommen werden kann - allerdings keine genaue Grenze. Muss ich meine Items bei dieser Größe aus Schiefe / Kurtosis testen?
Ich habe es jedenfalls schon gemacht, und bei einem Item kam ein kritischer Wert für die Kurtosis raus: 5.375.
Kann mir jemand sagen wie ich damit umgehen kann? Oder soll ich es einfach ignorieren und auf eine ausreichend große Stichprobe verweisen, um von Normalverteilung ausgehen zu können?

Danke für die Hilfe!
Benni
GlockiGlocksen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 10. Aug 2020, 14:54
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon bele » Mo 10. Aug 2020, 15:29

GlockiGlocksen hat geschrieben:Ich habe in mehreren Quellen gelesen, dass bei "großen" Stichproben aufgrund des zentralen Grenzwertsatzes die Normalverteilung angenommen werden kann - allerdings keine genaue Grenze.


Dein Datensatz wird durch große n nicht normalverteilt. Der Mittelwert Deines Datensatzes, der entstammt zunehmend genauer einer Normalverteilung. Egal wie schief Deine Daten sind, der Mittelwert entstammt einer Normalverteilung und deshalb kannst Du Mittelwerttests u. ä bei diesem Datenumfang guten Gewissens durchführen.

Ich hab' hier mal eine Simulation dazu gepostet. Wenn es hilft, kannst Du das da gerne auch upvoten https://stats.stackexchange.com/a/307581/117812

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon GlockiGlocksen » Mo 10. Aug 2020, 15:49

danke für die schnelle Antwort. Kannst du mir noch einen Hinweis geben wie ich mit dem hohen Kurtosis Wert umgehen kann? Bzw. wie ich es reporte?
GlockiGlocksen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 10. Aug 2020, 14:54
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon bele » Mo 10. Aug 2020, 16:06

Eigentlich ist der Wert berichtet, wenn Du sagst, dass er 5,4 beträgt. Wahlweise kannst Du vielleicht ein 95%-CI angeben, damit man weiß, wie genau er bestimmt ist. Der Wikipedia entnehme ich die Formulierung "Es handelt sich hierbei um im Vergleich zur Normalverteilung spitzere Verteilung, d. h. eine Verteilungen mit starkem Peak". Ob Dir das gefällt und ob Du das abschreibst musst Du selbst entscheiden.

Viel Erfolg,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon PonderStibbons » Mo 10. Aug 2020, 16:08

GlockiGlocksen hat geschrieben:Ich habe in mehreren Quellen gelesen, dass bei "großen" Stichproben aufgrund des zentralen Grenzwertsatzes die Normalverteilung angenommen werden kann

Das widerspricht doch dem gesunden Menschenverstand. Wieso sollte etwas normalverteilt sein,
nur weil die Stichprobe aus vielen Elementen besteht?

Nein, im zentralen Grenzwertsatz geht es darum, dass die Mittelwerte aus unendlich oft gezogenen
Zufallsstichproben dann normalverteilt sind, wenn die Stichprobe groß genug ist; unabhängig davon,
wie die Daten in der Population, aus der die unendlich oft gezogenen Stichproben stammen,
verteilt sind. Von Belang ist das für inferezstatistische Betrachtungen.

Wieso Du Dich überhaupt um das Thema "Normalverteilung" scherst, hast Du leider nicht angegeben.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon GlockiGlocksen » Di 11. Aug 2020, 11:24

Ich interessiere mich dafür, weil mein Betreuer mir dieses Video für die Datenbereinigung an die Hand gegeben hat.

https://www.youtube.com/watch?v=iWrQ-SgVy-0 (siehe etwa ab 20:37).

In diesem Video wird die Betrachtung von Schiefe und Kurtosis als Standardvorgehen zur Datenbereinigung präsentiert. Ich finde es aber eigentlich auch schwachsinnig.
Konkret geht in meinem Beispiel bei der Verteilung um die Frage, wie stark die Attraktivität eines Arbeitgebers steigt, wenn er flexible Arbeitszeiten anbietet. Warum sollte die Antwort auch normalverteilt sein.. Macht eigentlich keinen Sinn.

Liebe Grüße
Benni
GlockiGlocksen
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 10. Aug 2020, 14:54
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Schiefe und Kurtosis berechnen nötig?

Beitragvon bele » Di 11. Aug 2020, 12:01

GlockiGlocksen hat geschrieben:In diesem Video wird die Betrachtung von Schiefe und Kurtosis als Standardvorgehen zur Datenbereinigung präsentiert. Ich finde es aber eigentlich auch schwachsinnig.


Das Video ist sehr lang und benutzt einen Softwarestack, den ich nicht nutze, daher habe ich mir das nicht ganz angeschaut. Der Teil ab Minute 20 ist aber gar nicht schlecht. Verwirrend fand ich erst, dass der Excess hier als Kurtosis angegeben wird, eventuell kann man das beim Berichten dazu sagen, dass hier excess kurtosis berichtet wird. Am Beispiel der Variable Age wird im Film vorgemacht, dass deren hohe Kurtosis auffällt, dass man versucht, das vernünftig zu erklären und dass man die Variable dann trotzdem im Modell lässt .

Der Film wirft eben nicht jede Variable mit hoher Kurtosis aus dem Modell und er versucht auch nicht, alles zur Normalität zu transformieren. Daran kannst Du Dich halten und wenn der Betreuer sich an der Kurtosis stört, ihn auf den Film zurückverweisen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

folgende User möchten sich bei bele bedanken:
GlockiGlocksen


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron