Mittelwerttest bei nicht normalverteilten Variablen

Univariate Statistik.

Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon neptunhiker » Mo 17. Mär 2014, 23:44

Hallo zusammen,

kann mir jemand sagen, wie ich die Nullhypothese Mittelwert=0 bei einer Verteilung teste, die nicht normalverteilt ist?

Vielen Dank im Voraus.
neptunhiker
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Aug 2013, 09:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon strukturmarionette » Di 18. Mär 2014, 00:09

Hi,

wenn du ein bissl mehr mitteilst, lässt sich vielleicht was dazu sagen.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon neptunhiker » Di 18. Mär 2014, 08:22

Sehr gerne. Also, es handelt sich um mehrere Datensätze, die jedoch alle relativ ähnliche statistische Eigenschaften aufweisen. Die Anzahl der Beobachtungen liegt bei mindestens n=300. Die Datensätze weisen ausschließlich positive Werte auf, wobei die Verteilung stark rechtsschief ist. Im Anhang habe ich mal einen Beispieldatensatz hinterlegt. Die Frage ist also, ob der Mittelwert, der sehr nahe bei Null liegt, statistisch signifikant verschieden von Null ist.

rechtsschiefe Verteilung.xls
(72 KiB) 157-mal heruntergeladen


Vielen Dank nochmal für die Hilfe.
neptunhiker
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Aug 2013, 09:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon PonderStibbons » Mi 19. Mär 2014, 16:40

Also, es handelt sich um mehrere Datensätze, die jedoch alle relativ ähnliche statistische Eigenschaften aufweisen. Die Anzahl der Beobachtungen liegt bei mindestens n=300.

Worum geht es denn da inhaltlich?
Die Datensätze weisen ausschließlich positive Werte auf, wobei die Verteilung stark rechtsschief ist.(...)
Die Frage ist also, ob der Mittelwert, der sehr nahe bei Null liegt, statistisch signifikant verschieden von Null ist.

Also, FALLS es von vornherein unmöglich ist, dass die
gemessene Größe negative Werte aufweist, dann ist
ein Signifikanztest hier doch vollkommen sinnlos. Dass
der Mittelwert der Grundgesamtheit, aus der die
Stichprobe stammt, nicht 0 sein kann, ist dann doch
zwingend anzunehmen; empirisch nachgewiesen ist dies
spätestens dann, wenn auch nur 1 Wert vorliegt, der
nicht 0 ist. Falls Du mit "signifikant" aber irgendetwas
Alltagssprachliches meinen solltest wie erheblich,
wichtig, markant, deutlich - damit befasst sich der
Signifikanztest (hier: t-Test) nicht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon neptunhiker » Mi 19. Mär 2014, 22:51

Hallo PonderStibbons,

vielen Dank für deine Antwort. Zunächst zu deiner ersten Frage.

Worum geht es denn da inhaltlich?


Es werden Renditedifferenzen zwischen zwei Zeitreihen berechnet. In der Regel sollten die Renditen der Zeitreihenpaare, aufgrund der Anlageziele der Produkte, identisch oder zumindest sehr ähnlich sein. Grundsätzlich ist die Differenz aus den Renditezeitreihen konstruktionsbedingt Null oder positiv, da die eine Zeitreihe durch Gebühren belastet wird und die andere nicht.

Meine Frage ist daher, ob die Renditedifferenzen, die ausnahmslos - wenn vorhanden - positiv sind, eher zufällig auftreten oder nicht. Ob das so ist, würde ich gerne anhand eines Signifikanzniveaus belegen. Stell dir 300 Renditedifferenzen vor, von denen 270 gleich Null sind und nur 30 einen leicht positiven Wert aufweisen. Die Verteilung ist also stark rechtsschief und alles andere als normalverteilt. Wie kann man jetzt also statistisch testen, ob diese 30 Werte rein zufällig auftauchen oder eben doch systematisch auftreten. Beim t-Test habe ich meine Bedenken, da dieser ja auf einer Normalverteilung beruht. Allerdings habe ich auch gelesen, dass auch der t-Test bei ausreichend vielen Beobachtungen (n>30) anwendbar ist. Bildet man aus diesen 300 Werten nun den Mittelwert, liegt der knapp über Null. Die Frage ist dann, ob dieser Mittelwert statistisch signifikant von Null abweicht. Du schreibst:

empirisch nachgewiesen ist dies spätestens dann, wenn auch nur 1 Wert vorliegt, der nicht 0 ist.


Ist das so? Dieser eine Wert könnte doch Zufall sein, ein Fehler im Datensatz beispielsweise. Lässt sich sowas auf einem Signifikanzniveau nicht testen? Klar, man könnte einfach angeben, dass 0,333% der Werte nicht Null sind. Aber lässt sich daraus auch ein Signifikanzniveau ableiten und stellen die 0,333% für sich genommen vielleicht sogar ein ausreichendes Signifkanzniveau dar, dass man interpretieren könnte? Was aber wenn der Wert, der von Null abweicht, nicht nur ganz knapp von Null abweicht, sondern bspw. 1000 beträgt. Die 0,333% würden bleiben, doch der Mitterlwert wäre ein deutlich anderer. Meiner Meinung nach müssten in einen Test nicht nur die Anzahl der Abweichungen eingehen, sondern eben auch das Niveau der Werte, die von Null abweichen. Oder wie siehst du das?

Danke nochmal für deine Zeit und Mühen.

Viele Grüße
neptunhiker
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Mi 21. Aug 2013, 09:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mittelwerttest bei nicht normalverteilten Variablen

Beitragvon PonderStibbons » Mi 19. Mär 2014, 23:33

Wie kann man jetzt also statistisch testen, ob diese 30 Werte rein zufällig auftauchen oder eben doch systematisch auftreten.

Leider weiß ich nicht, was mit diesen Begriffen hier gemeint ist.
Ein Signifikanztest der Nullhypothese: "In der Grundgesamtheit,
aus der diese Werte stammen, ist der Mittelwert der Renditen = 0"
ist aber allem Anschein nach nicht geeignet, etwas zur Beantwortung
der Frage beizutragen, ob 30 der gemessenen Werte zufällig oder
systematisch auftauchen. Wie gesagt, es ist unmöglich dass
die o.a. Nullhypothese gilt, wenn von vornherein ausgeschlossen
ist, dass es negative Werte geben kann und mindestens 1 gültiger
Wert > 0 vorliegt. Da muss man nichts testen.
Lässt sich sowas auf einem Signifikanzniveau nicht testen? Klar, man könnte einfach angeben, dass 0,333% der Werte nicht Null sind. Aber lässt sich daraus auch ein Signifikanzniveau ableiten und stellen die 0,333% für sich genommen vielleicht sogar ein ausreichendes Signifkanzniveau dar, dass man interpretieren könnte? Was aber wenn der Wert, der von Null abweicht, nicht nur ganz knapp von Null abweicht, sondern bspw. 1000 beträgt. Die 0,333% würden bleiben, doch der Mitterlwert wäre ein deutlich anderer. Meiner Meinung nach müssten in einen Test nicht nur die Anzahl der Abweichungen eingehen, sondern eben auch das Niveau der Werte, die von Null abweichen.

Das ist doch keine Meinungsfrage. Ich habe bereits darauf hingewiesen,
ein Signifikanztest dient dazu, eine Nullhypothese beizubehalten
oder zu verwerfen. Das hat nichts mit der Größe, Wichtigkeit oder
Relevanz eines Effektes zu tun, sondern nur mit der Frage: ist
der Mittelwert in der Grundgesamtheit Null oder nicht-Null, ja
oder nein. Und im vorliegenden Fall kann man das sogar ohne formalen
Test entscheiden.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste

cron