Shapiro-Wilk Test auf Normalverteilung

Fragen, die sich auf kein spezielles Verfahren beziehen.

Shapiro-Wilk Test auf Normalverteilung

Beitragvon Mr_K » Mi 31. Aug 2011, 14:10

Hallo zusammen,

ich habe eine Frage zum Shapiro-Wilk Test. Dieser kann inzwischen Proben mit einem Umfang von 3 <= n <= 5000 auf Normalverteilung untersuchen. Aus welchem Grund ist es nicht möglich mehr als 5000 Stichproben zu verarbeiten? Vielleicht habt ihr auch eine Quelle für mich. Ich habe selber schon lange gesucht und nichts gefunden.

Vielen Dank und Grüße,
Mr_K
Mr_K
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 31. Aug 2011, 13:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Shapiro-Wilk Test auf Normalverteilung

Beitragvon strukturmarionette » Sa 3. Sep 2011, 22:39

Hi,


Shapiro-Wilk Test. Dieser kann inzwischen Proben mit einem Umfang von 3 <= n <= 5000 auf Normalverteilung untersuchen.

Sorry, ich hab keine direkte Quelle als Antwort für Dich.

Aber auf welche Quelle beziehst Du Dich denn?

S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Shapiro-Wilk Test auf Normalverteilung

Beitragvon Mr_K » Mo 5. Sep 2011, 11:25

Hallo,

ich beziehe mich auf ein Matlab Skript für den Shapiro-Wilk Test.

http://www.mathworks.com/matlabcentral/fileexchange/13964

In dem Kommentar steht, dass der Test für maximal 5000 Stichproben geeignet ist. Auf anderen Internetseiten steht das gleiche, jedoch ohne Begründung.

Grüße
Mr_K
Mr_K
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 31. Aug 2011, 13:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Shapiro-Wilk Test auf Normalverteilung

Beitragvon bele » Di 6. Sep 2011, 13:23

Die entsprechende Funktion in R ist ebenfalls auf 5000 Fälle beschränkt:

Code: Alles auswählen
> shapiro.test(rnorm(5001))
Fehler in shapiro.test(rnorm(5001)) :
  Stichprobengröße muss zwischen 3 und 5000 liegen


Die Erläuterung in R schreibt dazu:
The algorithm used is a C translation of the Fortran code described in Royston (1995) and found at http://lib.stat.cmu.edu/apstat/R94. The calculation of the p value is exact for n = 3, otherwise approximations are used, separately for 4 ≤ n ≤ 11 and n ≥ 12.


Vielleicht liegt es daran, dass die Approximation für max 5000 Fälle genau genug ist?

Gruß,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

Re: Shapiro-Wilk Test auf Normalverteilung

Beitragvon strukturmarionette » Di 6. Sep 2011, 14:37

Hi,

inde Online-Hile von SPSS-19 ist ähnliches zulesen:


Bei Angabe von nichtganzzahligen Gewichtungen wird die Shapiro-Wilk-Statistik berechnet, wenn die gewichtete Stichprobengröße zwischen 3 und 50 liegt. Bei keinen oder ganzzahligen Gewichtungen wird die Statistik berechnet, wenn die gewichtete Stichprobengröße zwischen 3 und 5,000 liegt.



Shapiro-Wilk Statistic (W) (EXAMINE algorithms)

Based on the computed W statistic, the significance is calculated by linearly interpolating within the range of simulated critical values given in Shapiro and Wilk (1965).

If non-integer weights are specified, the Shapiro-Wilk’s statistic is calculated when the weighted sample size lies between 3 and 50. For no weights or integer weights, the statistic is calculated when the weighted sample size lies between 3 and 5000.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron