Boh Schwede...die Zitatfunktion ne...
Für Statistische Auswertungen werden ja eigentlich Normalverteilte Zahlen genutzt.
Daher will ich nochmal erklären das ich das Gegenteil suche, ich will Nicht-Normalverteilte Zahlen. Daher ist meine Vorgehensweise vielleicht auch etwas anders als gewohnt.
PonderStibbons hat geschrieben:In beiden Fällen, also die 2048 zerwürfelten Zahlen wie auch die 23 folgenden Zahlen möchte ich prüfen ob sie Normalverteilt oder Nicht Normalverteilt sind
Der Test sagt aus, wie wahrscheinlich die Stichproben-Daten wären, wenn die
Grundgesamtheit exakt normalverteilt sein sollte.
Ja ganz genau. Und das will ich herausfinden. Die Aussage das die Zahlen Warscheinlich Normalverteilt / Warscheinlich nicht Normalverteilt sind ist die Aussage die gewünscht ist.
Und da verschiedene Tests ja die Warscheinlichkeit prüfen das die Zahlen aus einer Normalverteilung stammen, kann ich daraus die Aussage Normalverteilt / Nicht Normalverteilt ableiten.
Mittlerweile habe ich festgestellt das die Tests eher dazu tendieren die Zahlen als Normalverteilt auszuwerten. Das ist ja alles nur Warscheinlichkeit und dementsprechend unscharf in der Aussage. Wenn ich nach den Tabellen gehe die es für die verschiedenen Tests ja gibt dann musste ich tatsächlich die Werte abändern damit mir da nicht mit zu hoher Warscheinlichkeit Normalverteilte Zahlen reinrutschen. Ich verwerfe also eher Zahlen wenn die Warscheinlichkeit der Nicht-Normalverteilung zu hoch ist.
Dafür musste ich erstmal mit vielen vielen Testreihen ermitteln wie die Ergebniswerte sind und ab wann es Normalverteilt / Nicht Normalverteilt bewertet wird. Das ist echt ein wenig schwierig und da bin ich auch noch nicht mit durch.
PonderStibbons hat geschrieben:In der Natur wird diese Nullhypothese stets verworfen, wenn die Stichrprobe groß ist (= große statistische power, Verwerfung auch
bei kleinen Abweichungen der Stichprobendaten von der Normalverteilung) und sehr oft fälschlich beibehalten, wenn die
Stichprobe klein ist (= geringe statistische power).
Ja das ist das Phänomen das ich wohl festgestellt habe, was ich oben erwähnte.
Wobei es aber auch einfach ist bei sehr großen Stichprobenumfang (z.b. alle 2045 Zahlen) eine Nicht-Normalverteilung zu haben. Während innerhalb dieser Stichprobe aber Bereiche existieren die wieder Normalverteilt sind. Wenn man aus diesen 2048 Zahlen also die erforderlichen 23 Zahlen herausnimmt kann es sein das diese Normalverteilt sind.
Noch weitaus schwieriger ist es mit 11 Zahlen, diese Variante gibt es auch. Da eine nicht-Normalverteilung zu bekommen hat sich als Sysiphusaufgabe erwiesen.
PonderStibbons hat geschrieben:Insofern liest es sich so, als würden Deine Fragestellung und die Lösung (inferenzstatistischer Test) nicht zusammenpassen.
Ja hab ich mir schon gedacht. Das ist halt schwierig. Vor allem für euch
Ich kann euch aber auch nicht wirklich in das einweisen um das es geht weil das umfangreich ist. Und das wird zu abscheulichen Diskussionen führen die sich auf totalen Abwegen fern dieses Themas befinden. Das kenne ich schon zu gut und hab das viele Jahre schon durch.
bele hat geschrieben:Ich verstehe vielleicht nicht, was hier genau gemeint ist. Sind die Zahlen gleichverteilt oder kommt jede genau einmal vor? Dann weißt Du, dass die Zahlen aus einer Gleichverteilung o. ä. stammen und dass sie nicht aus einer Normalverteilung stammen. Punkt.
Ganz simpel, die Zahlen sind 1 2 3 4 ..... 2045 2046 2047 2048
Und diese werfe ich mit einem CSPRNG durcheinander, einem Kryptografisch Sicherem Pseudo-Zufallsszahlen-Generator. Cryptographic Secure Pseudo-Random Number-Generator.
Diese Zahlen sind dann in der Grundgesamtheit Nicht-Normalverteilt.
Das ist aber leider nur ein Anfang.
Dieses Zerwürfeln der Zahlen mache ich zehnmal, zwanzigmal. Immer von Anfang an, also 1 2 3 4 5... 2045 2046 2047 und dann durcheinanderwerfen mit dem CSPRNG.
Denn würde ich bereits zerwürfelte Zahlen nochmal zerwürfeln dann könnt das nach hinten losgehn.
So und diese Zahlen mache ich mir Spaltenweise in einer Excelliste.
Daraus kann ich mir dann aus den Spalten immer wieder eine Reihe mit 23 Zahlen von Hand rauskopieren um sie zu verwenden. Diese 23 sind dann ja schon einmal schön durcheinander.
Mit dieser Methode kommt jede Zahl also auch nur einmal vor.
Es wäre aber zulässig das dieselbe Zahl mehrfach vorkommt, sie dürfte sogar 23 mal vorkommen. In der Theorie.
Nur das macht halt keinen Sinn.
Für diese Verwendung müssen die 23 Zahlen idealerweise auch mit grösster Warscheinlichkeit Nicht-Normalverteilt sein.
Daher muss ich diese 23 Zahlen anschliessend prüfen um möglichst sicher zu sein das sie nicht vielleicht doch Normalverteilt sind.
Denn bei den zerwürfelten Zahlen von 1 - 2048 können dennoch Bereiche drin sein wo 23 aufeinanderfolgende Zahlen wieder mit hoher Warscheinlichkeit Normalverteilt sind.
Weil 23 aus 2048 eben wieder sehr wenig sind.
bele hat geschrieben:Formulieren wir also vorsichtiger: Die 23 Zahlen können zufällig mal so aussehen, als könnten sie aus einer ungefähren Normalverteilung gezogen sein. Ist es das, was Du meinst?
Ja genau, habe versucht das zu beschreiben.
Ich habe Zahlen von 1 bis 2048 und die werf ich durcheinander mit einem CSPRNG.
Also willst Du vorrangig ausschließen, dass ein 23 Zahlen-Set nicht allzusehr nach normalverteilt aussieht?
Yes Sir!
bele hat geschrieben:Stetik hat geschrieben:Ich habe Zahlen von 1 bis 2048 und die werf ich durcheinander mit einem CSPRNG.
Ich verstehe vielleicht nicht, was hier genau gemeint ist. Sind die Zahlen gleichverteilt oder kommt jede genau einmal vor? Dann weißt Du, dass die Zahlen aus einer Gleichverteilung o. ä. stammen und dass sie nicht aus einer Normalverteilung stammen. Punkt.
Muss es denn ein bestimmter Test sein oder könnte man auch einfach einen Cutoff für Schiefe und Wölbung festlegen und solchermaßen "selbstgestrickt" mit einfachen Mitteln allzu normal anmutende Sample ausschließen?
LG,
Bernhard
[/quote]
Genau da bin ich heute bei.
Es muss kein bestimmter Test sein. Ich habe mir heute viele verschiedene Tests zusammengebaut mit dem ich 23 Zahlen in einem Rutsch mit diesen verschiedenen Tests prüfen kann. Bin noch dabei das alles auf einer einzigen Excelseite unterzubringen. Dann muss ich wieder prüfen ab wann die Aussage Normalverteilt / Nicht-Normalverteilt herauskommt und warscheinlich wieder ein wenig die Vorgabewerte verändern um die Angsttoleranz reinzubringen.
Das praktische ist das es drölf Fantastillionen Tests gibt die in vorangehenden Schritten erstmal mit sehr verschiedenen Methoden die Verteilung der Zahlen prüfen. Und diese Methoden sind für meine Zwecke schon ganz gut geeignet.
Ist aber schwierig das in Excel alles umzusetzen wenn man das schon 89343 Jahre nicht mehr gemacht hat. Ich hab vorgestern mit ersten unbeholfenen Versuchen angefangen und dann gestern zwei erste Tests gestrickt. Da hab ich heute dann weitergemacht. Da hab ich jedesmal locker 5 Stunden dran rumgeschraubt und bissel was anderes hab ich zuhause ja auch noch zu tun wa.