Anova Normalverteilung

Alles zu (M)ANOVA, ALM...

Anova Normalverteilung

Beitragvon Funkydonkey » Sa 9. Apr 2016, 15:06

Hallo zusammen,

seit 5h Versuche ich mir diesbezüglich wissen anzueignen, aber leider lese ich zu viele versch. Quellen und bin am verzweifeln. Deswegen erstelle hierzu ein neues Topic:

Muss bei einer Anova jede Faktorstufe einzeln auf Normalverteilung überprüft werden (also jede Faktorstufe für sich in Verbindung mit der abh. Variablen), oder reicht es die komplette abhängige Variable zu überprüfen?
Beispiel: Abh. Variable=Anlagevermögen; Unab. Variable= Branche; Reicht es also das Anlagevermögen komplett zu prüfen, oder muss ich das für jede Branche einzeln für das Anlagevermögen machen?
Ihr würdet mir SEHR weiterhelfen! Vielen Danke!

Grüße!:)
Funkydonkey
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 9. Apr 2016, 15:00
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Anova Normalverteilung

Beitragvon PonderStibbons » Sa 9. Apr 2016, 16:55

Muss bei einer Anova jede Faktorstufe einzeln auf Normalverteilung überprüft werden (also jede Faktorstufe für sich in Verbindung mit der abh. Variablen),

Muß nicht, aber kann.
oder reicht es die komplette abhängige Variable zu überprüfen?

Welche Quellen legen denn diesen Gedanken nahe? Die Verteilung der
abhängigen Variable ist überhaupt nicht von Belang. Bei Verfahren im
Rahmen des Allgemeinen Linearen Modells sollen die Vorhersagefehler
(die Residuen) des Modells vorzugsweise aus einer Normalverteilung
stammen, nicht die Verteilung der AV selbst. Aber selbst das ist ab
ausreichender Stichprobengröße nicht mehr unbedingt erforderlich,
um zuverlässige Ergebnisse zu erhalten (Wirkung des "zentralen
Grenzwertsatzes").

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Funkydonkey

Re: Anova Normalverteilung

Beitragvon Funkydonkey » Sa 9. Apr 2016, 17:19

Danke für deine gute Antwort! Zum Beispiel steht hier unter Punkt 1.6 einiges dazu: http://www.uni-koeln.de/~a0032/statisti ... -anova.pdf - allerdings geht hier um die Normalverteilung der Residuen, aber das ist erstmal egal, mir geht es darum, was genau ich prüfen muss, dannach schaue ich wie ich das mache:)
Die abhängige Variable X hat zum Beispiel N = 3377 (habe ich normalverteilt, also Extremwerte gefiltert). Diese hat jeweils jetzt eine Schiefe und Kurtosis zwischen -1,96 und +1,96 (das soll maßgeben sein, ob eine annähernde Normalverteilung vorliegt). Die gleiche Variable unbearbeitet hat N=5101.

Worauf kommt es denn an, ob ich die Gruppen der Variablen X selbst noch auf Normalverteilung filtern muss?:) Eine Gruppe hat zum Beispiel "nur" N=137. Eine andere Gruppe zum Beispiel N=1550. Es gibt insgesamt 10 Gruppen, die jeweils nochmal 10 Jahre beinhalten.

Danke!!
Funkydonkey
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 9. Apr 2016, 15:00
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Anova Normalverteilung

Beitragvon PonderStibbons » Sa 9. Apr 2016, 18:24

Die abhängige Variable X hat zum Beispiel N = 3377 (habe ich normalverteilt, also Extremwerte gefiltert).

Das hört sich ziemlich abwegig an, da es eine Datenmanipulation ist und zudem
vermutlich völlig überflüssig.
Worauf kommt es denn an, ob ich die Gruppen der Variablen X selbst noch auf Normalverteilung filtern muss?

Ich verstehe leider die Frage nicht. Du wolltest eine ANOVA rechnen,
dafür sollen die Residuen einer Normalverteilung entstammen,
bei n > 5000 ist das aber irrelevant.

Eine Gruppe hat zum Beispiel "nur" N=137. Eine andere Gruppe zum Beispiel N=1550. Es gibt insgesamt 10 Gruppen, die jeweils nochmal 10 Jahre beinhalten.

Verstehe ich leider nicht, aber ist vielleicht auch nicht notwendig.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Funkydonkey

Re: Anova Normalverteilung

Beitragvon Funkydonkey » Sa 9. Apr 2016, 18:43

Ich verstehe leider die Frage nicht. Du wolltest eine ANOVA rechnen,
dafür sollen die Residuen einer Normalverteilung entstammen,
bei n > 5000 ist das aber irrelevant.


Danke!! Dann muss ich überhaupt keine Werte "rausschmeißen"? Um genau zu sein und wirklich nicht alles falsch zu machen schreibe ich nochmal genau wie meine Rohdaten aufgebaut sind. Ich habe ca. 20 Variablen (in SPSS)(diese sind bis auf 3 Variablen nicht annähernd normalverteilt). Betrachten wir einfach erstmal eine davon. Das Anlagevermögen. Diese Spalte hat 5100 Rohwerte (5100 Zellen untereinander stehend). Diese 5100 Werte beziehen sich auf verschiedene Unternehmen. Genau genommen auf 510. Dementsprechend sind immer 10 Jahres Daten vorhanden (stehen wie geschrieben immer untereinander). Es fängt an mit 10 Jahren (10 Zellen), dann folgen die nächsten 10 Jahre für ein anderes Unternehmen usw. Eine andere Variable, welche die Branchen widerspiegelt (das dürfte dann der Faktor sein) beinhaltet widerum in ihrer Spalte die Ziffern 1-10,welche für Branchen stehen. Zum Beispiel 1: Industrie (das sollte eine der 10 Faktorstufen sein?). Für die ersten 10 Jahre für das erste Unternehmen steht beispielsweise in der "Branchen Spalte" die Ziffer 1 10x untereinander.
So weit so gut;)
Die Ziffer 1 kommt in dieser "Branchen Spalte" beispielsweise 100 x vor (10 Unternehmen sind insgesamt aus der Industrie Branche mal 10 Jahre= 100). Das ist die Ausgangsposition.

Jetzt möchte ich für jede Variable sagen (zb. Anlagevermögen), ob die Branche einen Einfluss auf diese Variable hat, also wie die Unterschiede sind. Hierzu soll ich die Anova benutzen.

Meine Ursprungsfrage war jetzt, ob es reicht das Anlagevermögen normalverteilt zu machen (was ich ja nicht brauch wie du sagst?), oder ob ich die einzelnen Gruppen unter sich erst normalverteilt machen muss? (oder die Residuen dieser?)-->beides nicht nötig, weil so viele N?

Sorry, dass ich das so in der Art geschrieben habe, ich habe die Erfahrung gemacht, dass es so besser verstanden wird. Es ist verdammt schwierig so etwas zu beschreiben;)

Vielen Dank!
Funkydonkey
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 9. Apr 2016, 15:00
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Anova Normalverteilung

Beitragvon strukturmarionette » Sa 9. Apr 2016, 19:24

Hi,

oder ob ich die einzelnen Gruppen unter sich erst normalverteilt machen muss? (oder die Residuen dieser?)

- das scheinen aber ZWEI absolut grundlegende Missverständnisse vorzuliegen.
- Es kann nicht darum gehn, Messwerte durch Manipulation 'normalverteilt' zu machen.
- Entweder kann von NV (für bestimmte Anliegen) ausgegangen werden oder nicht.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Funkydonkey

Re: Anova Normalverteilung

Beitragvon Funkydonkey » Sa 9. Apr 2016, 19:38

strukturmarionette hat geschrieben:

- Entweder kann von NV (für bestimmte Anliegen) ausgegangen werden oder nicht.


Danke für deine Antwort!
Also kann man Extremwerte nie filtern? Brauche ich für mein anliegen eine NV? Ich bin gerade extrem verwirrt:(
Funkydonkey
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 9. Apr 2016, 15:00
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Anova Normalverteilung

Beitragvon PonderStibbons » Sa 9. Apr 2016, 21:19

Danke!! Dann muss ich überhaupt keine Werte "rausschmeißen"? Um genau zu sein und wirklich nicht alles falsch zu machen
Diese Spalte hat 5100 Rohwerte (5100 Zellen untereinander stehend). Diese 5100 Werte beziehen sich auf verschiedene Unternehmen. Genau genommen auf 510. Dementsprechend sind immer 10 Jahres Daten vorhanden (stehen wie geschrieben immer untereinander).


Jetzt möchte ich für jede Variable sagen (zb. Anlagevermögen), ob die Branche einen Einfluss auf diese Variable hat, also wie die Unterschiede sind. Hierzu soll ich die Anova benutzen.

Du solltest Dir Hilfe im real life besorgen, wie es scheint. Zum Beispiel handelt es sich um ein Messwiederholungsdesign, das wird mit Messwiederholungs-ANOVA analysiert oder einem Mehrebenenmodell. Und da sind dann jeweils die spezifischen Voraussetzungen zu beachten.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Anova Normalverteilung

Beitragvon Funkydonkey » So 10. Apr 2016, 10:34

PonderStibbons hat geschrieben:Jetzt möchte ich für jede Variable sagen (zb. Anlagevermögen), ob die Branche einen Einfluss auf diese Variable hat, also wie die Unterschiede sind. Hierzu soll ich die Anova benutzen.

Hilfe im Reallife ist schwierig.. Ich frage einfach mal anders. Brauche ich bei der Messwiederholungs-ANOVA bei meiner Datenmenge, die so aufgebaut ist wie beschrieben überhaupt eine Normalverteilung in welcher Art auch immer? Danke nochmal!
Funkydonkey
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Sa 9. Apr 2016, 15:00
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Anova Normalverteilung

Beitragvon strukturmarionette » So 10. Apr 2016, 11:02

Hi,

Brauche ich bei der Messwiederholungs-ANOVA bei meiner Datenmenge, die so aufgebaut ist wie beschrieben überhaupt eine Normalverteilung in welcher Art auch immer? Danke nochmal!

- Ja.
- Aufgrund der Gültigkeit des zentralen Grenzwerttheorems aus der Mathematik kann bei großen Stichproben für Inferenzstatistik aber davon ausgegangen werden.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Funkydonkey

Nächste

Zurück zu Varianzanalysen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste