Mehrfache Transformationen möglich?

Alle Verfahren der Regressionanalyse.

Mehrfache Transformationen möglich?

Beitragvon limafu » Sa 22. Jun 2013, 12:55

Hallo zusammen,

ich habe einen Datensatz und bereits alle darin beinhalteten Variablen auf NV geprüft.
Einige davon sind nicht normalverteilt. Diese würde ich gerne transformieren bzw. habe ich teilweise bereits.
Leider kommt nach erneutem Test auf NV nicht das gewünschte Ergebnis heraus. Wieder nicht-normalverteilt.

Nun meine Frage, ist es möglich bzw. gestattet, die bereits transformierten Daten nochmals zu transformieren? Und das so lange bis eine NV vorliegt?
Das scheint mir etwas willkürlich, und bei einem Versuch hat das leider auch nicht funktioniert.

Des Weiteren noch eine Frage zu den Transformationen:
Gibt es Vorschläge bei welcher Schiefe welche Transformation am besten geeignet ist?
Ich weiß, dass bei Rechtslastigkeit im Histogramm, die log-Transformation gängig ist.
Wie sieht das denn bei Linkslastigkeit aus? Oder bei mehreren Peaks?

Über Hilfe und Antworten würde ich mich sehr freuen!

Viele Grüße,
Lisa
limafu
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 22. Jun 2013, 12:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mehrfache Transformationen möglich?

Beitragvon daniel » Sa 22. Jun 2013, 14:01

Weshalb möchtest Du denn normalverteilte Variablen?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Mehrfache Transformationen möglich?

Beitragvon limafu » Sa 22. Jun 2013, 17:18

Unter anderem um eine ANOVA zu rechnen, sowie eine Regressionsanalyse durchzuführen.
Soweit ich weiß, sollten die Daten dazu normalverteilt sein.
limafu
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 22. Jun 2013, 12:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mehrfache Transformationen möglich?

Beitragvon daniel » Sa 22. Jun 2013, 17:32

Beide Verfahren beruhen auf dem gleichen statistischen Modell, keines verlangt die Normalverteilung des outcomes (abhängige variable) und schon gar nicht aller "Daten" (i.e. Prädikatoren). Eine (faktorielle) ANOVA wird mit kategorialen oder nominalen Prädikatoren geschätzt. Diese können gar keiner Normalverteilung folgen.

Die Normalverteilungsannahme bezieht sich i.d.R. auf die Residuen (Fehler) der Regression, die zudem homoskedastisch (gleiche Varianz) und nicht seriell korreliert sein dürfen. Die Normalverteilungsannahme ist bei der Regression zumeist nur in kleinen Stichproben für die finiten Eigenschaften relevant. Weitere Ausführungen hier: post7698.html?hilit=BLUE#p7698
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Mehrfache Transformationen möglich?

Beitragvon limafu » Mo 24. Jun 2013, 13:11

Das ist mir bewusst, dass sich die Normalverteilungsannahme auf die Residuen bezieht. Ist einfach gängiger zu sagen die Daten müssen einer NV unterliegen. Wie auch immer, ich verstehe das so, dass wenn meine Daten normalverteilt sind, auch meine Residuen normalverteilt sind. Wie sollte ich dies sonst testen/wissen?
Ich bin kein Statistiker. Ich möchte verschiedene Verfahren auf meine Daten anwenden, und diese verlangen laut Literatur eine NV. Also gehe ich dementsprechend.

Meine Frage, ob man mehrere Transformationen anwenden kann, ist leider immernoch nicht beantwortet.
Weiß jemand ob es erlaubt ist bereits transformierte Variablen nochmals oder mehrmals zu transformieren bis der Test auf NV angibt, dass meine Daten normalverteilt sind?

Vielen Dank schonmal,
limafu
limafu
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 22. Jun 2013, 12:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mehrfache Transformationen möglich?

Beitragvon daniel » Mo 24. Jun 2013, 13:30

und diese verlangen laut Literatur eine NV. Also gehe ich dementsprechend.


Welche Literatur verlangt das für welches Verfahren?

Meine Frage, ob man mehrere Transformationen anwenden kann, ist leider immernoch nicht beantwortet.


Du möchtest gerne eine "ja" oder "nein" hören. Das ist verständlich, aber leider ist das nicht so leicht. Niemand mit ein wenig Ahnung und Verantwortungsgefühl wird Dir eine solche Antwort geben.

Weiß jemand ob es erlaubt ist bereits transformierte Variablen nochmals oder mehrmals zu transformieren bis der Test auf NV angibt, dass meine Daten normalverteilt sind?


Immer erheiternd, wenn von "erlauben" gesprochen wird. Wer soll es denn verbieten? Klar kannst Du Variablen so oft und in jeglicher Weise transformieren, wie Du willst. Toll auch, wenn sie danach normalverteilt sind. Schlecht nur, dass Du vermutlich nicht mehr in der Lage bist die geschätzen Parameter zu interpretieren -- und all das, nur weil Du normalverteilte Variablen willst, die mit höchster Wahrscheinlichkeit nicht nötig sind.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Mehrfache Transformationen möglich?

Beitragvon limafu » Mo 24. Jun 2013, 13:49

Ich möchte lediglich wissen ob es jemanden gibt, der bereits ein ähnliches Problem hatte und wie derjenige vorgegangen ist.
Auf Grundsatzdiskussionen und seichte ironische Fragen/Bemerkungen kann ich verzichten, danke.
limafu
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 22. Jun 2013, 12:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Mehrfache Transformationen möglich?

Beitragvon daniel » Mo 24. Jun 2013, 15:09

Da habe ich ja noch eine Frage/Aussage nicht kommentiert.

ich verstehe das so, dass wenn meine Daten normalverteilt sind, auch meine Residuen normalverteilt sind.


Keineswegs. Residuen können normalverteilt sein, wenn die Variablen nicht normalverteilt sind. Genauso führen normalverteilte Variablen nicht zu normalverteilten Residuen.

Wie sollte ich dies sonst testen/wissen?


Du berechnest die empirischen Residuen aus dem Regressionsmodell und testest diese auf Normalverteilung.

Ich möchte lediglich wissen ob es jemanden gibt, der bereits ein ähnliches Problem hatte und wie derjenige vorgegangen ist.


Ich habe zumindest bereits auf einen post verwiesen, in dem das gleiche Problem diskutiert wird. Es sollten sich mit der Suchfunktion viele weitere Einträge mit der (auf hartnäckigen Missverständnissen beruhenden) Frage nach normalverteilten Variablen/Daten bei Regressionsanalysen finden lassen. Falls ich die Zeit finde, werde ich mal einen FAQ ähnlichen Eintrag dazu verfassen.


Auf Grundsatzdiskussionen und seichte ironische Fragen/Bemerkungen kann ich verzichten, danke.


Nun, wenn es offenbar bereits bei den Grundlagen (i.e. Grundsätzen) Probleme gibt, sollten diese doch wohl diskutiert werden, oder? Meine Frage (ich nehme an, es geht um das "verbieten") war nicht seicht, sondern im Gegenteil relativ tief. Es geht mir darum, dass Du Dich mit der Materie auseinandersetzen musst und nicht nach "Rezept" arbeiten solltest. Ironisch war die Frage dagegen in der Tat formuliert -- nicht alles zu ernst nehmen.

Ich hoffe, jemand anders kann Dir weiterhelfen, da mein Verständnis von Hilfestellung nicht mit Deinen Erwartungen zu korrespondieren scheint.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Mehrfache Transformationen möglich?

Beitragvon PonderStibbons » Di 25. Jun 2013, 10:24

Es wird vermutlich die falsche Größe betrachtet (Verteilung der AV statt
Verteilung der Residuen), womöglich mit den falschen Methoden
(Signifikanztest statt Q-Q plots etc.?), eventuell überflüssigerweise
(nur bei kleinen Stichproben sind die gängigen Tests empfindlich
gegenüber Abweichungen von der Normalverteilung), jedenfalls mit
einer problematischen Konsequenz (Transformation von Daten - wer
traut sich zu, die Ergebnisse adäquat zu interpretieren). Bei so vielen
mutmaßlichen Fehlern tut man sich schwer, auf die Frage einzugehen.
Da die Fragestellung, Stichprobengröße und Anbalysemethode nicht
genannt sind, ist es auch schwer, Alternativen aufzuzeigen.

Gesehen habe ich mehrfache Transformationen noch nie, die
Interpretation wird dadurch m.E. vollends unmöglich.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Mehrfache Transformationen möglich?

Beitragvon limafu » Di 25. Jun 2013, 11:55

Hallo P.,

vielen Dank für Deine Antwort! Vorallem, was die mehrfache Transformation betrifft. Das hatte ich mir auch schon gedacht...

Was ich mich mittlerweile frage:
Es wird angegeben, dass für verschiedene Analyseverfahren eine NV vorliegen muss. Dabei werden wiederum Tests auf NV angegeben, bspw. Kolmogorov-Smirnow oder Shapiro-Wilk. Nun wendet man diese an, obwohl dies scheinbar falsch ist?!
Untersuchen gerade diese beiden Tests nun die NV der Residuen oder der Variablen? Denn ich habe u.a. anderem gelesen, dass der Shapiro-Wilk auf die NV der Residuen testet?! Möglich ist dies ja, da man bei den ganzen Blackboxen oft nicht mehr weiß, was genau berechnet wird. Dann heißt es wiederum, dass gerade der Shapiro-Wilk gut geeignet ist für kleine Stichproben (n<50).

Meine Stichprobe ist leider etwas klein (n=18). Untersucht werden soll, ob die Variabilität von Biomasse von verschiedenen anderen Faktoren abhängig ist. Dies soll u.a. durch Korrelationen und multi-lineare Regressionsverfahren analysiert werden.
Ich bin mir mittlerweile unsicher ob dafür nun eine NV vorliegen muss? Verschiedene Quellen geben verschiedene Angaben.

Um nochmals auf die Tests auf NV zurückzukommen. Es wäre also sinnvoller die Residuen zu berechnen und diese auf NV zu überprüfen (anhand der oben genannten Tests)? Sollten diese nicht normalverteilt sein, ist eine Transformation anzuwenden? Könnte es da erneut Probleme bei der Interpretation geben?

Mit freundlichen Grüßen,
limafu
limafu
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Sa 22. Jun 2013, 12:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron