Verteilung einer neu erstellten Variable prüfen?

Univariate Statistik.

Verteilung einer neu erstellten Variable prüfen?

Beitragvon Davidos » Sa 2. Sep 2023, 12:01

Hallo,
ich bearbeite gerade meine Bachelor-Thesis und habe im Verlauf dessen aus bereits geprüften und bereinigten Daten (2 Versuchsgruppen und 2 Messzeitpunkte) neue Variablen erstellt. Diese sind die Differenzwerte pro Versuchsperson, welche die Veränderung von T1 zu T2 abbilden sollen. Bei diesen neuen Variablen zeigen sich jetzt jedoch sehr viele Ausreißer und ich bin mir bezüglich des weiteren Vorgehens unsicher.

Müsste ich diese neuen Variablen ebenfalls auf ihre Verteilung prüfen und mit den Aureißern umgehen (z.b. transformieren, wenn sie sehr extrem sind) oder könnte ich die Daten auch so belassen und argumentieren, dass sie aus bereits bereinigten Daten erstellt wurden und sich diese Verteilung in meiner Stichprobe nunmal so ergeben hat? Gibt es da ein konventionelles Vorgehen oder ist einem das einfach selbst überlassen?

Freue mich über jede Anregung!
Lg
David
Davidos
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Sa 2. Sep 2023, 11:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Verteilung einer neu erstellten Variable prüfen?

Beitragvon PonderStibbons » Sa 2. Sep 2023, 12:31

sehr viele Ausreißer

Das klingt wie ein Widerspruch in sich.
Müsste ich diese neuen Variablen ebenfalls auf ihre Verteilung prüfen und mit den Aureißern umgehen (z.b. transformieren, wenn sie sehr extrem sind)

Um darauf eingehen zu können, müsste man wissen, was Du denn mit diesen neu erstellten Variablen vorhast.
Die Stichprobengröße müsste ebenfalls bekannt sein. Und es wäre auch schön zu wissen, was das ursprünglich
für Variablen sind und wie sie gemessen wurden.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Verteilung einer neu erstellten Variable prüfen?

Beitragvon Davidos » Sa 2. Sep 2023, 12:42

Hey, danke für die schnelle Antwort!

- Insgesamt sind es 123 Personen, die sich in 59 und 64 Personen in den beiden Gruppen aufteilen.
- Die neu erstellten Variablen sollen in einem Mediationsmodell als Mediator und abhänige Variable verwendet werden.
- Die ursprügnlichen Variablen (D, L, I) wurden jeweils über eine Likert-Skala erfasst, aus denen ich Summen (D_S) und Mittelwerte (I_Y, L_Y) berechnet habe. Die Differenzwerte wurden dann jeweils innerhalb einer Variable berechnet, also z.b. I_Y vom zweiten Zeitpunkt - I_Y vom ersten Zeitpunkt.

Viele Grüße!
Davidos
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Sa 2. Sep 2023, 11:47
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Verteilung einer neu erstellten Variable prüfen?

Beitragvon bele » Sa 2. Sep 2023, 13:02

Hi,

es ist im Grunde immer gut zu schauen, ob es merkwürdige Werte gibt, die dagegen sprechen, dass man gleiches mit gleichem vergleicht. Was Du unter einem Ausreißer verstehst und warum Du glaubst, wie Du den von PonderStibbons angesprochenen möglichen Widerspruch von "sehr vielen" Ausreißern in überschaubaren Teilnehmerzahlen erklärst und ob die Form der Datenerhebung geeignet ist, störende Ausreißer zu erzeugen etc, das wissen wir natürlich nicht.

Immer wieder tauchen im Forum Menschen auf die denken, dass Ihre Prädiktoren oder Zielwerte normalverteilt sein müssen. Das müssen sie nicht. Weder Mediatoren noch Abhängige.

In Abwesenheit weiterer Informationen wäre meine allgemeine Empfehlung, die Regressionen einmal zu rechnen und dann die Residuen auf extrem einflussreiche Werte zu prüfen. Da Residuen idealerweise normalverteilt sein sollten ist es hier leichter zu sagen, welche Beobachtungen vielleicht problematisch sind und welche eher nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Verteilung einer neu erstellten Variable prüfen?

Beitragvon PonderStibbons » Sa 2. Sep 2023, 13:16

- Die ursprünglichen Variablen (D, L, I)

Depression, Lateralität, Introversion? Dominanzstreben, Latenz, Introspektion? Demut, Laufgeschwindigkeit, Interesse?
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron