ANOVA für lineare Modelle

Alle Verfahren der Regressionanalyse.

Re: ANOVA für lineare Modelle

Beitragvon kleinersven » Di 18. Jun 2019, 08:46

PS: Log-transformiert habe ich auch die Fragebögen schonmal, hat leider auch nicht geholfen....

Aber ich habe jetzt gerade nochmal generell über das Modell nachgedacht und eine weitere Variable eingebaut (die mir gerade einfiel dass sie ebenfalls sehr wichtig für das Modell ist) inklusive Interaktionsterm dieser Variablen mit dem Fragebogen... und plötzlich erhöht sich auch der Einfluss des Fragebogens allerdings hat er nun auch ein positives Vorzeichen und in dem Rauchermodell bzw. wenn ich nur das Modell (lm(formula = a$Reaktionszeit ~ 1 + a$cond + a$emo + a$Fragebogen1)) mache dann hat er immer ein negatives Vorzeichen.... Wieso ändern sich die Koeffizienten obwohl es der gleiche Datensatz ist? Könnte ich das Modell als "finales" Modell nehmen oder ist es weniger aussagekräftig nachdem ich weiß, dass der Fragebogen in einem anderen Modell ein anderes Vorzeichen hatte? Bin gerade total verunsichert weil das verändert ja meine ganze Interpretation.

Ich hoffe es ist nicht allzu unübersichtlich ich kriege die Koeffizienten Liste irgendwie gerade nicht entzerrt sondern sobald ich es absende hängen die Spalten wieder so eng zusammen... hab daher die wichtigen Koeffizienten mal fett gemacht und unterstrichen.

Call:
lm(formula = a$Reaktionszeit ~ 1 + a$cond + a$emo + a$Fragebogen1 * a$Acc)

Residuals:
Min 1Q Median 3Q Max
-362.85 -55.88 -9.19 47.50 319.07 [/code]

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 585.0586 6.8635 85.243 < 2e-16 ***
a$cond2 87.2657 0.5625 155.147 < 2e-16 ***
a$emo95 8.0463 0.5615 14.330 < 2e-16 ***
a$Fragebogen1 4.1360 1.3257 3.120 0.001810 **
a$Acc -92.7417 7.1611 -12.951 < 2e-16 ***
a$Fragebogen1:a$Acc -5.1544 1.3846 -3.723 0.000197 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 80.64 on 82493 degrees of freedom
(5981 observations deleted due to missingness)
Multiple R-squared: 0.2294, Adjusted R-squared: 0.2294
F-statistic: 4912 on 5 and 82493 DF, p-value: < 2.2e-16


Und könnte ich nicht das Rauchen auch noch in dieses Modell einbauen? Dann habe ich allerdings 5 Variablen in einem Modell und ich habe gelesen, dass man ca. 20 Probanden pro einer Variable haben soll und ich hatte 79 Probanden, heißt mehr als 4 Variablen dürfte ich eigentlich nicht in mein Modell einbauen oder?
kleinersven
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Di 12. Mär 2019, 18:14
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: ANOVA für lineare Modelle

Beitragvon PonderStibbons » Di 18. Jun 2019, 10:16

Wieso Stichprobengröße 79? Laut Deinem output hast Du über 80.000 Fälle.

Vielleicht stellst Du das Ganze einmal zusammenhängend und für außenstehende nachvollziehbar dar -
Thema, Fragestellungen, konkretes Erhebungsdesign, welche Variablen erhoben wurden und wie sie
konkret gemessen wurden, und wie Deine Regressionsberechnung zustandekam.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: ANOVA für lineare Modelle

Beitragvon kleinersven » Di 18. Jun 2019, 10:39

Ich habe Reaktionszeiten gemessen während die Probanden eine Aufgabe machen mussten. Daher habe ich viele Reaktionszeiten pro Proband weil für jeden Trial der Aufgabe (ca. 14000 Trials pro Aufgabe) eine Reaktionszeit aufgezeichnet wurde. Das habe ich mit 80 Probanden gemacht.
Ich habe folgende Variablen die ich untersuchen möchte:
emo = Emotion, kategorial, neutral und negativ (es wurden Emotionen in den Probanden ausgelöst während der Aufgabe)
cond = "Condition", kategorial, zwei verschiedene Aufgabentypen innerhalb der Aufgabe
Fragebogen 1
Fragebogen 2
Fragebogen 3
Acc = Accuracy, also die Korrektheit mit der die Probanden die Aufgabe ausgeführt haben (eine Prozentangabe pro Proband)

All diese Variablen sollen Prädiktoren sein für die Reaktionszeit um zu sehen wie sie sich auf diese auswirken.

Ich wusste nicht, dass es sich nach der Anzahl der Fälle richtet wieviele Variablen in ein lineares Modell rein dürfen.
Daher könnte ich eigentlich auch ein lineares Modell mit all meinen Variablen machen die ich untersuchen möchte oder? Dann wäre es einheitlich.
Also:
Reaktionszeit ~ cond+emo+Fragebogen1+Fragebogen2+Fragebogen3+Acc
und dann noch innerhalb dieses Modells die Interaktionen mir anschauen
zum Beispiel Reaktionszeit~cond*Fragebogen1+emo+Fragebogen2+Fragebogen3+Acc ... etc...

So hätte ich auch nicht unterschiedliche Koeffizienten für einen Fragebogen je nachdem welches Modell ich mache sondern könnte mich auf dieses eine Modell berufen.
kleinersven
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Di 12. Mär 2019, 18:14
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: ANOVA für lineare Modelle

Beitragvon PonderStibbons » Di 18. Jun 2019, 10:56

Ich habe Reaktionszeiten gemessen während die Probanden eine Aufgabe machen mussten. Daher habe ich viele Reaktionszeiten pro Proband weil für jeden Trial der Aufgabe (ca. 14000 Trials pro Aufgabe) eine Reaktionszeit aufgezeichnet wurde. Das habe ich mit 80 Probanden gemacht.

Du kannst die multiplen Messungen an ein- und demselben Probanden nicht wie unabhängige
Fälle behandeln. Das erzeugt falsche Standardfehler und daher falsche Ergebnisse bei der Testung.
Das ist das kleine Einmaleins und absolut basal.

Du solltest, so wie es aussieht, entweder die Messungen geeignet aggregieren, oder ein
Mehrebenenmodell rechnen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: ANOVA für lineare Modelle

Beitragvon kleinersven » Di 18. Jun 2019, 11:02

Du meinst mit Mehrebenenmodell ein linear gemischtes Modell?
Also dass ich folgendes mache:
(lmer (Reaktionszeit~cond+emo+Fragebogen1+Fragebogen2+Fragebogen3+Acc+(1|sub))) ?

Tut mir leid, ich stelle hier wohl wirklich basale Fragen aber ich bin wirklich sehr dankbar, dass ihr sie mir beantwortet!
kleinersven
Beobachter
Beobachter
 
Beiträge: 15
Registriert: Di 12. Mär 2019, 18:14
Danke gegeben: 5
Danke bekommen: 0 mal in 0 Post

Re: ANOVA für lineare Modelle

Beitragvon PonderStibbons » Di 18. Jun 2019, 11:05

Ich kann leider keine Schritt-für-Schritt Anleitung für die Durchführung einer Mehrebenenanalyse in R geben.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: ANOVA für lineare Modelle

Beitragvon bele » Di 18. Jun 2019, 13:06

@kleinersven
Hi,

kleinersven hat geschrieben:Aber ich habe jetzt gerade nochmal generell über das Modell nachgedacht und eine weitere Variable eingebaut (die mir gerade einfiel dass sie ebenfalls sehr wichtig für das Modell ist)


Wenn die weitere Variable inhaltlich wichtig ist, dann soll sie in das Modell rein.

und plötzlich erhöht sich auch der Einfluss des Fragebogens allerdings hat er nun auch ein positives Vorzeichen und in dem Rauchermodell


Jeder Koeffizient ist abhängig von den anderen enthaltenen Prädiktoren und deren Koeffizienten. Du kannst nie einen ohne die anderen betrachten. Sehr wahrscheinlich sind Deine Prädiktoren nicht wirklich voneinander unabhängig sondern schleppen in sich Informationen mit, die auch in den anderen irgendwie enthalten sind.

Könnte ich das Modell als "finales" Modell nehmen


Braucht nach PonderStibbons Rückfrage nicht mehr beantwortet zu werden. Du musst entweder aggregieren (z. B. durchschnittliche Reaktionszeit pro Proband), was einen erheblichen Informationsverlust zur Folge hat, oder ein Mehrebenenmodell rechnen, was halt deutlich komplizierter ist.

Ich hoffe es ist nicht allzu unübersichtlich ich kriege die Koeffizienten Liste irgendwie gerade nicht entzerrt sondern sobald ich es absende hängen die Spalten wieder so eng zusammen...


Für so etwas gibt es code-Tags im Forum. Mit denen werden alle Zeichen gleich breit.

Und könnte ich nicht das Rauchen auch noch in dieses Modell einbauen? Dann habe ich allerdings 5 Variablen in einem Modell und ich habe gelesen, dass man ca. 20 Probanden pro einer Variable haben soll und ich hatte 79 Probanden, heißt mehr als 4 Variablen dürfte ich eigentlich nicht in mein Modell einbauen oder?


Das mit den 20 Probanden pro Variable ist eine ganz grobe Faustregel und wenn einer 15 oder 10 Probanden pro Variable sagt, dann gibt es diese Fausregel wahrscheinlich auch. Wenn theoriegeleitet Rauchen für die Fragestellung wesentlich ist, dann sollte sie ins Modell. Wenn nicht, dann möglichst nicht.

Code: Alles auswählen
(lmer (Reaktionszeit~cond+emo+Fragebogen1+Fragebogen2+Fragebogen3+Acc+(1|sub))) ?


Weißt Du, kleinersven, es ist schwer, Dich hier im Forum einzuschätzen: Einerseits hast Du Dir keine Gedanken gemacht, dass ein bei n = 80000 knapp signifikanter Effekt nicht sehr groß sein kann, andererseits zauberst Du hier gleich die korrekte Funktion für ein random effects modell hervor. Andererseits sollte auch dem Anfänger auffallen, dass dieser lmer-Aufrur nichtmal beinhaltet, dass die Daten in einem Dataframe namens a liegen. Eine klare Beschreibung, worum es geht, gibt es noch nicht, dann fällt da plötzlich ein Fragebogen 3 vom Himmel.
Die gar nicht böse gemeinte aber ehrliche Antwort ist, dass man in einem Forumspost einzelne Fragen klären oder einzelne Anstöße geben kann, Du aber jemanden brauchst, der sich in Deine Arbeit vernünftig einarbeitet und mit Dir eine gemeinsame Lösung erarbeitet, idealerweise bis einschließlich Interpretation. Das dürfte den Rahmen eines Forums sprengen.
Suche an Deiner Hochschule nach einer besseren Betreuung. Gibt es irgendwo eine Statistikberatung? Sonst solltest Du für eine Dissertation erwägen, eventuell auch einen kommerziellen Statistikberater ins Boot zu holen (statworx.de ist der Gastegeber dieses Forums und gehört zuerst genannt, www.faes.de betreibt das bessere deutschsprachige R-Forum, andere finden sich über Suchmaschinen). Oft machen die Sonderpreise für Studierende, muss man halt nachfragen und Preise vergleichen.

Sorry,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: ANOVA für lineare Modelle

Beitragvon PonderStibbons » Di 18. Jun 2019, 13:43

emo = Emotion, kategorial, neutral und negativ (es wurden Emotionen in den Probanden ausgelöst während der Aufgabe)
cond = "Condition", kategorial, zwei verschiedene Aufgabentypen innerhalb der Aufgabe
Fragebogen 1
Fragebogen 2
Fragebogen 3
Acc = Accuracy, also die Korrektheit mit der die Probanden die Aufgabe ausgeführt haben (eine Prozentangabe pro Proband)

Das ist leider noch weit entfernt von einer nachvollziehbaren Beschreibung der Versuchsdurchführung.

Anscheinend gibt es zwei Messwiederholungsfaktoren Emotion (3 Stufen) und Aufgabentyp (2 Stufen).

Ferner mehrere Prädiktoren, die zwischen Subjekten unterscheiden, namentlich Fragebogen 1 bis 3 sowie
optional das Rauchen. Den Status von accuracy konnte ich der Beschreibung nicht klar entnehmen;
falls es 1 Wert pro Proband über den ganzen Versuch hinweg ist, dann wäre es ebenfalls ein Prädiktor so wie die
Fragebögen und das Rauchen.

Man könnte nun die Reaktionszeiten eines Probanden innerhalb jeder der 3x2 Bedingungen (Kombination aus
Aufgabentyp und Emotion) aggregieren und dann mit einer "mixed ANOVA" (eine Messwiederholungs-
Varianzanalyse mit zusätzlichen Zwischensubjektfaktoren bzw. zusätzlichen subjektbezogenen "Kovariaten")
analysieren. Eventuell kann man das mit unterschiedlichen Parametern aggregieren: mediane Reaktionszeit,
interquartile Range der Reaktionszeit, 80. Perzentil der Reaktionszeit usw., je nach Erkenntniszielen und
Studienfragestellung, die uns nach wie vor leider nicht dargestellt werden.

Aber das basiert nun weitgehend auf Raterei, womöglich ist ein Mehrebenenmodell der Sachlage weitaus
angemessener.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste