Korrelation sinkt bei größerer Gruppe?

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Korrelation sinkt bei größerer Gruppe?

Beitragvon m12345 » Mo 13. Jan 2025, 16:58

Hallo,

ich habe Lesemotivation und Leseleistung zweier Gruppen getestet und die Korrelation mit KORREL berechnet. Die Daten habe ich im Anhang.

Was ich nicht verstehe: Die Gruppen haben folgende Werte:

A: r = -0,319
B: r = -0,306

Wenn ich nun die Werte beider Gruppen zusammenfasse und erneut r berechne, würde ich erwarten, dass r irgendwo zwischen diesen beiden Werten liegt. Excel gibt mir jedoch r=-0,29 aus.

Wie kommt es, dass der Wert der Gesamtstichprobe eine geringere Korrelation ausgibt als die geringste Korrelation einer Einzelgruppe? Liegt ein Fehler vor?

Danke!

P.S: Den Screenshot kann ich leider doch nicht anhängen, ich erhalte die Fehlermeldung "Das Kontingent für Dateianhänge ist bereits vollständig ausgenutzt."
m12345
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 13. Jan 2025, 16:49
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon bele » Mo 13. Jan 2025, 17:14

Hi,

Dein r ist eine Streuung um eine Gerade. Stell Dir vor, Gruppe A streut um die Gerade und die Gruppe B streut um die Gerade . Wenn Du jetzt beide Punktwolken in ein Diagramm einzeichnest, wird dann alles mehr auf einer Geraden liegen oder wird alles mehr streuen?
Sobald die beiden um verschiedene Geraden streuen ist das zu erwarten.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5924
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1402 mal in 1388 Posts

folgende User möchten sich bei bele bedanken:
m12345

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon m12345 » Mo 13. Jan 2025, 19:17

Hallo Bernhard,

der Gedanke mit den unterschiedlichen Geraden leuchtet mir nicht so richtig ein. Intuitiv wäre meine Vermutung, dass eine zweite Gerade, die der ersten Gerade sehr ähnlich ist, den Effekt verstärkt. Wenn ich beim Testen auf Signifikanz eine größere Stichprobe habe, dann ist die größere Stichprobe ja auch insofern vorteilhaft, dass mehr Datenpunkte den p-Wert erhöhen, also einen verstärkenden Effekt haben. Mir fällt schwer zu akzeptieren, dass bei der Korrelation mehr Datenpunkte die Korrelation abschwächen. Wahrscheinlich vermische ich hier die Art und Weise, wie r- und p-Werte zustandekommen :?

Hier die Punktwolken:
https://1drv.ms/i/c/a19b344e672c5925/EV ... g?e=ILefMY
m12345
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 13. Jan 2025, 16:49
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon bele » Mo 13. Jan 2025, 22:13

Ob die zweite Gerade der ersten sehr ähnlich ist bliebe ja erstmal noch zu untersuchen. Ich vermute ja gerade, dass sie es nicht ist.

Die Parallele zwischen Korrelationskoeffizienten und p-Werten verstehe ich gerade gar nicht. Beides sind ganz verschiedene Größen, beide messen etwas ganz anderes und von p-Werten war hier bisher nicht die Rede.

OneDrive lässt mich da ohne Anmeldung nicht gucken. Sehen die Punktwolken denn so aus, als folgten Sie der gleichen Geraden?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5924
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1402 mal in 1388 Posts

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon m12345 » Mo 13. Jan 2025, 22:27

Der Link sollte sich ohne Anmeldung öffnen lassen, geht hier jedenfalls auch im Inkognito-Modus.

Hier nochmal das Bild: https://ibb.co/6PLqTQZ
m12345
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 13. Jan 2025, 16:49
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon bele » Di 14. Jan 2025, 16:35

Hallo,

ja, Daten anschauen ist doch was schönes und gibt einem ein gutes Gefühl, dass man weiß, worüber man redet. Für Deine endgültige Ergebnisdarstellung empfehle ich Dir, Dich mit dem Problem des Overplottings zu beschäftigen und eine Grafik zu erstellen, an der man erkennt, welche Punkte tatsächlich zwei übereinanderliegende Punkte sind. Das hat erstmal nichts mit Deiner Frage zu tun, wäre mir hier aber wichtig.

Was ich sehe, sind zwei Punktwolken die sehr ähnlich streuen und die auch sehr ähnliche Korrelationskoeffizienten haben. Beide Punktwolken zusammen in einem Plot sehen genauso aus: Etwa gleiche Streuung und etwa gleicher Korrelationskoeffizient: Letztlich haben alle drei Punktwolken ein r von ungefähr 0,3. Die Annahme, dass die Korrelation größer wird, bloß weil man mehr Teilnehmer hat, ist falsch. Beim p-Wert ist sie oft richtig. Wenn Du also einen Signifikanztest für den Korrelationskoeffizienten rechnest, dann wird der in der doppelt so großen Stichprobe kleiner sein als in oder in . Auch wenn Du ein 95%-Konfidenzintervall für den Korrelationskoeffizienten bestimmen würdest, wäre es sehr viel enger, würde aber weiter um 0,3 liegen.
Ich weiß nicht, wie kompliziert es in Excel ist, p-Werte für Korrelationen zu rechnen. Du kannst gerne die Werte aus dem Bild hier als einfachen Text (oder besser: einfachen Text in code-Tags) posten, dann rechne ich Dir das vor. Die Daten vom Bild abzutippen habe ich heute keine Lust oder Zeit.

Deine ursprüngliche Frage zum Vergleich der Korrelationen zweier Punktmengen und der Korrelation der Vereinigungsmenge dieser Punktmengen wird gerne unter dem Namen "Simpsons Paradoxon" gelehrt. Kann es sein, dass ein Medikament für Frauen und für Männer schlecht, für alle Menschen hingegen gut ist? Ich kopiere mal die Grafik von einer anderen Webseite hier hinein:

Bild
(Bildquelle: https://www.clinfo.eu/wp-content/upload ... adoxon.png )

Du siehst an den roten Punkten eine negative Korrelation zwischen Dosis und Wirkung für Frauen, an den blauen Punkten eine negative Korrelation zwischen Dosis und Wirkung für Männer aber an der schwarzen eine positive Korrelation über alle Gruppen hinweg. Die Korrelation kann also nicht nur kleiner und größer werden, sie kann sogar das Vorzeichen wechseln, wenn es unglücklich kommt.

Viele Grüße,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5924
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1402 mal in 1388 Posts

folgende User möchten sich bei bele bedanken:
m12345

Re: Korrelation sinkt bei größerer Gruppe?

Beitragvon m12345 » Di 14. Jan 2025, 21:56

Ganz herzlichen Dank! Ich denke, ich habe es verstanden - dein Beispiel war sehr hilfreich. Die p-Werte habe ich schon berechnet, das ist zum Glück kein Problem.
m12345
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Mo 13. Jan 2025, 16:49
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron