Hallo,
Ich knabber momentan an einer Statistikaufgabe die ich loesen muss.
Folgende Aufgabe:
Stellen Sie sich vor Sie haben Datenpaare (Xi, Yi) mit I = 1, …., n und eine weitere Stichprobe der Gleichen Merkmalle/Variablen aber anderer Probanden (Xk, Yk) mit k = 1, …. , m. In beiden Stichproben gelte, dass die Korrelation Rxy = 1 ist. Nun werfen Sie beide Stichproben zusammen, so dass Sie die Wertepaare (Xm,Ym) mit m = 1, …. , n+m erhalten. (x und y-werte die vorher ein Paar bildeten, tun dies natuerlich auch weiterhin) und dort die jorrelation berechnen wollen. Beurteilen Sie folgende Aussagen und begruenden Sie mit passenden Argumenten, Beispielen oder Gegenbeispielen.
A) Die Korrelation der Gesamtstichprobe kann + 1.
B) Die Korrelation der Gesamtstichprobe muss 1 oder –1 sein.
C) Die Korrelation der Gesamtstichprobe kann naeherungsweise 0 sein, selbst wenn beide Einzelkorrelationen + 1 sind. Tip: Denken Sie ueber Geraden mit gleich grosser positive Steigung nach und konstruieren Sie sich einige extreme Beispiele.
Ich wuerde sagen A ist korrekt. Die Korrelation der Gesamtstichprobe kann 1 sein (z.b wenn wir identische werte haben (1,2 ; 2,3 ; 3;4 ; ... in Stichprobe A und 1,2 ; 2,3 ; 3;4 ; ... in Stichprobe B).
Falls C auch korrekt ist, ist B natuerlich Falsch. Ich bin mir etwas unsicher mit C allerdings. Nehmen wir an wir haben die obigen Datenpaare (1,2 ; 2,3 ; 3,4; ...) in Stichprobe A aber folgende in Stichprobe B: 1,0.1 ; 2,0.2; 3,0.3 ; ... . Dann haetten ja beide Stichproben eine perfekte positive Korrelation aber die Gesamtstichprobe nach dem Zussamwerfen nicht mehr. Oder liege ich da falsch?
Dementsprechend wuerde ich sagen das A und C korrekt sind.
Vielen Dank fuer eure Hilfe schonmal!