Wann korrelieren Werte stärker?

Bivariate Korrelation, partielle Korrelation und Rangkorrelation.

Wann korrelieren Werte stärker?

Beitragvon pinker_hase » Mo 18. Feb 2013, 20:43

Ich habe Bewertungen auf einer Skala von 0 bis 10 einer Menge von Büchern. Diese Bewertungen stammen von Lesern welche stets mehrere Buchbewertungen haben. Mein Ziel ist es, Bücher zu finden, die einem anderen Buch besonders ähnlich bewertet wurden, weil ich davon ausgehe, dass diese dann eine Ähnlichkeit besitzen. Nicht zwingen inhaltlich, aber für den Lesertyp.

1. Um ähnlich bewertete Bücher zu finden suche ich nach Lesern von Buch_1 und schaue, was diese noch bewertet haben.
zB.
-Tanja 12 Bücher
-Robert 25 Bücher
-Martin 47 Bücher
...

2. Von jedem dieser Bücher, welche von Menschen gelesen wurden, welche ebenfalls Buch_1 lasen, nehme ich den Absolutwert der Differenz beider Bewertungen.
-Tanja, Buch_1 8 Punkte, Buch_2 7 Punkte - delta ist 1
-Tanja, Buch_1 8 Punkte, Buch_3 6 Punkte - delta ist 2
...

3. Ich fasse das nach dem jeweils 2. Buch zusammen und bilde den Durchschnittswert der jeweiligen Differenzen und zähle wie oft das Buch vorkam
-Buch_2, 32 mal, durchschnittliche Abweichung der Bewertung: 0,84
-Buch_3, 12 mal, durchschnittliche Abweichung der Bewertung: 2,48
...

Und nun meine eigentliche Frage:
Je öfter ein zweites Buch zusammen mit Buch_1 gelesen wurde, desto größer müsste statistisch die Abweichung sein (unabhängig vom Inahlt) - ist das richtig?
Bzw. inwieweit sollte ich beachten wie oft ein zweites Buch mit Buch_1 zusammen bewertet wurde? Oder ist es völlig egal ob 10 mal oder 1000 mal und nur die durchschnittliche Differenz zählt?

Wäre für entknotung dieser Sache sehr dankbar :)
pinker_hase
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 18. Feb 2013, 20:19
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wann korrelieren Werte stärker?

Beitragvon PonderStibbons » Mi 20. Feb 2013, 10:46

Je öfter ein zweites Buch zusammen mit Buch_1 gelesen wurde, desto größer müsste statistisch die Abweichung sein (unabhängig vom Inahlt) - ist das richtig?

Hast Du nicht mit durchschnittlichen Anweichungen gerechnt,
d.h. durch die Anzahl der Bewertungen geteilt?
Bzw. inwieweit sollte ich beachten wie oft ein zweites Buch mit Buch_1 zusammen bewertet wurde?

Welche Bücher stehen sich näher: zwei, die im Jahr beide von tausend Leuten
gelesen werden oder zwei, die beide gemeinsam von 3 Leuten gelesen wurden?

Wobei zusätzlich das Problem auftritt, dass die einzelnen Bücher unterschiedlich
oft gelesen wurden, also die maximale Größe der Schnittmenge auch von dieser
Grundrate abhängt.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Wann korrelieren Werte stärker?

Beitragvon pinker_hase » Do 21. Feb 2013, 02:59

PonderStibbons hat geschrieben:
Je öfter ein zweites Buch zusammen mit Buch_1 gelesen wurde, desto größer müsste statistisch die Abweichung sein (unabhängig vom Inahlt) - ist das richtig?

Hast Du nicht mit durchschnittlichen Anweichungen gerechnt,
d.h. durch die Anzahl der Bewertungen geteilt?

Doch, habe ich - und mit meiner Annahme liege ich daher wohl falsch.

Bzw. inwieweit sollte ich beachten wie oft ein zweites Buch mit Buch_1 zusammen bewertet wurde?

Welche Bücher stehen sich näher: zwei, die im Jahr beide von tausend Leuten
gelesen werden oder zwei, die beide gemeinsam von 3 Leuten gelesen wurden?

Davon wie oft zwei Bücher von der selben Person zusammen gelesen wurden will es eigentlich nicht hauptsächlich abhängig machen. Das kann Amazon auch. Ich möchte die Bewertungen mit einbeziehen. Ich gehe also davon aus, dass wenn jemand Krimis nicht mag, er zwei Krimis tendenziell niedrig bewerten würde und umgekehrt.

Hat aber dann die Häufigkeit dennoch einen Einfluss? Und wie lässt sich ermitteln wie groß der ist?

Gruß
pinker_hase
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mo 18. Feb 2013, 20:19
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste