1. Um ähnlich bewertete Bücher zu finden suche ich nach Lesern von Buch_1 und schaue, was diese noch bewertet haben.
zB.
-Tanja 12 Bücher
-Robert 25 Bücher
-Martin 47 Bücher
...
2. Von jedem dieser Bücher, welche von Menschen gelesen wurden, welche ebenfalls Buch_1 lasen, nehme ich den Absolutwert der Differenz beider Bewertungen.
-Tanja, Buch_1 8 Punkte, Buch_2 7 Punkte - delta ist 1
-Tanja, Buch_1 8 Punkte, Buch_3 6 Punkte - delta ist 2
...
3. Ich fasse das nach dem jeweils 2. Buch zusammen und bilde den Durchschnittswert der jeweiligen Differenzen und zähle wie oft das Buch vorkam
-Buch_2, 32 mal, durchschnittliche Abweichung der Bewertung: 0,84
-Buch_3, 12 mal, durchschnittliche Abweichung der Bewertung: 2,48
...
Und nun meine eigentliche Frage:
Je öfter ein zweites Buch zusammen mit Buch_1 gelesen wurde, desto größer müsste statistisch die Abweichung sein (unabhängig vom Inahlt) - ist das richtig?
Bzw. inwieweit sollte ich beachten wie oft ein zweites Buch mit Buch_1 zusammen bewertet wurde? Oder ist es völlig egal ob 10 mal oder 1000 mal und nur die durchschnittliche Differenz zählt?
Wäre für entknotung dieser Sache sehr dankbar
![Lächeln :)](http://www.statistik-forum.de/images/smilies/icon_e_smile.gif)