Es ist etwas schwierig zu erklären. Ich habe in meiner ursprünglichen Datenkbank zu einzelnen Filmen (Fälle) die dazugehörenden Genre (Mehrfachnennungen) erhoben sowie die entsprechenden Anbieter der Filme. Durch Datenbanktransformation habe ich sozusagen eine Kreuztabelle aus den einzelnen Genre (Fälle) und den Anbietern (Variablen), die ich meiner Meinung nach zur Berechnung der Entropie zwischen den Anbietern nutzen kann (Klärung der "Nähe" der Anbieter hinsichtlich ihres Genreangebotes). Nun ist es so, dass ein Film der einem ersten Genre zugeordnet wurde, auch eher einem zweiten Genre zugeordnet werden kann, was dem ersten von Natur aus ähnlich ist (z.B. Action und Crime oder Romance und Science Fiction und Fantasy). Damit sind die Fälle in meiner transformierten Datenbank nicht gänzlich voneinander unabhängig. ich frage mich nun, ob sich dieser Umstand auf die Euklidische Distanz zwischen den Anbietern auswirken kann.
Ich hoffe, dass war irgendwie verständlich
