Es handelt sich um eine mehrfaktorielle Varianzanalyse (6 Faktoren mit je 2 oder 3 Stufen).
Die AV ist die Summe der Ausgaben. Die UV sind Einkommen (Klasse), Alter (Klasse), Besuchsmotiv, Begleitung (ja, nein), Distanz zum Angebotsstandort (Klasse), Wochentag (Mo-Fr, Sa).
Das kann nicht hinhauen, weil Du dann mehr Faktorkombinationen
als Probanden hast.
Bei Backhaus steht, dass Ausreißer eliminiert werden sollen, bevor eine VA gerechnet werden kann.
Wird das da anders als "ein Ausreißer ist ein Wert, der meine
Berechnung stört" definiert? Ein Ausreißer ist ein Messwert, der
nicht hineingehört, zum Beispiel weil er aus einer anderen
Population stammt oder auf einer Fehlmessung beruht.
Ansonsten ist Eliminieren doch Datenfälschung, das leuchtet
doch unmittelbar ein.
Wie kann ich denn dann nun Weitermachen?
Das frage ich mich ebenfalls (s.o.).
Du kannst die extremen Werte darauf untersuchen, ob sie keine versehentliche
oder tatsächliche Falschangabe sind, eventuell kannst Du für die extremen Werte
die Verteilung trunkieren (also beibehalten, dass sie die höchsten 10 Werte sind,
aber sie verkleinern auf einen plausibleren Wert). Du kannst Logarithmieren der
AV versuchen, was hohe Werte an die Mitte "heranzieht". Dann gibt es noch "robuste
Methoden", aber die sind für einen Anfänger wohl eher nicht so griffig.
Mit freundlichen Grüßen
P.