Hallo zusammen,
ich versuche mich gerade an einem Datensatz zur Kundenzurfriedenheit. Meine Aufgabe ist es, die (36000) Kunden besser beschreiben zu können. Es gibt viele kategoriale und einige intervallskalierte Daten, die ich auch zu Faktoren zusammenfassen kann.
Wenn ich nun Unterschiede zwischen Männern und Frauen beschreiben möchte, welche Verfahren kann ich verwenden?
- MANOVA
Kann man das wirklich zur explorativen Suche verwenden?
- Diskriminanzanalyse
Das bereitete mir bisher einige Schwierigkeiten. Box M Test wird signifikant (was er nicht werden soll, wobei sich die Auffassungen, wie wichtig der Test ist, stark unterscheiden). Die strengen Voraussetzungen sind bei mir also nicht erfüllt. Normalverteilt sind meine Variablen ebenfalls nicht.
-Logistische Regression
Die LR hat ganz andere Ergebnisse geliefert als die Diskriminanzanalyse, wenn ich nur die intervallskalierten Variablen verwendet habe.
-Clusteranalyse, Neuronale Netze?
Da kenne ich mich gar nicht aus.
MANOVA, Logistische Regression, Diskriminanzanalyse haben total unterschiedliche Ergebnisse ausgespuckt (bei intervallskalierten Variablen). Was nun?
Bei den kategorialen Daten arbeite ich mit Kreuztabellen. Gibt es da weitere Möglichkeiten?
Mir geht es primär erst einmal darum herauszufinden, worin sich die Gruppen unterscheiden. Die Größe der Prädiktoren/unabhängigen Variablen ist mir momentan nicht so wichtig, wie deren signifikanter Einfluss auf die abhängige Variable.
Wie sieht das mit den Verfahren zur schrittweisen Selektion aus? Meinungen divergieren ebenfalls stark, ob man das und welches überhaupt verwenden sollte.
Bin für jewglichen Input dankbar.