Danke für die Eure schnellen Rückmeldungen.
Meine Frage ergab sich aus der Aussage
"Grundsätzlich ist auch eine Linearitätsprüfung möglich, wenn die unabhängige Variable kategorial ist, aber den Kategorienstufen eine Ordnung zu Grunde liegt.",
die unter
http://home.arcor.de/sigmatraugott/Skripte/Lineare%20Regression.html zu finden ist. Es scheint mir nicht so, als ob der Text von einem Laien geschrieben wurde.
@daniel: bzgl. der metrischen Kovariablen:
Du weisst es bestimmt, aber ich möchte hier trotzdem das Modell der multiplen linearen Regression formelmäßig angeben:
y = b0 + b1*x1 + ... + bk*xk + u.
D. h. alle xj (j=1,...k) müssen einzeln betrachtet linear (in den Parametern) zu y stehen. Oder? Steht irgendein xj zu y nicht linear, so ist die Beziehung des vollen Modells auch nicht linear. In vielen Lehrbüchern zur multiplen linearen Regression steht, dass im Allgemeinen alle nicht linearen Beziehungen sich auf ein lineares Modell zurückführen lassen, solange diese
linear in Parametern sind. Ist auch nachfollziehbar. Die Allgemeine Formel dafür lautet:
f(y) = b0 + b1*f1(x1) + ... + bk*fk(xk) + u,
wobei
y, x1, ..., xk den Beobachteten Daten entsprechen. D. h., ich erzeuge durch die nicht linearen Funktionen (Transformationen) f, f1, ..., fk ein lineares Modell mit der Zielvareablen f(y) und den Kovariablen f1(x1), ..., fk(xk), die in dem Sinne eigentlicht nicht beobachtbar sind.
Wenn es nun so ist, dann kann ich doch die Kovariablen einzeln betrachten. Dazu fixiere ich einfach alle anderen Kovariablen bzw. führe alle anderen Summanden zum neuen Parameter b0_neu und schaue mir k neue Modelle der Form
f(y) = b0_neu + b1*fj(xj)
an. Vernachlässige ich die Koeffiziente, so kann ich mir k Punktediagramme [f(y) in Abhängigkeit von fj(xj)]. Lassen sich dabei bestimmte Zusammenhänge einer nicht linearen Art feststellen und dazu eine passende Funktion f, f1, ..., fk angeben, so kann ich in einem Fall mit beispielsweise zwei Kovariablen, die einzelnbetrachtet in einer Wurzel- bzw. Exponentialbeziehung zu y stehen, als lineares Modell schreiben
y = b0 + b1*wurzel(x1) + b2*exp(x2).
Oder verstehe ich da etwas falsch?
Und nun zur Linearitätsprüfung für nominalskalierten Variablen:
Du schreibst: "Du könntest die Linearität Deiner metrischen Variablen in allen durch die kategorialen Variablen indizierten Gruppen prüfen."
Also, wenn ich die Prüfung auf der Ebene der einzelnen Kategorien durchführe, so heißt es, ich habe dann jeweils nur einen Teil meiner Datenbasis mit den Zielvariablenwerten für die Fälle, wenn die ausgewählte Kategorie als Asprägung der zu prüfenden Kovariablen vorkommt. Dann ist es ja gar nicht möglich, denn ich kann je meine einzelnen Datensätze bzw . Beobachtungen oder Messungen beliebig vertauschen bzw. die Reihenfolge ihres Vorkommens ändern. Dann sind die Werte der Zielvariablen an gar nichts fixiert und es lassen sich dadurch beliebige Strukturen in den Daten bilden.
Eigentlich habe ich es mir so vorgestellt:
1. Je Kategorie die Punktewolke bilden oder den Mittelwert berechnen
2. Durch nebeneinander stellen eine Struktur entdecken, dabei dürfen die Reihenfolge der einzelnen Kategorien vertauscht werden, da diese sowieso nur zufällig ist und die Zielvariable (bzw. ihre Werte) an den Kategorien fixiert ist. So könnte ich doch bei gegeben Daten den Kategorienstufen einer nominalen Kovariablen eine feste Ordnung zu Grunde legen!?
Was meint Ihr?