Hallo zusammen, ich habe derzeit ein Problem und befürchte, dass ich da einen Zusammenhang noch nicht ganz verstanden habe-
ich erhebe derzeit Daten, die Parameter bei einem Fehlerauftreten beschreiben- an einem Tag treten mehrere Fehler auf, die Tagesperformance (in ppm) also entsprechend in mehreren Zeilen untereinander gleich (nur einzelne x in den Spalten haben sich geändert, z.B Schicht, Uhrzeit, Fehlerartikel, etc.). Nun möchte ich hierauf eine Regressionsanalyse machen. Das erste Ding ist, dass ich sowohl stetige, als auch attributive Faktoren habe- sollte aber einer allgemeinen Regression nichts ausmachen. Hierfür brauche ich ja nur normalverteilte Residuen- und hier gehts los:
Werte ich testhalber nur den Einfluss zweier x ein , von denen garantiert ist, dass sie das y zu 100% abbilden (Spalte y=ppm-rate, Spalte x1=Anzahl Teile behandelt , Spalte x2= Anzahl Teile fehlerhaft), so bekomme ich ein tolles Modell, allerdings nicht normalverteilte Residuen. Nun habe ich wie oben erwähnt mehrfach unterianander die gleichen Werte stehen, je nachdem wie oft ein fehlerhaftes Teil an dem Tag aufgetreten ist. Entsprechend in jeder Zeile dahinter der gleiche Residuen-Wert. entferne ich alle Doppelwerte, also nur ein Wert pro Tag stehen lassen und wiederhole den Test- so bekomm eich zum einen gänzliche andere Residuen raus und zum anderen sind sie jetzt prima normalverteilt .
Was ist nun richtig?
Ich hoffe ich konnte mien Problem verständlich schildern, ich freue mich über jedes Feedback
Danke