Multiple nichtlineare Regression

Alle Verfahren der Regressionanalyse.

Multiple nichtlineare Regression

Beitragvon Spielverderber » Di 7. Okt 2014, 23:07

Hallo liebe Statistiker,

Im Rahmen meiner Bachelorarbeit suche ich nach einer Mögichkeit zur "multiplen nichtlineare regression" um herauszufinden welche Produktionsfaktoren verantwortlich sind für z.B. die Leistung und um dann die Soll-Leistung Vorhersagen zu können. Leider bin ich nicht ganz so fit in Statistik, trotzdem habe ich mich bereits in Excel und SPSS versucht - Dort habe ich es allerdigs nur eine "Linearen Regression" zustande bekommen, aber da es einige Variable gibt, die nicht linear sind - ist diese Variante nicht geeignet.

Problem in Kurzfassung:

Ich habe eine Menge möglicher Einflussfaktoren, die Einfluss auf die Ist-Leistung haben können. Jetzt würde ich gerne herausfinden welche Faktoren den größten EInfluss haben oder ob es bestimmte Kombinationen gibt, die zusammen einen möglichst großen Einfluss haben.

So das ich dann am Ende 3-4 Faktoren zusammen hab, mit denen ich die Leistung vorhersagen kann.


Link Zur Exceldatei
https://www.dropbox.com/s/s2iux9l0ubqkuj0/Analyse.xlsx?dl=0

Ich habe hier den Text in Zahlen Umgewandelt



Vielen Dank im voraus

Patrick
Zuletzt geändert von Spielverderber am Mi 8. Okt 2014, 11:01, insgesamt 1-mal geändert.
Spielverderber
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 7. Okt 2014, 22:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multible nichtlineare Regression

Beitragvon strukturmarionette » Di 7. Okt 2014, 23:20

Hi,

aber da es einige Variable gibt, die nicht linear sind - ist diese Variante nicht geeignet.


- Was versteht Du darunter?
- Wie hast Du das festgestellt?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Multible nichtlineare Regression

Beitragvon Spielverderber » Di 7. Okt 2014, 23:52

Ich hab in Excel ein Diagramm erstellt und eine Trendlinie durch die Punkte gelegt.
Ebenfalls durch erfahrungsberichte. So steigt z.B. mit steigender Auflage die Leistung und ab einer bestimmten Auflage bleibt die Leistung gleich.
und beim Flächengewicht steigt die leistung bis zu einem Flächengewicht von 300g/m² und mit weiterem anteigen sinkt die Leistung ( somit Parabelformig)
Spielverderber
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 7. Okt 2014, 22:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple nichtlineare Regression

Beitragvon bele » Mi 8. Okt 2014, 12:34

Hallo Spielverderber,

der Begriff "Lineare Regression" ist etwas weiter, als Du ihn benutzt. Man zählt darunter auch Regressionen, bei denen x als Quadrat oder in der dritten Potenz eingehen. Sehr viele Zusammenhänge lassen sich mit solchen Polynomen ausreichend annähern, um das Problem dann doch mit linearer Regression zu lösen. Die von Dir genannte Parabel wäre ein typisches Beispiel, wo ein quadratischer Term zu einer guten Anpassung führt.
Zur Durchführung in SPSS kann ich jetzt nichts sagen, aber da findet sich jemand.
Anders wäre das, wenn Du eine begründete Theorie hättest, welche nichtlinearen Funktionen für welche Parameter eine Rolle spielen. Dann kann man die in einer nichtlinearen Regression gleich einbeziehen, ansonsten ist es oft gut, es zunächst linear zu versuchen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Multiple nichtlineare Regression

Beitragvon bele » Mi 8. Okt 2014, 14:55

Hallo,

ich bin's nochmal, nachdem ich ein wenig in die Daten geguckt habe. Du hast hoffentlich daran gedacht, SPSS mitzuteilen, dass Kartonqualität nominal codiert ist und nicht quantitativ? Kartonqualität 3 und Kartonqualität 6 scheinen eine maßgebliche Rolle zu spielen, die anderen eher nicht so. Bei Flächengewicht und Auflage sind die quadratischen Terme zusätzlich zu den linearen in der Tat von signifikanter Bedeutung, dritte Potenzen habe ich noch nicht ausprobiert, auch Stofflauf ist signifikant. 30% Varianzaufklärung sind mit dem Modell
ISTLeistung ~ Farbdeckung^2 + Auflage^2 + Kartonqualität + Flaechengewicht^2 + Farbdeckung + Wiederholauftrag + Auflage + Flaechengewicht + Stofflauf
sofort drin, ob sich durch cubische Terme mehr erreichen lässt. Das Quadrieren von Dummyvariablen wie "Wiederholauftrag" macht natürlich keinen Sinn.

LG,
Bernhard

Code: Alles auswählen
lm(formula = ISTLeistung ~ I(Auflage^2) + I(Flaechengewicht^2) +
    Wiederholauftrag + Kartonqualität + Auflage + Flaechengewicht +
    Stofflauf, data = daten)

Residuals:
    Min      1Q  Median      3Q     Max
-5798.9 -1484.3  -241.5  1296.7  9259.7

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)   
(Intercept)          -7.686e+02  1.615e+03  -0.476    0.634   
I(Auflage^2)         -3.177e-06  3.747e-07  -8.480  < 2e-16 ***
I(Flaechengewicht^2) -7.229e-02  1.486e-02  -4.864 1.37e-06 ***
Wiederholauftrag      2.058e+02  1.692e+02   1.217    0.224   
Kartonqualität2      -3.222e+02  1.705e+03  -0.189    0.850   
Kartonqualität3       1.945e+03  3.334e+02   5.832 7.81e-09 ***
Kartonqualität4      -7.520e+02  1.379e+03  -0.545    0.586   
Kartonqualität5       2.183e+02  7.634e+02   0.286    0.775   
Kartonqualität6       2.319e+03  5.113e+02   4.535 6.61e-06 ***
Kartonqualität7      -1.312e+03  1.207e+03  -1.087    0.277   
Auflage               2.580e-01  1.890e-02  13.654  < 2e-16 ***
Flaechengewicht       4.434e+01  9.862e+00   4.496 7.90e-06 ***
Stofflauf2           -6.506e+02  1.650e+02  -3.943 8.70e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2333 on 843 degrees of freedom
Multiple R-squared:  0.3084,   Adjusted R-squared:  0.2986
F-statistic: 31.33 on 12 and 843 DF,  p-value: < 2.2e-16
Zuletzt geändert von bele am Mi 8. Okt 2014, 15:17, insgesamt 1-mal geändert.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

folgende User möchten sich bei bele bedanken:
Spielverderber

Re: Multiple nichtlineare Regression

Beitragvon Spielverderber » Mi 8. Okt 2014, 15:10

hmm... ich kenne mich nur leider selbst nicht mit SPSS aus und habe auch sehr wenig mit statistik am hut
Spielverderber
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 7. Okt 2014, 22:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple nichtlineare Regression

Beitragvon bele » Mi 8. Okt 2014, 15:31

Das ist ein Problem, wenn Du eine Statistik-Bachelorarbeit machen willst. Was mit Deinen Daten funktionieren könnte und vom Ergebnis her auch mit begrenzten Statistikkenntnissen begreifbar ist, sind Baum-Modelle, wie im anhängenden Bild. Solche Bäume können sich an sehr nicht-lineare Verhältnisse anpassen und man kann sie natürlich beliebig komplex machen. Hier habe ich nur wenige Verzweigungen vorgesehen, damit das Bild ins Forum passt und lesbar bleibt. Manchmal lassen sich aus solchen Bäumen sehr verständliche Regeln ableiten wie "Ist die Auflage unter 500 geht die Leistung in die Knie". Ob und wie sich das mit SPSS machen lässt kann ich nicht beurteilen. Mehr über die Software die ich hier benutzt habe in diesem Link: http://cran.r-project.org/web/packages/ ... /party.pdf Damit lassen sich anstelle von Regressionsbäumen auch ganze "Wälder" errechnen, wenn man bereit ist auf die einfache Interpretierbarkeit zu verzichten.

LG,
Bernhard
Dateianhänge
Baumbeispiel.png
An die oben verlinkten Originaldaten angepasster Regressionsbaum für IST-Leistung. Der Regressionbaum unterscheidet erstmal nach Auflage, dann nach bz_Stofflauf.
Baumbeispiel.png (10.73 KiB) 3765-mal betrachtet
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1398 mal in 1384 Posts

Re: Multiple nichtlineare Regression

Beitragvon DHA3000 » Mi 8. Okt 2014, 15:38

Spielverderber hat geschrieben:hmm... ich kenne mich nur leider selbst nicht mit SPSS aus und habe auch sehr wenig mit statistik am hut


Du solltest diese Ablehnungshaltung überdenken. Entweder du bist bereit, dich selbstständig in die Materie einzuarbeiten (das ist nicht schwer) oder du gehst zu deinem Betreuer und schwächst das Thema ab.
Was bringt es denn, wenn dir Leute hier ernsthaft helfen wollen, du aber immer nur "aber ich habe doch keine Ahnung davon" schreibst?!
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Multiple nichtlineare Regression

Beitragvon Spielverderber » Mi 8. Okt 2014, 15:59

Ich habe absolut keine ablehnung....

Ich versuche mich schon seit 2 wochen in diese Materie einzuarbeiten und und ich bin für jede hilfe die mich nach vorne bringt dankbar!!
Es ist ja auch keine Statistikarbeit, ich versuche nur über diesen weg möglichst genau vorhersagen zu treffen.

wie gesagt ich nehme jeden Rat dankbar auf und versuche es auch möglichst selbstständig umzusetzen
Spielverderber
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 7. Okt 2014, 22:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Multiple nichtlineare Regression

Beitragvon Spielverderber » Mi 8. Okt 2014, 17:00

Ich habe mich jetzt noch ein wenig in excel versucht, wäre es richtig, wenn ich eine lineare Regression mit Angepassten werten durchführe??

Spricht ich habe in meine Linearen Regression die Werte:
Ln(Auflage) , Flächengewicht^3 , LZ^2 , BZ als Quantitative Variablen und Lieferant und Qualität als Qualitative Variable

Somit habe ich ja alle Werte Linear oder müssen die ursprünglichen werte noch dazu??
Spielverderber
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Di 7. Okt 2014, 22:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron