Welche Analyse durchführen? (Lineare Regression nicht okay)

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welche Analyse durchführen? (Lineare Regression nicht okay)

Beitragvon fenomen » Mi 19. Mär 2014, 13:32

Hallo zusammen,

ein Auszug aus meinen Daten:

m n F
1 1 55.00001
1 2 62.64448
1 3 55.48668
1 4 70.01258
1 5 57.96297
2 1 70.44448
2 2 67.04320
2 3 72.23974
2 4 65.04696
2 5 74.55196
3 1 69.51783
3 2 72.58183
3 3 68.59168
3 4 69.81895
3 5 66.94571
4 1 58.61510
4 2 66.03614
4 3 69.98427
4 4 70.00876
4 5 71.52874
5 1 73.41989
5 2 70.41362
5 3 75.29110
5 4 73.16407
5 5 70.42550


Ich habe bereits in R eine lineare Regression versucht:

Code: Alles auswählen
> m <- regr$m
> n <- regr$n
> F <- regr$F
>
> regressionlm <- lm(F ~ m + n)
> summary(regressionlm)


Dabei bekomme ich folgendes Ergebnis:

Call:
lm(formula = F ~ m + n)

Residuals:
Min 1Q Median 3Q Max
-9.9305 -2.4520 -0.0608 3.0176 7.3555

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 58.9773 3.0898 19.088 3.53e-15 ***
m 2.2012 0.6909 3.186 0.00427 **
n 0.7633 0.6909 1.105 0.28116
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.885 on 22 degrees of freedom
Multiple R-squared: 0.3408, Adjusted R-squared: 0.2808
F-statistic: 5.686 on 2 and 22 DF, p-value: 0.01022


Leider ist mein R^2 sehr niedrig mit 0.3408, sodass hier wenig Aussagekraft dahinter steckt. Von m und n hängt aber (nach einigen Operationen) der F-Wert in irgendeiner Form ab (konkret arbeiten wir mit Fuzzy-Zahlen und Integralen, sodass alles sehr durcheinander ist). Welche anderen Tests kann ich durchführen, um die Abhängigkeit von m und n a) signifikant und b) aussagekräftig zu untermauern?

Besten Dank für eure Hilfe.

fenomen
fenomen
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 12. Mai 2012, 12:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welche Analyse durchführen? (Lineare Regression nicht ok

Beitragvon bele » Mi 19. Mär 2014, 14:20

Hast Du irgendwelche Theorien, wie F von n und m abhängen könnte, wenn nicht linear? Ansonsten könnte man versuchen quadratische Terme oder Interaktionen hinzu zu nehmen. Deine Fallzahl scheinaber eher klein zu sein.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Welche Analyse durchführen? (Lineare Regression nicht ok

Beitragvon fenomen » Mi 19. Mär 2014, 14:46

Nicht wirklich, leider.

Ich habe es mal plotten lassen, eventuell hilft das ja...

Code: Alles auswählen
scatterplot3d(m,n,F,  highlight.3d = TRUE, col.axis = "blue", col.grid = "lightblue", main = "Output", pch = 20)


Bild

Wenn ich mir die Grafik so anschaue, könnte man doch eine Gerade durch die Punkte ziehen - so schlecht sähe doch dann eigentlich es nicht aus. Ist aber nur eine Vermutung, ich habe da leider keine Idee. :(
fenomen
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 12. Mai 2012, 12:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welche Analyse durchführen? (Lineare Regression nicht ok

Beitragvon bele » Mi 19. Mär 2014, 15:09

Da kann man sogar eine Ebene durchlegen. Das Problem ist, dass nur m einen signifikanten Einfluss hat, n aber nicht. Ich habe mal schnell einen Versuch mit einem cubischen und einem quadratischen Term gemacht. Wie gefällt Dir das hier, als erster Schnellschuss:
Code: Alles auswählen
> summary(lm(F~m+I(m^3)+I(m^2), data=a))

Call:
lm(formula = F ~ m + I(m^3) + I(m^2), data = a)

Residuals:
    Min      1Q  Median      3Q     Max
-8.6945 -2.2396  0.4402  2.6747  9.8100

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  31.3744     9.1071   3.445  0.00243 **
m            41.3039    11.9044   3.470  0.00229 **
I(m^3)        1.4652     0.4879   3.003  0.00677 **
I(m^2)      -13.9410     4.4185  -3.155  0.00477 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.14 on 21 degrees of freedom
Multiple R-squared:  0.5482,   Adjusted R-squared:  0.4836
F-statistic: 8.493 on 3 and 21 DF,  p-value: 0.0006909


Immerhin haben wir n noch gar nicht drin und schon ein adjusted R^2 von 48%.Mit ein wenig Finetuning geht das bestimmt noch besser.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Welche Analyse durchführen? (Lineare Regression nicht ok

Beitragvon fenomen » Mi 19. Mär 2014, 15:19

Danke vorab, das klingt ja schon mal viel besser!

"Mit ein wenig Finetuning geht das bestimmt noch besser." Was meinst du damit genau? Ich habe paar Fälle mal durchgespielt:

Call:
lm(formula = F ~ m + I(m) + I(m^2))
Multiple R-squared: 0.3541, Adjusted R-squared: 0.2954


Call:
lm(formula = F ~ m + I(m^5) + I(m^5))
Multiple R-squared: 0.3128, Adjusted R-squared: 0.2504


Call:
lm(formula = F ~ m + I(m^3) + I(m^4))
Multiple R-squared: 0.5457, Adjusted R-squared: 0.4808


Ein Wert von des Adjusted R-squared von mehr als 0.6 wäre ziemlich gut...
fenomen
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Sa 12. Mai 2012, 12:40
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welche Analyse durchführen? (Lineare Regression nicht ok

Beitragvon bele » Mi 19. Mär 2014, 16:34

Mit ein bisschen Feintuning sollte heißen: Ich arbeite hier zwischendurch und habe das noch nicht zuende gedacht.

Sorry, so wird das nicht laufen: Sich ein adj. R^2 vorgeben und wild herum probieren geht nicht. Aber nehmen wir mal, wie oben, m als linearen, als cubischen und als quadratischen Term mit hinein und plotten die Residuen gegen n (n haben wir ja noch gar nicht drin):

Code: Alles auswählen
a<- read.table(header=TRUE, text="m n F
1 1 55.00001
1 2 62.64448
1 3 55.48668
1 4 70.01258
1 5 57.96297
2 1 70.44448
2 2 67.04320
2 3 72.23974
2 4 65.04696
2 5 74.55196
3 1 69.51783
3 2 72.58183
3 3 68.59168
3 4 69.81895
3 5 66.94571
4 1 58.61510
4 2 66.03614
4 3 69.98427
4 4 70.00876
4 5 71.52874
5 1 73.41989
5 2 70.41362
5 3 75.29110
5 4 73.16407
5 5 70.42550")

plot(lm(F~m+I(m^2)+I(m^3), data=a)$residuals~a$n)
abline(lm(lm(F~m+I(m^2)+I(m^3), data=a)$residuals~a$n), col="red")


Dann hat man in dem Graph schon den Eindruck, dass mit steigendem n auch die Residuen noch größer werden. Also nehmen wir n ruhig noch linear mit in die Regression auf:

Code: Alles auswählen
summary(lm(F~m+I(m^3)+I(m^2)+I(n), data=a))

Call:
lm(formula = F ~ m + I(m^3) + I(m^2) + I(n), data = a)

Residuals:
    Min      1Q  Median      3Q     Max
-7.1678 -3.6253 -0.1234  2.6747  9.0466

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  29.0844     9.1111   3.192  0.00458 **
m            41.3039    11.6942   3.532  0.00209 **
I(m^3)        1.4652     0.4792   3.057  0.00622 **
I(m^2)      -13.9410     4.3405  -3.212  0.00438 **
I(n)          0.7633     0.5751   1.327  0.19935   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.067 on 20 degrees of freedom
Multiple R-squared:  0.5848,   Adjusted R-squared:  0.5017
F-statistic: 7.041 on 4 and 20 DF,  p-value: 0.001043


Na immerhin: n ist nicht signifikant aber das adjusted R^2 verbessert sich noch. Vielleicht muss auch nicht alles signifikant sein, wenn man aus 25 Datensätzen 5 Parameter schätzt. Ich befürchte, sehr viel mehr wird auf diesem Weg nicht zu holen sein: Da ist einfach viel unerklärte Varianz drin.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste