Vergleich zweier Nichtlinearer Regressionen

Alle Verfahren der Regressionanalyse.

Vergleich zweier Nichtlinearer Regressionen

Beitragvon gadus » Di 19. Jul 2011, 16:41

Hallöchen!

Ich sitze gerade an einer Auswertung und habe ein ziemliches Problem, dass mich nun schon seit ein paar Tagen beschäftigt. :roll: Es geht darum, dass ich zwei verschiedene Stichproben von Fischen habe.
Die eine Stichprobe stammt aus der Ostsee, die andere aus der Nordsee (gleiche Fischart). Die Stichproben sind also unabhängig, aber nicht gleich groß. ALs Daten liegen je Stichprobe die Längen und die dazugehörogen Gewichte der Fische vor. Daraus soll für beide Gebiete jeweils eine Längen-Gewichts-Beziehung berechnet werden, um diese dann beide miteinander zu vergleichen, d.h. ob sich die beiden Längen-Gewichts-Beziehungen signifikant unterscheiden, oder nicht.
Die Längen-Gewichts-Beziehungen werden als Potenzfunktion dargstellt mit: Gewicht= a*Länge^b
Nun habe ich mit einer nichtlinearen Regression für beide Gebiete die Parameter a und b errechnet und möchte wissen, ob Sie sich zwischen den Gebieten unterscheiden.

Mein Recherchen haben bisher folgende Möglichkeiten ergeben:

1. Vergleich der Potenzfunktionen direkt mittels F-Test: http://www.graphpad.com/curvefit/1_mode ... tasets.htm (s. unter "Compare entire curves using a F test"). Es ergibt sich ein hochsignifikanter Unterschied, dem ich nicht so ganz traue, da sich die Parameter doch sehr ähneln und ich glaube, dass das Verfahren aufgrund des hohen Stichprobenumfangs ziemlich konservativ ist.

2. Eine weitere Möglichkeit wäre die Transformation der Daten (z.B. beide Variablen log) um sie zu linearisieren und dann mittels ANCOVA ein Vergleich der linearen Regressionsgeraden durchzuführen. Problem hierbei ist, dass die Annahmen für die lineare Regression deutlich verletzt werden (trotz Transformation keine Normalverteilung der Residuen, keine Homogenität der Residuen (Cone-Effekt)etc.). Die Daten sind aber logischerweise nicht normalverteilt (es gibt viel mehr kleine Fische als Große) bzw. die Varianz steigt mit zunehmender Fischgröße natürlicherweise (Je schwerer der Fische desto größßer die individuellen Gewichtsunterschiede bei gleicher Länge) Also kann man diesen Weg wohl nicht gehen!

Nun meine Frage: Hat jemand noch eine andere Idee, wie man diese Fragestellung lösen kann? Ich wäre über jeden Tipp äußerst erfreut.

Schonmal herzlichen Dank für Eure Mühe im voraus,

Gadus
gadus
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 19. Jul 2011, 16:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich zweier Nichtlinearer Regressionen

Beitragvon PonderStibbons » Di 19. Jul 2011, 17:29

hochsignifikanter Unterschied, dem ich nicht so ganz traue, da sich die Parameter doch sehr ähneln und ich glaube, dass das Verfahren aufgrund des hohen Stichprobenumfangs ziemlich konservativ ist.
Da Du aus dem Umfang der Stichprobe ein Geheimnis machst, hier nur der allgemeine Hinweis, dass zunehmende Stichprobengrößen die inferenzstatistischen Tests keineswegs konservativer machen. Bei sehr großen Stichproben werden auch sehr kleine Effekte inferenzstatistisch signifikant. Die Verwerfung der Nullhypothese gelingt in diesen Fällen eben darum, weil genügend Daten einer Entscheidung gegen H0 zugrunde liegen. Bei wenig Daten braucht es dagegen einen markanten Stichproben-Effekt, um H0 zu verwerfen.

Gruß

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Vergleich zweier Nichtlinearer Regressionen

Beitragvon gadus » Di 19. Jul 2011, 19:00

Hallo,

danke für Deinen Hinweis, der mich darauf aufmerksam gemacht hat, dass ich den Unterschied nicht nur rein statistisch betrachten sollte, sondern auch im biologischen Kontext, d.h. ob er trotz Signifikanz kausal wirklich relevant ist.

Die Stichproben waren übrigens: Ostsee: n= 891, Nordsee n= 459
gadus
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 19. Jul 2011, 16:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Vergleich zweier Nichtlinearer Regressionen

Beitragvon gadus » Do 21. Jul 2011, 20:32

Eine neue Frage hätte ich noch: Was gibt man gewöhnlicherweise als Maß für die goodness of fit bei einer nichtlinearen Regression an? Ein R^2 ist ja nicht unbedingt sinnvoll und wird bei R auch nicht im output mit ausgespuckt. Oder täusche ich mich?
Ich dachte zunächst an das confidence interval. Irgendwie sind sich meine schlauen Bücher auch nicht wirklich einig. Was würdet Ihr angeben?

R spuckt mir das hier aus:

> summary(model_angel)

Formula: W_angel ~ a * TL_angel^b

Parameters:
Estimate Std. Error t value Pr(>|t|)
a 1.068e-05 6.397e-07 16.69 <2e-16 ***
b 2.981e+00 1.481e-02 201.22 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0895 on 889 degrees of freedom

Number of iterations to convergence: 3
Achieved convergence tolerance: 2.713e-06
(459 observations deleted due to missingness)


> overview(model_angel)
------
Formula: W_angel ~ a * TL_angel^b

Parameters:
Estimate Std. Error t value Pr(>|t|)
a 1.068e-05 6.397e-07 16.69 <2e-16 ***
b 2.981e+00 1.481e-02 201.22 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0895 on 889 degrees of freedom

Number of iterations to convergence: 3
Achieved convergence tolerance: 2.713e-06
(459 observations deleted due to missingness)

------
Residual sum of squares: 7.12

------
Asymptotic confidence interval:
2.5% 97.5%
a 9.421470e-06 1.193255e-05
b 2.951683e+00 3.009830e+00

------
Correlation matrix:
a b
a 1.0000000 -0.9987497
b -0.9987497 1.0000000
gadus
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Di 19. Jul 2011, 16:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron