STATISTIK-FORUM.de

gadus · von **gadus** » Di 19. Jul 2011, 16:41

Hallöchen!

Ich sitze gerade an einer Auswertung und habe ein ziemliches Problem, dass mich nun schon seit ein paar Tagen beschäftigt. :roll:

Es geht darum, dass ich zwei verschiedene Stichproben von Fischen habe.
Die eine Stichprobe stammt aus der Ostsee, die andere aus der Nordsee (gleiche Fischart). Die Stichproben sind also unabhängig, aber nicht gleich groß. ALs Daten liegen je Stichprobe die Längen und die dazugehörogen Gewichte der Fische vor. Daraus soll für beide Gebiete jeweils eine Längen-Gewichts-Beziehung berechnet werden, um diese dann beide miteinander zu vergleichen, d.h. ob sich die beiden Längen-Gewichts-Beziehungen signifikant unterscheiden, oder nicht.
Die Längen-Gewichts-Beziehungen werden als Potenzfunktion dargstellt mit: Gewicht= a*Länge^b
Nun habe ich mit einer nichtlinearen Regression für beide Gebiete die Parameter a und b errechnet und möchte wissen, ob Sie sich zwischen den Gebieten unterscheiden.

Mein Recherchen haben bisher folgende Möglichkeiten ergeben:

1. Vergleich der Potenzfunktionen direkt mittels F-Test: http://www.graphpad.com/curvefit/1_mode ... tasets.htm (s. unter "Compare entire curves using a F test"). Es ergibt sich ein hochsignifikanter Unterschied, dem ich nicht so ganz traue, da sich die Parameter doch sehr ähneln und ich glaube, dass das Verfahren aufgrund des hohen Stichprobenumfangs ziemlich konservativ ist.

2. Eine weitere Möglichkeit wäre die Transformation der Daten (z.B. beide Variablen log) um sie zu linearisieren und dann mittels ANCOVA ein Vergleich der linearen Regressionsgeraden durchzuführen. Problem hierbei ist, dass die Annahmen für die lineare Regression deutlich verletzt werden (trotz Transformation keine Normalverteilung der Residuen, keine Homogenität der Residuen (Cone-Effekt)etc.). Die Daten sind aber logischerweise nicht normalverteilt (es gibt viel mehr kleine Fische als Große) bzw. die Varianz steigt mit zunehmender Fischgröße natürlicherweise (Je schwerer der Fische desto größßer die individuellen Gewichtsunterschiede bei gleicher Länge) Also kann man diesen Weg wohl nicht gehen!

Nun meine Frage: Hat jemand noch eine andere Idee, wie man diese Fragestellung lösen kann? Ich wäre über jeden Tipp äußerst erfreut.

Schonmal herzlichen Dank für Eure Mühe im voraus,

Gadus

PonderStibbons · von **PonderStibbons** » Di 19. Jul 2011, 17:29

hochsignifikanter Unterschied, dem ich nicht so ganz traue, da sich die Parameter doch sehr ähneln und ich glaube, dass das Verfahren aufgrund des hohen Stichprobenumfangs ziemlich konservativ ist.

Da Du aus dem Umfang der Stichprobe ein Geheimnis machst, hier nur der allgemeine Hinweis, dass zunehmende Stichprobengrößen die inferenzstatistischen Tests keineswegs konservativer machen. Bei sehr großen Stichproben werden auch sehr kleine Effekte inferenzstatistisch signifikant. Die Verwerfung der Nullhypothese gelingt in diesen Fällen eben darum, weil genügend Daten einer Entscheidung gegen H0 zugrunde liegen. Bei wenig Daten braucht es dagegen einen markanten Stichproben-Effekt, um H0 zu verwerfen.

Gruß

P.

gadus · von **gadus** » Di 19. Jul 2011, 19:00

Hallo,

danke für Deinen Hinweis, der mich darauf aufmerksam gemacht hat, dass ich den Unterschied nicht nur rein statistisch betrachten sollte, sondern auch im biologischen Kontext, d.h. ob er trotz Signifikanz kausal wirklich relevant ist.

Die Stichproben waren übrigens: Ostsee: n= 891, Nordsee n= 459

gadus · von **gadus** » Do 21. Jul 2011, 20:32

Eine neue Frage hätte ich noch: Was gibt man gewöhnlicherweise als Maß für die goodness of fit bei einer nichtlinearen Regression an? Ein R^2 ist ja nicht unbedingt sinnvoll und wird bei R auch nicht im output mit ausgespuckt. Oder täusche ich mich?
Ich dachte zunächst an das confidence interval. Irgendwie sind sich meine schlauen Bücher auch nicht wirklich einig. Was würdet Ihr angeben?

R spuckt mir das hier aus:

> summary(model_angel)

Formula: W_angel ~ a * TL_angel^b

Parameters:
Estimate Std. Error t value Pr(>|t|)
a 1.068e-05 6.397e-07 16.69 <2e-16 ***
b 2.981e+00 1.481e-02 201.22 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0895 on 889 degrees of freedom

Number of iterations to convergence: 3
Achieved convergence tolerance: 2.713e-06
(459 observations deleted due to missingness)

> overview(model_angel)
------
Formula: W_angel ~ a * TL_angel^b

Parameters:
Estimate Std. Error t value Pr(>|t|)
a 1.068e-05 6.397e-07 16.69 <2e-16 ***
b 2.981e+00 1.481e-02 201.22 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.0895 on 889 degrees of freedom

Number of iterations to convergence: 3
Achieved convergence tolerance: 2.713e-06
(459 observations deleted due to missingness)

------
Residual sum of squares: 7.12

------
Asymptotic confidence interval:
2.5% 97.5%
a 9.421470e-06 1.193255e-05
b 2.951683e+00 3.009830e+00

------
Correlation matrix:
a b
a 1.0000000 -0.9987497
b -0.9987497 1.0000000

STATISTIK-FORUM.de

Vergleich zweier Nichtlinearer Regressionen

Vergleich zweier Nichtlinearer Regressionen

Re: Vergleich zweier Nichtlinearer Regressionen

Re: Vergleich zweier Nichtlinearer Regressionen

Re: Vergleich zweier Nichtlinearer Regressionen

Wer ist online?