Regression - Welche Verteilung? Aussagekraft?

Alle Verfahren der Regressionanalyse.

Regression - Welche Verteilung? Aussagekraft?

Beitragvon Verplantins » Sa 27. Dez 2014, 18:53

Guten Tag die werten Statistikerinnen und Statistiker,

Bin neu hier im Forum und möchte gleich eure Hilfe beanspruchen, da ich so gut wie keine Ahnung von Statistik habe (ca. 3 wochen Erfahrung) und mein Betreuer anscheinend auch nicht.
Sitze momentan an der statistischen Auswertung meiner Bachelorarbeit.
Das Thema der Arbeit ist die Berechnung der Wurzelmasse einiger bestimmter Baumarten (ca. 3 Jahre alt).
Hierzu wurde das Wurzelsystem so weit wie möglich ausgegraben. Jedoch sind bei dem Vorgehen Wurzelabrisse entstanden(und teilweise Wurzeln im Boden verblieben), welche rechnerisch wieder an die Wurzel angefügt werden sollen, um das Gesamtgewicht der Wurzel zu bestimmen.
(an dieser Stelle würde ich gerne eine erklärende Grafik einfügen, krieg es aber nicht hin....)

Datenerhebung:
Es wurden von jedem Wurzelabriss die Durchmesser aufgenommen und auf ganze Zahlen gerundet (1x Anfangsdurchmesser, zig x Enddurchmesser). zusätzlich wurde das Gewicht festgehalten.

Klasseneinteilung:
Diese Abrisse wurden anhand des Anfangsdurchmessers sortiert , wodurch eine Klasseneinteilung entstand (Anfangsdurchmesser 1mm, 2mm, 3mm, usw.)

Durchschnittsgewichte der Klassen:
Zunächst wurde das Mittlere Gewicht der ersten Durchmesserklasse bestimmt (1mm Anfangsdurchmesser).
Dieses Durchschnittsgewicht wird nun zu den Wurzelabrissen der höheren Durchmesserklassen hinzu addiert, sofern diese Enddurchmesser von 1mm dicke aufweisen.
Dadurch lässt sich das Gewicht der nächst höheren Durchmesserklasse berechnen (2mm), da diese lediglich Endurchmesser von 1mm stärke besitzt, usw.

Regression
Anhand der Durchsnittsgewichte der Durchmesserklassen, wurde eine potentielle Regression durchgeführt (Grafisch mit excel ->chart erstellen -> trendlinie einfügen + bestimmtheitsmaß + formel).
Danach wurden die Durchmesserklassen logarithmisiert und es wurde mit dem Datenanalysetool eine lineare Regression durchgeführt.

Soweit, sogut.......nun möchte ich jedoch wissen wie aussagekräftig diese Regression ist!!!

Residuen
Die Residuen scheinen nicht zufällig verteilt zu sein (sieht aus wie eine Sinuskurve)

P-Wert
Der P-Wert ist in 4 von 5 Fällen <5%.
Die Baumsorte mit der geringsten Biomasse hat den kleinsten P-Wert....
In einem Fall beträgt der P-Wert 25%, undzwar bei der Baumsorte die am meisten Biomasse aufgebaut hat und (vermutlich) am schwersten auszugraben war(=viele Wurzelstücke verbleiben im Boden)....

Verteilung der Stichproben
und nun der Teil der mir am meisten kopf zerbrechen bereitet: Die Verteilung der Stichproben.
Anhand der Histogramme ist deutlich zu erkennen, dass es sich um KEINE Normalverteilung handelt. dies wurde ebenfalls durch den K-S-Test bestätigt.
Die Verteilung die (optisch) dem Histogramm am nähesten kommt ist die logharitmische Normalverteilung. Nur bin ich mir nicht sicher ob diese passt.

Seht jedoch selbst (Werte sind von der Regression mit einem P-Wert von 25%):

Durchmesserklassen| Anzahl der Proben| Durchschnittsgewicht
1| 451| 0,51
2| 189| 3,44
3| 105| 7,19
4| 50| 9,11
5| 21| 14,08
6| 17| 13,39
7| 14| 11,98
8| 13| 15,00
9| 8| 14,97
10| 9| 19,38
11| 12| 19,54
12| 5| 19,04
13| 6| 30,07
14| 6| 25,87
15| 4| 26,66
16| 3| 31,00
17| 7| 29,62
18| 5| 34,78
19| 4| 34,18
20| 4| 41,39
21| 4| 37,81
22| 3| 51,47
23| 0|
24| 5| 50,05
25| 4| 58,02
26| 1| 88,46
27| 1| 48,44
28| 1| 81,91
29| 1| 73,68
30| 1| 57,11
31| 0|
32| 1| 109,43
33| 0|
34| 0|
35| 1| 69,69
36| 0|
37| 1| 83,23
38| 0|
39| 0|
40| 0|
41| 0|
42| 0|
43| 1| 191,39


Falls ihr es bis hierher geschafft habt, danke ich euch an dieser Stelle für eure Geduld! und nun zu meinen weiteren Fragen:
1. Kann ich die Regresssionsanalyse überhaupt so durchführen, angesichts der Verteilung der Daten oder anderen Faktoren die ich übersehen habe bzw nicht verstehe? :roll:
2. Welche Verteilung liegt vor? Muss ich evtl. auch andere Verteilungen anschauen, wie z.B. die Verteilung der Gewichte der einzelnen Durchmesserklassen?
3. Ist die Regression Aussagekräftig bzw. wie kann ich die Aussagekräftigkeit dieser Regression bestimmen.

Ich hoffe, dass mein Post im richtigen Forum landet, sowie dass ich mein Problem verständlich darstellen konnte und noch vielmehr, dass jemand mir bei der Lösung behilflich sein kann.
Mit den besten Grüßen,
Verplantins
Zuletzt geändert von Verplantins am Sa 27. Dez 2014, 21:37, insgesamt 1-mal geändert.
Verplantins
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 27. Dez 2014, 15:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regression - Welche Verteilung? Aussagekraft?

Beitragvon strukturmarionette » Sa 27. Dez 2014, 19:54

Hi,

was ist denn Deine abhängige Variable?

und:

Was sind Deine unabhängigen Variablen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Verplantins

Re: Regression - Welche Verteilung? Aussagekraft?

Beitragvon Verplantins » Sa 27. Dez 2014, 21:36

Danke für das Interesse/Hilfsbereitschaft!
Hoffe ich habe die Frage richtig verstanden, wie bereits erwähnt habe ich mich zum ersten mal mit Statistik vor ca. 3 Wochen befasst.... :?
Also, es wird das Gewicht der Wurzel(-abrisse) berechnet in Abhängigkeit von dem Anfangsdurchmesser.
Die Werte sind in der langen Liste eingetragen....

Kann leider keine Dateien Anhängen: "Das Kontingent für Dateianhänge ist bereits vollständig ausgenutzt."..... liegt evtl an meiner Neuanmeldung vor 4 Stunden, vlt klappt es ja morgen mit dem Hochladen.
Hätte hier noch ein Foto, dass das "zusammenpuzzlen" der Wurzel erklärt, sowie eine kleine Version der Arbeitsmappe mit nur 2 der 5 Baumsorten (einmal die Regression mit einem P-Wert von 25% und die mit dem niedrigsten 0,00....%)
Verplantins
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 27. Dez 2014, 15:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regression - Welche Verteilung? Aussagekraft?

Beitragvon strukturmarionette » So 28. Dez 2014, 01:13

Hi,

Also, es wird das Gewicht der Wurzel(-abrisse) berechnet in Abhängigkeit von dem Anfangsdurchmesser.


demnach
- ist die Unabhängige Variable (Prädiktor) der 'Anfangsdurchmesser'
- ist die Abhängige Variable (Kriterium) ein Gewichtsmaß

(Stimmt das so?)

Kann ich die Regresssionsanalyse überhaupt so durchführen,


- Ob das Sinn macht:
Hierzu wurde das Wurzelsystem so weit wie möglich ausgegraben. Jedoch sind bei dem Vorgehen Wurzelabrisse entstanden(und teilweise Wurzeln im Boden verblieben), welche rechnerisch wieder an die Wurzel angefügt werden sollen, um das Gesamtgewicht der Wurzel zu bestimmen.

erfordert zunächst keine statistische Überlegung. Das wäre fachlich aus der Botanik o.ä. heraus zu begründen.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Regression - Welche Verteilung? Aussagekraft?

Beitragvon Verplantins » So 28. Dez 2014, 07:11

Klingt plausibel mit den Variablen, der Durchmesser soll ja das Gewicht voraussagen.
Jedoch habe ich keine Ahnung, wie ich dies fachlich begründen soll. (->3 Wochen Statistik Erfahrung...irgendwie kann ich es nicht oft genug erwähnen....spiegelt auch meine Unsicherheit wieder... :oops: )

Ich vermute, dass die Regression in dem einem Fall nicht so gut funktioniert hat (P-Wert=25%) , da nicht alle Wurzeln ausgegraben wurden.
Habe auch schon in Fachliteratur zu Wurzelausgrabungen gelesen, dass man das Wurzelsystem komplett ausgraben muss, um "vernünftige" Werte zu erhalten.
Mit "vernünftig" ist gemeint, dass man das komplette Wurzelsystem und dessen Gewicht nicht abschätzen kann, da das Wurzelwachstum äußerst irregulär ist und von vielen Faktoren beeinflusst wird/werden kann.

In den anderen Fällen ist der P-Wert unter 5% und die Regression hat anscheinend ziemlich gut geklappt, sofern man dem P-Wert vertrauen kann!?!?
1.Kann ich meinen P-Werten vertrauen? Habe ich sonst alles richtig gemacht? Keine Korrelationsanalyse? Kein zwei Stichproben F-, T-Test, oder ähnliches?
2.Und was ist mit der Verteilung? (habe vorhin jmd. getroffen, der meinte, dass die Kurve der Log.NormalVerteilung, ziemlich gut in mein Histogramm passt, sowie dass die Kurve lediglich angepasst werden müsste....ist das korrekt?)

bezüglich:
erfordert zunächst keine statistische Überlegung. Das wäre fachlich aus der Botanik o.ä. heraus zu begründen.

Soll ich dann die eben erwähnten Gründe einfach niederschreiben? Fällt Dir, oder sonst noch jemanden eine Begündung ein?
Verplantins
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Sa 27. Dez 2014, 15:40
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regression - Welche Verteilung? Aussagekraft?

Beitragvon bele » Fr 2. Jan 2015, 15:02

Hallo Verplantins,

ich gestehe, dass ich nicht wirklich verstehe, was Du da gemacht hast.
Du hast also Bäume ausgebuddelt und versucht, aus den ausbuddelbaren Stücken das Gesamtgewicht der Wurzel zu bestimmen. Klingt nicht sehr überzeugend, aber mit diesen Daten musst Du jetzt leben. Jetzt versuchst Du aus dem Stammdurchmesser das so bestimmte Wurzelgewicht vorherzusagen und willst uns als Rechtfertigung einen p-Wert verkaufen.

Die Vorgehensweise beim Ausgraben und Zusammensetzen musst Du aus botanischer Sicht beurteilen. Da halten wir uns raus.

Anhand der Durchsnittsgewichte der Durchmesserklassen, wurde eine potentielle Regression durchgeführt (Grafisch mit excel ->chart erstellen -> trendlinie einfügen + bestimmtheitsmaß + formel).
Danach wurden die Durchmesserklassen logarithmisiert und es wurde mit dem Datenanalysetool eine lineare Regression durchgeführt.


Ich verstehe nicht, wie man Durchmesserklassen logarithmisieren kann oder warum Du einmal eine potenzielle Regression und einmal eine lineare mit logarithmisierten Werten durchgeführt hast und was mit den beiden Ergebnissen jeweils passiert ist. Das bleibt alles irgendwie noch unklar.



Verplantins hat geschrieben:Ich vermute, dass die Regression in dem einem Fall nicht so gut funktioniert hat (P-Wert=25%) , da nicht alle Wurzeln ausgegraben wurden.

Klingt für den Nicht-Botaniker sehr plausibel.

In den anderen Fällen ist der P-Wert unter 5% und die Regression hat anscheinend ziemlich gut geklappt, sofern man dem P-Wert vertrauen kann!?!?

Der p-Wert macht eine Aussage darüber, wie unwahrscheinlich die Daten im Falle einer gültigen Nullhypothese sind. Die Nullhypothese lautet etwas platt ausgedrückt: "Der Durchmesser des Stammes hat nichts mit der Wurzelmasse zu tun." Diese Nullhypothese war von vorneherein unsinnig. Natürlich hat ein Baum mit dickerem Stamm eher schwerere Wurzeln. Wenn die Nullhypothese wahr ist, ist der p-Wert definiert. Ist sie, wie hier, falsch, dann ist der p-Wert nicht definiert. Er eignet sich damit auch nicht wirklich überzeugend als Maß des Zusammenhangs.

Verplantins hat geschrieben:1.Kann ich meinen P-Werten vertrauen? Habe ich sonst alles richtig gemacht? Keine Korrelationsanalyse?

Welche Bestimmtheitsmaße hat Excel Dir den ausgegeben? Eine nicht-parametrische Korrelationsanalyse (Spearman-rho zwischen Stammdurchmesser und Wurzelmasse hätte wenigstens kein Problem mit Verteilungen.

Die Residuen scheinen nicht zufällig verteilt zu sein (sieht aus wie eine Sinuskurve)

Dann böte es sich an, auch noch andere Modelle zu rechnen und den Versuch zu unternehmen, diese Sinuskurve in die Vorhersage einzubeziehen. Über die Vorhersagequalität und darüber, wie gut das Modell passt, sagen die Residuen mehr als der p-Wert.

Soll ich dann die eben erwähnten Gründe einfach niederschreiben? Fällt Dir, oder sonst noch jemanden eine Begündung ein?

Begründung für was genau? Dafür dass diese eine Baumsorte nicht passt? Klar, das musst Du so niederschreiben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 16 Gäste

cron