Guten Tag die werten Statistikerinnen und Statistiker,
Bin neu hier im Forum und möchte gleich eure Hilfe beanspruchen, da ich so gut wie keine Ahnung von Statistik habe (ca. 3 wochen Erfahrung) und mein Betreuer anscheinend auch nicht.
Sitze momentan an der statistischen Auswertung meiner Bachelorarbeit.
Das Thema der Arbeit ist die Berechnung der Wurzelmasse einiger bestimmter Baumarten (ca. 3 Jahre alt).
Hierzu wurde das Wurzelsystem so weit wie möglich ausgegraben. Jedoch sind bei dem Vorgehen Wurzelabrisse entstanden(und teilweise Wurzeln im Boden verblieben), welche rechnerisch wieder an die Wurzel angefügt werden sollen, um das Gesamtgewicht der Wurzel zu bestimmen.
(an dieser Stelle würde ich gerne eine erklärende Grafik einfügen, krieg es aber nicht hin....)
Datenerhebung:
Es wurden von jedem Wurzelabriss die Durchmesser aufgenommen und auf ganze Zahlen gerundet (1x Anfangsdurchmesser, zig x Enddurchmesser). zusätzlich wurde das Gewicht festgehalten.
Klasseneinteilung:
Diese Abrisse wurden anhand des Anfangsdurchmessers sortiert , wodurch eine Klasseneinteilung entstand (Anfangsdurchmesser 1mm, 2mm, 3mm, usw.)
Durchschnittsgewichte der Klassen:
Zunächst wurde das Mittlere Gewicht der ersten Durchmesserklasse bestimmt (1mm Anfangsdurchmesser).
Dieses Durchschnittsgewicht wird nun zu den Wurzelabrissen der höheren Durchmesserklassen hinzu addiert, sofern diese Enddurchmesser von 1mm dicke aufweisen.
Dadurch lässt sich das Gewicht der nächst höheren Durchmesserklasse berechnen (2mm), da diese lediglich Endurchmesser von 1mm stärke besitzt, usw.
Regression
Anhand der Durchsnittsgewichte der Durchmesserklassen, wurde eine potentielle Regression durchgeführt (Grafisch mit excel ->chart erstellen -> trendlinie einfügen + bestimmtheitsmaß + formel).
Danach wurden die Durchmesserklassen logarithmisiert und es wurde mit dem Datenanalysetool eine lineare Regression durchgeführt.
Soweit, sogut.......nun möchte ich jedoch wissen wie aussagekräftig diese Regression ist!!!
Residuen
Die Residuen scheinen nicht zufällig verteilt zu sein (sieht aus wie eine Sinuskurve)
P-Wert
Der P-Wert ist in 4 von 5 Fällen <5%.
Die Baumsorte mit der geringsten Biomasse hat den kleinsten P-Wert....
In einem Fall beträgt der P-Wert 25%, undzwar bei der Baumsorte die am meisten Biomasse aufgebaut hat und (vermutlich) am schwersten auszugraben war(=viele Wurzelstücke verbleiben im Boden)....
Verteilung der Stichproben
und nun der Teil der mir am meisten kopf zerbrechen bereitet: Die Verteilung der Stichproben.
Anhand der Histogramme ist deutlich zu erkennen, dass es sich um KEINE Normalverteilung handelt. dies wurde ebenfalls durch den K-S-Test bestätigt.
Die Verteilung die (optisch) dem Histogramm am nähesten kommt ist die logharitmische Normalverteilung. Nur bin ich mir nicht sicher ob diese passt.
Seht jedoch selbst (Werte sind von der Regression mit einem P-Wert von 25%):
Durchmesserklassen| Anzahl der Proben| Durchschnittsgewicht
1| 451| 0,51
2| 189| 3,44
3| 105| 7,19
4| 50| 9,11
5| 21| 14,08
6| 17| 13,39
7| 14| 11,98
8| 13| 15,00
9| 8| 14,97
10| 9| 19,38
11| 12| 19,54
12| 5| 19,04
13| 6| 30,07
14| 6| 25,87
15| 4| 26,66
16| 3| 31,00
17| 7| 29,62
18| 5| 34,78
19| 4| 34,18
20| 4| 41,39
21| 4| 37,81
22| 3| 51,47
23| 0|
24| 5| 50,05
25| 4| 58,02
26| 1| 88,46
27| 1| 48,44
28| 1| 81,91
29| 1| 73,68
30| 1| 57,11
31| 0|
32| 1| 109,43
33| 0|
34| 0|
35| 1| 69,69
36| 0|
37| 1| 83,23
38| 0|
39| 0|
40| 0|
41| 0|
42| 0|
43| 1| 191,39
Falls ihr es bis hierher geschafft habt, danke ich euch an dieser Stelle für eure Geduld! und nun zu meinen weiteren Fragen:
1. Kann ich die Regresssionsanalyse überhaupt so durchführen, angesichts der Verteilung der Daten oder anderen Faktoren die ich übersehen habe bzw nicht verstehe?
2. Welche Verteilung liegt vor? Muss ich evtl. auch andere Verteilungen anschauen, wie z.B. die Verteilung der Gewichte der einzelnen Durchmesserklassen?
3. Ist die Regression Aussagekräftig bzw. wie kann ich die Aussagekräftigkeit dieser Regression bestimmen.
Ich hoffe, dass mein Post im richtigen Forum landet, sowie dass ich mein Problem verständlich darstellen konnte und noch vielmehr, dass jemand mir bei der Lösung behilflich sein kann.
Mit den besten Grüßen,
Verplantins