Anwendungsbeispiel

Fragen, die sich auf kein spezielles Verfahren beziehen.

Anwendungsbeispiel

Beitragvon Strandläufer » Mi 16. Dez 2020, 11:50

Hallo Ihr Lieben,
vielleicht kann mir einer helfen
Es geht in der Aufgabe um den Gemüseanbau.
Bei n=100
Als Variablen gibt es
das Anbaugebiet (A,B,C)
die Düngersorte (D,E,F)
werden Pestizide eingesetzt (also ja, nein)
die Menge der Bewässerung (in Litern),
die Pflanzensorte (1,2,3,4) und
den Ertrag (in Kg/Beet).
Wenn ich nun wissen will welchen Einfluss z.B. die Gabe der unterschiedlichen Düngersorten und Pestizide auf den Ertrag hat wie geh ich am besten vor?
Brauch ich alle Variablen?> Bewässerung wird sicherlich auch einen Einfluss haben ebenso die Pflanzensorte und vielleicht auch das Anbaugebiet wobei wenn ich von kontrolierten Bedingungen im Gewächshaus ausgehe eher nicht oder?.....
Wie würde der Versuchsaufbau aussehen? Also wie viele Beete müsste ich anlegen und wie würde ich die bewirtschaften (Kombination der Variablen)? > Anzahl der Wiederholungen und Kontrollgruppen
Welche Test sind sinnvoll auf dem Weg zum Ergebnis?
Wie kann ich eine Normalverteilung leicht abschätzen?

Ich steh echt auf der Leitung und weiß nicht wie ich anfangen soll....

Vielen Dank
und liebe Grüße
Strandläufer
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 16. Dez 2020, 11:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anwendungsbeispiel

Beitragvon bele » Mi 16. Dez 2020, 13:15

Hallo Strandläufer,

ich habe da so ein Bauchgefühl, dass es besser wäre, die Aufgabe im Originaltext als in der Nacherzählung zu posten. Ich kann Deiner Schilderung zum Beispiel nicht entnehmen, was n = 100 hier heißen soll. Ob Du alle Variablen brauchst? Wäre eher eine Frage an einen Landwirt oder Gärtner oder den Auftraggeber der Studie. Natürlich müsste man den Landwirt oder den Bauern auch fragen, ob es sinnvoll ist, die Bewässerungsmenge zu manipulieren oder ob die sich mittels Bodenfeuchtesensor gesteuerter Bewässerungsautomatik von selbst ergibt. Zunächst würde es sich anbieten, wenn man in jedem Anbaugebiet für jede Düngersorte und jede Pestizidoption und jede Pflanzensorte mindestens ein Beet hätte. Besser wären natürlich mehrere Beete. Vielleicht schließen sich auch manche Kombinationen aus? Welchen Sinn hätte es, Pestizide einzusetzen wenn ein Dünger danach ausgewählt wurde, dass er Bio-zertifiziert ist?

Wie kann ich eine Normalverteilung leicht abschätzen?

Es gibt keinen Grund Normalverteilungen abschätzig zu betrachten oder zu behandeln. Normalverteilungen sind eine schöne Sache, vor allem wenn man z-Werte in Perzentilen umrechnen möchte. Ohne Kontext macht die Frage aber keinen Sinn und im Kontext würde ich sie vorrangig als Hinweis Deiner Lehrer darauf sehen, dass Du parametrische Statistikverfahren vorschlagen sollst.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Anwendungsbeispiel

Beitragvon Strandläufer » Do 17. Dez 2020, 16:18

Hallo Bernhard,
vielen Dank für die Antwort!
Nochmal kurz vorweg:
Als Variablen gibt es
das Anbaugebiet (A,B,C)
die Düngersorte (D,E,F)
werden Pestizide eingesetzt (also ja, nein)
die Menge der Bewässerung (in Litern),
die Pflanzensorte (1,2,3,4) und
den Ertrag (in Kg/Beet)
Daraus hab ich 100 Datensätze mit unterschiedlichen Kombinationen daher die n=100

Hier ist die Aufgabe im Original und die Gedanken welche ich mir schon dazu gemacht habe

Fragestellung:
Welchen Einfluss haben die Düngemittelsorte und die Gabe von Pestizid auf den Ertrag von
Gurken?
> Hoffentlich einen ertragssteigernden Einfluss sonst ist es wirtschaftlich nicht sinnvoll. Kann ich hier was mit Hypothesen machen? "Hat Einfluss" gegen "Hat kein Einfluss"? Also H0 gegen H1 testen? und dann als Antwort später in Worten " hat (kein) ertragssteigernden Einfluss?" oder geht es noch irgendwie um die Stärke/Größe des Einflusses?

Würden Sie für jede Gurkensorte die gleiche Empfehlung für die Verwendung von
Pestizid geben?
> wahrscheinlich nicht. Ich gehe davon aus, dass die verschiedenen Sorten auch unterschiedlich anfällig für Schädlinge sind. Betrachte ich da nur Gurkensorte, Pestizid (ja/nein) in Hinblick auf den Ertrag ohne die anderen Fakrtoren zu berücksichtigen? Da fehlt ja dann eigentlich was ...Es sei den ich habe jede Sorte, mit jedem Dünger, aus jedem Anbaugebiet kombiniert sowie mit und ohne Pestizide getestet auch die Bewässerung nehem ich als vergleichbar an.

Hinweise zur Bearbeitung
Beschreiben Sie die abhängige und die unabhängige(n) Variablen, die Sie zur Beantwortung der Frage
einbeziehen möchten
. > das ist die Frage. Brauch ich alle Variablen so wie die Frage oben Formuliert ist? Klar hat nicht nur Düngersorte und Pestizide (ja/nein) einen Einfluss sondern auch Wassermenge, eigentlich ja auch Menge von Dünger und Pestiziden ebenso wie das Substrat im Beet und noch mehr. Wozu es in diesem Beispiel keine Daten gibt (siehe Oben die Variablen) ,also geh ich dabei von gleichen Bedingungen aus. Variablen nach Variablentyp beschreiben also Numerisch:>kontinuierlich>normal/nicht normal; Diskret>Intervallskala oder Ordinalskala,______ Katergorisch u.s.w.

Überlegen Sie auch, ob Ihre abhängige Variable normalverteilt sein könnte
und warum.

>
bele hat geschrieben: Wie kann ich eine Normalverteilung leicht abschätzen?


Es gibt keinen Grund Normalverteilungen abschätzig zu betrachten oder zu behandeln. Normalverteilungen sind eine schöne Sache, vor allem wenn man z-Werte in Perzentilen umrechnen möchte. Ohne Kontext macht die Frage aber keinen Sinn und im Kontext würde ich sie vorrangig als Hinweis Deiner Lehrer darauf sehen, dass Du parametrische Statistikverfahren vorschlagen sollst.

Das denk ich auch. Vieleicht ein Frequenzdiagramm so dass eine Gausche Glockenform zu erkennen ist oder eben nicht dann hätte ich eine visuelle Begründung (mehr Werte/Stichproben/Daten um den Mittelwert als an den Rändern) dann vielleicht noch Stichprobengröße> bei zukleiner Stichprobe kann im/mit dem Diagramm nicht wirklich eine Aussage gemacht werden.

Entscheiden Sie sich anhand des Datensets für ein experimentelles Design, wie es in der Studie (in
Bezug auf Ihre Frage!) sinnvoll wäre und leiten Sie daraus Kontrollen und Wiederholungen ab. (Wie
kann man die Unabhängigkeit der Stichproben gewährleisten bzw. für welche Faktoren sollte
kontrolliert werden?)
> Anzahl von Stichproben, Anzahl der Wiederholungen der Beete
bele hat geschrieben:Zunächst würde es sich anbieten, wenn man in jedem Anbaugebiet für jede Düngersorte und jede Pestizidoption und jede Pflanzensorte mindestens ein Beet hätte. Besser wären natürlich mehrere Beete.
und auch Anzahl der Pflanzen im Beet auch als Wiederholung, für möglichst gleiche Bedingungen sorgen >Licht, Temperatur, eigentlich auch noch gleicher Zeitpunkt bzw Häufigkeit der Anwendung von Dünger & Pestiziden bzw definieren ob es was mit Langzeitwirkung ist, möglichst viel automatisieren da kontrolierbarer als der Mensch in diesem Bereich wie von Dir schon angemerkt

Begründen Sie die Auswahl des statistischen Tests, mit dem Sie die Fragestellung beantworten
möchten.
> Also z.b. ob das Skalenniveau metrisch oder kategorial ist und was davon auf Zielvariable (Ertrag?) und was auf Gruppenvariable (Dünger, Pestizide? ) zutrift und danach such ich den passenden Test

Testen Sie, ob die Voraussetzungen für diesen Test erfüllt sind.> hier (nochmal) auf Normalverteilung testen ? Auch Stichprobengröße berücksichtigen da ja manche Testes erst ab gewissem Stichprobenumfang gute Ergebnisse liefern?

Führen Sie den Test durch und stellen Sie die Ergebnisse angemessen dar.> Sollte machbar sein dazu Tabelle oder Grafik und ergänzent Text

Diskutieren Sie Ihr Ergebnis.>Sollte auch klappen. Kann ich hier auch anbringen, dass nicht alle wachstums/ertragsbeeinflussenden (aus biologischer/ökologischer sicht) Parameter in den Daten vorkommen? Die Vorteile/Nachteile der/des gewählten Testverfahrens anbringen. Nochmal bezug zur Fragestellung. Vielleicht auch die Methode der Datenerhebung bzw die verwendeten Geräte wobei ich dazu keine Infos hab> aber das könnte ja auch ein Kritikpunkt sein da so eine Einschätzung der Datenqualität nicht wirklich möglich ist bzw Vergleichbarkeit zu anderen Studien nicht wirklich Möglich ist

Diskutieren Sie, ob die Anzahl der Stichproben angemessen war.> hier nochmal darauf eingehen ob der gewählte Test bei der gegebenen Stichprobengröße gute Ergebnisse liefert. Vielleicht auch auf den Aufwand zur generierung einer höhren Anzahl an Stichproben eingehen (Kosten<> Nutzen)? sonst ja schon je mehr je besser (bis zu einem bestimmten Wert, danach dann kaum noch Veränderung?)

Formulieren Sie ausführlich fünf weitere Fragen, die mit diesem Datenset untersucht werden können
(welche Variablen, wie testen)

> Einfluss von Bewässerung und Dünger auf Ertrag
> Einfluss von Bewässerung und Pestizide auf Ertrag
> Einfluss von Anbaugebiet und Sorte auf Ertrag
>> wäre alles das gleiche Prinzip wie die Ausgangsfrage oben also auch gleiches Vorgehen oder ?
>vielleicht welche Kombi hat hohen (höchsten) Ertrag bei geringem Wasserverbrauch
> welche Kombi aus Dünger und Pestizidverwendung bringt den höchsten Ertrag?
> welche Kombi ohne Pestizide bringt höchsten Ertrag?
> Welche Anbauregion bringt den höchsten Ertrag?
> Welche Sorte liefert ohne Pestizide den höchsten Ertrag?
>> hier dann wieder die Frage welche Tests aber da würde ich auch wieder nach Skalenniveau der einzelnen Variablen schauen und schauen ob normalverteilt oder nicht und wie viele Ausprägungsstufen die Zielvariable hat dann den Test raussuchen. Achja und schauen was Zielvariabel und was Gruppenvariable ist (Zielvariable (abhängige) z.b. Ertrag und Gruppenvariable (unabhängige) dann Pestizide(ja/nein), Düngersorte wenn ich den Einfluss von Pestizide und Düngersorte auf Ertrag ermitteln will? )

Sooo ganz schön viel und hoffentlich nicht zu durcheinander oder völlig falsch
LG und vielen Dank schon mal
Strandläufer
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 16. Dez 2020, 11:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Anwendungsbeispiel

Beitragvon bele » Do 17. Dez 2020, 16:50

Strandläufer hat geschrieben:Hallo Bernhard,
vielen Dank für die Antwort!
Nochmal kurz vorweg:
Als Variablen gibt es
das Anbaugebiet (A,B,C)
die Düngersorte (D,E,F)
werden Pestizide eingesetzt (also ja, nein)
die Menge der Bewässerung (in Litern),
die Pflanzensorte (1,2,3,4) und
den Ertrag (in Kg/Beet)
Daraus hab ich 100 Datensätze mit unterschiedlichen Kombinationen daher die n=100

Hier ist die Aufgabe im Original und die Gedanken welche ich mir schon dazu gemacht habe

Fragestellung:
Welchen Einfluss haben die Düngemittelsorte und die Gabe von Pestizid auf den Ertrag von
Gurken?
> Hoffentlich einen ertragssteigernden Einfluss sonst ist es wirtschaftlich nicht sinnvoll. Kann ich hier was mit Hypothesen machen? "Hat Einfluss" gegen "Hat kein Einfluss"? Also H0 gegen H1 testen? und dann als Antwort später in Worten " hat (kein) ertragssteigernden Einfluss?" oder geht es noch irgendwie um die Stärke/Größe des Einflusses?

Würden Sie für jede Gurkensorte die gleiche Empfehlung für die Verwendung von
Pestizid geben?
> wahrscheinlich nicht. Ich gehe davon aus, dass die verschiedenen Sorten auch unterschiedlich anfällig für Schädlinge sind. Betrachte ich da nur Gurkensorte, Pestizid (ja/nein) in Hinblick auf den Ertrag ohne die anderen Fakrtoren zu berücksichtigen? Da fehlt ja dann eigentlich was ...Es sei den ich habe jede Sorte, mit jedem Dünger, aus jedem Anbaugebiet kombiniert sowie mit und ohne Pestizide getestet auch die Bewässerung nehem ich als vergleichbar an.

Hinweise zur Bearbeitung
Beschreiben Sie die abhängige und die unabhängige(n) Variablen, die Sie zur Beantwortung der Frage
einbeziehen möchten
. > das ist die Frage. Brauch ich alle Variablen so wie die Frage oben Formuliert ist? Klar hat nicht nur Düngersorte und Pestizide (ja/nein) einen Einfluss sondern auch Wassermenge, eigentlich ja auch Menge von Dünger und Pestiziden ebenso wie das Substrat im Beet und noch mehr. Wozu es in diesem Beispiel keine Daten gibt (siehe Oben die Variablen) ,also geh ich dabei von gleichen Bedingungen aus. Variablen nach Variablentyp beschreiben also Numerisch:>kontinuierlich>normal/nicht normal; Diskret>Intervallskala oder Ordinalskala,______ Katergorisch u.s.w.

Überlegen Sie auch, ob Ihre abhängige Variable normalverteilt sein könnte
und warum.

>
bele hat geschrieben: Wie kann ich eine Normalverteilung leicht abschätzen?


Es gibt keinen Grund Normalverteilungen abschätzig zu betrachten oder zu behandeln. Normalverteilungen sind eine schöne Sache, vor allem wenn man z-Werte in Perzentilen umrechnen möchte. Ohne Kontext macht die Frage aber keinen Sinn und im Kontext würde ich sie vorrangig als Hinweis Deiner Lehrer darauf sehen, dass Du parametrische Statistikverfahren vorschlagen sollst.

Das denk ich auch. Vieleicht ein Frequenzdiagramm so dass eine Gausche Glockenform zu erkennen ist oder eben nicht dann hätte ich eine visuelle Begründung (mehr Werte/Stichproben/Daten um den Mittelwert als an den Rändern) dann vielleicht noch Stichprobengröße> bei zukleiner Stichprobe kann im/mit dem Diagramm nicht wirklich eine Aussage gemacht werden.

Entscheiden Sie sich anhand des Datensets für ein experimentelles Design, wie es in der Studie (in
Bezug auf Ihre Frage!) sinnvoll wäre und leiten Sie daraus Kontrollen und Wiederholungen ab. (Wie
kann man die Unabhängigkeit der Stichproben gewährleisten bzw. für welche Faktoren sollte
kontrolliert werden?)
> Anzahl von Stichproben, Anzahl der Wiederholungen der Beete
bele hat geschrieben:Zunächst würde es sich anbieten, wenn man in jedem Anbaugebiet für jede Düngersorte und jede Pestizidoption und jede Pflanzensorte mindestens ein Beet hätte. Besser wären natürlich mehrere Beete.
und auch Anzahl der Pflanzen im Beet auch als Wiederholung, für möglichst gleiche Bedingungen sorgen >Licht, Temperatur, eigentlich auch noch gleicher Zeitpunkt bzw Häufigkeit der Anwendung von Dünger & Pestiziden bzw definieren ob es was mit Langzeitwirkung ist, möglichst viel automatisieren da kontrolierbarer als der Mensch in diesem Bereich wie von Dir schon angemerkt

Begründen Sie die Auswahl des statistischen Tests, mit dem Sie die Fragestellung beantworten
möchten.
> Also z.b. ob das Skalenniveau metrisch oder kategorial ist und was davon auf Zielvariable (Ertrag?) und was auf Gruppenvariable (Dünger, Pestizide? ) zutrift und danach such ich den passenden Test

Testen Sie, ob die Voraussetzungen für diesen Test erfüllt sind.> hier (nochmal) auf Normalverteilung testen ? Auch Stichprobengröße berücksichtigen da ja manche Testes erst ab gewissem Stichprobenumfang gute Ergebnisse liefern?

Führen Sie den Test durch und stellen Sie die Ergebnisse angemessen dar.> Sollte machbar sein dazu Tabelle oder Grafik und ergänzent Text

Diskutieren Sie Ihr Ergebnis.>Sollte auch klappen. Kann ich hier auch anbringen, dass nicht alle wachstums/ertragsbeeinflussenden (aus biologischer/ökologischer sicht) Parameter in den Daten vorkommen? Die Vorteile/Nachteile der/des gewählten Testverfahrens anbringen. Nochmal bezug zur Fragestellung. Vielleicht auch die Methode der Datenerhebung bzw die verwendeten Geräte wobei ich dazu keine Infos hab> aber das könnte ja auch ein Kritikpunkt sein da so eine Einschätzung der Datenqualität nicht wirklich möglich ist bzw Vergleichbarkeit zu anderen Studien nicht wirklich Möglich ist

Diskutieren Sie, ob die Anzahl der Stichproben angemessen war.> hier nochmal darauf eingehen ob der gewählte Test bei der gegebenen Stichprobengröße gute Ergebnisse liefert. Vielleicht auch auf den Aufwand zur generierung einer höhren Anzahl an Stichproben eingehen (Kosten<> Nutzen)? sonst ja schon je mehr je besser (bis zu einem bestimmten Wert, danach dann kaum noch Veränderung?)

Formulieren Sie ausführlich fünf weitere Fragen, die mit diesem Datenset untersucht werden können
(welche Variablen, wie testen)

> Einfluss von Bewässerung und Dünger auf Ertrag
> Einfluss von Bewässerung und Pestizide auf Ertrag
> Einfluss von Anbaugebiet und Sorte auf Ertrag
>> wäre alles das gleiche Prinzip wie die Ausgangsfrage oben also auch gleiches Vorgehen oder ?
>vielleicht welche Kombi hat hohen (höchsten) Ertrag bei geringem Wasserverbrauch
> welche Kombi aus Dünger und Pestizidverwendung bringt den höchsten Ertrag?
> welche Kombi ohne Pestizide bringt höchsten Ertrag?
> Welche Anbauregion bringt den höchsten Ertrag?
> Welche Sorte liefert ohne Pestizide den höchsten Ertrag?
>> hier dann wieder die Frage welche Tests aber da würde ich auch wieder nach Skalenniveau der einzelnen Variablen schauen und schauen ob normalverteilt oder nicht und wie viele Ausprägungsstufen die Zielvariable hat dann den Test raussuchen. Achja und schauen was Zielvariabel und was Gruppenvariable ist (Zielvariable (abhängige) z.b. Ertrag und Gruppenvariable (unabhängige) dann Pestizide(ja/nein), Düngersorte wenn ich den Einfluss von Pestizide und Düngersorte auf Ertrag ermitteln will? )

Sooo ganz schön viel und hoffentlich nicht zu durcheinander oder völlig falsch
LG und vielen Dank schon mal


Aus alledem vermute ich mal, dass Ihr die lineare Regressionsanalyse und auch schon Interaktionsterme durchgenommen habt? In diesem Fall könnte man damit arbeiten und ein lineares Modell aufstellen, dass aus den genannten Prädiktoren = unabhängigen Variable = Features den Ertrag vorhersagt.

Fragen wie "Welchen Einfluss haben die Düngemittelsorte und die Gabe von Pestizid auf den Ertrag von Gurken?" beantwortet man dann anhand der Koeffizienten und deren Signifikanz, die die Düngemittelsorten und der Pestizidgebrauch in dieser Regression erhalten.

"das ist die Frage. Brauch ich alle Variablen so wie die Frage oben Formuliert ist?" - Was habt Ihr denn über Vor- und Nachteile der multiplen Regression gelernt?

"Würden Sie für jede Gurkensorte die gleiche Empfehlung für die Verwendung von Pestizid geben?>" -- wenn ich Recht haben sollte mit meiner VErmutung, dass Ihr multiple lineare Regressionsanalyse betreiben sollt, dann wäre das die Gelegenheit, über Interaktionsterme nachzudenken.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Anwendungsbeispiel

Beitragvon Strandläufer » Di 5. Jan 2021, 09:59

Frohes neues Jahr noch!
Vielen lieben Dank für die Antwort.
Ich habe damit schon etwas rumprobiert und es scheint zu brauchbaren Ergebnissen zu führe.
Vielen Dank nochmal !
Schöne Grüße
Strandläufer
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 16. Dez 2020, 11:21
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 14 Gäste