Welches Verfahren ist geeignet?

Fragen zur Planung einer Untersuchung oder eines Projekts.

Welches Verfahren ist geeignet?

Beitragvon Cylix » Di 13. Jun 2023, 14:32

Hallo allerseits,
ich würde in meiner Bachelorarbeit gerne eine statistische Untersuchung durchführen. Dabei möchte ich schauen, ob Merkmale wie Durchschnittsalter, Geschlechterverhältnis, Durchschnittseinkommen, Einwohnerzahl einer Gemeinde etc. einen Einfluss auf das Vorhandensein von Windenergieanlagen haben. Die Daten habe ich alle zusammengesucht, nur bin ich mir unsicher, wie ich mit ihnen sinnvoll eine Korrelation berechnen kann? Das Problem ist vor allem die Variable der Windräder, dort habe ich die Anzahl pro Gemeinde, die Werte liegen in einem Bereich von 0 bis 30, sind nicht normalverteilt... Könnt ihr mir weiterhelfen, wie ich da eine vernünftige Untersuchung hinbekomme? Und welches Verfahren eignet sich dafür? Würde evtl. eine Klassifizierung sind ergeben?
Wenn ihr noch weitere Infos braucht, liefer ich die gerne nach!
Danke schonmal und viele Grüße
Cylix
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 13. Jun 2023, 14:24
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist geeignet?

Beitragvon PonderStibbons » Di 13. Jun 2023, 14:47

ich würde in meiner Bachelorarbeit gerne eine statistische Untersuchung durchführen. Dabei möchte ich schauen, ob Merkmale wie Durchschnittsalter, Geschlechterverhältnis, Durchschnittseinkommen, Einwohnerzahl einer Gemeinde etc. einen Einfluss auf das Vorhandensein von Windenergieanlagen haben.

Das dürfte in einer Bachelorarbeit nicht möglich sein, dazu müsstest Du Durchschnittsalter, Geschlechterverhältnis, Durchschnittseinkommen, Einwohnerzahl einer Gemeinde experimentell variieren. Was Du leisten kannst, das ist Zusammenhänge aufzuzeigen, nicht Kausalitäten.

Und was heißt "etc."? Wie viele weitere Merkmale und welche willst Du denn einbeziehen?

Gibt es bereits Erkenntnisse, auf die sich die Studie beziehen kann, hinsichtlich des Zusammenhangs solcher Faktoren mit Anzahl Windräder?

Und ganz zentral: wie groß ist die Stichprobe? Man diskutiert sehr anders, wenn es sich um 1500 Gemeinden handelt, als wenn es sich um 15 handelt.

Die Daten habe ich alle zusammengesucht, nur bin ich mir unsicher, wie ich mit ihnen sinnvoll eine Korrelation berechnen kann? Das Problem ist vor allem die Variable der Windräder, dort habe ich die Anzahl pro Gemeinde, die Werte liegen in einem Bereich von 0 bis 30, sind nicht normalverteilt...

Wie lauten Mittelwert, Median, Standardabweichung dieser abhängigen Variable, und wie hoch ist der Anteil der 0-Werte?
Könnt ihr mir weiterhelfen, wie ich da eine vernünftige Untersuchung hinbekomme? Und welches Verfahren eignet sich dafür? Würde evtl. eine Klassifizierung sind ergeben?

Womöglich. Klassifizierung wovon, anhand welcher Daten, mit welchem Ziel und zu welchem Zweck?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Cylix

Re: Welches Verfahren ist geeignet?

Beitragvon Cylix » Di 13. Jun 2023, 16:28

Danke für deine ausführlichen Nachfragen!

Das dürfte in einer Bachelorarbeit nicht möglich sein, dazu müsstest Du Durchschnittsalter, Geschlechterverhältnis, Durchschnittseinkommen, Einwohnerzahl einer Gemeinde experimentell variieren. Was Du leisten kannst, das ist Zusammenhänge aufzuzeigen, nicht Kausalitäten.

Da habe ich mich wahrscheinlich falsch ausgedrückt, es soll auf Zusammenhänge hinauslaufen.

Und was heißt "etc."? Wie viele weitere Merkmale und welche willst Du denn einbeziehen?

Geplant hatte ich folgende Merkmale zu untersuchen: Einwohnerzahl, %-Anteil Frauen, % Einwohner U18, % EW Ü65, % Abgänger mit allg. Hochschulreife, % ohne Abschluss, Wahlergebnisse bestimmter Parteien, touristische Übernachtungen/Einwohner (+evtl. Durchschnitsseinkommen). Also um die 10 Merkmale.

Gibt es bereits Erkenntnisse, auf die sich die Studie beziehen kann, hinsichtlich des Zusammenhangs solcher Faktoren mit Anzahl Windräder?

Nicht mit der Anzahl, aber es wurde nachgewiesen dass solche Faktoren einen Einfluss auf die räumliche Verteilung von Windrädern haben. Also auf das Vorhandensein oder Nicht-Vorhandensein.

Und ganz zentral: wie groß ist die Stichprobe? Man diskutiert sehr anders, wenn es sich um 1500 Gemeinden handelt, als wenn es sich um 15 handelt.

Die Daten liegen für 419 Gemeinden vor

Wie lauten Mittelwert, Median, Standardabweichung dieser abhängigen Variable, und wie hoch ist der Anteil der 0-Werte?

Ich habe für jede der Gemeinden die Anzahl an Windräder ermittelt, also wieder 419 Objekte, davon haben 277 keine Windräder (also rund 66%).
Mittelwert = 6.056338
Median = 4
Standardabweichung = 5.8063

Womöglich. Klassifizierung wovon, anhand welcher Daten, mit welchem Ziel und zu welchem Zweck?

Ich dachte an die Klassifizierung der Variable Anzahl Windräder... Aber auch nur weil ich mit dem Datensatz so wie er ist, nicht so richtig weiter komme...
Cylix
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 13. Jun 2023, 14:24
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Welches Verfahren ist geeignet?

Beitragvon PonderStibbons » Di 13. Jun 2023, 17:23

Geplant hatte ich folgende Merkmale zu untersuchen: Einwohnerzahl, %-Anteil Frauen, % Einwohner U18, % EW Ü65, % Abgänger mit allg. Hochschulreife, % ohne Abschluss, Wahlergebnisse bestimmter Parteien, touristische Übernachtungen/Einwohner (+evtl. Durchschnitsseinkommen). Also um die 10 Merkmale.

Und das sind alles Gemeinden, für die ausreichend Platz und Wind zur Verfügung stehen, sodass man
sich allein auf die sozidemografischen Merkmale der Einwohner konzentrieren kann?
Nicht mit der Anzahl, aber es wurde nachgewiesen dass solche Faktoren einen Einfluss auf die räumliche Verteilung von Windrädern haben. Also auf das Vorhandensein oder Nicht-Vorhandensein.

Da Du 66% ohne Windräder hast (was ist mit Windrädern in Planung?!), wäre Vorhandensein/Nichtvorhandensein vielleicht die bessere Ergebnisgröße.
Mittelwert = 6.056338

Nur mal nebenbei, bei Zähldaten reicht eine Stelle hinterm Komma, die Millionstel sind da nicht mehr so informativ.

Wie gesagt, Windräder ja/nein bzw. Windräder vorhanden bzw. in Planung: ja versus nein wäre vielleicht näherliegend.
Da kann man dann für kontinuierliche Variablen Mittelwertvergleiche (t-Tests) zwischen den Gruppen Windrad ja/nein
berechnen. Mehrere Prädiktoren gemeinsam zur Vorhersage von "Windräder ja/nein" gingen auch (multiple binär-logistische
Regression).

Bivariate Beziehungen zwischen Anzahl Windräder (mit 66% Nullwerten) und den einzelnen Variablen könnte man mit
Verfahren für ordinale Daten (Spearman-Rangkorrelation) angehen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Versuchsplanung

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron