Methodenauswahl

Fragen, die sich auf kein spezielles Verfahren beziehen.

Methodenauswahl

Beitragvon Banane21 » Do 1. Okt 2015, 17:06

Hallo zusammen,

ich möchte analysieren, wie groß der Einfluss verschiedener Faktoren (etwa 10, alle binär bzw. ordinal) auf die Entwicklung der Marktwerte (Einkommen) von Wind- (Onshore und Offshore) und Solarenergie sowie auf die Strompreise ist. Ich habe also etwa 10 unabhängige ordinale/ binäre erklärende Variablen und 4 metrische abhängige Variablen. Der zu Grunde liegende Datensatz besteht aus Modellierungsergebnissen - ich habe 3456 Szenarien gerechnet, die sich jeweils aus verschiedenen Kombinationen der einzelnen erklärenden Variablen ergeben.

Ich bin mir nun nicht sicher, wie ich am besten herausfinde, welche erklärenden Variablen ausschlaggebend für die Variation der abhängigen Variablen sind.

Bisher habe ich mir dazu folgendes Vorgehen überlegt:

1. Vorabanalse mit Boxplots für jede Ausprägung der unabhängigen Variablen, um zu sehen, ob über die Gesamtheit aller Szenarien Unterschiede zwischen den Ausprägungen bestehen
2. Einfache Varianzanalysen mit dem gleichen Ziel
3. Faktorenanalyse, um herauszufinden, ob einige der gewählten erklärenden Variablen zusammenhängen (ich bin mir aber nicht sicher, inwieweit das bei meinen Daten Sinn macht, da die einzelnen erklärenden Variablen in der Modellierung ja unabhängig voneinander variiert wurden)
4. ggf. Clusteranalyse der Merkmale mit dem gleichen Ziel
5. Regressionsanalyse mit Random oder Fixed Effects (je nach Ergebnis des Haussman-Tests) mit allen Variablen und mit den Faktoren

Am Ende hoffe ich, Aussagen darüber treffen zu können, welche Einflussfaktoren wichtig sind; daraus sollen dann Politikempfehlungen entwickelt werden, wie man diese Faktoren beeinflussen kann (falls sie beeinflussbar sind).

Über eine Bewertung und vielleicht Konkretisierung meiner bisherigen Überlegungen würde ich mich seh freuen - ich bin leider kein wirklicher Statistik-Crack...

Noch nen schönen Abend und schon mal danke!

Jenny
Banane21
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 1. Okt 2015, 16:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Methodenauswahl

Beitragvon strukturmarionette » Do 1. Okt 2015, 19:01

Hi,

-10 UVs und 4 AVs. OK.
auf die Entwicklung der ...

- wieviele Messungen im Zeitablauf (Periode) liegen denn je AV vor?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Methodenauswahl

Beitragvon Banane21 » Fr 2. Okt 2015, 17:10

Hallo,

danke der Nachfrage.

Es gibt eigentlich keinen wirklichen Zeitablauf - ich habe aber wie gesagt etwa 3500 Szenarien gerechnet; das heißt, es liegen 3500 Beobachtungen für die abhängigen Variablen vor; die unabhängigen Variablen sind in den unterschiedlichen Szenarien jeweils in unterschiedlichen Kombinationen enthalten.

Hier noch eine Tabelle , die mein Vorhaben vielleicht etwas besser erklärt (leider kann ich hier keine Dateien anhängen).

ID -----color -----size -----weight -----price
1 -----blue -----big -----heavy -----0,3
2 -----blue -----big -----medium -----0,7
3 -----blue -----big -----low -----1,2
4 -----blue -----small -----heavy -----3,4
5 -----blue -----small -----medium -----5,6
6 -----blue -----small -----low -----7,2
7 -----yellow -----big -----heavy -----0,1
8 -----yellow -----big -----medium -----4,5
9 -----yellow -----big -----low -----3,3
10 -----yellow -----small -----heavy -----4,5
11 -----yellow -----small -----medium -----2,3
12 -----yellow -----small -----low -----3,4
13 -----red -----big -----heavy -----5,4
14 -----red -----big -----medium -----0,3
15 -----red -----big -----low -----0,2
16 -----red -----small -----heavy -----0,1
17 -----red -----small -----medium -----0,5
18 -----red -----small----- low -----0,7

Ich möchte untersuchen, inwieweit die unabhängigen kategorischen Variablen (im Beispiel color, weight und size) die abhängigen stetigen Variablen (im Beispiel price) beeinflussen bzw. welche unabhängigen die abhängigen in welchem Ausmaß beeinflussen. Dafür habe ich (wie im Beispiel auch) Kombinationen aus allen unabhängigen Variablen erstellt und dazu jeweils den Wert der abhängigen Variable ermittelt. Ist das jetzt etwas klarer?

Falls Sie/ ihr noch weitere Infos zum Beantworten meiner Frage brauchst, stehe ich natürlich gern zur Verfügung.

Danke schon mal!
Banane21
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 1. Okt 2015, 16:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Methodenauswahl

Beitragvon strukturmarionette » Sa 3. Okt 2015, 01:00

Hi,

- dass Deine Rohdaten Querschschnittsdaten und keine Längsschnittdaten (Entwicklungen) sind ist ist nur klar.

Dafür habe ich (wie im Beispiel auch) Kombinationen aus allen unabhängigen Variablen erstellt und dazu jeweils den Wert der abhängigen Variable ermittelt. Ist das jetzt etwas klarer?

- Nein. Im Gegenteil. Es gibt aber viele Mitleser hier, die das vielleicht nachvollziehen können.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Methodenauswahl

Beitragvon Banane21 » Mo 5. Okt 2015, 11:00

Hallo zusammen,

hier kommt nochmal ein Erklärungsversuch:

Ich habe mir verschiedeneGrößen überlegt (bzw. aus der Literatur zusammengetragen), die meine abhängigen Variablen (den Marktwert von Wind und PV sowie den durchschnittlichen Strompreis) beeinflussen.
Dann habe ich bei jeder dieser Größen verschiedene Niveaus definiert (bspw. gering, mittel und hoch beim Gaspreis; geringes und hohes Speichervolumen bei Pumpspeicehrn; Ateil der Erneuerbaren Energien an der Stromerzeugung 30, 50 und 80% etc.). Diese Größen habe ich dann in allen Kombinationen (also 3(Gaspreis) *2 (Speichevolumen) * ...) als Inputdaten für ein Strommarktmodell genutzt und für alle verschiedenen Kombinationen die Strompreise und Marktwerte berechnen lassen.

Die statistische Aufgabe ist es nun, die Ergebnisse des Modells zu analysieren und dadurch herauszufinden, welche Einflussgrößen Marktwerte und Strompreise in welchem Ausmaß beeinflussen, welche Wechselwirkungen zwischen den einzelnen Einflussgrößen bestehen etc.

Ich haffe, die Erklärung ist jetzt besser, ansonsten kann ich es auch gern nochmal versuchen.

Beste Grüße,

Jenny
Banane21
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Do 1. Okt 2015, 16:45
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Methodenauswahl

Beitragvon bele » Mo 5. Okt 2015, 16:37

Es geht also darum, mit statistischen Regressionmodellen herauszufinden, wie das Strommarktmodell funktioniert oder mindestens mit einem einfachen statistischen Modell das Strommarktmodell anzunähern. Nun Regressionsverfahren gibt es sehr viele und es wäre gut, wenn jemand sich damit beschäftigt, der sowohl von Strommarktmodellen also auch von Regressionsverfahren etwas versteht, um die Auswahl einzuschränken. Wenn nichts hilft, dann muss man herumprobieren. In der Statistik probiert man gerne mit einfachen Verfahren zuerst und deshalb ist ein erster Versuch oft ein einfaches lineares Modell. Das kann man dann entweder nach und nach Verfeinern oder auf komplexe Verfahren des maschinellen Lernens ausweichen. Ein einfaches Kochbuch für so eine komplexe Fragestellung in einem Forum zu geben wird nicht gelingen.

Über eine Bewertung und vielleicht Konkretisierung meiner bisherigen Überlegungen würde ich mich seh freuen - ich bin leider kein wirklicher Statistik-Crack...


Es klingt ein bisschen so, als ob Du einen wirklichen finden müsstest.

Sorry JMTC,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste