Multiple Regression von gruppierten Daten

Alle Verfahren der Regressionanalyse.

Multiple Regression von gruppierten Daten

Beitragvon Perilun » Mi 30. Nov 2016, 12:24

Wie kann eine multiple Regression von gruppierten Daten durchgeführt werden?

Ein Beispiel:
Erste Gruppe: x1=1 bis 10 y1=0.5
Zweite Gruppe x2=11:20 y2= 0.8
Dritte Gruppe x3=21:30 y3 = 1.7

usw.

Kann dies mit Hilfe der multiplen Regression durchgeführt werden oder gibt es dort andere Verfahren?
Gibt es dort einen Trick?
Zuletzt geändert von Perilun am Do 1. Dez 2016, 18:44, insgesamt 1-mal geändert.
Perilun
Beobachter
Beobachter
 
Beiträge: 18
Registriert: Do 16. Jun 2016, 17:34
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression von gruppierten Daten (Treppenfunkti

Beitragvon bele » Mi 30. Nov 2016, 16:05

----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Multiple Regression von gruppierten Daten (Treppenfunkti

Beitragvon Perilun » Do 1. Dez 2016, 18:43



Was würdest du denn genaueres wissen wollen?

Ich habe Messdaten. Insgesamt 60 Stück.

Die Messdaten sind aufgeteilt in 6 Gruppen je 10 Proben.

Ich würde gerne eine Regression zwischen mehreren Messwerten und einer bekannten Größe aufstellen. Die bekannte Größe ist innerhalb der jeweiligen Gruppe ist identisch.

Jetzt weiß ich nicht welche Besonderheiten mit solch eine gruppierte Darstellung der Messdaten einhergeht und was es zu beachten gilt?
Perilun
Beobachter
Beobachter
 
Beiträge: 18
Registriert: Do 16. Jun 2016, 17:34
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression von gruppierten Daten

Beitragvon bele » Do 1. Dez 2016, 19:44

Das war schon sehr viel aussagekräftiger und verständlicher. Ich nehme an, die "bekannte Größe" soll die abhängige Variable sein. Oder soll die Gruppenzugehörigkeit die abhängige Variable sein? Wieviele Einflussvariablen sollen berücksichtigt werden? Kommen alle Regressionsverfahren in Frage oder ist eine lineare Regression vorgegeben? Geht es um die Signifikanz von Prädiktoren oder um Vorhersage? Sollen als Antwort kontinuierliche Ergebnisse herauskommen oder nur die 6 vorgegebenen Stufen? Liegen die Daten schon vor, oder werden sie noch erhoben? Können wir also die Residuen eines ganz einfachen linearen Modells schon sehen?

Das wären die ersten, die mir so einfallen.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: Multiple Regression von gruppierten Daten

Beitragvon Perilun » Fr 2. Dez 2016, 23:07

bele hat geschrieben:Das war schon sehr viel aussagekräftiger und verständlicher. Ich nehme an, die "bekannte Größe" soll die abhängige Variable sein. Oder soll die Gruppenzugehörigkeit die abhängige Variable sein? Wieviele Einflussvariablen sollen berücksichtigt werden? Kommen alle Regressionsverfahren in Frage oder ist eine lineare Regression vorgegeben? Geht es um die Signifikanz von Prädiktoren oder um Vorhersage? Sollen als Antwort kontinuierliche Ergebnisse herauskommen oder nur die 6 vorgegebenen Stufen? Liegen die Daten schon vor, oder werden sie noch erhoben? Können wir also die Residuen eines ganz einfachen linearen Modells schon sehen?

Das wären die ersten, die mir so einfallen.



So viele Fragen :lol:

Es soll eine unterschiedliche Anzahl der Variablen berücksichtigt werden (nicht mehr als 7)

Die bekannte Größe ist die abhängige Größe also y.
Es geht um Vorhersage.

Was die Regressionsverfahren ist angeht, darauf bezieht sich die Frage, ob es mit dem linearen multiplen Regressionsmodell durchgeführt werden kann oder ob es ein besseres Verfahren dafür gibt.
Perilun
Beobachter
Beobachter
 
Beiträge: 18
Registriert: Do 16. Jun 2016, 17:34
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Multiple Regression von gruppierten Daten

Beitragvon PonderStibbons » Sa 3. Dez 2016, 00:51

So viele Fragen :lol:

Was ist daran zum Lachen oder lächerlich?

Es soll eine unterschiedliche Anzahl der Variablen berücksichtigt werden (nicht mehr als 7)
Die bekannte Größe ist die abhängige Größe also y.
Es geht um Vorhersage.
Was die Regressionsverfahren ist angeht, darauf bezieht sich die Frage, ob es mit dem linearen multiplen Regressionsmodell durchgeführt werden kann oder ob es ein besseres Verfahren dafür gibt.

Du solltest erstmal konkret und zusammenhängend und nachvollziehbar
Deine Studie beschreiben. Thema, Fragestellung, Vorgehen bei der Erhebung.
So dass man versteht worum es geht. Mit ein paar Halbsätzen und Bedeutungsfetzen
kann leider niemand etwas anfangen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Multiple Regression von gruppierten Daten

Beitragvon bele » Sa 3. Dez 2016, 13:25

Wenn beim zweiten Mal so wenig kommt, kommt auch meistens später nichts wirklich brauchbares mehr, daher wage ich eine erste Antwort:
Wenn Du 7 Einflussfaktoren hast, musst Du im linearen Modell 8 Koeffizienten schätzen. 8 Koeffizienten aus 60 Datensätzen ist sportlich, aber einen Versuch wert. Wenn Du Glück hast, und die tatsächlich zugrunde liegenden Prozesse sind tatsächlich linear und die Messfehler klein und es gibt keine ausgeprägten Interaktionen, dann kannst Du damit ein gutes prognostisches Modell rechnen.

Wenn die Zusammenhänge zwischen den Prädiktoren und dem vorherzusagenden Wert weniger einfach gestrickt sind und es nur um Vorhersage handelt, dann würde ich (wieder mal) Regressionsverfahren auf der Basis von Entscheidungsbäumen vorschlagen (google mal nach "CART", "CHAID" oder "C4.5" jeweils zusammen mit "Algorithmus" oder "algorithm", außerdem "random-forest"). Damit bekommst Du ohne viel Mühe erstmal ein Regressionsmodell, dass Du einfach anwenden kannst.

Ob das dann auch was taugt, und ob es besser oder schlechter als das lineare Modell ist, ist schon schwerer zu beantworten. Googlen nach "Cross-Validation" könnte dann helfen, oder sich zur Residuen-Analyse belesen.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste