Auswerten Ergebnis nichtlineare Regression

Alle Verfahren der Regressionanalyse.

Auswerten Ergebnis nichtlineare Regression

Beitragvon shadevar » Mi 23. Aug 2017, 06:09

Hallo Zusammen,

ich habe die Suche bedient und erstmal nichts brauchbares gefunden, hoffentlich kann mir jemand von euch helfen.
Und zwar geht es um Folgendes: Ich möchte untersuchen wie sich verschiedene Faktoren auf die Höhe der Investments von Start-Ups auswirken. Dabei habe ich zunächst den Einfluss des Alters eines Start-Ups auf dieses untersucht und einen nichtlinearen Zusammenhang unterstellt - d.h. die Variable "Höhe Investment" logarithmiert. Das alles war ja dann auch noch recht einfach grafisch auswertbar.

Nun zu meinem eigentlichen Problem: Alle weiteren Einflussfaktoren sind nominaler Natur - z.B. Herkunftsland oder Form der Investition. Wenn ich hier eine Regression anwende bekomme ich zwar auch Ergebnisse, deren Interpretation fällt mir aber deutlich schwerer. Woher weiß ich welche Formel ich nutzen muss zum gleichstellen und auflösen, sodass ich am Ende wieder interpretierbare Werte vorliegen habe?
Ich versuche mich aktuell an R. Wenn ich die Regression mit LOG(Höhe Erstinvestition) durchführe komme ich auf diese Werte:

lm(formula = LogHoeheErstinvestiton ~ country_code, data = Data)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.53561 0.04439 282.427 < 2e-16 ***
country_codeALB -0.73282 2.02428 -0.362 0.717343
country_codeARE 0.30133 0.28684 1.051 0.293487

Soweit ich es bisher verstanden habe greift R dabei auf den Logarithmus Naturalis zurück e^ln(x)=x. Wende ich das strickt so auf die Ergebnisse an komme ich auf diesen Wert für meinen Intercept: 278,065.0.
Testhalber habe ich jetzt auch mal noch ohne logarithmus versucht: lm(formula = HoeheErstinvestiton ~ country_code, data = Data). Da komme ich auf einen Wert von 3,199,531.0 .
Also irgendwo habe ich einen riesen Denkfehler...hoffe Ihr könnt mir vielleicht helfen!
Danke Vielmals :)
shadevar
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 23. Aug 2017, 05:27
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon strukturmarionette » Mi 23. Aug 2017, 08:42

Hi,

ich habe die Suche bedient und erstmal nichts brauchbares gefunden

- 42

Nun zu meinem eigentlichen Problem: Alle weiteren Einflussfaktoren sind nominaler Natur

- warum ist das für Dich ein Probem? Inwiefern?

d.h. die Variable "Höhe Investment" logarithmiert. Das alles war ja dann auch noch recht einfach grafisch auswertbar.

- warum die UV-Manipulation(en)?
- warum "Hohe Investment" in Hochkommata?
- besser zunächst: Stichproben- und vollständige Variablenbeschreibung, Design, Zielpopulation

ich versuche mich aktuell an R.

http://www.r-forum.de/

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon bele » Mi 23. Aug 2017, 16:44

Hallo shadevar,

bitte verwende für R output code-Tags, sonst ist das kaum lesbar:

Code: Alles auswählen
lm(formula = LogHoeheErstinvestiton ~ country_code, data = Data)
                 Estimate Std. Error t value Pr(>|t|)   
(Intercept)      12.53561   0.04439 282.427 < 2e-16 ***
country_codeALB -0.73282    2.02428  -0.362 0.717343   
country_codeARE  0.30133    0.28684   1.051 0.293487   


Soweit ich es bisher verstanden habe greift R dabei auf den Logarithmus Naturalis zurück e^ln(x)=x.

Falls Du die Variable "LogHoeheErstinvestition" mit der Funktion 'log' berechnet hast, dann ist das der natürliche Logarithmus, ja.

Wende ich das strickt so auf die Ergebnisse an komme ich auf diesen Wert für meinen Intercept: 278,065.0.

Der Intercept im linearen Teil des Modells ist 12,53, wie oben leicht ablesbar. Wie kommst Du jetzt auf 278?

Testhalber habe ich jetzt auch mal noch ohne logarithmus versucht: lm(formula = HoeheErstinvestiton ~ country_code, data = Data). Da komme ich auf einen Wert von 3,199,531.0 .

Spricht irgendwas dagegen, auch hier das summary vom Modell komplett zu posten?


Also irgendwo habe ich einen riesen Denkfehler...hoffe Ihr könnt mir vielleicht helfen!

Vielleicht begründest Du noch, woraus Du das ableitest.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon bele » Mi 23. Aug 2017, 16:56

@strukturmarionette

strukturmarionette hat geschrieben:
d.h. die Variable "Höhe Investment" logarithmiert. Das alles war ja dann auch noch recht einfach grafisch auswertbar.

- warum die UV-Manipulation(en)?


Das Modell wurde so spezifiziert:
Code: Alles auswählen
LogHoeheErstinvestiton ~ country_code

In R bedeutet das, dass LogHoeheErstinvestition die abhängige Variable ist, die durch den country_code vorhergesagt werden soll. country_code ist dabei, das kann man der Form des Outputs entnehmen, eine dreistufige nominale Variabe. R hat daraus zwei Dummy-Variablen für die Werte country_code==ALB und country_code == ARE gemacht.

Das geschätzte Modell ist
Wenn man ALB und ARE auf 0 setzt, beträgt did Erstinvestition .

LG,
Bernhard
Zuletzt geändert von bele am Fr 25. Aug 2017, 10:29, insgesamt 1-mal geändert.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

folgende User möchten sich bei bele bedanken:
shadevar

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon shadevar » Do 24. Aug 2017, 18:13

Hallo und danke für die schnellen Antworten!


d.h. die Variable "Höhe Investment" logarithmiert. Das alles war ja dann auch noch recht einfach grafisch auswertbar.

- warum die UV-Manipulation(en)?
- warum "Hohe Investment" in Hochkommata?
- besser zunächst: Stichproben- und vollständige Variablenbeschreibung, Design, Zielpopulation

Die Manipulation habe ich gewaehlt um eine bessere auswertung zu ermoglichen. Siehe zb an diesem Beispiel:
Mit Log -------------------------- Ohne Log
Bild Bild

Ich bin selbst nur Laie aber ich würde mal sagen, das hat mit einer sehr grossen Streuung der Daten zu tun (?).


ich versuche mich aktuell an R.

http://www.r-forum.de/

So wie ich mein Problem verstehe ist es ja nicht unbedingt eine Frage zu R sondern ehr allgemeiner Natur. Aber danke fuer den Link, ich werde mich auch dort mal noch weiter umschauen - dort gibt es bestimmt einige interessante Threads :)




Wende ich das strickt so auf die Ergebnisse an komme ich auf diesen Wert für meinen Intercept: 278,065.0.

Der Intercept im linearen Teil des Modells ist 12,53, wie oben leicht ablesbar. Wie kommst Du jetzt auf 278?

Sorry, auch hier habe ich leider die falsche Formatierung gewählt. @bele
Es soll 278.065,0 heissen.
Das Modell wurde so spezifiziert:
Code: Alles auswählen
Code: Alles auswählen
LogHoeheErstinvestiton ~ country_code


In R bedeutet das, dass LogHoeheErstinvestition die abhängige Variable ist, die durch den country_code vorhergesagt werden soll. country_code ist dabei, das kann man der Form des Outputs entnehmen, eine dreistufige nominale Variabe. R hat daraus zwei Dummy-Variablen für die Werte country_code==ALB und country_code == ARE gemacht.

Das geschätzte Modell ist
Wenn man ALB und ARE auf 0 setzt, beträgt did Erstinvestition .

Hast du deine Frage gerade selbst beantwortet?

Also irgendwo habe ich einen riesen Denkfehler...hoffe Ihr könnt mir vielleicht helfen!

Vielleicht begründest Du noch, woraus Du das ableitest.


Also wie du vorher schon festgestellt hast betraegt die Erstinvestition beim Intercept ca. 270.000 wenn ich den Logarythmus zurück rechne.
Siehe:
Code: Alles auswählen
LogHoeheErstinvestiton ~ country_code

Wenn ich allerdings das gleiche Modell ohne vorherig angewanten Logarithmus berechene :
Code: Alles auswählen
HoeheErstinvestiton ~ country_code

erhalte ich einen Wert von 3.199.531.
Wie erklärt sich diese Diskrepanz?

Spricht irgendwas dagegen, auch hier das summary vom Modell komplett zu posten?

Spricht nichts dagegen, reiche ich nach sobald ich an einem Computer mit R sitze!


Danke euch vielmals!
shadevar
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 23. Aug 2017, 05:27
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon PonderStibbons » Do 24. Aug 2017, 22:45

Du analysierst Daten weder mit Bezug auf statistische Überlegungen (mangels Kenntnissen - Deine Aussage), noch mit Bezug auf Vorwissen/Theorie/substanzielle Überlegungen hinsichtlich des erforschten Gegenstands.

Wie sieht denn der Kontext aus, warum und wozu führst Du diese Auswertung durch?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Auswerten Ergebnis nichtlineare Regression

Beitragvon bele » Fr 25. Aug 2017, 10:28

shadevar hat geschrieben:
http://www.r-forum.de/

So wie ich mein Problem verstehe ist es ja nicht unbedingt eine Frage zu R sondern ehr allgemeiner Natur. Aber danke fuer den Link, ich werde mich auch dort mal noch weiter umschauen - dort gibt es bestimmt einige interessante Threads :)

Es gibt zwei deutschsprachige Foren zu R. Suche beide und prüfe, wo mehr Threads beantwortet werden, wie lange es zu den Antworten braucht und wo es die kompetenteren Antworten gibt.


shadevar hat geschrieben:Hast du deine Frage gerade selbst beantwortet?

Nein. strukturmarionette hatte Dich gefragt, warum Du die unabhängige Variable manipulierst und ich habe geantwortet, dass Du die abhängige Variable manipulierst, was Deinem Post aber nur zu entnehmen war, wenn man mit R vertraut ist. strukturmarionette hat richtig dick Ahnung von Statistik, aber deshalb ja nicht notwendigerweise davon, wie man Modelle in R spezifiziert. Es soll ja noch zwei, drei oder vier andere Softwareoptionen für das Berechnen von Statistiken geben.


Wie erklärt sich diese Diskrepanz?

Wenn beim linearen Modell das gleiche herauskäme wie beim loglinearen Modell, warum sollte man dann loglineare Modelle überhaupt rechnen? Wozu hast Du eine Logarithmierung vorgenommen, wenn Du denkst, dass Du ohne sie auf das gleiche Ergebnis kommst?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste