Hallo Zusammen,
ich habe die Suche bedient und erstmal nichts brauchbares gefunden, hoffentlich kann mir jemand von euch helfen.
Und zwar geht es um Folgendes: Ich möchte untersuchen wie sich verschiedene Faktoren auf die Höhe der Investments von Start-Ups auswirken. Dabei habe ich zunächst den Einfluss des Alters eines Start-Ups auf dieses untersucht und einen nichtlinearen Zusammenhang unterstellt - d.h. die Variable "Höhe Investment" logarithmiert. Das alles war ja dann auch noch recht einfach grafisch auswertbar.
Nun zu meinem eigentlichen Problem: Alle weiteren Einflussfaktoren sind nominaler Natur - z.B. Herkunftsland oder Form der Investition. Wenn ich hier eine Regression anwende bekomme ich zwar auch Ergebnisse, deren Interpretation fällt mir aber deutlich schwerer. Woher weiß ich welche Formel ich nutzen muss zum gleichstellen und auflösen, sodass ich am Ende wieder interpretierbare Werte vorliegen habe?
Ich versuche mich aktuell an R. Wenn ich die Regression mit LOG(Höhe Erstinvestition) durchführe komme ich auf diese Werte:
lm(formula = LogHoeheErstinvestiton ~ country_code, data = Data)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.53561 0.04439 282.427 < 2e-16 ***
country_codeALB -0.73282 2.02428 -0.362 0.717343
country_codeARE 0.30133 0.28684 1.051 0.293487
Soweit ich es bisher verstanden habe greift R dabei auf den Logarithmus Naturalis zurück e^ln(x)=x. Wende ich das strickt so auf die Ergebnisse an komme ich auf diesen Wert für meinen Intercept: 278,065.0.
Testhalber habe ich jetzt auch mal noch ohne logarithmus versucht: lm(formula = HoeheErstinvestiton ~ country_code, data = Data). Da komme ich auf einen Wert von 3,199,531.0 .
Also irgendwo habe ich einen riesen Denkfehler...hoffe Ihr könnt mir vielleicht helfen!
Danke Vielmals