Hallo zusammen,
dies ist mein erstes Thema in diesem Forum und ich freue mich bereits auf den regen Austausch. Leider bin ich noch ein blutiger Anfänger in dem Fachgebiet der Statistik und hoffe eure Zeit nicht zu verschwenden.
Für den Aufbau des GLM´s ist die Grundthese, auf der das Modell beruht, die Abhängigkeiten der Hausmieten (AV, metrisch) von den Ausstattungsmerkmale (UV) und den Lageparametern (UV) des Hauses. Die Ausstattungsmerkmale können hierbei nominal wie bspw. Balkon (Ja/Nein), ordinal wie bspw. Baujahreskategorien und metrisch wie bspw. die Wohnfläche skaliert sein. Der Lageparameter ist ebenfalls nominal skaliert und bezieht sich auf den Standort des Hauses (Stadtteil/Ortsteil).
Insgesamt werden ca. 50.000 Datensätze für die Analyse verwendet, welche jedoch teilweise Lücken in bestimmten Angaben aufweisen. Nun zu meiner Frage!
Laut einem Arbeitskollegen ist die Anwendung eines generalisierten linearen Modells in Form einer LN-Regression sinnvoll. Die Wahrscheinlichkeitsverteilung des Modells ist vermutlich rechtsschief womit ich mich für eine Gamma-Verteilung entschieden habe. Ist diese Auswahl sinnvoll? Und falls ja warum bzw. warum nicht? Wie kann ich die Güte des Modells überprüfen?
Ich freue mich auf eure Antworten!
Mit besten Grüßen
Philipp