Problem bei Normalverteilung- Programm Statistica

Alle Verfahren der Regressionanalyse.

Problem bei Normalverteilung- Programm Statistica

Beitragvon sudem100 » Sa 4. Mär 2017, 19:57

Hallo liebe Statistiker,

ich habe leider nicht so viel Ahnung von Statistik und daher wollte ich euch gern fragen.
Kurz zu meiner Studie: Anzahl: 267 Patienten.Ich untersuche ob bestimmte Patientenfaktoren, wie Alter Geschlecht, Größe, Gewicht (unabhängige Variablen) Einfluss auf einen bestimmten TSH Blutwert (abhängige Variable) haben. Später soll ich eine Formel herausfinden, die diesen Blutwert voraaussagt, wenn ich die Patientenfaktoren da eingebe.

Zur Statistik: Ich nutze das Programm: Statistica. Ich soll eine lineare Regression rechnen, wo ich den Einfluss jeder unabhängigen Variable auf den TSH Blutwert untersuche.
Dann mit den Variablen, die einen signifikanten Einfluss haben, eine multiplen Regression durchführen. Dadurch dann herausfinden, welche Variable den größten Einfluss auf den Blutwert hat und eine Formel aufstellen mit beta usw. Wenn ich die Patientenfaktoren in die Formel eingebe, käme dann der Blutwert heraus.

Als Voraussetzung für die lineare Regression sollen die Variablen normalverteilt sein. Am besten mit dem Shapiro Wilk Test oder Kolmogorov Smirnov Test überprüfen.

Und hier ist mein Problem. Wenn ich die Variablen direkt eingebe, ist keines der Variablen normalverteilt (obwohl laut Histogram sehr ähnlich).
Ich habe schon gelesen, dass nicht die Variablen, sondern die Residuen normalverteilt sein müssen. (Was Residuen sind habe ich immernoch nicht ganz verstanden).
Ich weiss leider nicht, wie ich in Statistica die Residuen von den Variablen herausbekomme, um die dann auf Normalverteilung zu testen.

Es ist wohl im Bereich "Multiple Regression" versteckt. Ich habe es auch einmal versucht einzugeben, aber ich weiss nicht, ob es so richtig ist. Vielleicht könnt ihr mir das beantworten:
Ich habe bei der multiplen Regression eingegeben: Abhängige Variable: Blutwert
Unabhängige Variable: Alter
-> Residualanalyse -> Residuen/Prognose speichern -> (dann darf man eine Variable eingeben, egal welche) z.B. Blutwert TSH
Dann kommt eine Tabelle mit den Überschriften "Blutwert TSH" "Prognose" "Residuen" "StandardPredicted" "StandardResiduen"
Dann könnte ich "Residuen" auf Normalverteilung testen. Oder nimmt man standardisierte Residuen?

Ich fasse einmal meine Probleme und Fragen zusammen:
- Muss ich ALLE Variablen / Residuen auf Normalverteilung testen?
- Wie kann ich das machen?
- Ist es richtig, dass ich über den Menüpunkt "Multiple Regression" auf die Residuen komme?

Ich würde mich sehr über Hilfe freuen, denn ich verzweifel langsam:(
sudem100
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: Sa 4. Mär 2017, 18:46
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Problem bei Normalverteilung- Programm Statistica

Beitragvon PonderStibbons » Sa 4. Mär 2017, 22:16

Hallo liebe Statistiker,

Gibt es hier nicht.
ich habe leider nicht so viel Ahnung von Statistik

Ich soll eine lineare Regression rechnen,

Dann wäre natürlich die Frage naheliegend, wieso Du Dir zumutest, etwas durchzuführen, wofür Dir die Voraussetzungen fehlen?

Als Voraussetzung für die lineare Regression sollen die Variablen normalverteilt sein.

Nein, das ist falsch. Normalverteilung der Residuen ist ab n > 30 nicht erforderlich, um die Gültigkeit es F-Tests der Regression sicherzustellen. (Stichwort "zentraler Grenzwertsatz").

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste

cron