Hallo zusammen,
ich schreibe gerade meine Bachelor-Thesis und bin auf ein Problem bei meiner Hypothesenprüfung gestoßen und weiß nicht wie ich damit umgehen soll. Alles was ich online zu dem Thema finde ist sehr komplex und hilft mir nicht wirklich weiter, da meine Abgabe schon nächste Woche ist und ich nicht alles neu machen kann.
Die Studie: Ich untersuche ob sich die Resilienzfaktoren soziale Selbstwirksamkeit und internale Kontrollüberzeugung auf psychisches Leiden allgemein und Covid-19 bedingtes psychisches Leiden auswirken. Alle Variablen messe ich mit metrisch skalierten Instrumenten. Insgesamt habe ich 336 Probanden. Die Zusammenhänge der Variablen wollte ich durch Korrelationen und multiple lineare Regression testen.
Problem: Beim Testen der Voraussetzungen für Korrelation und Regression sind für verschiedene Variablen verschiedene Voraussetzungen nicht gegeben. Nach dem Shapiro-Wilk Test sind alle meine Variablen nicht normal verteilt. Es gibt bei jeder Variable Ausreißer (Boxplot), jedoch weiß ich nicht ab wann ich diese rausnehmen soll, bzw. wie ich das überhaupt anstelle, da es bei fast jeder Variable andere sind. (Ich kann die Daten doch nicht einfach löschen oder?)
Bei der multiplen Regression sind die Varianzen von psychischem Leiden allgemein mit den UVs heterogen. Die Residuen aller Variablen bei der Regression sind auch nicht normal verteilt. Linearer Zusammenhang besteht nach Rainbow-Test nur bei Covid bedingtem Leiden mit den UVs, ansonsten gibt es keinen linearen Zusammenhang.
Wenn ich die verschiedenen Probleme google, werden mir Sachen vorgeschlagen wie die Daten zu transformieren, oder nicht-parametrische Tests zu nehmen, aber da gibt es so viele Möglichkeiten für die einzelnen Methoden und ich weiß nicht mal welche am besten geeignet ist.. Daher bin ich gerade nur noch verwirrt. Ich hoffe es gibt hier ein paar Statistik-Gurus die mir weiterhelfen können. (Übrigens benutze ich R für alles)
Danke schonmal im Voraus