STATISTIK-FORUM.de

AdrianO_0101 · von **AdrianO_0101** » Mo 5. Jun 2023, 14:13

Liebe Community,

ich bin neu im Forum, sollte mein Anliegen an anderer Stelle besser aufgehoben sein, wäre ich sehr dankbar über eine Info! :-)

Hintergrund

In Kürze beginne ich mit meiner Masterarbeit, die sich mit dem Thema "Affektives Commitment der Generation Z in einem Energieversorgungsunternehmen" auseinandersetzt. Im Rahmen der Thesis möchte ich mithilfe einer multiplen Regression den Einfluss von mehreren unabhängigen Variablen (ausgewählte Aufgabenmerkmale, Arbeitsbedingungen, organisationale Leistungen wie Arbeitsplatzflexibilisierung und Weiterbildungsangebote) auf die abhängige Variable "affektives organisationales Commitment" untersuchen. Die Abschlussarbeit schreibe ich in Kooperation mit einem Großunternehmen (ca. 3.500 MA, davon schätzungsweise 600 MA, die sich der Gen Z zuordnen lassen). Dabei möchte ich Beschäftigte der Generation Z (Geburtsjahr ab 1995) mithilfe eines Fragebogens befragen, um zu ermitteln welche Bindungsfaktoren einen signifikanten Einfluss auf das affektive Commitment dieser Beschäftigten im dem Unternehmen haben. Mein Professor war mit den bisherigen Überlegungen einverstanden und empfahl mir maximal 10 (besser 8) unabhängige Variablen in die Regression einzubeziehen und teilte mir die Daumenregel von 10 Probanden /unabhängiger Variable mit. Jedoch soll ich bis zur Anmeldung Informationen zur Stichprobengröße und erwartbaren Varianz im Antwortverhalten in Erfahrung bringen.

Problem 1
Stichprobenumfang: Diesen möchte ich gerne mit dem Tool G*Power ermitteln. Im Anhang habe ich einen Screenshot mit den erwarteten Parametern angehangen. Jedoch bin ich mir insb. hinsichtlich der effect size unsicher. Grundsätzlich orientiert sich meine geplante Untersuchung an der Publikation von Drescher & Warszta (2021), d.h. einige Faktoren der Arbeitssituation werde ich ebenfalls untersuchen, zusätzlich jedoch auch Aspekte der Organisation). In ihrer Untersuchung haben die Autoren ein R2 = 0.45 ermittelt, welches ich testweise als möglichen Anhaltspunkt für die zu erwartende Teststärke in meiner Untersuchung herangezogen habe. Nutze ich Cohens (1992) Gleichung für die Effektstärke erhalte ich f2= 0.82, was offensichtlich auf einen sehr großen Effekt hindeutet. Würde ich ein derart starken Effekt annehmen, würde sich mein Stichprobenumfang auf nur n=40 reduzieren. Wäre es hierbei sinnvoller, von einem mittleren Effekt f2 = 0.15 auszugehen? Wäre ich mit einem Stichprobenumfang von n= 100 oder n= 150 schon in einem akzeptablen Bereich?

Problem 2
Ausreichend Varianz im Antwortverhalten: Meinem Professor zufolge soll ich überlegen, ob ausreichend Varianz beim Antwortverhalten zu erwarten ist (also sinngemäß, dass bspw. die Arbeitssituation, sozialer Kontext/Arbeitsbedingungen, organisationale Leistungen nicht von allen Probanden gleich beantwortet werden), so dass die Regression sinnvoll zu rechnen ist. Meine theoretischen Überlegungen hierzu sind:
- Untersuchte Gen Z-Beschäftigte stammen aus sehr unterschiedlichen Tätigkeitsbereichen. Diese umfassen nahezu die gesamte Bandbreite an administrativen, betrieblichen Tätigkeitsfeldern (z.B. Kommunikation, Finanzen, HR, Logistik) als auch eine Vielzahl an technischen Feldern (IT, Instandhaltung, Kraftwerksbereich...)
- Untersuchte Gen Z-Beschäftigte sind in unterschiedlichen Beschäftigungsverhältnissen beschäftigt. Auszubildende über Studierende (z.B. Praktikanten, Werkstudierende & Masteranden) hin zu Trainees und klassischen Berufseinsteigern mit Festanstellung sollten sich erheblich in ihrer Arbeitssituation unterscheiden (z.B. Autonomiegrad, Sinnhaftigkeit der Arbeit). Darüber hinaus bestehen auch Unterschiede bzgl. Zugang zu organisationalen Leistungen (z.B. Weiterbildungsangebote, Arbeitsplatzflexibilisierung)
- Die zu befragenden Gen Z - Beschäftigten stammen mitunter aus verschiedenen Tochtergesellschaften und sind zumeist auf unterschiedliche Teams verteilt --> d.h. die zu untersuchenden Beschäftigten sind nicht alle in einer einzigen Abteilung oä. verortet, wodurch ebenfalls Unterschiede in der Arbeitssituation denkbar sind.

Sind das nachvollziehbare Überlegungen? Falls nein, gebe es Möglichkeiten mehr Varianz im Antwortverhalten gewährleisten zu können?

Über eure Antworten würde ich mich sehr freuen! :-)

Freundliche Grüße

bele · von **bele** » Mo 5. Jun 2023, 16:55

Hallo Adrian,

bei der Poweranalyse musst Du aufpassen. Der Teil mit dem n = 40 deutet darauf hin, dass Du eine Fallzahl berechnest, mit der die Regression als ganzes signifikant wird. Dir scheint es aber nicht besonders wichtig, ob das Modell als ganzes signifikant wird, sondern ob einzelne Prädiktoren signifikant werden. Dafür ist es unter anderem auch relevant, wie stark die einzelnen Prädiktoren miteinander korrellieren. Ich könnte mir gut vorstellen, dass es unzufriedene Mitarbeiter gibt, die sowieso alles doof finden und sehr zufriedene, die mit allem glücklich sind. Dann wäre Multikollinearität zu erwarten und viel größere Fallzahlen erforderlich.

Ich weiß auch nicht, ob "Signifikanz" ein besonders schlaues Entscheidungskriterium ist, welche Prädiktoren jetzt besonders wichtig sind.

Zuletzt wäre ich sehr vorsichtig mit der causalen Zuschreibung. Ich verstehe nichts von Deinem Forschungsthema oder auch nur von Deinem Forschungsgebiet oder auch nur von Deiner Wissenschaft. Für mich als Laien ist es denkbar, dass Sinnhaftigkeit der Arbeit dazu führt, dass ich mich emotional mit der Firma committe. Ich könnte mir aber auch vorstellen, dass hohes emotionales Commitment mit der Firma mir das Gefühl gibt, dass meine Arbeit sinnvoll sei.

Just my two cent, ich hoffe auch das sind nachvollziehbare Erwägungen.

LG,
Bernhard

folgende User möchten sich bei bele bedanken:
AdrianO_0101

AdrianO_0101 · von **AdrianO_0101** » Mo 5. Jun 2023, 18:26

Hallo Bernhard,

zunächst einmal vielen Dank für deine Antwort!

Aber um den notwendigen Stichprobenumfang zu berechnen muss ich doch i.d.R. das gewünschte R^2 des Gesamtmodells miteinbeziehen, oder? Dass ich mir die Korrelationen der einzelnen Prädiktoren anschauen sollte, um bspw. Hinweise auf mögliche Multikollinearität zu erhalten, habe ich auch gelesen. Jedoch dachte ich, dass Multikollinearität insb. auf die Redundanz bzw. starke inhaltliche Überlappung der Prädiktoren zurückzuführen sei (z.B. wenn ich Sinnhaftigkeit und Bedeutsamkeit der Arbeitsaufgabe als zwei unabhängige Variablen aufnehmen würde)? Hättest du eine Anregung unter welchen Parametern ich den Stichprobenumfang schätzen kann? Wie ist deine Einschätzung zu Problem 2?

Danke für den Tipp bezüglich der kausalen Zuschreibung, das merke ich mir für die Diskussion! Jedoch muss ich ja im Rahmen der Hypothesenbildung eines der beiden Konstrukte als unabhängige Variable modellieren. In den Publikationen die ich gelesen habe, wird Sinnhaftigkeit der Arbeit üblicherweise als verursachender Faktor beschrieben, aber deine Überlegungen zu einer möglichen gegenseitigen Beeinflussung ergeben absolut Sinn.

Liebe Grüße
Adrian

PonderStibbons · von **PonderStibbons** » Mo 5. Jun 2023, 20:21

R² von 0,45 bedeutet R = 0,67. Wenn man das Fehlerrauschen aufgrund der sicher nicht sehr reliablen Messinstrumente mit einbezieht, ist das fast eine perfekte Vorhersage im Rahmen dessen, was möglich ist. Da würde ich vermuten, es liegen gravierende methodische Fehler vor, und/oder absichtliche oder unabsichtliche Verzerrungen bei der Analyse, und/oder die Ergebnisse sind trivial-banal. Ich würde jedenfalls nicht davon ausgehen, dass das unbedingt nochmal so hinkommt.

Meinem Professor zufolge soll ich überlegen, ob ausreichend Varianz beim Antwortverhalten zu erwarten ist

Wenn Z mit 1995 anfängt, betrifft das in einem Unternehmen aktuell Leute von 16 bis 28, das sollte doch für Varianz sorgen.

Oder nimm 120 Leute aus einer anderen "Generation" hinzu und rechne die Wechselwirkungen zwischen "Generation" und den Prädiktoren.
Es wäre vielleicht nicht uninteressant zu wissen, ob die gefundenen Einflussfaktoren überhaupt Z-spezifisch sind.

folgende User möchten sich bei PonderStibbons bedanken:
AdrianO_0101

AdrianO_0101 · von **AdrianO_0101** » Mo 5. Jun 2023, 21:12

Hallo PonderStibbons,

vielen Dank für deine Antwort! :-)

Bei der Referenzstudie wurden nahezu durchweg Skalen aus validierten Fragebögen genutzt und die Cronbach Alphas betrugen für sämtliche Konstrukte mindestens 0.77. Als Laie kann ich aktuell noch nicht wirklich erkennen, an welcher Stelle hier gravierende methodische Fehler vorliegen :-(

Was meinst du in diesem Zusammenhang mit trivial-banal? Ich würde die Studie gerne der Antwort anhängen, nur leider ist das Kontingent für Dateianhänge vollständig ausgenutzt.

Höchstwahrscheinlich sind die gefundenen Einflussfaktoren nicht z-spezifisch. In der Generationenforschung gibt es gegenwärtig eine lebhafte Debatte darüber, ob es so etwas wie Generationen-Effekte bzw. erhebliche Generationen-Unterschiede tatsächlich gibt; da letztere ja auch durch Alters- oder Periodeneffekte begründet sein können, was in klassischen Querschnittstudien nicht erfasst wird. Nichtsdestotrotz ist es aus Sicht eines Arbeitgebers ja wichtig zu wissen, welche Faktoren positiv mit der Bindung dieser jungen Zielgruppe zusammenhängen um mögliche Anhaltspunkte für Interventionen abzuleiten. Mein Ansatz ist es eher, abzuleiten welche Faktoren (i.s.V. Arbeitswerten) für die Generation Z laut aktuellen Forschungsstand besonders wichtig sind und zu testen ob diese im Zusammenhang mit deren emotionaler Bindung stehen. Im Grunde genommen würde meine Arbeit damit idealerweise bestehende Einflussfaktoren der Commitment-Forschung bestätigen und zeigen, dass diese auch für die jüngste Generation Z (in unserem Unternehmen) Bestand haben.

Wäre das trivial, denn im Grunde geht es wahrscheinlich primär um die Replikation bestehender Erkenntnisse der Commitmentforschung, nur eben bezogen auf die Generation Z.

Liebe Grüße
Adrian

bele · von **bele** » Di 6. Jun 2023, 12:20

Hallo Adrian,

Als Laie kann ich aktuell noch nicht wirklich erkennen, an welcher Stelle hier gravierende methodische Fehler vorliegen

PonderStibbons hat nicht geschrieben, dass Du das erkennen sollst. Er hat lediglich geschrieben dass Du sehr vorsichtig sein solltest aus hohen R^2-Werten in einer Publikation auf ähnlich hohe in Deiner Studie rückzuschließen. Hohe R^2-Werte entstehen, wenn man sehr viele Prädiktoren pro Beobachtung nutzt, hohe R^2-Werte entstehen, wenn man aus Länge und Umfang eines Menschen auf sein Gewicht schließt (Ponder schreibt "trivial-banal") und zufällig hohe R^2 werden durch publication bias besonders sichtbar. Und...und...und...

AdrianO_0101 hat geschrieben:Aber um den notwendigen Stichprobenumfang zu berechnen muss ich doch i.d.R. das gewünschte R^2 des Gesamtmodells miteinbeziehen, oder?

Erstens musst Du das R^2 realistisch abschätzen und da zeigt die Erfahrung nunmal, dass man mit publizierten Werten aus Vorstudien vorsichtig sein muss. Zweitens führt das zu einer Fallzahl, in der das Gesamtmodell mit einer gegebenen Power signifikant wird. Das Signifikantwerden des Gesamtmodells lässt noch keine Rückschlüsse darauf zu, wieviele Prädiktoren damit signifikant werden können. Da ich ja ohnehin die Signifikanz eines Prädiktors für ein fragwürdiges Kriterium halte, hätte ich kein Problem damit. Bitte sag mir, dass die Wichtigkeit eines jeden Prädiktors nicht durch Sortieren nach p-Wert bestimmt werden wird.

Jedoch dachte ich, dass Multikollinearität insb. auf die Redundanz bzw. starke inhaltliche Überlappung der Prädiktoren zurückzuführen sei

Das ist schon richtig. Aber wenn Du nach Sinnhaftigkeit der Arbeit und nach Teamgeist. Dann sind das für Dich vielleicht zwei ganz verschiedene Fragen. Die Teilnehmer könnten aber ihre Arbeit sinnhaft finden, weil sie etwas für das Team tun können und schon hängen beide thematisch ganz nah beieinander, ohne dass Dir das bei der Formulierung der Items klar war.

Hättest du eine Anregung unter welchen Parametern ich den Stichprobenumfang schätzen kann?

Für mich ist das mit der Fallzahlschätzung alles die dunkle Seite der Macht. Ehrlicherweise würde ich mir überlegen, wieviele Fälle ich erreichen kann und dann die Poweranalyse so drehen, dass das rauskommt, was ich für machbar halte. Das sagt natürlich keiner laut. Wenn Du mit der Machbarkeit bei unter zehn Fällen pro Prädiktor ankommst solltest Du aber ins Grübeln kommen. Die Faustregel ist so schlecht nicht.

Wie ist deine Einschätzung zu Problem 2?

Da ich nichgs über die Betriebe und Gen Z und Arbeitsmotivation weiß, enthalte ich mich da einer Meinung.

Danke für den Tipp bezüglich der kausalen Zuschreibung, das merke ich mir für die Diskussion!

Das wird bestimmt nicht falsch sein. Und wenn Du dieses Jahr noch eine längere Reise vor Dir hast empfehle ich das Hörbuch "The book of Why" von Judea Pearl. Gibt es auch gedruckt und gebunden. Die Chancen stehen gut, dass Du das bisher in Statistik gelernte danach nochmal ganz anders einordnest und einsetzt.

Jedoch muss ich ja im Rahmen der Hypothesenbildung eines der beiden Konstrukte als unabhängige Variable modellieren.

Das eine hat mit dem anderen nichts zu tun. Wenn nachts der Hahn kräht kann ich vorhersagen, dass bald die Sonne aufgeht. Dafür muss ich keinesfalls annehmen, dass die Sonne aufgeht weil der Hahn kräht. Meine Modellbeziehung und mein Glaube über Kausalität sind zwei ganz verschiedene Dinge.

In den Publikationen die ich gelesen habe, wird Sinnhaftigkeit der Arbeit üblicherweise als verursachender Faktor beschrieben

Das ist eine valide Argumentation. Expertenmeinungen können Kausalitätsannahmen begründen, Regressionsrechnungen dagegen nicht.

aber deine Überlegungen zu einer möglichen gegenseitigen Beeinflussung ergeben absolut Sinn.

Freut mich, manchmal versteht auch der Laie etwas richtig.

LG,
Bernhard

AdrianO_0101 · von **AdrianO_0101** » Mi 7. Jun 2023, 09:28

Hallo Bernhard,

vielen Dank für deine Antwort!

Für mich ist das mit der Fallzahlschätzung alles die dunkle Seite der Macht. Ehrlicherweise würde ich mir überlegen, wieviele Fälle ich erreichen kann und dann die Poweranalyse so drehen, dass das rauskommt, was ich für machbar halte. Das sagt natürlich keiner laut. Wenn Du mit der Machbarkeit bei unter zehn Fällen pro Prädiktor ankommst solltest Du aber ins Grübeln kommen. Die Faustregel ist so schlecht nicht.

Ich habe mit mehreren Kollegen gesprochen und diese gehen davon aus, dass ein Umfang von 100 - 150 Teilnehmern realistisch möglich ist und wir verschiedene Möglichkeiten haben um die Teilnahmequote im Problemfall zu erhöhen. Gibt es für die Parameter jedoch so etwas wie etablierte (vorsichtige) Daumenregeln? In Backhaus et al. (2021) habe ich gelesen, dass als Alpha oft 0.05 und für die Power 0.8 angenommen werden. In Online-Quellen wird für die Power oftmals 0.95 angenommen. Wäre ein Power-Wert von 0.8 in einer Masterarbeit vertretbar? Ein Power-Wert von 0.8 würde doch implizieren, dass mein beta bei 0.2 (also die Wahrscheinlichkeit dass ich meine Nullhypothese fälschlicherweise beibehalte), ist das nicht schon eine arg hohe Fehlerwahrscheinlichkeit?

Ist es zudem grundsätzlich möglich, dass ich in meinem Fragebogen bspw. zunächst 10 unabhängige (aus der Theorie abgeleitete) Variablen erfasse, aber die Regression ggf. nur mit 8 unabhängigen Variablen rechne (die entsprechenden Hypothesen dementsprechend auch aus der Arbeit entferne), sofern mein Stichprobenumfang eher im unteren Bereich meiner Schätzung liegen sollte (z.B. 100 Teilnehmer)? Oder wäre das schlichtweg falsch/unwissenschaftlich?

Denkt ihr es wäre eine sinnvolle Überlegung die Anzahl meiner theoriegeleiteten Prädiktoren von 10 auf 8 Variablen zu reduzieren und lieber 2-3 Kontrollvariablen aufzunehmen (z.B. Alter, Art des Beschäftigungsverhältnisses, ggf. Geschlecht). Es ist ja denkbar, dass bspw. die Art des Beschäftigungsverhältnisses (Ausbildung, Praktikum, Traineeship, klassische Festanstellung) bedeutend mit einigen der unabhängigen Variablen (z.B. Autonomiegrad, Bedeutsamkeit/Sinnhaftigkeit der Arbeitsaufgabe, Zugang zu HR-Angeboten) und dem affektiven Commitment (abhängige Variable) korreliert.

Mein Hauptanliegen ist es letztlich, dass idealerweise möglichst viele meiner Prädiktoren signifikant werden, kein zu hohes Maß an Multikollinearität auftritt und ich die Prädiktoren anhand ihrer Beta-Koeffizienten vergleichen kann und in Kombination mit bisheriger Fachliteratur daraus mögliche Implikationen für meinen Arbeitgeber ableiten kann. Ist das zu einfach gedacht? Entschuldigt bitte, dass ich euch so mit Fragen bombardiere, aber ich habe das Gefühl, wenn ich jetzt bei der Modellierung und Stichprobenplanung einen groben Fehler mache, mir das mächtig auf die Füße fallen kann.

PS: Habt ihr Tipps wie idealerweise mit der Operationalisierung vorzugehen ist? Skalen lassen sich meist deutlich einfacher in englischer Sprache finden. Mein Professor meinte es sei ok, würde ich diese einfach übersetzen und ein Reliabilitätsmaß angeben. Die Übersetzung derartiger Skalen wird ja aber üblicherweise mit sehr viel Aufwand betrieben (z.B. Rückübersetzungen, Test durch Muttersprachler) und ist alles andere als trivial. Würdet ihr empfehlen soweit wie möglich nur auf etablierte deutschsprachige Instrumente zu setzen? Ich habe überlegt vorzugsweise nur validierte und von der Forschungscommunity anerkannte Skalen zu nutzen (z.B. Deutsche Übersetzung des Work Design Questionnaires, ggf. Skalen aus dem Hogrefe Testzentrum oder der Zeitschrift für Arbeits- & Organisationspsychologie).

Liebe Grüße
Adrian

bele · von **bele** » Mi 7. Jun 2023, 12:36

Hallo Adrian,

AdrianO_0101 hat geschrieben:Ich habe mit mehreren Kollegen gesprochen und diese gehen davon aus, dass ein Umfang von 100 - 150 Teilnehmern realistisch möglich ist und wir verschiedene Möglichkeiten haben um die Teilnahmequote im Problemfall zu erhöhen.

Es handelt sich um eine Beobachtungsstudie, bei der niemand schaden nimmt. Nicht um eine Klinische Studie, in der Teilnehmer vielleicht zur schlechteren Behandlung randomisiert werden. Es spricht also ethisch nichts gegenmöglichst große Stichproben und Du tust Dich in allem nachher statistisch immer leichter, wenn die Stichprobe möglichst groß ist. Streng Dich wirklich an, die Stichprobe so groß wie möglich zu machen (ohne die Qualität der Daten zu mindern). Das ist der eine Tipp, den wir Dir geben können.

Ein Power-Wert von 0.8 würde doch implizieren, dass mein beta bei 0.2 (also die Wahrscheinlichkeit dass ich meine Nullhypothese fälschlicherweise beibehalte), ist das nicht schon eine arg hohe Fehlerwahrscheinlichkeit?

Selbst wenn der Effekt so hoch wäre, würdest Du in in 1 von 5 Studien nicht finden und wahrscheinlich ist der Effekt nicht so hoch, wie Du ihn studienbasiert annimmst. Persönlich erscheinen mir die 80% daher auch immer viel zu wenig. Da teile ich Deine Auffassung. Nichtsdestoweniger sind die 80% ein etablierter Wert. Um an das oben gesagt anzuknüpfen: Ich glaube ohnehin nicht, dass Du einen guten Grund hast, diese und keine andere Effektstärke anzunehmen daher kannst Du mit Effektstärken und Power solange herumspielen, dass die 150 herauskommen, die Du für vernünftig erreichbar hälst und die auch im Rahmen der beschriebenen Daumenregel eher auf der sicheren Seite ist.

Ist es zudem grundsätzlich möglich, dass ich in meinem Fragebogen bspw. zunächst 10 unabhängige (aus der Theorie abgeleitete) Variablen erfasse, aber die Regression ggf. nur mit 8 unabhängigen Variablen rechne (die entsprechenden Hypothesen dementsprechend auch aus der Arbeit entferne), sofern mein Stichprobenumfang eher im unteren Bereich meiner Schätzung liegen sollte (z.B. 100 Teilnehmer)? Oder wäre das schlichtweg falsch/unwissenschaftlich?

Dagegen könnte man wenig einwenden, wenn das präspezifiziert ist, d. h. so im Studienprotokoll steht. Es wird Dir aber nicht automatisch leicht fallen, die Kriterien dafür zu begründen. Persönlich fände ich es gut, wenn es solche Vorab-Regelungen für den Fall unbefriedigender Rekrutierung regelhaft gäbe, gesehen habe ich das aber noch nie.

Denkt ihr es wäre eine sinnvolle Überlegung die Anzahl meiner theoriegeleiteten Prädiktoren von 10 auf 8 Variablen zu reduzieren und lieber 2-3 Kontrollvariablen aufzunehmen (z.B. Alter, Art des Beschäftigungsverhältnisses, ggf. Geschlecht). Es ist ja denkbar, dass bspw. die Art des Beschäftigungsverhältnisses (Ausbildung, Praktikum, Traineeship, klassische Festanstellung) bedeutend mit einigen der unabhängigen Variablen (z.B. Autonomiegrad, Bedeutsamkeit/Sinnhaftigkeit der Arbeitsaufgabe, Zugang zu HR-Angeboten) und dem affektiven Commitment (abhängige Variable) korreliert.

Das kommt darauf an, wie Du Dir den Einfluss dieser Kontrollvariablen vorstellst. Nehmen wir Geschlecht und Ausbildung. Stellst Du Dir die Wirkkette eher so vor:

Geschlecht --> Ausbildung --> Commitment (1)

oder so

Ausbildung --> Commitment <-- Geschlecht (2)

Wenn das Geschlecht nur auf Ausbildung wirkt wie in (1) , dann reicht es völlig, Ausbildung allein in die Regression zu nehmen. Dann würdest Du den Effekt von Ausbildung nur verwässern. Dann wäre die Hinzunahmen von Geschlecht ein Fehler. Wirkt Geschlecht hingegen nur direkt auf das Commitment (2), dann kannst du Commitment vom Effekt von Geschlecht bereinigen und so den Zusammenhang zwischen Ausbildung und Commitment leichter nachweisen und Simpsons Paradox vermeiden.

und ich die Prädiktoren anhand ihrer Beta-Koeffizienten vergleichen kann und in Kombination mit bisheriger Fachliteratur daraus mögliche Implikationen für meinen Arbeitgeber ableiten kann. Ist das zu einfach gedacht?

Das kommt darauf an. Nehmen wir an, wir haben zwei wirklich starke Einflussfaktoren die miteinander korrelieren und einen schwächeren, der mit den beiden anderen nicht korrelliert: Dann kann es sein, dass Deine Regression den starken Einfluss der ersten beiden auf zwei eher kleine Koeffizienten verteilt und dem dritten einzigartigen sein ganzes Gewicht im Koeffizienten zugesteht. Das kann man gut oder schlecht finden: Du könntest einen starken auf verschiedene Aspekte Einfluss übersehen, weil ein schwächerer nur durch einen einzigen Aspekt abgebildet wird. Die Option, einen starken Einfluss zu übersehen ist sicher doof, wenn aber die Frage lautet, welchen einzelnen Faktor sollte ich verändern, dann könnte das vielleicht passen.

Ich mache Dir einen Gegenvorschlag: Stell Dir vor es gäbe eine Form der linearen Regression, die nicht nur nach kleinsten Quadraten strebt sondern auch danach, möglichst kleine Koeffizienten zu produzieren, selbst wenn das den Fit verschlechtert. Man könnte ihr eine Art Daumenschrauben anlegen kann die sie dazu zwingt, möglichst wenige Prädiktoren überhaupt zu verwenden. Wie stark wir die Daumenschrauben anziehen können wir über einen Parameter $\lambda$ (lambda) einstellen. Ziehen wir $\lambda$ voll an, dann setzt das Modell alle Koeffizienten auf Null. Lassen wir mit $\lambda$ etwas nach, dann gibt es irgendwann einen Prädiktor, der nicht mehr Null ist. Das ist die Stelle, an der Dein Abnehmer zuerst ansetzen sollte. Lassen wir $\lambda$ immer weiter locker, dann kommen nach und nach die anderen Prädiktoren mit einem Koeffizienten ungleich Null nach und wenn Dein Kunde den ersten und den zweien Parameter angegangen ist, dann könnte er sich den aussuchen, der als drittes einen Koeffizienten bekommen hat. Würde das für Dich logisch klingen? Wärest Du dafür bereit, Dich in eine Regressionsform einzuarbeiten, die Du in Deinem Statistikkurs noch nicht hattest? Das ist eine ehrliche Frage auf die verschiedene Antworten möglich sind.
Ich sage nicht, dass das die eine richtige Antwort ist. Wahrscheinlich gibt es die eine richtige Antwort nicht, aber so könnte ich mir eine Herangehensweise vorstellen.

Entschuldigt bitte, dass ich euch so mit Fragen bombardiere, aber ich habe das Gefühl, wenn ich jetzt bei der Modellierung und Stichprobenplanung einen groben Fehler mache, mir das mächtig auf die Füße fallen kann.

Keine Entschuldigung erforderlich und was Dein Gefühl angeht, damit hast Du völlig Recht. Wenn Du Dir das jetzt wirklich gründlich überlegst steigen Deine Chancen, dass die Studie nachher einfach nur noch geradeaus läuft enorm. Später kommt die Zeit für Fleiß und Masse, jetzt ist gründliches Denken angesagt.

PS: Habt ihr Tipps wie idealerweise mit der Operationalisierung vorzugehen ist?

Da halte ich mich heraus. Vielleicht haben PonderStibbons oder Holger eine Meinung?

LG,
Bernhard

STATISTIK-FORUM.de

Multiple Regression - Stichprobenumfang

Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Re: Multiple Regression - Stichprobenumfang

Wer ist online?