Richtiges statistisches Verfahren

Fragen, die sich auf kein spezielles Verfahren beziehen.

Richtiges statistisches Verfahren

Beitragvon Tazh » So 22. Mai 2022, 21:24

Liebe alle
Ich untersuche aktuell den Zusammenhang zwischen zwei Altersangaben mit der Hypothese "Je älter bei x, desto älter bei y". Ich habe dabei die Hypothese, dass die jeweiligen Altersjahre zusammenhängen.
Diese Teilstichprobengrösse ist dabei sehr klein (n = 8).
Zunächst wollte ich eine lineare Regression berechnen (da gemäss meiner Hypothese x y beeinflussen würde), bin mir jedoch aktuell unsicher, ob dies mit Altersangaben überhaupt möglich ist (da Alter in Jahren zur Verhältnisskala zählen)? Oder müsste ich eine Rangkorrelation rechnen?

Zudem habe ich das Problem, dass deskriptiv gesehen es zwar eine 50-75%ige Übereinstimmung gibt, wenn man das Alter +/- 1 Jahr analysiert (à la Personen, die älter/jünger sind bei x, sind auch bei y älter/jünger), jedoch wird die lineare Regression nicht signifikant. Ich habe zunächst an Bootstrapping gedacht - würde dies überhaupt funktionieren bei dieser kleinen Stichprobe?
Und gibt es eine Möglichkeit, diesen erwünschten Range (jeweils +/- 1 Jahr gilt als Treffer) miteinzuschliessen?

Oder gäbe es ein Test, der besser geeignet wäre für diese Fragestellung?

LG
Tazh
P.S. leider ist es mir aufgrund der Besonderheiten der Teilnehmer nicht möglich, mehr Teilnehmer zu finden und meine Stichprobe zu vergrössern.
Tazh
Einmal-Poster
Einmal-Poster
 
Beiträge: 1
Registriert: So 22. Mai 2022, 20:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Richtiges statistisches Verfahren

Beitragvon bele » So 22. Mai 2022, 22:27

Hallo Tazh,

Tazh hat geschrieben:Ich untersuche aktuell den Zusammenhang zwischen zwei Altersangaben mit der Hypothese "Je älter bei x, desto älter bei y".

Da bietet sich eine Rangkorrelation nach Spearman an.

Zunächst wollte ich eine lineare Regression berechnen (da gemäss meiner Hypothese x y beeinflussen würde), bin mir jedoch aktuell unsicher, ob dies mit Altersangaben überhaupt möglich ist (da Alter in Jahren zur Verhältnisskala zählen)?


Warum sollte Verhältnisskalenniveau gegen eine lineare Regression sprechen?

Oder müsste ich eine Rangkorrelation rechnen?


Die würde Deiner Hypothese am besten entsprechen, weil Du ja nur einen "je-desto"-Zusammenhang und nicht unbedingt einen linearen Zusammenhang annimmst. Wenn Du gerne Regressionsrechnung machen möchstest, kannst Du auch Rangdaten für die Regression einsetzen.

Zudem habe ich das Problem, dass deskriptiv gesehen es zwar eine 50-75%ige Übereinstimmung gibt, wenn man das Alter +/- 1 Jahr analysiert


Den Satz verstehe ich leider nicht. Da es sich nur um 8 Wertepaare handelt, könntest Du die auch einfach konkret angeben. Dann haben wir das konkreteste Bild.

jedoch wird die lineare Regression nicht signifikant.


Das kann auch bei deutlichen Effekten bei so einer kleinen Stichprobe durchaus vorkommen.

Ich habe zunächst an Bootstrapping gedacht - würde dies überhaupt funktionieren bei dieser kleinen Stichprobe?


Grundsätzlich lassen sich aus 8 Beobachtungen über 16 Mio Bootstrapsamples ziehen. Daran scheitert es also nicht. Andererseits geht man beim Bootstrapping ja davon aus, dass die Beobachtungen als Repräsentanten der beobachteten Verteilung gelten und dass die mit 8 Beobachtungen ausreichend dargestellt ist, daran muss man schon glauben.

Und gibt es eine Möglichkeit, diesen erwünschten Range (jeweils +/- 1 Jahr gilt als Treffer) miteinzuschliessen?


Das mit diesem Range habe ich schon oben nicht verstanden. Bitte erkläre nochmal, wie Du Dir das denkst.

Oder gäbe es ein Test, der besser geeignet wäre für diese Fragestellung?


Also ich fände alles andere als Spearman oder Kendall müsste man erklären, warum man sowas ausgefallenes anstelle der Standardmethoden macht.
Ich habe noch nicht genau verstanden, wie Du das bootstrappen willst, aber aus 8 Beobachtungen kann man 16 Mio Bootstrap-Samples oder vierzigtausend Permutationen machen. Für einen Permutationstest könnte man alle vierzigtausend Permutationen durchprobieren und hätte dann einen exaktem p-Wert, wo Bootstrapping nur einen angenäherten liefert. Das ändert aber auch alles nichts an dem Grundproblem, dass kleine Stichproben schwer signifikant werden.

P.S. leider ist es mir aufgrund der Besonderheiten der Teilnehmer nicht möglich, mehr Teilnehmer zu finden und meine Stichprobe zu vergrössern.


Ja, das ist vielleicht der meistgegebene Ratschlag der am seltensten umgesetzt werden kann ;-)

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 24 Gäste