STATISTIK-FORUM.de

GGGM · von **GGGM** » Do 6. Apr 2023, 13:52

Guten Tag, liebe Forengemeinde!

Ich schreibe aktuell meine Bachelorarbeit, dafür müsste ich folgendes wissen: Welche Möglichkeiten gibt es 2 geordnete Stichproben im Hinblick auf die Grundgesamtheiten zu vergleichen? Also gibt es Tests die berücksichtigen, dass die Stichprobe geordnet ist? Die Stichproben beinhalten jeweils 45 Werte die < 1 und >= 0 sind, vielleicht spielt das eine Rolle, ich weiß es nicht.

Mit freundlichen Grüßen
GGGM

PonderStibbons · von **PonderStibbons** » Do 6. Apr 2023, 23:35

Worin bestehen das Thema und die Fragestellungen Deiner Studie? Was
hast Du konkret erhoben und mithilfe welcher Verfahren?

Mit freundlichen Grüßen

PonderStibbons

folgende User möchten sich bei PonderStibbons bedanken:
GGGM

bele · von **bele** » Fr 7. Apr 2023, 13:23

Ich glaube, vor allem der Begriff der "geordneten" Stichprobe ist erklärungsbedürftig. Am besten erfolgt das im von PonderStibbons umrissenen Rahmen, aber ohne diese Erklärung verstehe ich die Frage nicht.

LG, Bernhard

folgende User möchten sich bei bele bedanken:
GGGM

GGGM · von **GGGM** » Sa 8. Apr 2023, 02:16

Vielen Dank für die schnellen Rückmeldungen PonderStibbons und bele.

Dann versuche ich mich nochmal genauer auszudrücken. Das mit dem "geordnet" vergessen wir alle ganz schnell wieder, da hab ich etwas fehlinterpretiert.

Ich habe 2 Stichproben X und Y, mit jeweils 45 Werten. Ich muss auf Gleichheit der Stichproben testen. Ich habe heute herausgefunden, dass meine Stichproben (zumindest eine davon, aber das reicht ja schon) nicht normalverteilt sind. Das habe ich mit dem Kolmogorov-Smirnov-Anpassungstest belegen können. Das Histogramm sieht auch nicht danach aus, dass eine Normalverteilung vorliegt.

Gibt es vielleicht einen Äquivalenztest der keine Normalverteilung voraussetzt? Ich habe bisher noch keinen gefunden. In einem Youtube Video (https://www.youtube.com/watch?v=QNMjrrMvGcE&t=897s) zum Äquivalenztest wurde ab Minute 2:36 kurz der "Krückentest" vorgestellt, dabei scheint man einfach das Signifikanzniveau auf 20% zu erhöhen und aus dem Gleichheitszeichen der Nullhypothese ein Ungleichheitszeichen zu machen. Ich habe noch nie etwas von einem "Krückentest" gehört. Meine Google-Suche diesbezüglich war auch wenig erfolgreich. Ich gehe davon aus, dass es einen Fachausdruck dafür geben wird. Vielleicht wissen Sie ja worum es sich hierbei handelt. Dazu möchte ich auch noch fragen, wie sinnvoll dieses Vorgehen ist. Der Videoersteller erwähnt, dass der Test suboptimal ist und ein Äquivalenztest besser sein soll... Könnte man vielleicht einen U-Test nach der Methode dieses Krückentests durchführen?

Wenn Sie mir jetzt die traurige Mitteilung machen, dass es kein geeignetes Testverfahren gibt, welche Möglichkeiten gibt es, 2 Stichproben im Hinblick auf Gemeinsamkeiten und Unterschiede zu vergleichen? Selbst wenn es nur deskriptive Methoden sind, das kann u.U. auch schon hilfreich sein.

Mit freundlichen Grüßen
GGGM

PonderStibbons · von **PonderStibbons** » Sa 8. Apr 2023, 09:58

Nochmal: wie lautet bitte das konkrete Thema und die konkrete Fragestellung, welche Variablen wurden anhand welcher Verfahren gemessen? Sind es unabhängige Stichproben oder wurden zwei Werte an derselben Stichprobe erhoben? Es ist auch nicht ersichtlich, worauf „Gleichheit der Stichproben“ (vermutlich ist gemeint: der Populationen,aus denen die Stichproben stammen) sich bezieht. Gleiche zentrale Tendenz? Gleiche Verteilungsform? Oder geht es um eine Korrelation?

Mit freundlichen Grüßen

PonderStibbons

folgende User möchten sich bei PonderStibbons bedanken:
GGGM

GGGM · von **GGGM** » Sa 8. Apr 2023, 12:41

Ich untersuche das Verkehrsunfallverhalten zweier Personengruppen. Es gibt ein Modell, welches für diese beiden Populationen verwendet wird. Von einer Population weiß man wie sie sich verhält, d.h. für diese Population wurde das Modell entwickelt. Damit kein neues Modell entwickelt werden muss, ist die Hoffnung, dass sich beide Populationen gleich verhalten und es wird auch vermutet. Bei den Daten handelt es sich um relative Häufigkeiten. Sie sagen aus wie, viele Unfälle es im Verhältnis zur gesamten Population pro Alter gegeben hat. Ich habe die Daten nicht selbst erhoben und habe keine Informationen darüber wie sie erhoben wurden.

Die Stichproben sind unabhängig. Die gleiche Verteilungsform liegt vor, aber vielleicht werde ich das, damit ich auch vernünftig begründen kann, dass dies der Fall ist, nochmal testen. Welche Tests gibt es im Hinblick auf die Gleichheit der Verteilung?

Mit gleicher zentraler Tendenz ist wohl der Median gemeint. Das wäre auch interessant zu erfahren. Sie merken schon, so ganz eindeutig ist die Aufgabenstellung nicht, mit anderen Worten ich muss mir selber Gedanken machen und selber sehen was Sinn macht.

Mit freundlichen Grüßen
GGGM

PonderStibbons · von **PonderStibbons** » Sa 8. Apr 2023, 16:57

Mit zentraler Tendenz ist zentrale Tendenz gemeint, das kann Modus, Median, Mittelwert sein, je nachdem. Mir ist nicht klar, was die Beobachtungseinheit ist. Es gibt zweimal jeweils n=45 Datenpunkte? Das sind Werte, die sich auf jeweils 45 verschiedene Altersstufen beziehen? Und dann ist von relativen Häufigkeiten die Rede, aber das erwähnte Modell scheint weder bei der Generierung der Daten noch bei deren Analyse ins Spiel zu kommen?

Ich finde es leider nach wie vor sehr schwierig, die Schilderung zu verstehen. Gibt es einen Aufgabentext, den Du hier posten kannst?

Mit freundlichen Grüßen

PonderStibbons

folgende User möchten sich bei PonderStibbons bedanken:
GGGM

GGGM · von **GGGM** » Sa 8. Apr 2023, 18:47

PonderStibbons hat geschrieben:Mit zentraler Tendenz ist zentrale Tendenz gemeint, das kann Modus, Median, Mittelwert sein, je nachdem. Mir ist nicht klar, was die Beobachtungseinheit ist. Es gibt zweimal jeweils n=45 Datenpunkte? Das sind Werte, die sich auf jeweils 45 verschiedene Altersstufen beziehen?

Das ist richtig. Es handelt sich um die gleichen Altersstufen in beiden Gruppen. Es werden die Alter 21 bis 65 in beiden Gruppen betrachtet.

PonderStibbons hat geschrieben:Und dann ist von relativen Häufigkeiten die Rede, aber das erwähnte Modell scheint weder bei der Generierung der Daten noch bei deren Analyse ins Spiel zu kommen?

Bei dem erwähnten Modell das auf eine Gruppe angewandt wird, handelt es sich um ein Modell mit dem die Beiträge für eine Schadensversicherung kalkuliert werden, nicht zu verwechseln mit dem Modell mit dem die relativen Häufigkeiten berechnet werden. Sind die relativen Unfallhäufigkeiten in Population A so hoch wie in B muss kein neues Modell zur Beitragskalkulation ermittelt werden, daher das Interesse das beide Gruppen gleich sind. Das Modell mit dem die relativen Häufigkeiten ermittelt wurden scheint keine Rolle zu spielen.

PonderStibbons hat geschrieben:Ich finde es leider nach wie vor sehr schwierig, die Schilderung zu verstehen. Gibt es einen Aufgabentext, den Du hier posten kannst?

Leider nein, tut mir Leid.

Ich habe mir einige Beiträge in diesem Forum zum Äquivalenztest durchgelesen. In einem davon wird von Ihnen erwähnt, dass normalverteilte oder nicht-normalverteilte Messwerte mit der Durchführbarkeit von t-Tests nichts zu tun haben. Das ist mir völlig neu. Meines Wissens nach kann man bei einer Stichprobengröße von n>30, über den zentralen Grenzwertsatz auf die Normalverteilung schließen, sodass man zumindest nicht auf Normalverteilung testen muss, aber das die Normalverteilung für den t-Test keine Rolle spielt höre ich zum ersten Mal. Es gibt ja mindestens einen Ansatz des Äquivalenztests bei dem der einseitige t-Test angewandt wird. Bitte erklären Sie mir diese Ihre Aussage. Sie finden sie wieder in Ihrem 2. Post folgender Frage: post41375.html?hilit=aequivalenztest%20normalverteilung#p41375 Wenn ich wüsste, dass meine Daten für einen einzigen Ansatz des Äquivalenztests die Grundvoraussetzungen erfüllt würde mich das schonmal sehr glücklich stimmen, dann habe ich zumindest eine Basis, auf dessen Grundlage ich mit meinen Betreuern diskutieren kann.

Mit freundlichen Grüßen
GGGM

PonderStibbons · von **PonderStibbons** » Sa 8. Apr 2023, 20:09

Es geht nicht um die Verteilung der Stichprobendaten, sondern um die Verteilung in den Grundgesamtheiten. Und n > 30 zaubert auch nicht plötzlich eine Normalverteilung von Variablen her, wo vorher keine war. Vielmehr wird diese Verteilungsbetrachtung ab einer ausreichenden Stichprobengröße entbehrlich, weil der Test dann auch bei anders verteilten Grundgesamtheiten zuverlässig ist.

Im vorliegenden Fall ist es etwas schwierig, die Fragestellung in numerische Vergleiche zu übersetzen. Beispielsweise, ist das Risiko in Gruppe A in der Altersgruppe 20-30 deutlich erhöht, in 30-40 deutlich verringert im Vergleich mit Gruppe B, wäre der Durchschnitts-Unterschied Null, obwohl augenscheinlich die Gruppen sich nicht ähneln. Ich würde damit anfangen, ein Streudiagramm für die 45 Wertepaare zu erstellen, zusätzlich Deskriptivstatistik für die 45 Differenzwerte (Min, Max, Median, Mw, SD) und Histogramm und/oder Boxplot dafür.

Für einen inferenzstatistischen Test, sei es für Ungleichheit, sei es als Äquivalenztest, sehe ich auf Anhieb keine Motivation, sofern die den 90 Raten zugrundeliegenden Raten auf sehr großen Stichproben beruhen und demzufolge genau sind.

Mit freundlichen Grüßen

Ponderstibbons

folgende User möchten sich bei PonderStibbons bedanken:
GGGM

GGGM · von **GGGM** » Sa 8. Apr 2023, 21:21

PonderStibbons hat geschrieben:Im vorliegenden Fall ist es etwas schwierig, die Fragestellung in numerische Vergleiche zu übersetzen. Beispielsweise, ist das Risiko in Gruppe A in der Altersgruppe 20-30 deutlich erhöht, in 30-40 deutlich verringert im Vergleich mit Gruppe B, wäre der Durchschnitts-Unterschied Null, obwohl augenscheinlich die Gruppen sich nicht ähneln. Ich würde damit anfangen, ein Streudiagramm für die 45 Wertepaare zu erstellen, zusätzlich Deskriptivstatistik für die 45 Differenzwerte (Min, Max, Median, Mw, SD) und Histogramm und/oder Boxplot dafür.

Für einen inferenzstatistischen Test, sei es für Ungleichheit, sei es als Äquivalenztest, sehe ich auf Anhieb keine Motivation, sofern die den 90 Raten zugrundeliegenden Raten auf sehr großen Stichproben beruhen und demzufolge genau sind.

Ich kenne die genaue Größe nicht, aber die Größe der Populationen liegen im unteren 6-stelligen Bereich. Ich schätze mal das sollte groß genug sein.

Könnte ich vielleicht die Altersgruppen in 5-10er Schritten einzeln testen? Dann sind sie zwar noch kleiner, aber jede Altersgruppe sollte zumindest immer noch auf einer 4-5-stelligen Anzahl beruhen. Die Streudiagramme sehen mit einer polynomischen Trendlinie sehr ähnlich aus, sodass das vielleicht Sinn machen könnte. Allein deskriptiv das Ganze zu bewerten ist meinem Prof. leider zu wenig.

Mit freundlichen Grüßen
GGGM

STATISTIK-FORUM.de

Vergleich zweier geordneter Stichproben

Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Re: Vergleich zweier geordneter Stichproben

Wer ist online?