Vergleich von prozentualem Wachstum

Fragen, die sich auf kein spezielles Verfahren beziehen.

Vergleich von prozentualem Wachstum

Beitragvon jegramme » Di 21. Mai 2024, 12:32

Hallo zusammen,

ich habe anhand großer Registerdaten das prozentuale Wachstum der Nutzung bestimmter Technologien in Verschiedenen Altersgruppen von 2008-2018 untersucht.

Outcome ist die Nutzung der Technologie in %, ich vergleiche 4 Altersgruppen über den Zeitraum 2008-2018.
Dargestellt ist einmal eine Grafik (wie hat sich das Wachstum verändert) und eine Tabelle mit absoluten Zahlen der Nutzer (also N gesamt und n Nutzer der Technologie) (zur Einordnung der Größenordnung).

Jetzt würde ich gerne aussagen darüber treffen, ob eine Altersgruppe signifikant mehr angewachsen ist als die anderen. Welche Verfahren wären dafür geeignet? Ich will quasi sagen dass die Nutzung der Technologie in der Gruppe X stärker war über die letzten 10 Jahre als in Gruppe Y und Z?

Ich habe am Donnerstag Verteidigung und glaube die Frage kommt, ihr würdet mir echt sehr weiterhelfen

Danke
Jenny
jegramme
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 21. Mai 2024, 12:25
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von prozentualem Wachstum

Beitragvon PonderStibbons » Di 21. Mai 2024, 13:18

Logistische Regression mit den Prädiktoren Jahr (evtl. zur Vereinfachung nur 2 bzw. wenige Jahre),
Altersgruppe, Wechselwirkung Gruppe*Jahr.
Abhängige Variable „Nutzung ja/nein“.

Mantel-Haenszel-Test (Kreuztabelle Jahr[2stufig, z.B. Baseline & letzte Erhebung] * Nutzung [ja/nein]),
Schichtungsvariable Alterskohorte.

Die Datenbasis ist leider nicht ansatzweise beschrieben, weswegen nicht zu sagen ist, ob sich Einwände
in Hinsicht der Abhängigkeit der Beobachtungen ergeben könnten bzw. ob die Daten es hergäben, es
als Messwiederholungsdesign mit immer denselben, individuell identifizierbaren Teilnehmern über die
Jahre zu analysieren.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
jegramme

Re: Vergleich von prozentualem Wachstum

Beitragvon bele » Di 21. Mai 2024, 14:25

Ich glaube, ich verstehe das nicht.

jegramme hat geschrieben:ich habe [...] das prozentuale Wachstum der Nutzung [...] untersucht.

Outcome ist die Nutzung der Technologie in %


Also geht es jetzt um das prozentuale Wachstum oder um das Wachstum der Nutzung in Prozent.

eine Grafik (wie hat sich das Wachstum verändert)


Also weder die Nutzung noch das Wachstum der Nutzung sondern die Änderung der Nutzung. Quasi die zweite Ableitung von Nutzung?

Ich will quasi sagen dass die Nutzung der Technologie in der Gruppe X stärker war [...]als in Gruppe Y und Z


Also doch die Nutzung und nicht das Wachstum der Nutzung oder die Änderung des Wachstums der Nutzung?

Ich habe am Donnerstag Verteidigung


Das ist wirklich nicht böse gemeint und soll auch nicht spitzfindig sein, aber ich würde es für wichtig halten, dass Du Dich bei der Präsentation um eine präzise Sprache bemühst.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
jegramme

Re: Vergleich von prozentualem Wachstum

Beitragvon jegramme » Di 21. Mai 2024, 15:15

OK ich versuche es nochmal etwas genauer zu erklären :)

Ich habe die Jahre 2008 - 2018
Für jedes dieser Jahre habe ich für 4 Altersgruppen (größer/gleich 60, 60-69, 70-79, größer/gleich 80) jeweils die absolute und prozentuale Angabe der Nutzung von Diabetestechnologie. Dabei geht es nicht um die individuelle Nutzungshäufigkeit o.ä. sondern um den prozentualen Anteil der Menschen aus der jeweiligen Altersgruppe, die in einem bestimmten Jahr diese Technologie genutzt haben.

Also z.B. im Jahr 2018 haben XX Menschen zwischen 60-69 Diabetestechnologie genutzt, das sind XX% der Menschen aus dieser Altersgruppe in meinem Datensatz (es handelt sich um große Registerdaten mit mehreren 1000 TN)

Am Ende kommt eine Grafik raus, X-Achse sind die Jahre, y-Achse ist die % Nutzung von Diabetestechnologie, darin 4 Graphen (jeder Altersgruppe). Da sieht man zumindest bildlich, dass der prozentuale Anteil der Nutzer in allen Altersgruppen über die Zeit steigt, dass aber die "jüngeren" älteren (also 60-69) prozentual einen höheren Anteil der Nutzer haben (tatsächlich ist es schön von jung nach alt abgestuft).

Ich habe zwei Probleme: das eine ist, dass sich auch die Grundgesamheit der Stichprobe in jedem Jahr ändert (es sind für jedes Jahr mal mehr oder weniger N pro Altersgruppe erfasst, wodurch natürlich auch der prozentuale Anteil sich verändert, ohne dass es automatisch heisst, dass es unbedingt mehr Nutzer gibt) -> um das zumindest diskutieren zu können zeige ich auch die absoluten Zahlen und die Zahlen der Neu Initiierungen der Technologien (also wie viele Menschen absolut kommen jedes Jahr neu in den Datensatz)...

Problem zwei: Ich kann das Ganze bisher nur deskriptiv beschreiben (sowas wie: "Ja die 60-69 jährigen haben einen höheren prozentualen Anteil an Nutzern als die über 80-jährigen, absolut gesehen sind aber auch die 80-jährigen deutlich seltener vertreten, sei es nun weil es weniger gibt oder die weniger gut erfasst sind - das lässt sich anhand der Registerdaten nicht genau sagen, leider haben wir zu dem Thema kaum repräsentative Zahlen, erst recht nicht im Bereich der älteren menschen). Was mich interessieren würde: kann ich diesen Unterschied zwischen den Altersgruppen quantifizieren im Sinne einer signifikanten Differenz?

Ich hoffe ich war jetzt etwas genauer sprachlich. Sorry. Ich bin super gestresst und aufgeregt und sehe langsam nur noch Schleier vor den Augen...
Zuletzt geändert von jegramme am Di 21. Mai 2024, 15:19, insgesamt 1-mal geändert.
jegramme
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 21. Mai 2024, 12:25
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von prozentualem Wachstum

Beitragvon jegramme » Di 21. Mai 2024, 15:18

PonderStibbons hat geschrieben: Die Datenbasis ist leider nicht ansatzweise beschrieben, weswegen nicht zu sagen ist, ob sich Einwände
in Hinsicht der Abhängigkeit der Beobachtungen ergeben könnten bzw. ob die Daten es hergäben, es
als Messwiederholungsdesign mit immer denselben, individuell identifizierbaren Teilnehmern über die
Jahre zu analysieren.


Ja tatsächlich gibt es von einigen Personen durchgehend Daten für mehrere Jahre hintereinander, manche fallen auch weg oder kommen neu dazu. Da es sich um einen sehr großen Registerdatensatz handelt, ist es glaube ich schwer auf individueller Ebene zu analysieren... Wir berichten zumindest die absolute Zahl der Menschen die jedes Jahr neu in den Datensatz gekommen sind (eine Technologie neu nutzen) um das ein bisschen zu berücksichtigen...
jegramme
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 21. Mai 2024, 12:25
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Vergleich von prozentualem Wachstum

Beitragvon bele » Di 21. Mai 2024, 16:31

Hallo jegramme,

Sorry. Ich bin super gestresst und aufgeregt und sehe langsam nur noch Schleier vor den Augen...


Cool bleiben. Keiner meint es hier böse, aber mit Antworten aufgrund unzureichender Problembeschreibung kannst Du halt auch nichts anfangen. Man kann so ein Problem immer verschieden betrachten und kommt dann zu unterschiedlichen Ergebnissen.

Da sieht man zumindest bildlich, dass der prozentuale Anteil der Nutzer in allen Altersgruppen über die Zeit steigt, dass aber die "jüngeren" älteren (also 60-69) prozentual einen höheren Anteil der Nutzer haben (tatsächlich ist es schön von jung nach alt abgestuft).


Ich finde es immer noch nicht ganz einfach, die genaue Fragestellung zu erkennen. Vielleicht ist sie Dir auch nicht klar. In diesem Zitat sprichts Du beispielsweise gar nicht mehr von Wachstum, sondern von einem höheren Anteil. Es ist ganz leicht, zu einem bestimmten Zeitpunkt zu zeigen, dass die ganz Jungen mehr Anteil haben als die halbjungen und die halbjungen mehr Anteil als die Alten. Dafür malst Du eine Kontingenztabelle, in den Spalten steht, ob einer alt oder mittelalt ist, in den Zeilen, ob er Deine Technologie verwendet oder nicht und dann rechnest Du einen Chi-Quadrattest und angesichts von wirklich großen Zahlen in den Tausendern wird das immer signifikant werden.

Die grafisch-visuelle Alternative dazu ist auch ganz einfach: Wenn zu einem Zeitpunkt 1903 von 3408 jungen die Technologie benutzen, dann kannst Du darüber ein 95%-Konfidenzintervall für den prozentualen Anteil berechnen. Das tust Du für jeden Zeitpunkt und zeichnest die um Deine Kurven. Dann wird man sehen, dass die Konfidenzintervalle sich nicht überlagern. Denn angesichts der großen Zahlen werden die Konfidenzintervalle entsprechend schmal ausfallen.

Sobald Du aber über mehrere Zeitpunkte hinweg rechnen willst wird es zum Problem, dass Du teils verbundene und teils unverbundene Stichproben hast. Das ist alles andere als banal und eine korrekte Lösung wirst Du IMHO dafür bis Donnerstag nicht finden. Also musst Du bereit sein, Vereinfachungen hinzunehmen.

Wenn man als Vereinfachung sagen würde, dass man die Jahre alle getrennt betrachtet, als ob es keine verbundenen Datensatzanteile gibt und weiter annimmt, dass der Anstieg irgendwie kontinuierlich über die Zeit im Sinne einer Geraden oder einer S-Kurve erfolgt, dann bietet sich die von PonderStibbons erwähnte logistische Regression an. Die kann man sich bis Donnerstag anschauen, die bewertet alle Jahre gemeinsam und die kennen auch die Prüfer. Außerdem kann man da dann tatsächlich die Steigerungs/Wachstumsrate über die Zeit beurteilen. Hat aber methodische Schwierigkeiten die Du auslassen kannst, wenn Du eine Grafik mit Konfidenzintervallbändern aus der Tasche ziehst und sagst: Wie man sieht, überlappen die sich nicht.

Mein Bauchgefühl sagt mir, dass man irgendwie einen Likelihood-ratio-Test basteln können müsste wie man das bei Sterbekurven in der Survival-Analyse macht, wenn man keine bestimmte Verteilung über die Zeit unterstellen will. Das kriebe ich aber gerade nicht zusammen. Bestimmt hat PonderStibbons noch eine bessere Idee.

JMTC,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5916
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste