Methodenwahl? Statistik für Anfänger :D

Fragen, die sich auf kein spezielles Verfahren beziehen.

Methodenwahl? Statistik für Anfänger :D

Beitragvon HILFESUCHE2020 » Mi 29. Apr 2020, 19:25

Hallo,

vielleicht kann mir jemand helfen.

Nun es geht bei mir um die Beobachtung, dass Klienten nicht in einer Beratungsstelle erschienen sind. Über ein Jahr verteilt ist die Beobachtung häufiger aufgetreten. Vorliegend sind personen- und terminbezogene Daten z.B. Alter, Wohnort, Geschlecht und zum Termin Monat der Beratung, Wartezeit etc..
Nun möchte ich überprüfen, ob man aus diesen Daten Rückschlüsse ziehen kann, ob jemand als Klient erscheint oder nicht.
z.B: Alle Frauen im Alter zwischen 20 und 40 werden kein Fall und kommen nicht. ODER Alle Klienten aus Berlin im Anmeldemonat September kommen in die Beratungsstelle.

Ich weiß nun wirklich nicht wo ich anfangen soll. Ich habe mir Histogramm und Häufigkeitstabellen erstellt. Schön und gut und somit für mich einen Überblick. Aber wie kann ich diese Rückschlüsse überprüfen?

Stolpere über soviele Fachworte: Metrisch, Skalierungen, F-/T-Test, Multiple Regression, Korrelationen. Ich weiß nicht mehr weiter.

Letztlich habe ich doch nur 2 Gruppen: erschienene und nicht erschiene Klienten mit ihren Ausprägungen.

WIe würdet ihr vorgehen?
HILFESUCHE2020
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 29. Apr 2020, 19:22
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Methodenwahl? Statistik für Anfänger :D

Beitragvon bele » Mi 29. Apr 2020, 19:59

Hallo HILFESUCHE ohne Namen,

HILFESUCHE2020 hat geschrieben:z.B: Alle Frauen im Alter zwischen 20 und 40 werden kein Fall und kommen nicht. ODER Alle Klienten aus Berlin im Anmeldemonat September kommen in die Beratungsstelle.


Es gibt eine große Methodenfülle, wie man sich dem nähern kann. Wenn man auf Aussagen wie die o. g. kommen will, bieten sich sogenannte Klassifikationsbäume an - eine Art automatisch erstellter Entscheidungsbaum, an dessen Ende "erschienen/nicht erschienen" steht. Aus dem Baum Aussagen wie die obige abzuleiten ist dann aber Menschenaufgabe.

Das wäre ein Artikel zum Entscheiden, ob das Thema zu Deinen Anforderungen passt: https://de.wikipedia.org/wiki/Entscheidungsbaum

Ein paar Beispiele, wie das aussehen kann:
http://www.di.fc.ul.pt/~jpn/r/tree/tree.html

Ausführliche Beschreibung (nicht von mathematischer Notation etc. bange machen lassen): https://cran.r-project.org/web/packages ... gintro.pdf

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
HILFESUCHE2020

Re: Methodenwahl? Statistik für Anfänger :D

Beitragvon HILFESUCHE2020 » Mi 29. Apr 2020, 21:22

Puh super Komplex. Egal wie ich es aufbaue...es sind gefühlt zuviele Faktoren- und ich muss da immer eine entscheidung treffen...aber ich will auch verbindungen untereinander...oder ich denke zu kompliziert :(

Danke für deine Antwort
HILFESUCHE2020
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 29. Apr 2020, 19:22
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Methodenwahl? Statistik für Anfänger :D

Beitragvon bele » Mi 29. Apr 2020, 22:06

Das coole an meinem Vorschlag ist ja, dass Du beliebig viele Faktoren hinein werfen kannst und der Computer für Dich nach vorhersagekräftigen darin sucht. Ob dann ein einfacher oder ein komplexer Baum herauskommt, das kannst Du zwar über das sog. Pruning mitbestimmen, entscheidet sich aber vor allem daran, ob in den Daten eine einfache Struktur verborgen liegt, oder eben auch nicht.

Geht es Dir denn eher um einfache Regeln oder dürfen die Zusammenhänge auch komplex sein, wenn sie nur gut vorhersagen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5927
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Methodenwahl? Statistik für Anfänger :D

Beitragvon PonderStibbons » Mi 29. Apr 2020, 22:09

Stolpere über soviele Fachworte: Metrisch, Skalierungen, F-/T-Test, Multiple Regression, Korrelationen. Ich weiß nicht mehr weiter.
(...)
WIe würdet ihr vorgehen?

Kannst Du denn mit Regressionsanalysen etwas anfangen oder ist das ganz außerhalb Deiner Reichweite?

Wie groß ist denn der Datansatz - wie viele Klienten waren eingeladen und wieviele sind nicht erschienen?

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron