Ausreißer bei binären Variablen identifizieren

Fragen, die sich auf kein spezielles Verfahren beziehen.

Ausreißer bei binären Variablen identifizieren

Beitragvon sabille » Mo 22. Jul 2013, 09:53

Schönen guten Morgen in die Runde!

Ich bin neu im Forum und habe mal eine Frage an Euch: Ich habe eine Menge binär codierter Variablen mit 0 'nein' und 1 'ja'. Es wird viel mehr mit ja geantwortet als mit nein, da nein für die Probanden mit Mehraufwand verbunden ist. Ich möchte nun gerne sowohl nach oben als auch nach unten Ausreißer identifizieren. Zunächst hatte ich an die Standardabweichung gedacht, allerdings übersteigt der Mittelwert + Standardabweichung dann häufig 1, während Mittelwert - Standardabweichung zu viele Fälle aussortiert. Hat einer eine Idee, wie man mit der Problematik umgehen kann?

Herzlichen Dank für Eure Hilfe
Sabille
sabille
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 19. Jul 2013, 13:17
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon PonderStibbons » Mo 22. Jul 2013, 10:40

Ich möchte nun gerne sowohl nach oben als auch nach unten Ausreißer identifizieren.

Bezogen auf welche Messung? Die aufsummierten 0/1-Items?
Und warum und wozu ist für Dich die Identifikation von
"Ausreißern" von Interesse?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
sabille

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon sabille » Mo 22. Jul 2013, 10:51

Hallo PonderStibbons,

danke für Deine Antwort.

Die Antworten werden von Testern gegeben und ich möchte Tester identifizieren, die zu gut oder zu schlecht urteilen. Ich möchte also pro Frage Ausreißer identifizieren und zusätzlich über einen Indexwert (Mittelwert aus allen Fragen berechnet).

Grüße
Sabille
sabille
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 19. Jul 2013, 13:17
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon PonderStibbons » Mo 22. Jul 2013, 12:03

Leider bleibt mir das unverständlich. Vielleicht beschreibst Du die Studie einmal
zusammenhängen (Thema, Fragestellung, Erhebungsdesign, konkrete Messungen,
Stichprobengröße).

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon sabille » Mo 22. Jul 2013, 14:21

Ich versuche es zu umreißen:

Es gibt 500 Tester, die 10000 verschiedene Autowerkstätten testen und einen Fragebogen ausfüllen. In diesem sind ca. 20 Aussagen enthalten, wie z.B. "Die Werkstatt ist sauber" ja/nein. Die Tester haben eine größere Motivation die Werkstätten gut zu beurteilen, als sie schlecht zu beurteilen, d.h. es antworten viel mehr mit ja als mit nein, da im Falle von der Antwort 'nein' ausführliche Ausführungen erwartet werden. Jetzt möchte ich gerne Ausreißer bei den Testern identifizieren. Gibt es Tester die durchweg zu gut urteilen bzw. zu schlecht? Da die Fragen unterschiedlich streuen, würde ich gerne Grenzen fragespezifisch festlegen. Ich habe die Daten jetzt auf Testerebene aggregiert und vergleiche die Mittelwerte. Meine Idee war es mit der Standardabweichung zu arbeiten, aber bei einem Mittelwert von 0,97 und einer Standardabweichung von 0,04 macht das nach oben keinen Sinn. Habt ihr eine bessere Idee?

Puhh, ich hoffe, das war jetzt verständlich.
sabille
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 19. Jul 2013, 13:17
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon PonderStibbons » Mo 22. Jul 2013, 14:58

Du willst nach 20 Kriterien nach 'Ausreißern' suchen?
Klingt mühselig. Welchen Vorteil das hat gegenüber
der Aggregation der 20 Fragen verstehe ich noch nicht.

Das Problem ist, ob statistische Kriterien überhaupt viel
mit Deinen inhaltlichen Vorstellungen zu tun haben.
Vielleicht ist inhaltlich schon jemand als einer identifizierbar,
der sich die Wertungen leicht gemacht hat, aber nach einem
statistischen Kriterium wäre er evtl. noch im tolerablen
Bereich.

Du könntest Dich der Methoden der explorativen Datenenalyse
bedienen, stem-and-leaf plots, histogramme, und vor allem
box-and-whiskers plots.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon bele » Mi 24. Jul 2013, 12:32

Hallo sabille,

Du könntest versuchen, Deinen Datensatz mit robusten Statistiken zu untersuchen. Ein Beispiel wäre, statt dem Mittelwert der Summenscores einen getrimmten Mittelwert anzugeben: Du berechnetst für alle 500 Tester die Summenscores. Dann lässt Du die 5% besten und 5% schlechtesten weg, bevor Du den Mittelwert bildest.

Gegebenenfalls könnte man sich auch so eine Art "Zero-Inflated-Modell" (in Deinem Fall "One-Inflated-Modell") denken, aber derzeit sieht es nicht so aus, als könntest Du prüfen, ob alle diese Manipulationen Deine Datenqualität tatsächlich verbessern. Daher die Skepzis und die Frage, ob man das wirklich machen oder einfach auf die Mengeneffekte in der Statistik hoffen soll.

Hast Du mal ein Histogramm/Verteilungskurve Deiner Summenscores berechnet? Wenn das zweigiplig wäre, einmal an einem realistischen Wert und einmal nahe Maximalwert, dann fände ich den Aufwand überlegenswert. Sonst eher nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Ausreißer bei binären Variablen identifizieren

Beitragvon sabille » Do 25. Jul 2013, 12:30

Danke Euch!
sabille
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 19. Jul 2013, 13:17
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste