Frage zu Datenniveau und Kreuztabellen

Frage zu Datenniveau und Kreuztabellen

Beitragvon sabineloar » So 19. Okt 2014, 22:55

Hallo zusammen

Wir machen gerade eine Gruppenarbeit in der Uni und haben einige Fragen zur Auswertung unserer Daten zum Thema Crowdfunding, also sehr spannend :)

Wir analysieren den Zusammenhang einer Projekts zum Thema Gesundheit (kein Bezug, schwacher Bezug, mittelstarker Bezug und starker Bezug) UV
mit dem Erfolg eines Projekts, d.h. Erfolg wird definiert als Erhaltener Geldetrag / Gewünschter Geldbetrag = ...%. Über 100% wäre also sehr erfolgreich. AV
Dies wollen wir anhand einer Kreuztabelle anschauen.

Jetzt haben wir folgende Fragen:

Welches Datenniveau hat die UV?
Wir würden sagen nominal, aber ist es ev. ordinal?

Wir haben die Prozentwerte in Kategorien eingeteilt. 0-30%, 31-40%, 41-70%, 71-100%
Sind diese Kategorien nun metrisch oder nominales Datenniveau?

Wie müssen wir vorgehen bei der Auswertung der Daten? D.h. Welche Zusammenhangsmasse und Kennzahlen anschauen?

Wir wären worklich froh um eure Hilfe. Mir ist bewusst, dass es ziemlich "doofe" Fragen sind :(

Besten Dank!!
sabineloar
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 19. Okt 2014, 22:44
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Frage zu Datenniveau und Kreuztabellen

Beitragvon PonderStibbons » So 19. Okt 2014, 23:09

Dies wollen wir anhand einer Kreuztabelle anschauen.
Jetzt haben wir folgende Fragen:
Welches Datenniveau hat die UV?

Da es eine ordinale Variable ist, könnte man den Zusammenhang mit dem Erfolg
per Spearman-Rangkorrelation analysieren.

Deskriptivstatistisch kann man zusätzlich den mittleren (durchschnittlichen
oder medianen) Ertrag je Stufe darstellen.

Wir haben die Prozentwerte in Kategorien eingeteilt. 0-30%, 31-40%, 41-70%, 71-100%
Sind diese Kategorien nun metrisch oder nominales Datenniveau?

Die sind vermutlich unsinnig, da kein guter Grund ersichtlich ist,
statistische Informationen zu verschenken und präzise Werte in
4 breite Kategorien mit künstlichen Grenzen umzuwandeln.
Die ursprügliche Prozentangabe ist übrigens intervallskaliert.


Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
sabineloar

Re: Frage zu Datenniveau und Kreuztabellen

Beitragvon sabineloar » Mo 20. Okt 2014, 11:18

Lieber P.

Vielen Dank für deine Rückmeldung.

Die sind vermutlich unsinnig, da kein guter Grund ersichtlich ist,
statistische Informationen zu verschenken und präzise Werte in
4 breite Kategorien mit künstlichen Grenzen umzuwandeln.
Die ursprügliche Prozentangabe ist übrigens intervallskaliert.


Das Problem ist, dass wir Daten für ca. 400 Projekte Daten codiert haben und wenn wir diese nicht zusammenfassen in solche Kategorien, dass wir eine riesige kreuztabelle haben mit extrem vielen Prozentabgaben und deshalb haben wir das so zusammengefasst.

Wie würdest du (ihr alle?) in diesem Fall vorgehen?
sabineloar
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 19. Okt 2014, 22:44
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Frage zu Datenniveau und Kreuztabellen

Beitragvon PonderStibbons » Mo 20. Okt 2014, 11:46

Wozu eine Kreuztabelle, wenn es intervallskalierte Werte sind?
Für eine Studie, in der die Körpergröße von Männern und Frauen
verglichen wird, würde man ja auch keine Kreuztabelle rechnen,
und jeden Millimeter Körpergröße als eigene Kategorie nehmen.

Zudem ist Eure die Kategorienbildung völlig willkürlich, soweit
ersichtlich, das produziert schlimmstenfalls irreführende
Auswertungsergebnisse.

Nochmal also, Ihr habt a) eine ordinale Variable (Bezug zur Gesundheit)
und b) eine intervallkskalierte Variable (% erhaltener Betrag).

Deskriptivstatistisch könnte man für die 4 Stufen der ersten Variable
jeweils den % erhaltenen Betrag auswerten (Minimum, Maximum, Median,
Mittelwert, Standardabweichung). Auch grafische Methoden
(box- und whisker-plots, X-Y-Streudiagramme) könnten erhellend
sein.

Danach ist die Frage, welche Hypothese vorliegt. Beispielsweise:
"Je höher der Gesundheitsbezug, desto höher der Einwerbeerfolg".
Diese Beziehung kann man mit dem genannten Spearman-
Rangkorrelationskoeffizienten rho darstellen und testen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
sabineloar

Re: Frage zu Datenniveau und Kreuztabellen

Beitragvon sabineloar » Mo 20. Okt 2014, 13:07

Ich weiss, es sind extrem dumme Fragen, aber wir alle hatten das letzte Mal vor 2 Jahren eine Statistik Vorlesung und seither nichts mehr gebraucht. Deshalb masslos überfordert mit den Berechnungen, die wir jetzt machen müssen.

Wozu eine Kreuztabelle, wenn es intervallskalierte Werte sind?

Was rechnet man denn sonst? Wie kann man diese beiden Kategorien der UV (kein - schwacher Bezug) und (mittelstarker - starker Bezug) miteinander vergleichen?

Zudem ist Eure die Kategorienbildung völlig willkürlich, soweit
ersichtlich, das produziert schlimmstenfalls irreführende
Auswertungsergebnisse.


Sehe ich auch so, aber müssen die Kategorien denn immer alle gleich gross sein oder wonach richtet man sich da?

Danach ist die Frage, welche Hypothese vorliegt. Beispielsweise:
"Je höher der Gesundheitsbezug, desto höher der Einwerbeerfolg".

Die Hypothese lautet: Projekte mit mittelstarkem bis starkem Bezug zum Thema Gesundheit sind erfolgreicher, als Projekte mit keinem - schwachem Bezug zum Thema Gesundheit.

Diese Beziehung kann man mit dem genannten Spearman-
Rangkorrelationskoeffizienten rho darstellen und testen.

Wie geht man dafür bei SPSS vor?
sabineloar
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 19. Okt 2014, 22:44
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Frage zu Datenniveau und Kreuztabellen

Beitragvon PonderStibbons » Mo 20. Okt 2014, 13:39

Die Hypothese lautet: Projekte mit mittelstarkem bis starkem Bezug zum Thema Gesundheit sind erfolgreicher, als Projekte mit keinem - schwachem Bezug zum Thema Gesundheit.

Ach so.

Dann hätte eine 2-stufige Bewertung ja von vornherein gereicht.

Warum bleibt Ihr denn nicht bei den 4 Stufen?

Wenn man das also nur mit 2 Stufen machen möchte, wäre eine neue Variable
zu bilden, die nur noch diese 2 Ausprägungen hat statt wie bisher 4.

Auch für diese 2 Stufen kann man dann den Erfolg darstellen durch
Angabe von Minimum, Maximum, Median, Mittelwert, Standardabweichung.

Man kann dann einen Vergleich zwischen den beiden Ausprägungen
durch einen t-Test für unabhängige Gruppen oder durch einen
"nonparametrischen" Mann-Whitney U-Test anstellen.

Falls Ihr bei Eurer Einteilung des Erfolgs in 4 Gruppen bleiben wollt,
dann könnt Ihr auch eine 2 x 4 Kreuztabelle mit Chi²-Test rechnen.
Nicht die Methode der Wahl, wie gesagt, aber vielleicht für Eure
Zwecke ausreichend.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Kreuztabellen & Chi²

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste