Welche Analyse ist am geeignetsten?

Fragen, die sich auf kein spezielles Verfahren beziehen.

Welche Analyse ist am geeignetsten?

Beitragvon Tobias Wa » Mi 29. Mai 2013, 20:11

Hallo zusammen,

ich sitze grade an eine statistischen Analyse meiner Daten und bin total festgefahren.
Mittlerweile weiß ich nicht mal mehr, welche Analyse ich verwenden sollte. Mein Dozent hat mir eine log. reg. empfohlen, die scheint mit meinen Variablentypen allerdings nicht kompatibel zu sein.

Zu meiner Studie:
Mein Ziel ist es ein neuartiges Training zu evaluieren. Das Training reduziert bekanntermaßen die Rückfallquote von Such-Patienten, ich möchte herausfinden, bei wem es besser und bei wem weniger gut wirkt.
Dazu möchte ich schauen, ob self-esteem (Fragebogenwert) und/oder die Anzahl der zusätzlichen Diagnosen und/oder die Anzahl Trainingssitzungen (unter allen Trainingsteilnehmern) Auswirkungen auf den Rückfall haben. Darüber hinaus wäre es interessant zu schauen, ob es bei dem Ganzen noch einen Unterschied zu der Kontrollgruppe gibt, die nicht am Training teilgenommen haben (das würde bedeuten nur die Interaktionen zwischen Teilnahme (ja/nein) und den folgenden Variablen zu verwenden, oder?)

abhängige Variable: Rückfall (ja/nein)
unabhängige Variable 1: self-esteem (interval, bzw. scale in SPSS)
2: Anzahl Diagnosen (0-5) (interval/scale)
3: Anzahl Trainingssitzungen (0-3/4-6/7-12) (nominal)
4: Z_self-esteem * Z_Anzahl Diagnosen (Interaktion errechnet aus den Z-Werten der beiden Variablen)
5: Z_self-esteem * Z_Anzahl Trainingssitungen
6: Z_Anzahl Diagnosen * Z_Anzahl Trainingssitzungen
7: Z_self-esteem * Z_Anzahl Diagnosen * Z_Anzahl Trainingssiungen

bei einer log.reg. mit variablen 1,2 und 4 wird die Interaktion zwar in der Korrelationstabelle einbezogen, allerdings nicht in dem resultierenden Modell.

Ich hoffe das Ganze ist halbwegs verständlich, aber ich bin grad echt durch ;)

Ganz vielen Dank im Vorraus!!
Tobias Wa
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 29. Mai 2013, 19:55
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Welche Analyse ist am geeignetsten?

Beitragvon PonderStibbons » Do 30. Mai 2013, 20:31

Bei einer Analyse von Rückfällen ist häufig eine Survival-Analyse angebracht
(Cox Regression beispielsweise). Aber vielleicht ist binär logistische Regression
hier passabel.
4: Z_self-esteem * Z_Anzahl Diagnosen (Interaktion errechnet aus den Z-Werten der beiden Variablen)
5: Z_self-esteem * Z_Anzahl Trainingssitungen
6: Z_Anzahl Diagnosen * Z_Anzahl Trainingssitzungen
7: Z_self-esteem * Z_Anzahl Diagnosen * Z_Anzahl Trainingssiungen

Wozu diese Interaktionen? Aus Deiner Beschreibung der Fragestellung geht das nicht hervor.
Wozu die z-Standardisierungen? Und darüberhinaus, eine ordinale Variable (Anzahl Sitzungen)
ist nicht z-standardisierbar.
Darüber hinaus wäre es interessant zu schauen, ob es bei dem Ganzen noch einen Unterschied zu der Kontrollgruppe gibt, die nicht am Training teilgenommen haben

Was genau soll da beschaut werden. "bei dem Ganzen" ist etwas unpezifisch.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welche Analyse ist am geeignetsten?

Beitragvon Tobias Wa » Fr 31. Mai 2013, 17:45

ja, binäre Regression war bisher auch mein gedanke. ich glaube mittlerweile, dass ich irgend einen dummen fehler bei der einschlussmethode gemacht habe, werde es bei Gelegenheit nochmal in ruhe ausprobieren.
das kommt davon wenn man zwischendurch noch 3 mal sein design ändert :(

was ich tatsächlich untersuchen möchte ist:
1) ob innerhalb der trainingsteilnehmer ein Rückfall durch a) anzahl trainingssitzungen, b) self-esteem, c) anzahl Diagnosen vorhergesagt werden kann.
2) ob dieser zusammenhang zwischen (einfluss von/auf?) trainingssitzungen, self-esteem, Diagnosen und Rückfall signifikant unterschiedlich ist in der trainingskondition und der kontrollkondition

sprich
1) DV=Rückfall (0/1)
IV1=trainingssitzungen (1-3/4-6/7-12)
IV2=self-esteem (scale)
IC3=Diagnosen (scale (1-5))
+ alle 2 und 3weg Interaktionen, um zu schauen ob ein Effekt möglicherweise nur auftritt wenn 2 oder 3 dinge gleichzeitig auftreten?

2) DV1=Rückfall (0/1)
DV2=teilnahme (0/1)
IVs sind die gleichen wie oben. macht das sinn?

zu der Standardisierung hat mir mein prof geraten. der statistikunterricht ist leider schon etwas her und da war ich nie der beste von daher war ich mir extrem unsicher, wie ich eine Interaktion zwischen 2 unterschiedlichen variablentypen berechnen soll. er meinte standardisieren und dann ganz normal zusammenrechnen. dass das bei nominalen variablen Unsinn ist fällt mir, jetzt wo du es sagst auch auf. das ginge nur bei intervallskalierten oder?
Tobias Wa
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 29. Mai 2013, 19:55
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Welche Analyse ist am geeignetsten?

Beitragvon PonderStibbons » Sa 1. Jun 2013, 12:33

2) ob dieser zusammenhang zwischen (einfluss von/auf?) trainingssitzungen, self-esteem, Diagnosen und Rückfall signifikant unterschiedlich ist in der trainingskondition und der kontrollkondition

Das ergibt im Fall von Trainingssitzungen wohl wenig Sinn, die Kontrollgruppe hat keine.
IV1=trainingssitzungen (1-3/4-6/7-12)

Die musst Du in 2 dummy-Variablen umwandeln, allerdings
erledigt das manches Statistikprogramm wohl automatisch,
wenn man die Variable in der Analyse als kategorial deklariert.
+ alle 2 und 3weg Interaktionen, um zu schauen ob ein Effekt möglicherweise nur auftritt wenn 2 oder 3 dinge gleichzeitig auftreten?

Das Fragezeichen scheint darauf hinzudeuten, dass da nicht unbedingt
theoretische Überlegungen hinter stecken.
Es ist zu bedenken, dass viele Prädiktoren auch eine größere Stichprobe
erfordern. Vorhandene Stichprobengrößen (Anzahl Rückfälle/Nichtrückfälle)
sind leider nicht angegeben.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welche Analyse ist am geeignetsten?

Beitragvon Tobias Wa » Sa 1. Jun 2013, 17:16

Erstmal danke für deine Antworten.

mit den trainingssitzungen hast du natürlich recht, der rest würde mich schon interessieren.
das Fragezeichen war kein ausdruck von Unsicherheit bezüglich meiner Fragestellung sondern ehr ob diese Methode letztendlich das angeben wird, was ich möchte, nämlich dass (als Beispiel) die anzahl rückfälle bei trainingsteilnehmern mit hohem self-esteem geringer wird, wenn sie weniger als 3 Diagnosen haben. ich habe zwar keine Literatur oder andere hinweise die darauf hindeuten dass so ein Effekt bestehen könnte, aber es wäre schon interessant es zu prüfen. und eine Interaktion im sinne einer Verstärkung des effekts wäre durchaus denkbar. also, dass sowohl self-esteem als auch anzahl diangosen einen Effekt haben, zusammen genommen aber einen deutlich stärkeren Effekt erzielen.

genauere werte zu meinen Daten kann ich grad nicht nennen, kann es aber gerne bei Gelegenheit nachtragen.
Tobias Wa
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 29. Mai 2013, 19:55
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Welche Analyse ist am geeignetsten?

Beitragvon PonderStibbons » Sa 1. Jun 2013, 17:39

Als Faustregel gilt für die Mindest-Stichprobengröße, dass pro Prädiktor
(incl. jedem Interaktionsterm) 10, besser 15-20 Fälle der kleineren
Ergebnisgruppe vorliegen. D.h. wenn die Nicht-Rückfälle seltener
sind als die Rückfälle, sollten es bei bspw. 5 Prädiktoren mindestens
50 Nichtrückfälle sein. Das noch ohne das Problem, dass die Trainings
womöglich gruppenweise durchgeführt wurden, also keine unabhängigen
Beobachtungen vorliegen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welche Analyse ist am geeignetsten?

Beitragvon Tobias Wa » So 2. Jun 2013, 15:14

also ich habe in der kleinsten gruppe (trainingsteilehmer mit Rückfall) über 100 cases, sollte also reichen, oder?
was meinst du mit dem Problem, dass das Training womöglich gruppenweise durchgeführt wurde? das versteh ich nicht. Also das Training wurde random zugeteilt (ca 50%). die teilnahme war freiwillig, dadurch unterscheidet sich die trainingsanzahl.
bei der trainingsanzahl ist es allerdings so, dass hier die werte deutlich unterschiedlich sind. die meisten fallen in die gruppe 7-12 Sitzungen, in der gruppe 1-3 Sitzungen sind dann nur noch sehr wenige. genauso bei den Diagnosen. nur einer hat 5 Diagnosen, 4 Diagnosen kommt glaub ich auch nur einmal vor, deutlich am meisten haben lediglich 1 Diagnose.
könnte das ein Problem sein? wäre es besser das ganze in 2 gruppen aufzuteilen (1 Diagnose / mehrere Diagnosen)?
Tobias Wa
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 29. Mai 2013, 19:55
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Welche Analyse ist am geeignetsten?

Beitragvon PonderStibbons » So 2. Jun 2013, 18:27

ich habe in der kleinsten gruppe (trainingsteilehmer mit Rückfall) über 100 cases, sollte also reichen, oder?

Es sieht danach aus.
was meinst du mit dem Problem, dass das Training womöglich gruppenweise durchgeführt wurde? das versteh ich nicht.

Wenn die Teilnehmer nicht einzeln geschult wurden, sondern Schulungsgruppen
bildeten (fiktives Beispiel: je 6 Teilnehmer bildeten gemeinsam eine Gruppe
und wurden gemeinsam trainiert), wären die Beobachtungen innerhalb solcher
Gruppenb nicht unabhängig.
wäre es besser das ganze in 2 gruppen aufzuteilen

Schwer zu sagen. Ich würde es so lassen wie es ist.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Welche Analyse ist am geeignetsten?

Beitragvon Tobias Wa » So 2. Jun 2013, 18:47

hm, das mit den trainingsgruppen ist eine interessante Anmerkung. wenn ich dich richtig verstehe meinst du, dass es sein könnte, das es zwischen den trainingsgruppen unterschiede gibt, die evtl. einfluss auf das Ergebnis haben könnten?
ich würde jetzt der Einfachheit halber einfach mal unterstellen, dass das ganze weitestgehend standardisiert abgelaufen ist und sich alle möglichen unterschiede per random eingeschlichen haben und sich dadurch ausgleichen. mag vllt. nicht 100% perfekt sein, aber damit kann ich leben.

zur info, das Training findet jeden tag statt und im Prinzip soll jeder kommen, bis er 12 Sitzungen vollendet hat. dh. innerhalb der stunde die das ganze angeboten wird kommen alle wann sie möchten (das Training dauert ca. 10min) und wenn jemand gleichzeitig anfängt/aufhört ist das zufall. für jeden gibt es die gleichen Instruktionen und die gleichen trainingsmaterialien, der trainingsleiter wechselt täglich, allerdings auch auf zufälliger Basis.
Tobias Wa
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 29. Mai 2013, 19:55
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste