Wie "mitteln"? simple linear least squares regression slopes

Alle Verfahren der Regressionanalyse.

Wie "mitteln"? simple linear least squares regression slopes

Beitragvon researcher » So 29. Dez 2013, 16:00

Hallo,

bei einem aktuellen Forschungsprojekt bin ich mir unsicher hinsichtlich der Datenauswertung und wollte ein paar andere Meinungen einholen. Obwohl es in der Studie um etwas anderes geht, hier die beispielhafte Problemdarstellung:
_____________________________________________
Wir sind ein Anästhesistenteam und haben auf Kongressen davon gehört, dass die Einspielung von Musik zur OP-Vorbereitung sich günstig auf Komplikationsraten, Blutungsrisiken etc. auswirkt. Unser sehr kritischer Chef glaubt nur immer das, was er selbst gesehen hat und wir beschließen, eine kleine eigene Proof-of-Concept-Studie durchzuführen. Wir können auf einer Dienstbesprechung das gesamt Krankenhauspersonal zum Mitmachen motivieren. Dazu geben wir für die freien Tage der MitarbeiterInnen mp3-Player mit guten Kopfhörern und digitale Finger-Pulsoxymeter mit Speicherfunktion nach Hause. Unter kontrollierten Kontextbedingungen sollen die KollegInnen dann Felix Mendelssohn Symphonie 4 in A-Dur "die Italienische" versus junge Tanzmusik JuniorSenior "Move Your Feet" hören, während das Pulsoxymeter die Herzschläge aufzeichnet. Zufällig ausgewählte 50% hören zuerst Mendelssohn und danach JuniorSenior, die restlichen 50% vice versa, um Reihenfolge-Effekte besser zu kontrollieren. Bei der Datenanalyse unterteilen wir die Hörzeit in 5 Epochen und berechnen jeweils die mittleren Herzfrequenzen. Mit einem FRIEDMAN oder QUADE-Test berechnen wir, einmal für Mendelssohn und einmal für JuniorSenior, ob es über alle 5 Zeitepochen über alle Versuchspersonen hinweg irgendwelche signifikanten Fluktuationen gegeben hat, d.h. wir kontrastieren mit der Nullhypothese, dass alle repeated measures aus ein und der selben Population stammen könnten. Wir erhalten beides mal ein signifikantes Ergebnis, d.h. JA unter beiden Musiken ändert sich die mittlere Herzfrequenz überzufällig.
_____________________________________________

Jetzt wollen wir noch wissen, WIE sich die Herzfrequenzen ändern und wir wollen alles nur auf lineare Trends vereinfachen, d.h. KEINE pairwise-comparisons aller 5 Epochen etc. Dazu berechnen wir für jede Person über die jeweiligen 5 Epochen, einmal für Mendelssohn und einmal für JuniorSenior, den "simple linear least square regression slope", der sagt uns: Herfrequenz steigt! vs. sinkt! vs. ändert sich wenig!, im Grunde ist das eine globale Aussage wie der Facebook-Daumen, gefällt mir oder gefällt mir nicht, aber wir wissen auch noch wie VIEL es steigt oder sinkt. (Natürlich müsste man im Experiment noch eine Kontrollkondition einbauen, in der die Leute z.B. einen Radiobeitrag hören). Unser Chef wollte eigentlich nur wissen durch eine eigene Studie: Kann unterschiedliche Musik tatsächlich das cardiovasculäre System messbar unterschiedlich beeinflussen?

Danke für Lesen bis hier hin...denn jetzt kommt meine statistsche Frage: WELCHE deskriptive Statistik kann ich verwenden, um die zentrale Tendenz der VERTEILUNG der slopes über alle Personen zu beschreiben, um so den TYPISCHEN slope Mendelssohn vs. JuniorSenior zu erhalten? Ganz spontan dachte ich daran, einfach die MEDIANE über alle individuellen slopes zu berechnen; als Streuungungsmaß würde ich dazu dann das 25. und 75 percentile mit angeben.

Aber dann habe ich mich erinnert, dass man bei Pearson Correlation Coefficients nicht so einfach mitteln darf, sondern vorher FISHERs z-transformieren muss, dann mitteln und dann diesen Mittelwert zurücktransformieren muss. Weil ja der standarized (!) regression slope, nicht der "unbehandelete" (!), denselben Wert wie die Pearson-Korrelation ergibt, liegt dieses Bedenken ja auch nicht so fern...Und ich befürchte, dass ich irgendeine Transformation vorschalten muss, bevor ich die regression slopes "mitteln" darf? Ich habe überall gesucht, konnte aber nichts finden...

Meinungen? Ideen?

Meine Frage ist also, WENN vorgeschaltete Transformation, WELCHE?
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon DHA3000 » So 29. Dez 2013, 20:14

Also irgendwie benutzt du englische Wörter auf der einen Seite übertrieben oft und auf der anderen Seite Deutsche, die nicht sehr verbreitet sind. Schon zu lange im Ausland? ;)

Mal etwas komprimierter, korrigiere mich, wenn ich es richtig verstanden habe:

Ihr habt die Herzfrequenz von Patienten (wieviele?) an fünf verschiedenen Zeitpunkten ("Epoche"???) betrachtet.
Dann habt ihr einen Mehrgruppen-Test durchgeführt und herausbekommen, dass die Mittelwerte nicht einheitlich sind.
Jetzt wollt ihr für jeden Patienten eine OLS-Regression aus 5 Messwerten errechnen?

Frage: Was sind das genau für Zeitpunkte? Im Zimmer, kurz vor der OP, bei der OP, nach der OP, am Abend?!
Das mit Pearson verstehe ich nicht, du rechnen ja nicht mit dem Korrealationskoeffizienten.

-----------------------------------------------------------------
Unabhängig davon mal generell:
Ihr wollt wissen, ob klassische Musik eine niedrigere Herzfrequenz bewirkt und somit wenige Komplikationen bewirkt?
Warum dann nicht einfach die Herzfrequnzen der Patienten einmal mit (Treatment-Gruppe) und einmal ohne (Kontrollgruppe) Musik aufzeichen und schauen, ob sich diee bei der Vorbereitung und dann während der OP signifikant unterscheiden? Das ist wäre eine klassische Differences-in-differences-Anwendung und erscheint mir hier am sinnvollsten. Zumal ich dann auch nicht fünf Zeitpunkte benötige, sondern nur zwei. Erläutere dies doch noch einmal genauer mit den Zeitpunkten. Die Kontrollgruppe fehlt sowieso irgendwie in eurem bisherigen Experiment?
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon researcher » So 29. Dez 2013, 20:50

"Schon zu lange im Ausland" -- messerscharf erkannt :D

Ihr habt die Herzfrequenz von Patienten (wieviele?) an fünf verschiedenen Zeitpunkten ("Epoche"???) betrachtet.
Dann habt ihr einen Mehrgruppen-Test durchgeführt und herausbekommen, dass die Mittelwerte nicht einheitlich sind.
Jetzt wollt ihr für jeden Patienten eine OLS-Regression aus 5 Messwerten errechnen?

Ja genauso ist es. Es wurden N=12 Personen jeweils unter den zwei Bedingungen gemessen. Wenn man die a priori Testpower mit z.B. dem Programm g*power für eine ANOVA mit Messwiederholung und alpha=0.05 und beta=0.20 ansetzt, kommt man auf N=12, wenn die Messwerte ziemlich hoch korrelieren, was sie nachweislich. Also für die parametrische ANOVA mit Messwdh. wäre N=12 ok und mit den non-parametrischen Alternativen, also FRIEDMAN oder QUADE, dürfte es zwar etwas kanpp sein, aber N=12 müsste noch akzeptabel sein.

Frage: Was sind das genau für Zeitpunkte? Im Zimmer, kurz vor der OP, bei der OP, nach der OP, am Abend?!

Das ganze war ja ein fiktives Beispiel, um die Problemstruktur an einem Beispiel zu verdeutlichen. Im Beispiel und auch in unseren Experimenten sind es 5 Zeitpunkte in immer dergleichen Situation/Setting, im Beispiel wäre dies am Wochenende zu Hause bei den Mitarbeitern wenn sie entspannt im Sessel sitzen, das entspricht einer "Labor"studie. Später dann in der Anwendung auf die OPs und deren Variablen wäre dies dann die "Feld"studie. Die Gesamtzeit, die die Musiken dauern, werden jeweils in 5 gleiche Epochen aufgeteilt, um so den Zeitverlauf abzubilden. 5 Epochen haben wir gewählt, weil es ja nicht klar ist, ob es sich um stationäre vs. non-stationäre Prozesse/Zeitverläufe handelt. Außerdem erhöhen mehr Zeitpunkte die statistische Testpower ;-)

In unserer realen Studie gibt es N=12 Personen, die in einer Sitzung mit Placebo-Stimulation vs. in einer anderen mit dem Verum, also dem wirklichen Stimulus behandelt werden. Reihenfolge ist crossover-randomisiert, d.h. 50% Pla-Ver und der Rest der Personen Ver-Pla. Nun geht es darum, wie der "mittlere" Zeitverlauf der Änderungen in den Herzfrequenzen über die jeweils 5 Zeit-Epochen aussieht. Mit FRIEDMAN/QUADE haben wir gesehen, DASS es Änderungen gibt, aber jetzt wollen wir die auch noch quantifizieren und das auf den einfachsten Fall einer zeitlichen Entwicklung reduzieren, d.h. eine lineare Abbildung. Deswegen die Berechnung der individuellen regression slopes, d.h. es gibt 12 slopes für Placebo und 12 für Verum über jeweils 5 Messzeitpunkte.

Und genau da weiß ich eben nicht, ob man über eine Verteilung von vielen SIMPLE LINEAR LEAST SQUARES REGRESSION SLOPES einfach so "mitteln" darf, d.h. z.B. den schlichten Median berechnen darf, um die zentrale Tendenz zu representieren, oder ob man davor noch irgendeine Transformation machen muss. Ich kam darauf, weil ja SIMPLE LINEAR LEAST SQUARES REGRESSION und die Pearson-Corr mathematisch f a s t dasselbe sind. Pearson Corr Coeff darf man eben NICHT einfach so mitteln, sondern muss Fisher's z-Transformation zwischenschalten...

Ich hoffe, jetzt ist meine Frage ein wenig klarer geworden ;-)
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon strukturmarionette » Mo 30. Dez 2013, 01:07

Hi,

der reale Stimuus ist demnach nicht Musik, sonder ein Verum?
Was in Eurem Sinn unter diesen ´Epochen´ zu verstehen ist, bleibt unklar.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon researcher » Mo 30. Dez 2013, 01:56

Hallo liebe Strukturmarionette,

in der klinischen Forschung nennt man das Gegenteil zum Placebo "das Verum" oder man spricht auch von Placebo- vs- "Verumgruppe". Verum und Placebo können sich in der pharmakologischen Forschung auf Substanzen beziehen, aber es können eben auch physikalische Interventionen sein wie z.B. Bestrahlungen oder Operationen oder sogar psychotherapeutische Interventionen. Sehr bekannt und erschreckend war zum Beispiel für Kniechirurgen, dass bei bestimmten Knorpelproblemen eine aufwändige endoskopische Knieoperation genauso spätere subjektive Zufriedenheit wie blosse Hauteinschneidung und Zunähen OHNE jede Operation im eigentlichen Sinne gebracht hat, deren Fazit: klinischer Nutzen der OP gleich null bei allen möglichen Risiken. Placebo war in diesem Fall die Schein-OP und Verum die reale Knie-OP. "Placebo" heisst auf Lateinisch einfach nur "ich werde gefallen" und "Verum" = das Wahre, das sind abstrakte Begriffe. In der Pharmakologie werden meistens heute auch noch in der Verumgruppe unterschiedliche Dosen der Substanz gegeben, z.B. 0.5x, 1x = Normaldosis, 2x= doppelte Dosis. Wenn eine Substanz wirksam sein soll, dann müssen alle drei Dosisstufen dem Placebo überlegen sein und außerdem sollte man noch sign. Unterschiede zwischen den Dosisstärken finden, was man dann dose-dependent response nennt. Diese Vorgehen kann noch mehr Evidenzen liefern, die dann noch besser die Kausalattribution zulassen: JA, die Substanz hat eine spezifische Wirkung...

Bei unserer Studie geht es tatsächlich um Audiostimulation, allerdings nicht um Musik, das war nur ein Beispiel. In Wirklichkeit sind es fast unhörbare leise Sinosoide, die mit einem Rauschen "maskiert" werden. Placebo ist bei uns nur dieses pure Rauschen, Verum ist Rauschen plus Sinosoide druntergemischt.

Das mit den Epochen ist eine gängige Bezeichnung in der Neurowissenschaft, wenn man mit Biosignalen arbeitet, die in aufeinanderfolgenden Zeitfenstern beobachtet werden, meistens wird z.B. pro Epoche gemittelt. Beispiel wieder aus der Musik, die Italienische von Mendelssohn ( http://www.youtube.com/watch?v=_HX_jF1_Tgc ) von ungefähr 25 Minuten, so ist es leichter zu rechnen. Stell Dir vor, wir stellen ein Mikrofon auf, dort wo der Dirigent steht, und nehmen alles auf. Dann unterteilen wir diese 25min in 5 Epochen = 5x5min. In jedem dieser Fenster/Epochen berechnen wir die mittlere Laustärke und bekommen so 5 Werte in z.B. Dezibel (dB). Das kann eben auch die mittlere Herzfrequenz über 5min sein, also hätte man 5 -Herzfrequenz-Werte, die den Zeitverlauf beschreiben. Diese Mittelung in Epochen macht man, damit die ganzen nonlinearen/nicht-stationären Vorgänge sich in der Mittelung gegenseitig (teilweise) aufheben, gutes Beispiel ist hier auch der Unterschied zwischen Wetter und Klima: Von Klima spricht man, wenn man in Epochen >30 Jahre mittelt, darunter spricht man von Wetter.

Ich hoffe, jetzt ist noch ein bissen deutlicher geworden, worum es mir geht. Meine Frage mit den slopes bezieht sich darauf, dass man für jede Person über diese 5x Fünfminutenmittelwerte die Regressionsgerade berechnen kann, für jede Person gibt es einen regression slope: einen für die Zeitentwicklung unter PLACEBO und einen unter VERUM. Und jetzt würde ich gerne irgendwie diese 2xN regression slopes mit jeweils einer deskriptiven Statistik zusammenfassen, d.h. über alle Personen hinweg gibt es einen "typischen" Wert für die PLACEBO slopes und einen für die VERUM slopes.

Ich bin ja inzwischen immer mehr für den einfachen Median, aber das muss diskutiert werden mit nicht-hauseigenen Statistikkundigen ;-)

Ah, ganz vergessen: Frohe Weihnachten :D
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon DHA3000 » Mo 30. Dez 2013, 02:59

Oha, hier lernt man ja noch so einiges. ;)

Aber: Allein aus statistischer Sicht sehe ich da zwei Probleme, die - bei aller Begeisterung für dein Projekt - dir nicht gefallen werden.
Man möge mich korrigieren, wenn ich falsch liege.

1) Der Quade-Test vergleicht im Grunde genommen mehrere Verteilungen. Du generierst diese Verteilungen faktisch diese aus 12 Beobachtungen. Das ist ziemlich sportlich. Normalerweise sollten dies so um die ~30 Werte sein. Wenn deine Software zufallswerte generieren kann, dann kannst du ja einmal (gegeben beliebigen Mittelwert und Varianz) dir Verteilungen "simulieren". Dann wirst du sehen, dass du mit 12 Werten nicht gerade zu einheitlichen Ergebnissen kommst. Das das Ergebnis deines Tests also signifikant ist, ist vollkommen logisch. Das liegt aber nicht unbedingt an der Unterschiedlichkeit der Stichproben, sondern an der unreichend beschriebenen, empirischen Verteilung.

2) Eine regressionsgrade aus 5 Werten zu berechnen ist noch sportlicher. :) Auch wenn es nur um die Tendenz geht. Vor allem: Du schreibst ja selber, dass deine Zeitreihe über die Epochen nicht linear ist (Stationarität lassen wir einal weg). Das Problem löst du aber nicht durch Mittelwertbildung über die einzelnen Epochen. Du hast dann ja nur weniger nicht-lineare Beobachtungen. Eine lineare Regression würde hier das Bild verfälschen.

Ich frage mich aber, wieso ihr überhauipt die Beobachtungen innerhalb der Epochen mittelt und nicht alle analysiert? Für mich klingt das erst einmal nach einer klassischen Zeitreihenanalyse.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon researcher » Mo 30. Dez 2013, 05:44

Danke für Die Antwort!

2) Eine regressionsgrade aus 5 Werten zu berechnen ist noch sportlicher. :) Auch wenn es nur um die Tendenz geht. Vor allem: Du schreibst ja selber, dass deine Zeitreihe über die Epochen nicht linear ist (Stationarität lassen wir einal weg). Das Problem löst du aber nicht durch Mittelwertbildung über die einzelnen Epochen. Du hast dann ja nur weniger nicht-lineare Beobachtungen. Eine lineare Regression würde hier das Bild verfälschen.

Ja Du hast natürlich Recht, aber es wie immer komplizierter. Es geht gar nicht um die HerzFREQUENZ, das hatte ich nur genommen als Beispriabilitätiel, um nicht die ganze Kiste der Herzratenvariabilitäts(HRV)-Analyse erklären zu müssen. Was ich nämlich eigentlich messe, sind Parameter, die die parasympathische Modulation der Herzfrequenz beschreiben, ganz genau ist es vor allem die Spectral Power im HighFrequency(HF)-Bereich, also über 0.15Hz, gemessen in milisec^2. Da die Snypasen des Parasympathicus schnell arbeiten (im gegensatz zu denen des Sympathicus) KANN alle Variabilität über 0.15Hz nur noch durch neuronale Prozesse des Parasympathicus erklärt werden. Wenn man sich entspannt, dann steogt die parasympathische Modulation der Herzfrequenz an. Also, jetzt kommts: die HF-Power darf man laut internationaler Taskforce (heißt wirklich so) nur über Epochen >=5min berechnen, weil sonst die Validität dieses Parameters nicht mehr gegeben ist, das hat man invasiv durch EKG-Ableitung einerseits und gleichzeitiges direktes Ableiten der Herznerven andererseits ausprobiert, vorwiegend an armen Versuchstieren. Fazit: eine Auflösung unter 5min ist auch theoretisch nicht möglich, es kann nur immer Werte über mindestens 5min geben und wenn der Stimulus 25min dauert (länger ist nicht zumutbar), dann gibt es eben nur 5 Werte. Die Reduktion auf eine gerade verwirft natürlich non-lineare Informationen, aber per Augenschein macht tatsächlich eine lineare Abbildung Sinn, die meisten Kurven folgen mehr oder weniger dem Muster steigt/sinkt/bleibt gleich. Die Reduktion/Projektion auf lineare Zusammenhänge ist gar nicht so ungewöhnlich, das wird oft gemacht (kein sehr hartes Argument): Indem man Information zwar verwirft, hat man aber den Vorteil, dass man besser vergleichen kann. Indem man alles über einen Kamm schert verwirft man Information, aber man gewinnt auch etwas. Unser Gehirn übrigens will ziemlich so alles auf lineare Zusammenhänge zurückführen, was oft mehr schlecht als recht zulässig ist, aber offenbar hat diese Tendez das Überleben der spezies begünstigt - so haben mir das mal Biologen erklärt.
ALSO, klar mit 5 Messpunkten ist die lineare Regression nichts weiter als ein blosses Curve Fitting, man kann nicht den Zusammenhang in der zugrundeliegenden Population zurückschliessen (Inferenzstatistik), es wäre halt nur ein ziemlich mickriger Versuch, die Zeitverläufe deskriptiv vergleichbar zu beschreiben und dann einen "Over-all"-Wert zu berichten.

Zum Quade-Test: Das parametrische Analogon wäre ja eine repeated measures ANOVA und da erreicht man mit N=12 (alpha=0.05 und beta=0.20) eine absolut zufriedenstellende Testpower. Aus Simulationsstudien zu den non-parametrischen Alternativen weiß man, dass der QUADE-Test mehr Testpower hat als der FRIEDMAN-Test, wenn es um <=5 repeated measures geht, darüber ist FRIEDMAN stärker. Wenn man mal von der Validität her argumentiert, werden mit dem QUADE-Test alle diejenigen physiologischen Parameter signifikant, die theoretisch zu erwarten sind, die anderen nicht: Es wurde noch vielmehr gemessen, z.B. die Spectral Power der Gehirnwellen (EEG). Genau an den Orten und in den Frequenzbanden, die theoretisch zu erwarten sind, zeigen sign. QUADE - Tests, dass es sign. Veränderungen über die Zeit gibt. Also, die vom a priori knowledge abgeleiteten Hypothesen werden sehr gut bestätigt durch QUADE, während dort, wo man es nicht erwartet, die p-values weit weg von der Signifikanzgrenze ausfallen.

Natürlich wäre eine Stichprobe von N=30 oder N=40, zweimal gemessen (PLACEBO vs. VERUM), ideal - das ist aber zeitökonomisch und auch finanziell undurchführbar . wir haben auch noch Hormonveränderungen in Speichelproben gemessen, jeweils Pre vs. Post und diese biochemischen Testverfahren sind sündhaft teuer.

In der Neurowissenschaft haben wir leider IMMER das Problem, dass wir am unteren Bereich der gerade noch zulässigen Stichprobenumfänge herumfischen, z.B. in der Positronen-Emissions-Tomographie (PET), weil da nur ein Versuch mehrere tausend Euro verschlingt. Dass man nicht auf Ebene der realen Zeitauflösung analysieren kann, sondern in Epochen mitteln MUSS, wird z.B. in der funktionellen Magnetresonanztomographie (fMRI) deutlich, dort arbeitet man mit dem sog. BOLD-Signal ( http://en.wikipedia.org/wiki/Blood-oxyg ... _dependent ). Durch das Mitteln werden die Messfehler/Rauschen etc. reduziert und die Signal-to-Noise-Ratio erhöht. Das gleiche Prinzip nutzt man beim Moving-Average-Filter, mit dem man Rauschen aus dem Signal herausfiltern kann, Beispiel hier: http://www.fourmilab.ch/hackdiet/e4/fig ... ure627.png Das Mitteln hat etwas mit Signal-Theorie zu tun und die ist wirklich ziemlich kompliziert un umfangreich, ich hoffe die Beispiele zeigen so ein bisschen worum es geht.

Das mit den Regression slopes ist auch nicht als harte, schließende Statistik einer Hypothesentestung gedacht, sondern als Versuch, die Tendenzen zwar wackelig, aber in nur illustrativer Form darzustellen.

Deswegen wiederhole ich nochmal die Frage, die mich auch ganz unabhängig vom konkreten Project interessiert: Darf man Regression-Slopes einfach so mitteln oder als Median deren zentrale Tendenz repräsentieren?
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon DHA3000 » Mo 30. Dez 2013, 12:47

Also Schritt für Schritt.

Das Argument "wir haben leider nicht mehr Datenpunkte, deswegen müssen diese ausreichen" höre ich immer wieder, vor allem aus dem medizinischen Bereich. Das mag sein, ja. Aber in dem Fall ist die Studie schlicht nicht durchführbar.
Jedenfalls nicht mit der fokussierten Methodik. Ich finde das Thema ansich interessant, und mir fallen auch mehrere Möglichkeiten ein, wie man man
Aber: Du erklärst alles sehr ausführlich, nur die Kernhypothese, die ihr testen wollt und was für Daten ihr genau habt, geht irgendwie immer unter. Versuch dies noch einmal zu erklären, ohne gleich inhaltlich großartig auszuholen und verwende möglichst statistische Begriffe. Das ist nämlich wichtig, um dir wirklich helfen zu können.

Ich mache mal den Anfang: Ihr habt zwölf Personen, für die ihr jeweils eine Zeitreihe mit Messzeitpunkten habt. Du schreibst, diese werden kontinuierlich erhoben, also diese Personen laufen mit einem Messgerät durch die Gegend und alle 5 min errechnet ihr einen Wert. Was genau heißt "wenn der Stimulus 25min dauert (länger ist nicht zumutbar)"? Also ich verstehe immer noch nicht den genauen Zeitraum, um den es hier geht. Ihr wollt dich einen bestimmten Event an einem Tag untersuchen oder? Und das gerät zeichnet den ganzen Tag auf? Oder hören die Leute willkürlich 25min Musik und das nur einen Tag und nur dieser Zeitraum wird aufgezeichnet? Bitte einfach nur den "Versuchsaufbau" genau beschreiben, nicht das ganze medizinische drum herum.

Zu deiner Frage mit dem OLS-Schätzer: Ja, den kann man mitteln, nur das ergibt bei 12 Werten vermutlich keinen Sinn. Dazu müsste man die Ergebnisse sich genauer ansehen. Aber du kannst nicht einfach mit einem nicht-parametrischen Test anfangen, dann mit nicht-linearität kommen und am Ende einen linearen Schätzer darüber legen. Damit wirfst du alle statistischen Argumentationen durcheinander und das wird dir jeder, der halbwegs statistisch bewandert ist, auf einer Konferenz um die Ohren hauen.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon researcher » Mo 30. Dez 2013, 23:49

Also, ich bin dabei eine Antwort vorzubereiten mit Grafiken der Daten, damit es deutlicher wird - morgen poste ich die dann. Es ist ja immer besser, über konrete Daten zu sprechen...
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie "mitteln"? simple linear least squares regression sl

Beitragvon researcher » Di 31. Dez 2013, 16:54

Vielen lieben Dank für Dein Interesse und Deine Hilfe und Frohes Neues Jahr!

das wird dir jeder, der halbwegs statistisch bewandert ist, auf einer Konferenz um die Ohren hauen.

Ja, deswegen muss es ja vorher auch mit Statistikexperten besprochen werden ;-)

Meine Antwort habe ich als komprimierte *.ZIP Datei angehängt, lies bitte das *.PDF und zum Schluss sehe Dir bitte das *.GIF an, das wird im Text erklärt. Die Originaldaten, falls Du auch was ausprobieren willst, habe ich als EXCEL-Datei dazugegeben.

Bin ja mal auf Deine Antwort gespannt.
Dateianhänge
statistik_forum.zip
*.ZIP-komprimiert, enthält *.PDF, *.GIF und *.XLSX
(691.1 KiB) 98-mal heruntergeladen
researcher
Beobachter
Beobachter
 
Beiträge: 13
Registriert: So 30. Sep 2012, 17:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste