Problem aus dem Berich Verhalten/Biologie

Fragen, die sich auf kein spezielles Verfahren beziehen.

Problem aus dem Berich Verhalten/Biologie

Beitragvon Hausmarke » Do 2. Jul 2015, 15:45

Hallo liebes Forum,

hat jemand vielleicht eine Idee zu folgendem Problem (Lösungen können auch Matlab/SPSS,C,C++,...) beinhalten:

Wir haben ein Experiment bei dem es etwa 21 verschiedene Zustände gibt (Zahlen zwischen 1-21);
Wir können derzeit etwa 600 Zustandandsänderungen aufzeichnen – wir bekommen demnach eine Zahlenreihe mit 600 Werten - jeder Wert jeweils zwischen 1-21;

Wir wollen nun herausfinden,
*ob bestimmte Subreihen (Wiederholungen) öfter als andere vorkommen – ob es da zu "Häufungen" kommt...
*ob es auch innerhalb und zwischen diesen häufig vorkommenden Subreihen zu Abhängigkeiten/Trends kommt – zb Subreihe x folgt in 90% der Fälle Subreihe y.

Hat da wer eine Idee dazu? Ich nehme mal an, das dieses Problem schon x-mal gelöst wurde? Wie heißt überhaupt diese Fragestellung als Fachbegriff?

Danke schon mal im Voraus...
Hausmarke
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 2. Jul 2015, 14:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon bele » Do 2. Jul 2015, 15:55

Hallo Hausmarke,

kann man "Subreihen" irgendwie weiter eingrenzen? Haben "Subreihen" eine kleinste oder größte Anzahl von Stellen oder können Sie beliebig lang sein? Gegeben folgende Reihe:
Code: Alles auswählen
1 2 3 2 1 1 2 3 2 1 1 2 3 2 1 1 2 3 2 1

wiederholt sich hier viermal die Reihe 12321 oder zweimal die Reihe 1232112321 oder folgt hier die Reihe 21 jeweils der Reihe 123? Oder alles gleichzeitig? Ich denke es wäre sehr hilfreich, wenn man das etwas eingrenzen könnte.
Muss jeweils nur eine 600er Reihe untersucht werden oder ist damit zu rechnen, dass in verschiedenen 600er Reihen jeweils dieselben "Subreihen" auftauchen?

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon strukturmarionette » Do 2. Jul 2015, 16:08

Hi,

Hat da wer eine Idee dazu?


- Hast du dir die 600 Zahlen bereits einmal mit einem Liniendiagramm ausgeben lassen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4356
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon Hausmarke » Do 2. Jul 2015, 16:19

Hallo;


Danke erst mal für deine Rasche Antwort!

Also wir nehmen an, dass die Länge dieser Subreihen schon begrenzt ist - ich würde jetzt mal ad hoc so 5-7 Elemente als Begrenzung annehmen - es kann jedoch auch sein, dass wir im Experiment dann längere, komplexere Abläufe übersehen könnten. nun aber starten wir mal mit einer kleinen n bei der Anzahl der Elemente einer Subreihe.
Was die Wiederholung betrifft, so wäre es eben toll, wenn wir von eben sagen wir mal von max. 5-7 Elementen die Analyse "Rückwerts" führen könnten - zB max Elementenläng 7,... 6,... usw und danach jeweils ein Ergebnis sehen würden.
Das mit dem doppelten vorkommen einer Folge hinter einander ist eben für uns auch interessant, weil es sich ja um ein biologisches Experiment handelt und davon ausgegangen werden kann, dass es häufig zu ähnlichen Abfolgen kommen wird. Genau um das geht es ja auch darum - wir wollen mit einer Versuchsgruppe und einer Kontrollgruppe fest stellen, ob sich bei der Häufigkeit und auch der Reihenfolge (Abfolge) der Subreihen was signifikantes fest stellen lässt.

Und ja - wir werden mehrere (derzeit max) 600er Zahlenreihen vermessen - eventuell in Zukunft auch längeren.

HM
Hausmarke
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 2. Jul 2015, 14:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon Hausmarke » Do 2. Jul 2015, 16:20

strukturmarionette hat geschrieben:Hi,

Hat da wer eine Idee dazu?


- Hast du dir die 600 Zahlen bereits einmal mit einem Liniendiagramm ausgeben lassen?

Gruß
S.


Nein - wir sind erst in der Planungsphase des Experiments - wir kennen nur die Eckdaten unseres Messtools.
Hausmarke
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 2. Jul 2015, 14:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon bele » Do 2. Jul 2015, 19:58

In 600 Messungen gibt es endlich viele 5er oder 6er Gruppen. Die kann man durchprobieren. Hat jemand in dem Team Erfahrung mit einer Programmiersprache? Es ist nicht so wichtig welche. Man könnte von Stelle 1 bis 595 alle 5er Gruppen nehmen und dann diese Liste sortieren und in der sortierten dann recht einfach schauen, wie oft welche vorkommt. Oder man nimmt alle vorkommenden, nimmt jede nur einmal und nutzt jede als regular expression jm zu zählen, wie häufig sie vorkommt.Reguläre Ausdrücke sind in allen Sprachen schnell implementiert, auch in Interpretersprachen wie R oder Python.
Wichtiger als die Wahl der Sprache wäre, dass jemand die Sprache schon kennt.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon strukturmarionette » Fr 3. Jul 2015, 01:32

Hi,

Ich nehme mal an, das dieses Problem schon x-mal gelöst wurde?

- warum diese Annahme?

Wie heißt überhaupt diese Fragestellung als Fachbegriff?

- Welche Fragestellung? Du nennst doch nichts konkretes.

wir wollen mit einer Versuchsgruppe und einer Kontrollgruppe fest stellen,

- wie groß sollen die Gruppen denn werden?
- wie soll die Zuordnug der Bedingungen zu den Gruppen erfolgen?
- was sind die Merkmalsträger?
- worin besteht das Treatment?
- welche unabhängigen Variablen existieren neben dem Treatment bzw sind relevant?
- was wird wie gemessen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4356
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon Hausmarke » Fr 3. Jul 2015, 09:56

@Bernhard: Interessanter Ansatz - allerding hab ich dann immer noch das Problem, dass ich keine Trends drin habe, ob und welche Subreihen häufiger anderen (auch mehreren) Subreihen folgen.

@strukturmarionette
-warum diese Annahme?
Naja - es kann ja nicht sein das wir die einzigen sind die in einer endlichen Menge an Daten mit einer endlichen Menge an Zuständen da drin dann Trends und Häufungen fest stellen wollen - mir fallen da ad hoc gleich ein paar andere AUsfgebengebiete zb in Verkaufs/Warenwirtschaft oder auch diese klassische "Trends" sachen im Netz ein "Leute die diese gekauft haben, haben auch Interesse an jenen Produkten..."
Außerdem war ich der Annahme, dass in einem der unzähligen Menüs verschiedenen Tests/Analysen im SPSS schon auch ein Ausdruck für mein Problem passend sein sollte...;)

- Welche Fragestellung? Du nennst doch nichts konkretes
Naja - muss man den die biologische Frage kennen, um ein Mathe./Stat. Problem zu lösen?
Ich kann nur eingeschränkt darüber berichten - es handelt sich um ein Experiment in neurologischer Grundlagenforschung.
Du kannst es dir in etwa so vor stellen: wir haben die Möglichkeit mit einem Videoüberwachungssystem/diversen Bewegungssensoren automatische Bewegungsanalysen zu erstellen. Dieses System kann dann eben die genannten etwa 21verschiedenen eindeutigen Bewegungen aufzeichnen (zb Tier geht nach links,Tier geht nach rechts, Tier hebt linke vordere Pfote,Tier hebt rechte vordere Pfote...,Tier putzt linke vordere Pfote, rechte vordere Pfote,...usw
Wir können also anhand einiger Basisbewegungsmuster analysieren lassen was ein Tier in einer bestimmten Umgebung so macht.
Wir wollen nun zb wissen, wie sich so ein Verhalten ändert, wenn wir zb dieses "Umgebung" ändern - zb Dinge dazu oder weg nimmt, Temp. oder Geräuschkulisse ändert,usw ...
Wie gesagt - diese Beschreibung ist in etwa der grundsätzliche Aufbau unseres geplanten Experiements.

greets
Hausmarke
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Do 2. Jul 2015, 14:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon bele » Fr 3. Jul 2015, 16:57

Hausmarke hat geschrieben:@Bernhard: Interessanter Ansatz - allerding hab ich dann immer noch das Problem, dass ich keine Trends drin habe, ob und welche Subreihen häufiger anderen (auch mehreren) Subreihen folgen.


Hi,

ich denke, das kann man sich in einem zweiten Schritt überlegen, wenn man die Daten gesehen hat. Ich habe mal ein Beispiel für meinen Ansatz in R erstellt:

Code: Alles auswählen
# wir brauchen eine 600 Zahlen lange Folge von "a" bis "u",
# zum Ausprobieren simulieren wir die zufällig und manipulieren
# ab Stelle 50 ein paar Wiederholungen rein:
samplesize = 600
daten <- sample(x = letters[1:21], size = samplesize, replace=TRUE)
daten[50:67] <- c("a","b","c","a","b","c","a","b","c","a","b","c","a","b","c","a","b","c")

# Identifikation möglicher "Subreihen" und Zählen von deren Häufigkeit mit count.occ()
count.occ <- function(vector, length=5, ss=samplesize){
    subs <- character(ss-length) # list of all "Subreihen"
    for(i in 1:(ss - length)){
        subs[i] <- paste(daten[i:(i+length-1)],collapse="")
    }
    print(table(sort(subs)))
    return(subs)
}

# Hier wird die Funktion count.occ mit unseren Beispieldaten aufgerungen und
# die "Subreihen" in subs gespeichert
subs <- count.occ(daten)

# Hier eine erste Annäherung an einen diagnostischen Plot. Damit könnte man
# spielerisch schnell finden, dass hier nicht  Subreihen der Länge 5 sondern der
# Länge 3 oder 6 gesucht werden müssten.
plot(1:595,table(subs)[subs[1:595]],
     xlab="Order of appearance", ylab="total repetitions")


Jede Deiner Zahlen von 1 bis 21 wird durch einen Buchstaben von "a" bis "u" repräsentiert. Ich ziehe erst eine 600 Zeichen lange Folge zufällig und ersetze dann Nummer 50 bis 67 durch die Wiederholung von "abcabcabc...", damit sich auch wirklich irgendwas wiederholt. Dann definiere ich eine Funktion count.occ die von jedem 5item Substring zählt, wie häufig er vorkommt. Das sieht dann z. B. so aus:

Code: Alles auswählen
aadik abcab abckd abmgs abntm acars addhf addpt adikn adpua aemsr
    1     5     1     1     1     1     1     1     1     1     1
ahdje ahdru ahpai aigal aihqr ailiu aimet aitih akflj alupj ampfd
    1     1     1     1     1     1     1     1     1     1     1
amqsc anbku aostj aptek arsmq aruue asbsl aspcg atqdo augth babca
    1     1     1     1     1     1     1     1     1     1     1
baugt bbcsp bcabc bckdt bcspd bdksu bdpkg bfpfb bgoqh bkutk bmgsk
    1     1     5     1     1     1     1     1     1     1     1
bntmr bpadd bpfie bppai bqrmg bqtqt brrhe bscoh bslfa bueiq cabca
    1     1     1     1     1     1     1     1     1     1     4
cabck cabnt campf carsm cbsco ccbsc cekth cfqip cgtfj chido chutc
    1     1     1     1     1     1     1     1     1     1     1
... und so weiter ...


count.occ hat erkannt, dass die Zeichenfolge "abcab" 5x vorkommt und auch dass "bcabc" 5mal vorkommt, "cabca" aber nur 4x vorkommt.

Dann habe ich einen Plot erstellt, wo auf der y-Achse alle 595 5er-Subreihen abgetragen werden und auf der y-Achse, wie oft die jeweilige Subreihe vorkommt. Wenn sich nicht allzuviel wiederholt, bekommt man hier schon einen guten Überblick. Je nachdem, wie die Daten sich dann verteilen kann man so eine Folge natürlich auch noch graphisch aufmotzen, bis man die Zusammenhänge erkennt, wenn es denn welche gibt. Die Grafik kann ich Dir hier nicht hochladen, aber wenn Du Dir R von http://www.r-project.org installierst, dann kannst Du einfach den Code von oben hineinkopieren und siehst die Grafik auch. Das ist noch keine Lösung, deutet aber an, wie ich das Problem angehen würde. Wenn man erkennt, dass es sehr viele Wiederholungen gibt, müsste man überlegen, welche davon man interessant findet. Wenn es nur wenige Muster gibt, könnte man die farblich codieren und darstellen. Wie gesagt, flexibel je nach Präzisierung der Aufgabe anhand der Zwischenergebnisse.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5928
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1403 mal in 1389 Posts

folgende User möchten sich bei bele bedanken:
Hausmarke

Re: Problem aus dem Berich Verhalten/Biologie

Beitragvon strukturmarionette » Fr 3. Jul 2015, 17:43

Hi,

gut, Merkmalsträger für Eure biologischen Experimente sollen Tiere sein.
Das ist aber nicht ausreichend, um verwertbare und hilfreiche statistische Verfahren empfehlen zu können.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4356
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 587 mal in 584 Posts

Nächste

Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste