Hallo ihr,
auf die Gefahr hin mich nun total zu blamieren versuche ich es trotzdem:
Ich teste zur zeit Strukturelle Alarme, d.h. kommt eine bestimmte Chemische Substruktur in einem Molekül vor wird dieses als positiv klassifiziert. Das ganze dient letzenendes der Vorhersage der Aktivität von neuen Molekülen und soll in der Entscheidung welches Molekül weiter getestet wird helfen.
Nun habe ich gesehen, dass dies für kleine und wenig komplexe Moleküle relativ gut funktioniert, aber bei größeren die Prädiktivität der Alarme sinkt. Meine Idee wäre also zu schauen ob es evtl Kombinationen von Substrukturen gibt die eine bessere Vorhersage liefern im Gegensatz zu einzelnen (oft gibt es pro Molekül mehrere Substrukturen die enthalten sind)
Also quasi wenn nur A oder B vorkommt ist die struktur negativ, wenn aber A und B vorkommen soll sie als aktiv klassifiziert werden. Gibt es denn eine sinnvolle Methode wie ich vorgehe um solche signifikante Kombinationen zu finden?
Ich bin leider total planlos wo ich überhaupt anfangen soll.
Mir langen auch gerne einmal ein paar Stichworte (Das Statistikbuch liegt neben mir, leider aber weiß ich gar nicht wo auf den 1000 Seiten ich anfangen soll) oder generelle Hilfen wie ich vorgehen sollte bzw ob sowas überhaupt realisierbar ist.
Ich hoffe jemand kann helfen und die Frage ist nicht allzu banal
Danke euch!
Grüßle