Wonach muss ich Suchen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Wonach muss ich Suchen

Beitragvon susi.sch » Di 22. Jan 2019, 23:11

Guten Abend,

ich war während meines Studiums sehr fasziniert von der Statistik und wollte daher meiner neuen Kollegin Arbeit abnehmen.
Leider stehe ich völlig auf dem Schlauch: Ich weiss einfach nicht mehr was ich machen soll, geschweige denn, wonach ich suchen soll.

Könnte mir jemand sagen, wie ich folgenden Sachverhalt klären kann - also nach welchem Verfahren ich suchen soll? :? :?

Wäre Super!

Sachverhalt:

Stoff A: Besteht zu 10% aus Zutat 1, 15% aus Zutat 2, 20 % aus Zutat 3, 24% aus Zutat 4, 1% aus Zutat 5 + rest
Stoff B: Besteht zu 33% aus Zutat 1, 4% aus Zutat 2 usw. + rest
Stoff C: Besteht zu 7% aus Zutat 1, 5% aus Zutat 2, 50 % aus Zutat 3, 4% aus Zutat 4, 21% aus Zutat 5 + rest
Stoff D: Besteht zu 43% aus Zutat 1, 1% aus Zutat 2, 20 % aus Zutat 3, 24% aus Zutat 4, 1% aus Zutat 5 + rest
Stoff E: Besteht zu 1% aus Zutat 1, 45% aus Zutat 2, 3 % aus Zutat 3, 24% aus Zutat 4, 10% aus Zutat 5 + rest

Ich will wissen:
Zu welchem Stoff gehört X mit der Verteilung: Besteht zu N aus Zutat 1, N% aus Zutat 2, N % aus Zutat 3, N% aus Zutat 4, N% aus Zutat 5

Von den Stoffen X habe ich über 200 denen ich ein Stoff A - E zuweisen muss. Also jeweil des Stoff der am besten passt.

Am Ende will ich habe: Stoff X1 passt am ist eher E, Stoff X2 ist eher Stoff A usw....

Wie heisst das verfahren mit ich das zuordnen kann. Und geht das in R?

Ich hoffe das ist einigermaßen Verständlich....

Grüße!
susi.sch
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 22. Jan 2019, 22:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Wonach muss ich Suchen

Beitragvon strukturmarionette » Mi 23. Jan 2019, 06:13

Hi,

- wie lauten die Rohmesswerte in konkreten Maßeinheiten je Stoff?
- auf was beziehen sich die Prozentuierungen welcher Substanzen?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
susi.sch

Re: Wonach muss ich Suchen

Beitragvon susi.sch » Mi 23. Jan 2019, 13:09

Hallo,

Es geht darum, dass Ester (langkettige organische Verbindungen) nach aktuellen Forschungen in Gruppen eingeteilt werden können.

Die Masserprozenten in den Gruppen ist fest definiert
Stoff/Gruppe A: Besteht zu 10 Masseprozent aus Chloriden --> "Zutat 1", 15 Masseprozent aus Carbonsäuren --> Zutat 2 usw.


Jetzt habe ich 200 verschiedene Ester und würde diese gerne meinen Gruppe zurodnen. Also ist Ester 1 eher Gruppe A/B/C/D/E?

Grüße!
susi.sch
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 22. Jan 2019, 22:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Wonach muss ich Suchen

Beitragvon PonderStibbons » Mi 23. Jan 2019, 13:33

Man könnte ein geeignetes Ähnlichkeits- bzw. Unähnlichkeitsmaß (Distanzmaß) finden,
um zu bestimmen, zu welcher Gruppe ein Stoff am ähnlichsten ist.
Vielleicht passt die Mahalanobis-Distanz. Oder ganz schlicht die euklidische Distanz.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
susi.sch

Re: Wonach muss ich Suchen

Beitragvon bele » Mi 23. Jan 2019, 16:47

Wäre auch mein erster Vorschlag, dass man zu jedem Stoff X zunächst die euklidische Distanz zu den Stoffen A bis E berechnet und dann nach der kleinsten euklidischen Distanz sucht. Dann kann man ja vielleicht die Freundin oder jemand anders mit guten Kenntnissen in organischer Chemie befragen, ob es Zutaten gibt, denen eine höhere Relevanz zuschreibt als anderen und durch ein gewichtetes Distanzmaß die Zuordnung noch verbessern.

In R kann man Distanzmatrizen mit der Funktion dist berechnen. Voreingestellt kennt die folgende Distanzmaße: "euclidean", "maximum", "manhattan", "canberra", "binary" or "minkowski". Auch da würde ich zunächst mit der Freundin oder jemandem mit Ahnung von Chemie mal die Liste durchgehen, ob irgendwas davon besser passt als euklidisch. Erläuterungen, was diese sechs Distanzmaße machen erhält man, wenn man in R
Code: Alles auswählen
help(dist)

eingibt.

Ein brauchbarer Anfang für Dich könnte so aussehen:

Code: Alles auswählen
zusammensetzung <- data.frame(
  chloride = c(1, 1, 3, 6, 20),
  carbonsauren = c(1, 1, 5, 40, 40),
  oxalsäuren = c(1, 2.1, 40, 10, 10)
)
row.names(zusammensetzung) = c("X1", "A", "B", "C", "D")

print(zusammensetzung)

distanzmatrix <- dist(zusammensetzung)

print(distanzmatrix)

print(distanzmatrix[1:4])

print(attr(distanzmatrix, "Labels"))[which.min(distanzmatrix[1:4])+1]


Der nach meiner Meinung beste Ort für Fragen zur Anwendung von R ist forum.r-statistik.de . Statistikfragen sind hier besser aufgehoben.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5917
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1399 mal in 1385 Posts

folgende User möchten sich bei bele bedanken:
susi.sch

Re: Wonach muss ich Suchen

Beitragvon susi.sch » Do 24. Jan 2019, 09:35

Danke für eure Antworten!

Die euklidische Distanz scheint mir am besten geeignet um einen Eindruck der "Ähnlichkeit" zu ermitteln.

Der Ansatz für R hat mir ebenfalss schonmal weitergeholfen.

Danke an alle die sich Gedanken über das Problem gemacht haben!
Schönen Tag euch!
susi.sch
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 22. Jan 2019, 22:58
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 9 Gäste

cron