Paarweise vergleich zweier String-Listen

Fragen, die sich auf kein spezielles Verfahren beziehen.

Paarweise vergleich zweier String-Listen

Beitragvon floryan » Sa 24. Okt 2015, 18:57

Hallo miteinander!

mit meinem ersten Post darf ich mich (hoffentlich) gleich Hilfe suchend an euch wenden:
Und zwar würde ich gerne zwei Listen miteinander vergleichen um eine Aussage darüber zu machen, wieviele Elemente gleich zw wie ähnlich sich die Listen sind. Alle String-Elemente aus den Listen kommen aus einer geschlossenen Menge. In den Listen können aber müssen nicht gleich viele Elemente enhalten sein. Das Ganze ist vergleichbar mit zwei Einkaufslisten, auf denen verschiedene Güter stehen.

Ich würde nun wie gesagt diese zwei Listen gerne vergleichen. Ein simpler manueller Vergleich der Anzahl der Übereinstimmungen wäre mein erster primitiver Ansatz gewesen. Nachdem ich aber leider nicht vom Fach bin, hatte ich mich gefragt, ob es da vielleicht statistische Methoden gibt, um eine Aussage über die Ähnlichkeit zweier String-Listen zu machen. Nachdem ich nicht weiß, ob bzw. welches Verfahren zutrifft, habe ich jetzt einmal ins allgemeine Forum gepostet.

Vielen Dank im Vorhinein!
Flo
floryan
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Sa 24. Okt 2015, 18:53
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Paarweise vergleich zweier String-Listen

Beitragvon strukturmarionette » Sa 24. Okt 2015, 23:12

Hi,

sowas kann jede 'normale' Programmiersprache.
Vielleicht könnte es für Dich auch ausreichen, dass Du Dir mit irgendeiner Standardsoftware (Mikrosoft Word oder Excel) die zwei Listen (jeweils in einer Spalte) nebeneinander sortieren lässt.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
floryan

Re: Paarweise vergleich zweier String-Listen

Beitragvon bele » Mo 26. Okt 2015, 17:05

Hallo Flo,

Nachdem ich aber leider nicht vom Fach bin, hatte ich mich gefragt, ob es da vielleicht statistische Methoden gibt, um eine Aussage über die Ähnlichkeit zweier String-Listen zu machen

Schau Dir mal diesen Link an und entscheide dann selbst, ob die cosine similarity ein passendes Ähnlichkeitsmaß für Deine Fragestellung ist: http://blog.datascienceheroes.com/text- ... tice-in-r/

Ein ausgewiesener Text Mining-Spezialist hat sich meines Wissens bisher im Forum nicht hervorgetan, aber vielleicht meldet sich ja doch jemand.

HTH,
Bernhard


Nachtrag: Absatz 3 in diesem Paper führt einige Ähnlichkeitsmaße für Texte auf: http://nzcsrsc08.canterbury.ac.nz/site/ ... tering.pdf (Anna Huang, Similarity Measures for Text Document Clustering, 2008)
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5920
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1401 mal in 1387 Posts

folgende User möchten sich bei bele bedanken:
floryan

Re: Paarweise vergleich zweier String-Listen

Beitragvon floryan » Mi 28. Okt 2015, 20:50

Hi,

danke für die Antworten!

strukturmarionette hat geschrieben:Vielleicht könnte es für Dich auch ausreichen, dass Du Dir mit irgendeiner Standardsoftware (Mikrosoft Word oder Excel) die zwei Listen (jeweils in einer Spalte) nebeneinander sortieren lässt.


Ja, das hätte bzw habe ich ohnehin gemacht. Mir ging es eher darum, ob es hier Methoden gibt die etwas mehr 'sophisticated' sind.

bele hat geschrieben:Schau Dir mal diesen Link an und entscheide dann selbst, ob die cosine similarity ein passendes Ähnlichkeitsmaß für Deine Fragestellung ist: http://blog.datascienceheroes.com/text- ... tice-in-r/


Das sieht sehr interessant aus - an Text Mining hatte ich noch gar nicht gedacht. Danke!

LG
floryan
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Sa 24. Okt 2015, 18:53
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste

cron