fuzzycheKc – Erkennung von ähnlichen Daten

September 11, 2012
By

This post was kindly contributed by eoda, R und Datenanalyse » R - go there to comment and to read the full post.

  • Lösung zur Steigerung der Datenqualität
  • Vollautomatisches Erkennen von Duplikaten und ähnlichen Einträgen
  • Vollständige Integtation in bestehende Systeme

Datenqualität hat eine hohe Relevanz für viele IT-Systeme wie CRM- oder ERP-Systeme. Richtige, vollständige und aktuelle Daten sind essentiell für erfolgreiche operative Prozesse. Darüber hinaus ist auch die Qualität analytischer Auswertungen ganz besonders von einer guten Datenqualität abhängig wie zum Beispiel beim analytischen CRM. Adressdaten in CRM-Systemen sind ein Bereich, in dem Datenqualität immer wieder eine besondere Rolle spielt. Fehlerhafthaft zugestellte Rechnungen sind dabei eines von vielen plakativen Beispielen für unzureichende Datenqualität.

Duplikate als eines von vielen Fehlerbildern unzureichender Datenqualität ziehen eine Reihe von Problemen auf verschiedenen Ebenen nach sich und sind in einem CRM-System ein besonders großes Ärgernis. Beispiele dafür sind mehrfache Ansprachen von Kunden und Interessenten verbunden mit Vertrauensverlust, unklare Zuordnung im Vertrieb oder fehlerhafte Auswertungen im Reporting. Auch Data Mining oder Predictive Analytics werden auf Basis von Datenbeständen mit einem hohen Anteil von Duplikaten nur mäßig gute Ergebnisse liefern können.

Verschiedene Initiativen führen dazu, dass stetig neue Daten in CRM Systeme integriert werden. Neue Leads, Kontakte oder Firmen werden unter anderem durch Webformulare, Adresskäufe, aus Projekten zur Leadgenerierung oder Firmenübernahmen stetig neu importiert. Dementsprechend ist die Gefahr, die Qualität der bestehenden Datenbestände durch Duplikate zu verwässern, systemimmanent und kaum vermeidbar.

Eine besondere Herausforderung im Zusammenhang mit Duplikaten sind ähnliche Einträge. Während ein CRM-System oft eindeutige Duplikate erkennen kann, lassen sich viele ähnliche Werte in Leads, Firmen oder Kontakten nicht so leicht identifizieren.

Mit fuzzychekc bietet eoda eine Lösung, die Sie dabei unterstützt, ähnliche Einträge in Datenbeständen wie Adressdatenbanken, Stücklisten etc. zu finden und als Duplikat oder gültigen Eintrag zu kennzeichnen. So können Sie einfach ihre Adressdatenbestände aufräumen.

Anwendungsbereiche

  • Integration von neuen Kundendaten, Kontakten, Leads,
  • Stetige Überwachung bestehender Datenbestände,
  • Ad hoc Deduplizierung für Aktionen wie Marketingkampagnen.

 

Tags: , , , , , ,

Comments are closed.