Fachartikel
Überraschend einfach: Data-Profiling als Werkzeug, um schmutzige Datenprobleme anzupacken

Mick Gouldson beschreibt seine jüngsten Beobachtungen und Erfahrungen wie foryouandyourcustomers in Melbourne Methoden anwandte, um die Einhaltung von Anforderungen an die Datengültigkeit zu visualisieren und damit die Masseneinführung von übernommenen Produkten zu erleichtern und zu beschleunigen.
Wenn Unternehmen zu wachsen versuchen, indem sie ihre Lieferkette integrieren oder über Fusionen und Übernahmen, stossen sie unweigerlich auf das Problem, Produktdaten von unterschiedlichen Quellen mit variierender Datenintegrität einzubinden. Das Problem verschlimmert sich durch ein anspruchsvolles Set von Datenmodellen und Geschäftsregeln, die Unternehmen durchsetzen, bevor die erfolgreiche Integration von digitalen Produktinformationen erreicht werden kann.
Die Welt wird anscheinend immer wie kleiner. Organisationen versuchen hingegen durch Konsolidierung, Übernahme und Integration von ähnlichen, aber einzigartigen Unternehmen zu wachsen.
Eine typische Strategie für grosse Konzernorganisationen besteht darin, diese Unternehmen in ihr Kernsystem und ihre Geschäftsprozesse zu integrieren, mit dem Versuch, den Betrieb zu optimieren und letztlich Allgemeinkosten zu verringern. Während jedes der übernommenen Unternehmen ein einzigartiges Angebot für den Markt vorweist, wird der Konzern versuchen, jene Tätigkeiten zu konsolidieren, die nicht zur Differenzierung beitragen. Das bedeutet, die Daten zu konsolidieren und zu integrieren, die diese Unternehmen unterstützen. In dieser Hinsicht erweisen sich Produkt-Masterdaten als vergleichsweise anspruchsvoll.
Mit Produktdaten entstehen spezifische Herausforderungen, weil jedes der übernommenen Unternehmen zweifellos über eine eigene Definition von Prozess, Datenvollständigkeit und -qualität verfügt. Allgemein gesagt, je mehr ein Unternehmen wächst, desto mehr Kontrolle wird benötigt, um Prozesse zu formalisieren und die Produktdatenqualität zu steigern. Das wiederum hilft Chaos zu vermeiden und erlaubt ihnen, ihren organisatorischen Standards gerecht zu werden.
Um das benötigte Kontrollniveau zu erreichen, ist ein Projekt zur Datenbereinigung unausweichlich. In meiner Zeit als Business und IT-Berater habe ich gesehen, wie solche Projekte auf verschiedene Art ablaufen:
Das IT-Team wird verantwortlich gemacht. Das kommt selten gut, besonders, wenn das IT-Team eine technische und nicht produktorientierte Sicht auf das Problem hat.
Dem Kategorien/Produkt-Team wird die Aufgabe gegeben, die Daten zu „reparieren“. Das kann in spontanen Aufräumversuchen enden, mit schlechter Planung und schlechtem Verständnis davon, wo die Probleme in den Daten bestehen.
Der bewährteste Ansatz ist, wenn das Kategorien-Team verantwortlich ist und die richtige Unterstützung durch die IT erhält, um zu verstehen, wo sie ihren Fokus setzen sollen. Auf diese Weise können sie ihren Zugriff wirkungsvoll planen und die zur Verfügung stehenden Werkzeuge nutzen, um die häufigsten Probleme zu identifizieren.
Das Projekt
Vor Kurzem hatte ich die Gelegenheit, mit einem Konzern aus dem Automobil-Ersatzteilmarkt in Europa zusammenzuarbeiten. Dieser verfügt über eine Strategie zur Konsolidierung der Masterdaten über ihre verschiedenen Marken. Sie haben Stibo STEP als ihre Masterdaten-Plattform gewählt, die SAP als ihr ERP unterstützt.
Als Resultat von Fusionen und Übernahmen laufen zu jeder Zeit mindestens zwei bis drei Projekte zur Produktdatenmigration. Jedes der Projekte umfasst einzigartige Produkte aus unterschiedlichen Produktgruppen, wie beispielsweise Kupplung, Federung oder Bremsprodukte.
Jedes dieser Produkte verfügt über seine eigenen Anforderungen an Datenvollständigkeit und – Qualität. Darüberhinaus bestanden eine erhebliche Anzahl an Geschäftsregeln und Bedingungen, die erfüllt werden mussten, bevor ein Produkt erfolgreich nach SAP migriert werden konnte.
Das Problem
Als foryouandyourcustomers einbezogen wurde, kämpften die Produktmanager mit der Datenqualität. Sie versuchten die Daten zu bereinigen, wussten aber nicht, wo die Probleme lagen. Sie behoben ein Problem und trafen sogleich auf ein anderes.
Der Trial-and-Error-Ansatz erwies sich als ineffizient und umständlich. Sie wussten zudem nicht, wie viel länger die Datenbereinigung dauern würde. Einen Schritt zurückzutreten, um auf die grösseren Probleme zu fokussieren, war unmöglich. Die Produktmanager brauchten Erkenntnisse darüber, wofür sie ihre Zeit verwenden und wie sie ihren Ansatz zur Datenbereinigung planen sollen.
Unser Beitrag
Stibo STEP umfasst fortgeschrittene Fähigkeiten des Data-Profiling. Wir entschieden uns, diese Fähigkeiten von STEP zu verwenden, um grundlegende Dashboards, Berichte und Einsichten zu bieten. Diese erlauben es zu sehen, wo in den Daten die Probleme liegen. Das wird das Unternehmen dabei unterstützen, Fortschritte zu planen und darüber zu berichten.
Insbesondere haben wir das Attributwert-Profiling implementiert, das Einblicke gibt zu häufigen und seltenen Werten, allgemeine Muster, maximale Länge und Attributverwendung über Produktgruppen hinweg. Wir haben jede der Geschäftsregeln, Bedingungen und Validierungen genommen, die ausgeführt wurden, wenn jemand ein Produkt freigeben wollte. Das Resultat jeder Geschäftsregel haben wir in mehrwertige Attribute in einer neuen Attributgruppe, die auf dem Produkt gespeichert ist, geschrieben. Glücklicherweise hatten wir eine gute Arbeitsgrundlage dadurch, dass die Geschäftsregeln detaillierte Fehlermeldungen und -codes besassen, die von einem vergangenen Projekt dokumentiert waren.
Stibo STEP Data Profiling-Funktionen

Als die Geschäftsregeln vollständig und die Attribute belegt waren, konnten wir das Data-Profiling über diese Attribute und Produkte ausführen. Wir haben die erforderlichen Seiten dem Web-UI hinzugefügt, um die Lösung in die Geschäftsprozesse zu integrieren. Das Resultat ist ein sauberes Out-of-the-Box Dashboard für alle Produktgruppen, das den Produktmanagern zu sehen erlaubt, welche Fehlertypen existieren und welche am meisten verbreitet sind.
Diese Lösung bietet auch die Fähigkeit, bestimmte Fehlertypen auszuwählen und Produkte mit diesem Fehler zu filtern und zu suchen. Die Produktmanager können gezielte Aktion erstellen, um Daten zu suchen oder zu beschaffen, die belegt werden müssen, indem die relevanten Daten exportiert oder Massen-Updates durchgeführt werden, um spezifische Probleme zu beheben. Das Data-Profiling-Dashboard erlaubt dem Produktteam ausserdem, den Verbesserungfortschritt zu verfolgen und einen Aktionsplan zu formulieren. Das war in der Vergangenheit schlicht nicht möglich.
Fazit
Auch wenn das, was wir in STEP implementiert haben, einfach war, hat es einen beträchtlichen Geschäftswert geschaffen. Mit dieser Lösung können die Produktmanager und ihre Teams nun:
die Gültigkeit ihrer Daten verstehen,
systematische Probleme in ihren Produktdaten aufspüren,
den Fortschritt ihrer Datenbereinigungprojekte planen und messen,
und den Durchlauf und die Zeitpläne vorhersagen.
Die Lösung wurde so gut akzeptiert, dass sie nun zusätzlich zum ursprünglichen Fokus auf die Datenmigration auch für den allgemeinen Unterhalt und die Aktualisierung von Produkten übernommen wird. Mit diesem Ansatz und dieser Lösung konnte foryouandyourcustomers ein weiteres Mal einen unserer Kernwerte demonstrieren: „Überraschend einfach“.