Blog ↗

So hilft Ihnen der Datenkatalog, optimale Datenqualität zu erreichen

Eine optimale Datenqualität ist in Krisenunternehmen heute von sehr großer Bedeutung, denn auf ihrer Grundlage werden Datenanalysen durchgeführt werden, die wiederum Basis für sehr weitreichende Entscheidungen sein können. Eine unzureichende Datenqualität, also z.B. Fehler in den Daten, können zu Fehlentscheidungen mit enormen finanziellen Folgen führen. Zur Erzielung einer optimalen Datenqualität gibt es eine Reihe von Maßnahmen, wie u.a. schon in unserem Artikel zum Thema „Data Cleansing” beschrieben.

datenkatalog

Doch schon vor dem eigentlichen Prozess der Datenerfassung kann die Datenqualität durch die Bestimmung eines „Dateneigenschaftskatalogs” gesteigert werden. Dieser Katalog, auch „Metadaten” genannt, ist mit allen Datenobjekten ausgestattet. Datenobjekte sind alle realen Objekte, die durch Daten repräsentiert werden, z.B. Geschäftspartner für Kunden und Lieferanten, Buchungen für Bewertung von Geschäftsvorfällen oder Artikelnummern für Produkte. Die Metadaten dienen später als wichtiges Mittel, um geeignete Daten für Analysen zu identifizieren. Zugleich erfüllt es den Zweck, die Vollständigkeit, Richtigkeit und Aktualität der Daten sicherzustellen.

Der gesamte Datenbestand eines Krisenunternehmens lässt sich auf diese Weise einheitlich strukturieren und damit vor Lücken und Redundanzen schützen.

Die folgende Grafik zeigt die Visualisierung eines Datensatzes, der ohne einen Datenkatalog erstellt wurde.

Word-cloud unbekannt

Alle Attribute, die nicht vorhanden waren, erhielten im Datensatz Werten wie „unbekannt“, „unknown“, „various“ oder „N/A“. In einem Datenkatalog wären für alle unbekannte Werte ein einheitlicher Wert wie beispielsweise „unbekannt“ verwendet worden.