Blog ↗

Messung und Optimierung von Datenqualität

In Krisensituationen werden für die Beteiligten umfangreiche Daten benötigt. Berater, die ihre Liquiditäts- und Unternehmensplanungen mit Daten füttern, Insolvenzverwalter oder Sachwalter, die für ihre Verwaltungssoftware und Buchhaltung Daten anfordern, Stakeholder, die mit Informationen versorgt werden möchten und zuletzt das Krisenunternehmen, dass seine Daten in dieser Situation besonders sichern und schützen muss.

Doch die Daten können oft nicht unmittelbar verwendet werden, weil ihre Qualität für den jeweiligen Zweck nicht ausreicht. Es gilt daher in Krisenunternehmen, frühzeitig eine optimale Datenqualität sicherzustellen. Dafür müssen bereits im Vorfeld entsprechende Qualitätskriterien definiert werden.

 

Kriterien für Datenqualität (Data Quality Dimensions)

Daten messen und optimieren

Aus den Erfahrungen von Krisenprojekten wurden hierzu bereits einige Best-Practice-Ansätze entwickelt und elf Kriterien für Datenqualität identifiziert. In den seltensten Fällen müssen dabei alle der Kriterien gleichzeitig angewendet werden. Vielmehr werden sie dem Zweck der Daten entsprechend aus den elf Kriterien ausgewählt.

Besonders bei der erstmaligen Definition der Kriterien lohnt es sich aus unserer Sicht, im ersten Schritte nur die drei wichtigsten Kriterien anzuwenden und diese erst in einem zweiten Schritt um die folgenden vier Kriterien zu erweitern. Im Laufe der Zeit können dann schließlich schrittweise und die restlichen Kriterien angewandt werden.

 

Die 11 Kriterien für Datenqualität

 1.    Vollständigkeit

Ein Datensatz muss alle notwendigen Attribute enthalten. Attribute müssen alle notwendigen Daten enthalten.

2.    Richtigkeit

 Die Daten müssen mit der Realität übereinstimmen

3.  Aktualität

 Alle Datensätze müssen jeweils dem aktuellen Zustand der abgebildeten Realität entsprechen. 

4. Eindeutigkeit

 Jeder Datensatz muss eindeutig interpretierbar sein.

5. Genauigkeit

Die Daten müssen in der jeweils geforderten Exaktheit vorliegen.

6.  Konsistenz

Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen.

7. Relevanz

Der Informationsgehalt von Datensätzen muss den jeweiligen Informationsbedarf erfüllen.

8.  Redundanzfreiheit

Innerhalb der Datensätze dürfen keine Doppelungen vorkommen.

9. Einheitlichkeit

Die Informationen eines Datensatzes müssen einheitlich strukturiert sein. Das heißt, eine Menge von Daten wird fortlaufend einheitlich präsentiert.

10. Zuverlässigkeit

Die Entstehung der Daten muss nachvollziehbar sein.

11. Verständlichkeit

Die Datensätze müssen in ihrer Begrifflichkeit und Struktur mit den Vorstellungen der Informationsempfänger (z.B. Fachbereiche) übereinstimmen.

 

Praxisbeispiel für die Anwendung der 11 Datenqualitäts-Kriterien

Das folgende Bild zeigt anschaulich, wie die Kriterien in der Praxis zur Anwendung kommen können.

 

Kriterien für Datenqualität

 

Fazit

Die Definition der Datenqualitätskriterien macht es möglich, Datenqualität zu messen und auf Basis dessen, schnell Problemfelder aufzeigen. Im weiteren Verlauf mag es sich anbieten, auf Grundlage der Ergebnisse, eine weitergehende Analyse der Problemursachen durchzuführen. Die Ergebnisse können anschließend wichtige Einblicke in das Krisenunternehmen geben, die für den weiteren Sanierungs- oder Restrukturierungsprozess von Nutzen sein können.