Identifizieren der Anforderungen an die Datenqualität

Mit der Data Reviewer-Lizenz verfügbar.

Eine der Herausforderungen bei der Implementierung von Datenqualitätskontrollen ist die Feststellung der technischen Datenqualitätsanforderungen für die Organisation. Es ist wichtig, die geschäftlichen Anforderungen an die Daten zu identifizieren und zu verstehen, bevor diese in technische Anforderungen übersetzt werden, die Daten von guter Qualität ausmachen.

Eine effektive Datenqualitätskontrolle basiert auf dem Verständnis dafür, wie Daten und Informationsprodukte innerhalb und außerhalb der Organisation verwendet werden. Jede Organisation definiert Qualität anders und stützt diese Definition auf den beabsichtigten Zweck und die Nutzung der Daten. Das folgende Diagramm zeigt verschiedene Quellen für Qualitätsanforderungen, die für Ihre Organisation in Frage kommen können.

Quellen und Datenqualitätsanforderungen

Elemente der Datenqualität

Elemente der Datenqualität beschreiben einen bestimmten Aspekt, der für die Verwendung und Genauigkeit eines Datasets erforderlich ist. GIS-Daten haben verschiedene Komponenten, die ihre Qualität ausmachen. Gemäß der Definition der International Organization for Standardization (ISO) gehören zu diesen Komponenten die Folgenden:

  • Vollständigkeit
  • Logische Konsistenz
  • Räumliche Genauigkeit
  • Thematische Genauigkeit
  • Zeitliche Qualität
  • Datennutzbarkeit

Vollständigkeit

Das Vorhandensein oder Fehlen von Features, ihren Attributen und Beziehungen in einem Datenmodell.

Stadtviertel mit fehlendem Gebäudegrundriss
Ein Stadtviertel mit fehlendem Gebäudegrundriss

Logische Konsistenz

Der Grad der Einhaltung vorab festgelegter Regeln für die Struktur, Attribuierung und Beziehungen eines Datenmodells, wie sie von einer Organisation oder Branche definiert wurden. Viele Branchen folgen Standards, die sich in einem räumlichen Datenmodell als Wertedomänen, Datenformate und topologische Konsistenz der Datenspeicherung widerspiegeln.

Autobahn mit einem Straßenbelag vom Typ Schotter
Eine Autobahn mit einem Straßenbelag vom Typ Schotter

Räumliche Genauigkeit

Die Genauigkeit der Position von Features in Bezug auf die Erde.

See-Feature wurde verschoben
Ein See-Feature wurde verschoben.

Thematische Genauigkeit

Die Genauigkeit von Attributen innerhalb von Features und deren jeweilige Beziehungen.

Als Feuchtgebiet erfasstes Schwimmbad
Ein Schwimmbad wurde als Feuchtgebiet erfasst.

Zeitliche Qualität

Die Qualität der zeitlichen Attribute und zeitlichen Beziehung von Features.

Veraltetes Diagramm mit offener Landebahn
Ein veraltetes Diagramm mit offener Landebahn
Aktualisiertes Diagramm mit geschlossener Landebahn
Ein aktualisiertes Diagramm mit geschlossener Landebahn

Datennutzbarkeit

Übereinstimmung eines Datasets mit bestimmten Anforderungen in Bezug auf einen Anwendungsfall.

Wird zum Erstellen von Karten für Nationalparks verwendet
Dieses wird zum Erstellen von Karten für Nationalparks verwendet.
Wird zum Erstellen von Routen für Notfallfahrzeuge verwendet
Dieses wird zum Erstellen von Routen für Notfallfahrzeuge verwendet.

Dokumentation der Qualitätsanforderungen

Ein Qualitätssicherungsplan ist ein Dokument, das die Qualitätsstandards, die für ein Projekt relevant sind, und die Methoden zu deren Erreichung identifiziert. Ein Qualitätssicherungsplan ist ein laufend aktualisiertes Dokument, das geändert wird, wenn von der Organisation neue Qualitätsanforderungen identifiziert werden. Es bietet auch die Gelegenheit, wichtige Projektbeteiligte zusammenzubringen, um ein allgemeines Bild davon zu entwickeln, was qualitativ hochwertige Daten und die Geschäftsprozesse, die diese Anforderungen bestimmen, ausmacht.

Die folgenden Dokumentationstechniken und -standards können bei der Ermittlung von Datenqualitätsanforderungen hilfreich sein:

  • ISO/TC 211 Geographic information/Geomatics: Eine Reihe von Standards der International Organization for Standardization (ISO) für geographische Informationen zur Definition von Methoden, Werkzeugen und Services für das Datenmanagement zur Beschaffung, Verarbeitung, Analyse, zum Zugriff, zur Darstellung und zur Übertragung solcher Daten in digitalem Format zwischen Benutzern, Systemen und Standorten.
  • Requirements Traceability Matrix (Rückverfolgbarkeit der Anforderungen): Ein zum Verwalten und Verfolgen von Geschäftsanforderungen erstelltes Dokument, mit dem sichergestellt werden soll, dass diese bei der Implementierung eines Projekts erfüllt werden. Dieses Dokument setzt die für das Projekt erfassten Geschäftsanforderungen mit den Funktionen eines Softwareprodukts in Korrelation.

Die Spalte "Anforderungskategorie" in der folgenden Tabelle zeigt ein Beispiel für erfasste Anforderungen, die sich auf einige der oben beschriebenen Elemente der Datenqualität beziehen. Nach der Organisation und Kategorisierung Ihrer Anforderungen besteht der nächste Schritt darin, die Datenqualitätsanforderungen mit den entsprechenden Funktionen in ArcGIS in Beziehung zu setzen.

IDAnforderungAnforderungsnummerAnforderungskategorieProduktfunktion

1

Die Möglichkeit, Abfragen auf Basis der Anzahl der von einem einzelnen Benutzer bearbeiteten Segmente auszuführen

F001

Funktionsanforderung

2

Die Möglichkeit sicherzustellen, dass das Produktionsdatenmodell dem Branchenstandard für Schemas entspricht

D001

Datenanforderung: Logische Konsistenz

3

Die Möglichkeit, als Geodatabase-Administrator POST-Berechtigungen auf die DEFAULT-Version weniger Admin-Benutzer zu beschränken

F002

Funktionsanforderung

4

Die Möglichkeit, Ad-hoc-Berichte zu erstellen, die Datenlücken für beliebige ausgewählte Attribute angeben

F003

Funktionsanforderung

5

Die Möglichkeit sicherzustellen, dass Quelldaten in die Produktionsdatenbank migriert werden und über entsprechende Domänen und Beziehungen verfügen

D002

Datenanforderung: Logische Konsistenz

6

Die Möglichkeit sicherzustellen, dass Quelldaten entsprechend den definierten Standards korrekt sind

D003

Datenanforderung: Räumliche Genauigkeit

7

Die Möglichkeit sicherzustellen, dass Produktionsdaten der mobilen Erfassung dienen und über Attributgenauigkeit verfügen

D004

Datenanforderung: Thematische Genauigkeit

8

Die Möglichkeit sicherzustellen, dass während des Projektzeitraums von 2010 bis 2020 keine Überlappung zwischen Ereignismesswerten auftritt

D005

Datenanforderung: Zeitliche Qualität

9

Die Möglichkeit, einen Validierungsfehler per Hyperlink mit einer verletzten Geschäftsregel zu verknüpfen und eine Beschreibung bereitzustellen

F004

Funktionsanforderung

10

Die Möglichkeit, die Anzahl der nicht ausgefüllten Zellen (NULL) für jedes erforderliche Attributfeld zu ermitteln

D006

Datenanforderung: Thematische Genauigkeit

11

Die Möglichkeit, Flurstücke zu identifizieren, die keine Features mit überlappenden Gebäudegrundrissen aufweisen

D007

Datenanforderung: Logische Konsistenz

12

Die Möglichkeit, Fehlerberichte zu erstellen, Excel-Dateien zu generieren und diese auf einem lokalen Laufwerk zu speichern

F005

Funktionsanforderung

13

Die Möglichkeit, ein eindeutiges ID-Attribut zu validieren, über das ein Flurstück mit den entsprechenden Gebäudegrundriss-Features verknüpft ist

D008

Datenanforderung: Logische Konsistenz

14

Die Möglichkeit zu bestätigen, dass alle Features den Metadatenstandards entsprechen

D009

Datenanforderung: Vollständigkeit der Daten

15

Die Möglichkeit, vorhandene Features als Fehler zu identifizieren

F006

Datenanforderung: Thematische Genauigkeit

16

Die Möglichkeit, die Position fehlender Features als Fehler anzugeben

F007

Datenanforderung: Vollständigkeit der Daten

Beispiel für eine Requirements Traceability Matrix

Verwandte Themen