Mit der Data Reviewer-Lizenz verfügbar.
Eine der Herausforderungen bei der Implementierung von Datenqualitätskontrollen ist die Feststellung der technischen Datenqualitätsanforderungen für die Organisation. Es ist wichtig, die geschäftlichen Anforderungen an die Daten zu identifizieren und zu verstehen, bevor diese in technische Anforderungen übersetzt werden, die Daten von guter Qualität ausmachen.
Eine effektive Datenqualitätskontrolle basiert auf dem Verständnis dafür, wie Daten und Informationsprodukte innerhalb und außerhalb der Organisation verwendet werden. Jede Organisation definiert Qualität anders und stützt diese Definition auf den beabsichtigten Zweck und die Nutzung der Daten. Das folgende Diagramm zeigt verschiedene Quellen für Qualitätsanforderungen, die für Ihre Organisation in Frage kommen können.
Elemente der Datenqualität
Elemente der Datenqualität beschreiben einen bestimmten Aspekt, der für die Verwendung und Genauigkeit eines Datasets erforderlich ist. GIS-Daten haben verschiedene Komponenten, die ihre Qualität ausmachen. Gemäß der Definition der International Organization for Standardization (ISO) gehören zu diesen Komponenten die Folgenden:
- Vollständigkeit
- Logische Konsistenz
- Räumliche Genauigkeit
- Thematische Genauigkeit
- Zeitliche Qualität
- Datennutzbarkeit
Vollständigkeit
Das Vorhandensein oder Fehlen von Features, ihren Attributen und Beziehungen in einem Datenmodell.
Logische Konsistenz
Der Grad der Einhaltung vorab festgelegter Regeln für die Struktur, Attribuierung und Beziehungen eines Datenmodells, wie sie von einer Organisation oder Branche definiert wurden. Viele Branchen folgen Standards, die sich in einem räumlichen Datenmodell als Wertedomänen, Datenformate und topologische Konsistenz der Datenspeicherung widerspiegeln.
Räumliche Genauigkeit
Die Genauigkeit der Position von Features in Bezug auf die Erde.
Thematische Genauigkeit
Die Genauigkeit von Attributen innerhalb von Features und deren jeweilige Beziehungen.
Zeitliche Qualität
Die Qualität der zeitlichen Attribute und zeitlichen Beziehung von Features.
Datennutzbarkeit
Übereinstimmung eines Datasets mit bestimmten Anforderungen in Bezug auf einen Anwendungsfall.
Dokumentation der Qualitätsanforderungen
Ein Qualitätssicherungsplan ist ein Dokument, das die Qualitätsstandards, die für ein Projekt relevant sind, und die Methoden zu deren Erreichung identifiziert. Ein Qualitätssicherungsplan ist ein laufend aktualisiertes Dokument, das geändert wird, wenn von der Organisation neue Qualitätsanforderungen identifiziert werden. Es bietet auch die Gelegenheit, wichtige Projektbeteiligte zusammenzubringen, um ein allgemeines Bild davon zu entwickeln, was qualitativ hochwertige Daten und die Geschäftsprozesse, die diese Anforderungen bestimmen, ausmacht.
Die folgenden Dokumentationstechniken und -standards können bei der Ermittlung von Datenqualitätsanforderungen hilfreich sein:
- ISO/TC 211 Geographic information/Geomatics: Eine Reihe von Standards der International Organization for Standardization (ISO) für geographische Informationen zur Definition von Methoden, Werkzeugen und Services für das Datenmanagement zur Beschaffung, Verarbeitung, Analyse, zum Zugriff, zur Darstellung und zur Übertragung solcher Daten in digitalem Format zwischen Benutzern, Systemen und Standorten.
- Requirements Traceability Matrix (Rückverfolgbarkeit der Anforderungen): Ein zum Verwalten und Verfolgen von Geschäftsanforderungen erstelltes Dokument, mit dem sichergestellt werden soll, dass diese bei der Implementierung eines Projekts erfüllt werden. Dieses Dokument setzt die für das Projekt erfassten Geschäftsanforderungen mit den Funktionen eines Softwareprodukts in Korrelation.
Die Spalte "Anforderungskategorie" in der folgenden Tabelle zeigt ein Beispiel für erfasste Anforderungen, die sich auf einige der oben beschriebenen Elemente der Datenqualität beziehen. Nach der Organisation und Kategorisierung Ihrer Anforderungen besteht der nächste Schritt darin, die Datenqualitätsanforderungen mit den entsprechenden Funktionen in ArcGIS in Beziehung zu setzen.
ID | Anforderung | Anforderungsnummer | Anforderungskategorie | Produktfunktion |
---|---|---|---|---|
1 | Die Möglichkeit, Abfragen auf Basis der Anzahl der von einem einzelnen Benutzer bearbeiteten Segmente auszuführen | F001 | Funktionsanforderung | |
2 | Die Möglichkeit sicherzustellen, dass das Produktionsdatenmodell dem Branchenstandard für Schemas entspricht | D001 | Datenanforderung: Logische Konsistenz | |
3 | Die Möglichkeit, als Geodatabase-Administrator POST-Berechtigungen auf die DEFAULT-Version weniger Admin-Benutzer zu beschränken | F002 | Funktionsanforderung | |
4 | Die Möglichkeit, Ad-hoc-Berichte zu erstellen, die Datenlücken für beliebige ausgewählte Attribute angeben | F003 | Funktionsanforderung | |
5 | Die Möglichkeit sicherzustellen, dass Quelldaten in die Produktionsdatenbank migriert werden und über entsprechende Domänen und Beziehungen verfügen | D002 | Datenanforderung: Logische Konsistenz | |
6 | Die Möglichkeit sicherzustellen, dass Quelldaten entsprechend den definierten Standards korrekt sind | D003 | Datenanforderung: Räumliche Genauigkeit | |
7 | Die Möglichkeit sicherzustellen, dass Produktionsdaten der mobilen Erfassung dienen und über Attributgenauigkeit verfügen | D004 | Datenanforderung: Thematische Genauigkeit | |
8 | Die Möglichkeit sicherzustellen, dass während des Projektzeitraums von 2010 bis 2020 keine Überlappung zwischen Ereignismesswerten auftritt | D005 | Datenanforderung: Zeitliche Qualität | |
9 | Die Möglichkeit, einen Validierungsfehler per Hyperlink mit einer verletzten Geschäftsregel zu verknüpfen und eine Beschreibung bereitzustellen | F004 | Funktionsanforderung | |
10 | Die Möglichkeit, die Anzahl der nicht ausgefüllten Zellen (NULL) für jedes erforderliche Attributfeld zu ermitteln | D006 | Datenanforderung: Thematische Genauigkeit | |
11 | Die Möglichkeit, Flurstücke zu identifizieren, die keine Features mit überlappenden Gebäudegrundrissen aufweisen | D007 | Datenanforderung: Logische Konsistenz | |
12 | Die Möglichkeit, Fehlerberichte zu erstellen, Excel-Dateien zu generieren und diese auf einem lokalen Laufwerk zu speichern | F005 | Funktionsanforderung | |
13 | Die Möglichkeit, ein eindeutiges ID-Attribut zu validieren, über das ein Flurstück mit den entsprechenden Gebäudegrundriss-Features verknüpft ist | D008 | Datenanforderung: Logische Konsistenz | |
14 | Die Möglichkeit zu bestätigen, dass alle Features den Metadatenstandards entsprechen | D009 | Datenanforderung: Vollständigkeit der Daten | |
15 | Die Möglichkeit, vorhandene Features als Fehler zu identifizieren | F006 | Datenanforderung: Thematische Genauigkeit | |
16 | Die Möglichkeit, die Position fehlender Features als Fehler anzugeben | F007 | Datenanforderung: Vollständigkeit der Daten |