Terminologie employée dans la validation de données

Vérifications des données

Les vérifications de données automatisent la validation d’une condition spécifique, en fonction de sa configuration, sur une ou plusieurs entités. Les vérifications évaluent différents aspects de la qualité d’une entité, comme la précision spatiale, la précision thématique, l’exhaustivité et la cohérence logique.

Contrainte liée aux données

Les contraintes liées aux données sont des méthodes automatisées qui détectent les entités, les attributs et les relations au cours de processus de mise à jour des données qui ne satisfont pas aux exigences de qualité établies. Ces méthodes incluent les vérifications automatisées de Data Reviewer implémentées dans les processus de règles attributaires de contrainte, les domaines/sous-types et les valeurs conditionnelles.

Gestion de la qualité des données

La gestion de la qualité des données offre des outils qui facilitent la livraison de produits et de services en standardisant les traitements et en renforçant l’efficacité des processus.

Validation des données

La validation des données est le processus utilisant des méthodes formelles pour détecter les entités, les attributs et les relations existants dans une base de données qui ne satisfont pas aux exigences de qualité établies. Ces méthodes incluent des fonctionnalités automatisées (les vérifications automatisées Data Reviewer, par exemple) et les fonctionnalités semi-automatisées qui facilitent l’examen visuel (l’outil Browse Features (Parcourir les entités), par exemple).

Résultats d’erreur et cycle de vie

Les résultats d’erreur et leur cycle de vie décrivent l’état d’un résultat d’erreur dans le traitement d’assurance qualité ou de contrôle qualité. Il existe trois cycles dans le cycle de vie d’un résultat d’erreur : l’examen, la correction et la vérification. Les informations de statut indiquent comment un enregistrement a été examiné, corrigé ou vérifié, la personne à l’origine de la modification de l’erreur pour la faire passer dans un nouveau cycle, ainsi que la date et l’heure de ce changement.

Résultat d’erreur

Un résultat d’erreur est une entité ou un enregistrement de ligne qui identifie les écarts de précision ou d’exactitude d’une entité ou d’une ligne de table dans les données. L’enregistrement contient des informations qui identifient la source de données, la condition d’erreur et la gravité, ainsi que les informations sur le cycle de vie et le statut. Les résultats d’erreur sont créés par les vérifications des données ou les outils d’inspection et sont stockés dans une géodatabase via la structure de l’espace de travail Data Reviewer ou les tables système de géodatabase (règles attributaires).

Traitement par lots Data Reviewer

Les tâches de traitement par lots Data Reviewer sont les conteneurs des vérifications de données ArcGIS Data Reviewer configurées. Elles peuvent inclure des vérifications qui valident les relations spatiales, la cohérence des attributs et le contenu des métadonnées d’intégrité des entités. Les tâches de traitement par lots sont créées dans ArcMap et sont stockées sous forme de fichiers .rbj qui peuvent être ajoutés dans un projet. Vous pouvez utiliser une tâche de traitement par lots pour valider vos données à l’aide de l’outil de Exécuter une tâche de traitement par lots Data Reviewer.

Règles Data Reviewer

Les règles Data Reviewer sont des vérifications préconfigurées qui valident certains aspects de la qualité d’une entité. Il s’agit de vérifications qui valident les relations spatiales, la cohérence des attributs et l’intégrité des entités. Les règles Data Reviewer sont créées à l’aide de ArcGIS Pro et sont stockées dans une géodatabase qui contient les entités à valider.

Session Data Reviewer

Les résultats d’erreur découverts au cours de la validation automatisée (tâches de traitement par lots) ou de l’inspection visuelle sont organisés dans une session. Les sessions définissent une série de transactions de validation et de contrôle qualité effectuées par des vérifications de données ou un examen manuel. Les sessions sont stockées dans un espace de travail Data Reviewer et font partie des projets ArcGIS Pro pour faciliter les tâches de correction des données. Les sessions sont créées et supprimées à l’aide des outils Créer une session Data Reviewer et Supprimer une session Data Reviewer.

Espace de travail Data Reviewer

Un espace de travail Data Reviewer est une géodatabase qui contient les tables et les classes d’entités nécessaires au stockage des résultats d’erreur créés à l’aide des outils Data Reviewer au cours de la validation des données. Vous pouvez activer une géodatabase pour stocker les résultats d’erreur à l’aide de l’outil Activer Data Reviewer.

Résultat d’échantillonnage

Entité ou ligne de table sélectionnée comme membre d’une population échantillonnée. Dans Data Reviewer, l’échantillonnage des entités est implémenté à l’aide de l’outil Select Random Sample (Sélectionner l’échantillonnage aléatoire).