Identificar los requisitos de calidad de datos

Disponible con una licencia de Data Reviewer.

Uno de los retos en la implementación de procesos de control de calidad de los datos es la identificación de los requisitos técnicos de calidad de datos para la organización. Es importante identificar y entender los requisitos empresariales de los datos antes de traducirlos en requisitos técnicos de calidad de datos que definen los datos de buena calidad.

Un proceso de control de calidad de datos eficaz se basa en la comprensión de cómo se utilizan los datos y los productos de información dentro y fuera de la organización. Cada organización define los datos de buena calidad de forma distinta y base esta definición en la finalidad y el uso previsto de los datos. En el siguiente diagrama se ilustra una variedad de fuentes de requisitos de calidad de datos que pueden ser aplicables a su organización.

Fuentes y requisitos de calidad de los datos

Elementos de calidad de los datos

Los elementos de calidad de los datos describen una orientación determinada que se requiere para que un dataset se utilice y sea exacto. Los datos de SIG tienen distintos componentes en lo que se refiere a su calidad. Tal como los define Organización internacional para la estandarización (ISO), estos componentes incluyen lo siguiente:

  • Integridad
  • Coherencia lógica
  • Precisión espacial
  • Precisión temática
  • Calidad temporal
  • Uso de los datos

Integridad

La presencia o ausencia de entidades, sus atributos y relaciones en un modelo de datos.

Vecindario con una huella de edificio ausente
Un vecindario con una huella de edificio ausente.

Coherencia lógica

Un grado de adhesión a las reglas preestablecidas de la estructura, atribución y relaciones de un modelo de datos tal como lo define una organización o el sector. Muchos sectores siguen normas que se reflejan en un modelo de datos geoespaciales como dominios de valor, formatos de datos y consistencia topológica de cómo se almacenan los datos.

Autopista con superficie de pavimento de gravilla
Una autopista con superficie de pavimento de gravilla.

Precisión espacial

La precisión de la posición de las entidades con relación a la Tierra.

Entidad de lago desplazada.
Una entidad de lago que ha sido desplazada.

Precisión temática

La precisión de los atributos dentro de las entidades y sus relaciones apropiadas.

Piscina capturada como humedal
Se ha capturado una piscina como si fuera un humedal.

Calidad temporal

La calidad de los atributos temporales y la relación temporal de las entidades.

Gráfico obsoleto con pista abierta
Un gráfico obsoleto que contiene una pista abierta.
Gráfico actualizado con pista cerrada
Un gráfico actualizado que contiene una pista cerrada.

Uso de los datos

Cumplimiento por parte de un dataset de un conjunto específico de requisitos relacionados con un caso de uso.

Usado para rutas de vehículos de emergencias
Se utiliza para rutas de vehículos de emergencias.
Usado para cartografiar parques nacionales
Se utiliza para cartografiar parques nacionales.

Documentación de los requisitos de calidad

Un plan de garantía de calidad (QA, por sus siglas en inglés) es un documento que identifica qué estándares de calidad son pertinentes para un proyecto y los métodos para lograrlos. Un plan QA es un documento vivo que cambiará a medida que la organización identifique nuevos requisitos de calidad. También es una oportunidad para unir a las partes interesadas y construir una imagen común de lo que constituyen los datos de buena calidad y los procesos empresariales que impulsan esos requisitos.

A continuación se indican las técnicas de documentación y las normas que pueden ser útiles al identificar los requisitos de calidad de datos:

  • ISO/TC 211 Información geográfica/Geomática: serie de normas de información geográfica de la Organización internacional para la estandarización (ISO) para definir métodos, herramientas y servicios para la administración de datos, para adquirir, procesar, analizar, acceder, presentar y transferir dichos datos en formato digital entre usuarios, sistemas y ubicaciones.
  • Matriz de trazabilidad de requisitos: un documento creado para administrar y rastrear los requisitos del negocio para garantizar que se cumplan durante la implementación de un proyecto. En este documento se correlacionan los requisitos de negocio recopilados para el proyecto y las funcionalidades de un producto de software.

La columna Categoría de requisito de la tabla siguiente ilustra un ejemplo de requisitos recopilados que hacen referencia a algunos de los elementos de calidad de datos esbozados anteriormente. El paso siguiente después de organizar y clasificar los requisitos será correlacionar los requisitos de calidad de datos con las correspondientes funcionalidades presentes en ArcGIS.

IDRequisitoNúmero de requisitoCategoría de requisitoCapacidad del producto

1

Capacidad para ejecutar consultas basadas en el número de segmentos editados por un usuario individual

F001

Requisito funcional

2

Capacidad para garantizar que el modelo de datos de producción cumple el estándar del esquema de la industria

D001

Requisitos de datos - Coherencia lógica

3

Como administrador de geodatabase, capacidad para restringir los privilegios POST a la versión PREDETERMINADA de un pequeño conjunto de usuarios administradores

F002

Requisito funcional

4

Capacidad de producir informes ad hoc indicando los huecos en los datos para cualquiera de los atributos seleccionados

F003

Requisito funcional

5

Capacidad para garantizar que los datos de origen se migrarán a la base de datos de producción y tendrán los dominios y relaciones apropiadas

D002

Requisitos de datos - Coherencia lógica

6

Capacidad para garantizar que el origen de datos es exacto según los estándares definidos

D003

Requisitos de datos - Exactitud espacial

7

Capacidad para garantizar que los datos de producción son para los recolectores móviles y el atributo es exacto

D004

Requisitos de datos - Exactitud temática

8

Capacidad para garantizar que no hay superposición entre las mediciones de eventos durante el periodo del proyecto de 2010-2020

D005

Requisitos de datos - Calidad temporal

9

Capacidad para crear un hipervínculo de un error de validación con una regla empresarial infringida y proporcionar una descripción

F004

Requisito funcional

10

Capacidad para identificar el número de celdas que no se han completado (NULL) para cada campo de atributos requerido

D006

Requisitos de datos - Exactitud temática

11

Capacidad para identificar parcelas que no tienen entidades de huellas de edificios superpuestas

D007

Requisitos de datos - Coherencia lógica

12

Capacidad para crear informes de errores, generar archivos Excel y guardarlos en una unidad local

F005

Requisito funcional

13

Capacidad para validar un atributo de Id. único que vincula una parcela con un edificio coincidente

D008

Requisitos de datos - Coherencia lógica

14

Capacidad para confirmar que todas las entidades cumplen los estándares de metadatos

D009

Requisitos de datos - Completitud de datos

15

Capacidad para identificar las entidades existentes como un error

F006

Requisitos de datos - Exactitud temática

16

Capacidad para indicar la ubicación de entidades faltantes como un error

F007

Requisitos de datos - Completitud de datos

Matriz de trazabilidad de requisitos de muestra

Temas relacionados