Disponible con una licencia de Data Reviewer.
Uno de los retos en la implementación de procesos de control de calidad de los datos es la identificación de los requisitos técnicos de calidad de datos para la organización. Es importante identificar y entender los requisitos empresariales de los datos antes de traducirlos en requisitos técnicos de calidad de datos que definen los datos de buena calidad.
Un proceso de control de calidad de datos eficaz se basa en la comprensión de cómo se utilizan los datos y los productos de información dentro y fuera de la organización. Cada organización define los datos de buena calidad de forma distinta y base esta definición en la finalidad y el uso previsto de los datos. En el siguiente diagrama se ilustra una variedad de fuentes de requisitos de calidad de datos que pueden ser aplicables a su organización.
Elementos de calidad de los datos
Los elementos de calidad de los datos describen una orientación determinada que se requiere para que un dataset se utilice y sea exacto. Los datos de SIG tienen distintos componentes en lo que se refiere a su calidad. Tal como los define Organización internacional para la estandarización (ISO), estos componentes incluyen lo siguiente:
- Integridad
- Coherencia lógica
- Precisión espacial
- Precisión temática
- Calidad temporal
- Uso de los datos
Integridad
La presencia o ausencia de entidades, sus atributos y relaciones en un modelo de datos.
Coherencia lógica
Un grado de adhesión a las reglas preestablecidas de la estructura, atribución y relaciones de un modelo de datos tal como lo define una organización o el sector. Muchos sectores siguen normas que se reflejan en un modelo de datos geoespaciales como dominios de valor, formatos de datos y consistencia topológica de cómo se almacenan los datos.
Precisión espacial
La precisión de la posición de las entidades con relación a la Tierra.
Precisión temática
La precisión de los atributos dentro de las entidades y sus relaciones apropiadas.
Calidad temporal
La calidad de los atributos temporales y la relación temporal de las entidades.
Uso de los datos
Cumplimiento por parte de un dataset de un conjunto específico de requisitos relacionados con un caso de uso.
Documentación de los requisitos de calidad
Un plan de garantía de calidad (QA, por sus siglas en inglés) es un documento que identifica qué estándares de calidad son pertinentes para un proyecto y los métodos para lograrlos. Un plan QA es un documento vivo que cambiará a medida que la organización identifique nuevos requisitos de calidad. También es una oportunidad para unir a las partes interesadas y construir una imagen común de lo que constituyen los datos de buena calidad y los procesos empresariales que impulsan esos requisitos.
A continuación se indican las técnicas de documentación y las normas que pueden ser útiles al identificar los requisitos de calidad de datos:
- ISO/TC 211 Información geográfica/Geomática: serie de normas de información geográfica de la Organización internacional para la estandarización (ISO) para definir métodos, herramientas y servicios para la administración de datos, para adquirir, procesar, analizar, acceder, presentar y transferir dichos datos en formato digital entre usuarios, sistemas y ubicaciones.
- Matriz de trazabilidad de requisitos: un documento creado para administrar y rastrear los requisitos del negocio para garantizar que se cumplan durante la implementación de un proyecto. En este documento se correlacionan los requisitos de negocio recopilados para el proyecto y las funcionalidades de un producto de software.
La columna Categoría de requisito de la tabla siguiente ilustra un ejemplo de requisitos recopilados que hacen referencia a algunos de los elementos de calidad de datos esbozados anteriormente. El paso siguiente después de organizar y clasificar los requisitos será correlacionar los requisitos de calidad de datos con las correspondientes funcionalidades presentes en ArcGIS.
ID | Requisito | Número de requisito | Categoría de requisito | Capacidad del producto |
---|---|---|---|---|
1 | Capacidad para ejecutar consultas basadas en el número de segmentos editados por un usuario individual | F001 | Requisito funcional | |
2 | Capacidad para garantizar que el modelo de datos de producción cumple el estándar del esquema de la industria | D001 | Requisitos de datos - Coherencia lógica | |
3 | Como administrador de geodatabase, capacidad para restringir los privilegios POST a la versión PREDETERMINADA de un pequeño conjunto de usuarios administradores | F002 | Requisito funcional | |
4 | Capacidad de producir informes ad hoc indicando los huecos en los datos para cualquiera de los atributos seleccionados | F003 | Requisito funcional | |
5 | Capacidad para garantizar que los datos de origen se migrarán a la base de datos de producción y tendrán los dominios y relaciones apropiadas | D002 | Requisitos de datos - Coherencia lógica | |
6 | Capacidad para garantizar que el origen de datos es exacto según los estándares definidos | D003 | Requisitos de datos - Exactitud espacial | |
7 | Capacidad para garantizar que los datos de producción son para los recolectores móviles y el atributo es exacto | D004 | Requisitos de datos - Exactitud temática | |
8 | Capacidad para garantizar que no hay superposición entre las mediciones de eventos durante el periodo del proyecto de 2010-2020 | D005 | Requisitos de datos - Calidad temporal | |
9 | Capacidad para crear un hipervínculo de un error de validación con una regla empresarial infringida y proporcionar una descripción | F004 | Requisito funcional | |
10 | Capacidad para identificar el número de celdas que no se han completado (NULL) para cada campo de atributos requerido | D006 | Requisitos de datos - Exactitud temática | |
11 | Capacidad para identificar parcelas que no tienen entidades de huellas de edificios superpuestas | D007 | Requisitos de datos - Coherencia lógica | |
12 | Capacidad para crear informes de errores, generar archivos Excel y guardarlos en una unidad local | F005 | Requisito funcional | |
13 | Capacidad para validar un atributo de Id. único que vincula una parcela con un edificio coincidente | D008 | Requisitos de datos - Coherencia lógica | |
14 | Capacidad para confirmar que todas las entidades cumplen los estándares de metadatos | D009 | Requisitos de datos - Completitud de datos | |
15 | Capacidad para identificar las entidades existentes como un error | F006 | Requisitos de datos - Exactitud temática | |
16 | Capacidad para indicar la ubicación de entidades faltantes como un error | F007 | Requisitos de datos - Completitud de datos |