Идентификация требований к качеству данных

Доступно с лицензией Data Reviewer.

Одна из задач для внедрения процесса контроля качества состоит в их идентификации технических требований к качеству данных для вашей организации. Важно определить и понять бизнес-требования к вашим данным, прежде чем преобразовывать их в технические требования, определяющие данные хорошего качества.

Процесс эффективного контроля качества данных основывается на понимании того, как используются данные и информационные продукты внутри и за пределами организации. Каждая организация определяет качество по-своему и основывает это определение на предполагаемой цели и использовании данных. На следующей диаграмме показаны различные источники требований к качеству, которые могут быть применимы к вашей организации.

Источники и требования к качеству данных

Элементы к качеству данных

Элементы определения качества данных описывают определенные аспекты набора данных, важные для его использования. ГИС данные включают разные компоненты и стандарты качества. Как описано в стандарте International Organization for Standardization (ISO), в эти компоненты включено следующее:

  • Полнота
  • Логическая согласованность
  • Пространственная точность
  • Тематическая точность
  • Качество временных атрибутов
  • Пригодность данных

Полнота

Наличие или отсутствие объектов, их атрибутов и отношений в модели данных.

Квартал, в котором не хватает контуров зданий
Квартал, в котором не хватает контуров зданий.

Логическая согласованность

Степень соответствия готовых правил структуры модели данных, атрибутов и отношений требованиям организации или сферы деятельности. Во многих сферах используются стандарты, присутствующие в геопространственной модели данных в виде доменов значений, форматов данных и топологической целостности хранения данных.

Скоростная магистраль с гравийным типом покрытия
Скоростная магистраль с гравийным типом покрытия.

Пространственная точность

Точность положения объектов относительно поверхности земли.

Объект озера был обрезан.
Объект озера был обрезан.

Тематическая точность

Точность атрибутов объектов и соответствующих им отношений.

Бассейн указан как болото
Бассейн указан как болото.

Качество временных атрибутов

Качество временных атрибутов и временные отношения объектов.

Устаревшая карта с открытой взлетно-посадочной полосой
Устаревшая карта с открытой взлетно-посадочной полосой.
Обновленная карта с закрытой взлетно-посадочной полосой
Обновленная карта с закрытой взлетно-посадочной полосой.

Пригодность данных

Соответствие набора данных заданному набору требований, связанных с вариантом использования.

Используется для маршрутизации машин скорой помощи
Используется для маршрутизации машин скорой помощи.
Используется для картографирования национальных парков
Используется для картографирования национальных парков.

Требования к качеству документации

План обеспечения качества (QA) - это документ, который определяет стандарты качества, в соответствии с проектом и методами по их достижению. Схема контроля качества – активный документ, который меняется по мере определения новых требований к качеству в организации, кроме того, предоставляет возможности для объединения усилий заинтересованных сторон в построении общей картины того, что представляют собой качественные данные и бизнес-процессы, которые управляют этим требованиям.

Ниже приведены стандарты и методы документации, используемые для определения требований к качеству данных:

  • ISO/TC 211 Geographic information/Geomatics – International Organization for Standardization (ISO) – наборы ISO-стандартов географической информации, позволяющие определить методы, инструменты и сервисы управления данными, подходящие для получения, обработки, анализа, распространения, представления и передачи таких данных в цифровой форме между пользователями и системами.
  • Матрица отслеживания требований - документ, созданный для управления и отслеживания бизнес-требований с целью обеспечения их соответствия в ходе реализации проекта. Этот документ соотносит бизнес-требования, собранные для проекта, и возможности программного продукта.

Столбец «Категория требований» в следующей таблице показывает пример собранных требований, которые описывают некоторые элементы качества данных, перечисленные выше. Следующим шагом после организации и классификации ваших требований будет сопоставление требований к качеству данных с соответствующими возможностями, имеющимися в ArcGIS.

IDТребованиеНомер требованияКатегория требованияФункциональные возможности продукта

1

Возможности для выполнения запросов на основе числа сегментов, редактируемых отдельным пользователем

F001

Функциональное требование

2

Возможность обеспечить, чтобы модель данных продукции соответствовала отраслевому стандарту схемы

D001

Требования к данным – логическая согласованность

3

Как администратор базы геоданных, возможность ограничить права доступа POST до версии по умолчанию небольшого круга пользователей с правами администратора

F002

Функциональное требование

4

Возможность создавать специализированные отчеты с указанием пробелов в данных для любых выбранных атрибутов

F003

Функциональное требование

5

Возможность обеспечить перенос источника данных в производственную базу данных, а также соответствующие домены и отношения

D002

Требования к данным – логическая согласованность

6

Возможность гарантировать, что источник данных – правильный и соответствует заданным стандартам

D003

Требования к данным – пространственная точность

7

Возможность гарантировать, что производственные данные пригодны для мобильных устройств и приложений и обладают атрибутивной точностью

D004

Требования к данным – тематическая точность

8

Возможность обеспечить отсутствие наложений между измерениями событий в течение периода 2010 – 2020

D005

Требования к данным – Временное качество

9

Возможность создания гиперссылки с описанием для ошибок типа ValidationError при нарушении бизнес правил

F004

Функциональное требование

10

Возможность определения количества незаполненных (NULL) ячеек для каждого обязательного атрибутивного поля

D006

Требования к данным – тематическая точность

11

Возможность определить земельные участки, на которых отсутствуют накладывающиеся объекты – контуры зданий

D007

Требования к данным – логическая согласованность

12

Возможность создавать отчет об ошибках, файлы формата Excel и сохранять их на локальном диске

F005

Функциональное требование

13

Возможность проверки уникального атрибута ID, связывающего земельный участок с соответствующими объектами – контурами зданий

D008

Требования к данным – логическая согласованность

14

Возможность удостовериться, что все объекты совместимы со стандартами метаданных

D009

Требования к данным – полнота данных

15

Возможность идентифицировать существующие объекты ошибки

F006

Требования к данным – тематическая точность

16

Возможность указать расположение пропущенного объекта как ошибку

F007

Требования к данным – полнота данных

Пример матрицы отслеживания требований

Связанные разделы