Определение требований к качеству данных

Доступно с лицензией Data Reviewer.

Одна из задач для внедрения процесса контроля качества состоит в их идентификации технических требований к качеству данных для вашей организации. Важно определить и понять бизнес-требования к вашим данным, прежде чем преобразовывать их в технические требования, определяющие данные хорошего качества.

Процесс эффективного контроля качества данных основывается на понимании того, как используются данные и информационные продукты внутри и за пределами организации. Каждая организация определяет качество по-своему и основывает это определение на предполагаемой цели и использовании данных. На следующей диаграмме показаны различные источники требований к качеству, которые могут быть применимы к вашей организации.

Источники и требования к качеству данных

Элементы качества данных

Элементы определения качества данных описывают определенные аспекты набора данных, важные для его использования. ГИС данные включают разные компоненты и стандарты качества. Как описано в стандарте International Organization for Standardization (ISO), в эти компоненты включено следующее:

  • Полнота
  • Логическая согласованность
  • Пространственная точность
  • Тематическая точность
  • Качество временных атрибутов
  • Пригодность данных

Полнота

Наличие или отсутствие объектов, их атрибутов и отношений в модели данных.

Квартал, в котором не хватает контуров зданий
Квартал, в котором не хватает контуров зданий, показывает неполную модель данных.

Логическая согласованность

Степень соответствия готовых правил структуры модели данных, атрибутов и отношений требованиям организации или сферы деятельности. Во многих отраслях используются стандарты, присутствующие в геопространственной модели данных в виде доменов значений, форматов данных и топологической согласованности хранения данных.

Скоростная магистраль с гравийным типом покрытия
Скоростная магистраль с гравийным типом покрытия представляет собой стандарт отрасли.

Пространственная точность

Точность положения объектов относительно поверхности земли.

Объект озера смещен.
Этот объект озера был смещен, что указывает на пространственную неточность.

Тематическая точность

Точность атрибутов объектов и соответствующих им отношений.

Бассейн указан как болото
Плавательный бассейн был указан как болото, что является тематической неточностью.

Временное качество

Качество временных атрибутов и временные отношения объектов.

Устаревшая карта с открытой взлетно-посадочной полосой
Устаревшая карта с открытой взлетно-посадочной полосой показывает низкое временое качество.
Обновленная карта с закрытой взлетно-посадочной полосой
Карта была обновлена на закрытую взлетно-посадочную полосу, это улучшает качество объекта.

Пригодность данных

Соответствие набора данных заданному набору требований, связанных с вариантом использования.

Карта Соединенных Штатов, используемая для национальных парков
Эта карта Соединенных Штатов может использоваться для национальных парков, поскольку на ней отображены реки и горная топография с четкими границами штатов.
Карта, используемая для прокладки маршрутов для машин экстренных служб
Эта карта прокладывает маршруты для машин экстренных служб и соответствует требованиям отрасли к данным.

Требования к качеству документации

План обеспечения качества (QA) - это документ, который определяет стандарты качества, в соответствии с проектом и методами по их достижению. Схема контроля качества – активный документ, который меняется по мере определения новых требований к качеству в организации, кроме того, предоставляет возможности для объединения усилий заинтересованных сторон в построении общей картины того, что представляют собой качественные данные и бизнес-процессы, которые управляют этим требованиям.

Ниже приведены стандарты и методы документации, используемые для определения требований к качеству данных:

  • ISO/TC 211 Geographic information/Geomatics – International Organization for Standardization (ISO) – наборы ISO-стандартов географической информации, позволяющие определить методы, инструменты и сервисы управления данными, подходящие для получения, обработки, анализа, распространения, представления и передачи таких данных в цифровой форме между пользователями и системами.
  • Матрица отслеживания требований - документ, созданный для управления и отслеживания бизнес-требований с целью обеспечения их соответствия в ходе реализации проекта. Этот документ соотносит бизнес-требования, собранные для проекта, и возможности программного продукта.

Столбец «Категория требований» в следующей таблице показывает пример собранных требований, которые описывают некоторые элементы качества данных, перечисленные выше. Следующим шагом после организации и классификации ваших требований будет сопоставление требований к качеству данных с соответствующими возможностями, имеющимися в ArcGIS.

IDТребованиеНомер требованияКатегория требованияФункциональные возможности продукта

1

Возможности для выполнения запросов на основе числа сегментов, редактируемых отдельным пользователем

F001

Функциональное требование

2

Возможность обеспечить, чтобы модель данных продукции соответствовала отраслевому стандарту схемы

D001

Требования к данным – логическая согласованность

3

Как администратор базы геоданных, возможность ограничить права доступа POST до версии по умолчанию небольшого круга пользователей с правами администратора

F002

Функциональное требование

4

Возможность создавать специализированные отчеты с указанием пробелов в данных для любых выбранных атрибутов

F003

Функциональное требование

5

Возможность обеспечить перенос источника данных в производственную базу данных, а также соответствующие домены и отношения

D002

Требования к данным – логическая согласованность

6

Возможность гарантировать, что источник данных – правильный и соответствует заданным стандартам

D003

Требования к данным – пространственная точность

7

Возможность гарантировать, что производственные данные пригодны для мобильных устройств и приложений и обладают атрибутивной точностью

D004

Требования к данным – тематическая точность

8

Возможность обеспечить отсутствие наложений между измерениями событий в течение периода 2010 – 2020

D005

Требования к данным – Временное качество

9

Возможность создания гиперссылки с описанием для ошибок типа ValidationError при нарушении бизнес правил

F004

Функциональное требование

10

Возможность определения количества незаполненных (NULL) ячеек для каждого обязательного атрибутивного поля

D006

Требования к данным – тематическая точность

11

Возможность определить земельные участки, на которых отсутствуют накладывающиеся объекты – контуры зданий

D007

Требования к данным – логическая согласованность

12

Возможность создавать отчет об ошибках, файлы Excel и сохранять их на локальном диске

F005

Функциональное требование

13

Возможность проверки уникального атрибута ID, связывающего земельный участок с соответствующими объектами – контурами зданий

D008

Требования к данным – логическая согласованность

14

Возможность удостовериться, что все объекты совместимы со стандартами метаданных

D009

Требования к данным – полнота данных

15

Возможность идентифицировать существующие объекты ошибки

F006

Требования к данным – тематическая точность

16

Возможность указать расположение пропущенного объекта как ошибку

F007

Требования к данным – полнота данных

Пример матрицы отслеживания требований

Связанные разделы