Доступно с лицензией Data Reviewer.
Одна из задач для внедрения процесса контроля качества состоит в их идентификации технических требований к качеству данных для вашей организации. Важно определить и понять бизнес-требования к вашим данным, прежде чем преобразовывать их в технические требования, определяющие данные хорошего качества.
Процесс эффективного контроля качества данных основывается на понимании того, как используются данные и информационные продукты внутри и за пределами организации. Каждая организация определяет качество по-своему и основывает это определение на предполагаемой цели и использовании данных. На следующей диаграмме показаны различные источники требований к качеству, которые могут быть применимы к вашей организации.
Элементы качества данных
Элементы определения качества данных описывают определенные аспекты набора данных, важные для его использования. ГИС данные включают разные компоненты и стандарты качества. Как описано в стандарте International Organization for Standardization (ISO), в эти компоненты включено следующее:
- Полнота
- Логическая согласованность
- Пространственная точность
- Тематическая точность
- Качество временных атрибутов
- Пригодность данных
Полнота
Наличие или отсутствие объектов, их атрибутов и отношений в модели данных.
Логическая согласованность
Степень соответствия готовых правил структуры модели данных, атрибутов и отношений требованиям организации или сферы деятельности. Во многих отраслях используются стандарты, присутствующие в геопространственной модели данных в виде доменов значений, форматов данных и топологической согласованности хранения данных.
Пространственная точность
Точность положения объектов относительно поверхности земли.
Тематическая точность
Точность атрибутов объектов и соответствующих им отношений.
Качество временных атрибутов
Качество временных атрибутов и временные отношения объектов.
Пригодность данных
Соответствие набора данных заданному набору требований, связанных с вариантом использования.
Требования к качеству документации
План обеспечения качества (QA) - это документ, который определяет стандарты качества, в соответствии с проектом и методами по их достижению. Схема контроля качества – активный документ, который меняется по мере определения новых требований к качеству в организации, кроме того, предоставляет возможности для объединения усилий заинтересованных сторон в построении общей картины того, что представляют собой качественные данные и бизнес-процессы, которые управляют этим требованиям.
Ниже приведены стандарты и методы документации, используемые для определения требований к качеству данных:
- ISO/TC 211 Geographic information/Geomatics – International Organization for Standardization (ISO) – наборы ISO-стандартов географической информации, позволяющие определить методы, инструменты и сервисы управления данными, подходящие для получения, обработки, анализа, распространения, представления и передачи таких данных в цифровой форме между пользователями и системами.
- Матрица отслеживания требований - документ, созданный для управления и отслеживания бизнес-требований с целью обеспечения их соответствия в ходе реализации проекта. Этот документ соотносит бизнес-требования, собранные для проекта, и возможности программного продукта.
Столбец «Категория требований» в следующей таблице показывает пример собранных требований, которые описывают некоторые элементы качества данных, перечисленные выше. Следующим шагом после организации и классификации ваших требований будет сопоставление требований к качеству данных с соответствующими возможностями, имеющимися в ArcGIS.
ID | Требование | Номер требования | Категория требования | Функциональные возможности продукта |
---|---|---|---|---|
1 | Возможности для выполнения запросов на основе числа сегментов, редактируемых отдельным пользователем | F001 | Функциональное требование | |
2 | Возможность обеспечить, чтобы модель данных продукции соответствовала отраслевому стандарту схемы | D001 | Требования к данным – логическая согласованность | |
3 | Как администратор базы геоданных, возможность ограничить права доступа POST до версии по умолчанию небольшого круга пользователей с правами администратора | F002 | Функциональное требование | |
4 | Возможность создавать специализированные отчеты с указанием пробелов в данных для любых выбранных атрибутов | F003 | Функциональное требование | |
5 | Возможность обеспечить перенос источника данных в производственную базу данных, а также соответствующие домены и отношения | D002 | Требования к данным – логическая согласованность | |
6 | Возможность гарантировать, что источник данных – правильный и соответствует заданным стандартам | D003 | Требования к данным – пространственная точность | |
7 | Возможность гарантировать, что производственные данные пригодны для мобильных устройств и приложений и обладают атрибутивной точностью | D004 | Требования к данным – тематическая точность | |
8 | Возможность обеспечить отсутствие наложений между измерениями событий в течение периода 2010 – 2020 | D005 | Требования к данным – Временное качество | |
9 | Возможность создания гиперссылки с описанием для ошибок типа ValidationError при нарушении бизнес правил | F004 | Функциональное требование | |
10 | Возможность определения количества незаполненных (NULL) ячеек для каждого обязательного атрибутивного поля | D006 | Требования к данным – тематическая точность | |
11 | Возможность определить земельные участки, на которых отсутствуют накладывающиеся объекты – контуры зданий | D007 | Требования к данным – логическая согласованность | |
12 | Возможность создавать отчет об ошибках, файлы формата Excel и сохранять их на локальном диске | F005 | Функциональное требование | |
13 | Возможность проверки уникального атрибута ID, связывающего земельный участок с соответствующими объектами – контурами зданий | D008 | Требования к данным – логическая согласованность | |
14 | Возможность удостовериться, что все объекты совместимы со стандартами метаданных | D009 | Требования к данным – полнота данных | |
15 | Возможность идентифицировать существующие объекты ошибки | F006 | Требования к данным – тематическая точность | |
16 | Возможность указать расположение пропущенного объекта как ошибку | F007 | Требования к данным – полнота данных |