需要 Data Reviewer 许可。
实施数据质量控制过程的挑战之一是识别组织所需的技术数据质量要求。在将其转换为定义优质数据的技术数据质量要求之前,识别并了解数据的业务要求至关重要。
有效的数据质量控制过程基于对组织内外的数据和信息产品的了解。每个组织都以不同的方式定义优质数据,而这些定义则建立在数据的预期目的和使用的基础之上。下图说明了可能适用于组织的数据质量要求的多种来源。
数据质量元素
数据质量元素描述了所使用的数据集以及精度的特定要求。GIS 数据针对其质量有不同的组件。根据国际标准化组织 (ISO) 的定义,这些组件包括以下内容:
- 完整性
- 逻辑一致性
- 空间精度
- 专题精度
- 时态质量
- 数据可用性
完整性
要素是否存在、要素的属性以及数据模型中的关系。
逻辑一致性
对于经组织或行业所定义的数据模型结构、属性以及关系的预建立规则的遵循程度。许多行业均遵循以地理空间数据模型(如值属性域、数据格式以及数据存储方式的拓扑一致性)反映的标准。
空间精度
要素位置与地表精度有关。
专题精度
要素内的属性精度及其相应关系。
时态质量
时态属性的质量和要素的时态关系。
数据可用性
数据集需要遵守的、与用例相关的一系列特定要求。
质量要求文件
质量保证 (QA) 计划是一个文档,用于识别与工程相关的质量标准以及实现该标准的方法。质量保证 (QA) 计划是一个活动文档,会随组织确认的新质量要求而改变,它还可以作为一次机会,使关键利益相关方团结一致,共同构建出用于组成优质数据和推动需求的业务流程的共同图景。
以下内容是对识别数据质量要求大有帮助的科技文件和标准:
- ISO/TC 211 地理信息/基础地理信息 - 国际标准化组织 (ISO) 地理信息标准系列,用于定义数据管理的方法、工具和服务,从而获取、处理、分析、访问、显示数据并在用户、系统、地理位置之间以数字形式转换这些数据。
- 要求可追踪性矩阵 - 为管理和追踪业务要求而创建的文档,用于确保工程实施期间能够符合这些要求。本文档可将为工程收集的业务要求与软件产品的功能相关联。
下表的“要求类别”列举例说明了收集的要求,这些要求引用了上述的一些数据质量元素。组织要求并将其分类后,下一步是将数据质量要求关联至 ArcGIS 内相对应的功能。
ID | 要求 | 要求编号 | 要求类别 | 产品功能 |
---|---|---|---|---|
1 | 能够基于单个用户编辑的线段数量运行查询 | F001 | 功能要求 | |
2 | 能够确保生产数据模型与行业方案标准兼容 | D001 | 数据要求 - 逻辑一致性 | |
3 | 作为地理数据库管理员,能够将 POST 权限限制为一小组管理员用户的 DEFAULT 版本。 | F002 | 功能要求 | |
4 | 能够生成表明任何所选属性的数据中的间隙的专用报告 | F003 | 功能要求 | |
5 | 能够确保源数据可以迁移至生产数据库并拥有适当的属性域和关系 | D002 | 数据要求 - 逻辑一致性 | |
6 | 能够根据已定义的标准确保源数据的准确性 | D003 | 数据要求 - 空间精度 | |
7 | 能够确保生产数据可用于移动采集装置并且属性准确 | D004 | 数据要求 - 专题准确性 | |
8 | 能够确保在 2010 - 2020 年的工程时间段内各事件测量之间不会发生重叠 | D005 | 数据要求 - 时态质量 | |
9 | 能够将验证错误与其违反的业务规则实现超链接,并提供描述 | F004 | 功能要求 | |
10 | 能够识别每个必需属性字段未填充 (NULL) 的像元数 | D006 | 数据要求 - 专题准确性 | |
11 | 能够识别没有叠加建筑物覆盖区要素的宗地 | D007 | 数据要求 - 逻辑一致性 | |
12 | 能够创建错误报告、生成 Excel 文件并将其保存到本地驱动器 | F005 | 功能要求 | |
13 | 能够验证将宗地与匹配的建筑物覆盖区要素链接的唯一 ID 属性 | D008 | 数据要求 - 逻辑一致性 | |
14 | 能够确认所有元素都符合元数据标准 | D009 | 数据要求 - 数据完整性 | |
15 | 能够将现有要素识别为错误 | F006 | 数据要求 - 专题准确性 | |
16 | 能够将缺失要素的位置指示为错误 | F007 | 数据要求 - 数据完整性 |