生成橡皮页变换连接线、转换属性与检测要素变化工具利用要素匹配技术识别相应的要素,并生成各种结果。本文档描述了要素匹配过程,并解释了匹配表中找到的要素匹配信息。
什么是要素匹配?
要素匹配表示基于某搜索距离查找相似数据集中相应的要素。其中一个数据集被称为源,而另一个被称为目标,尤其是在要素匹配用于派生橡皮页变换连接线或将属性从源数据转换至目标数据时。这些数据集相互叠加,但是由于不一致的数据收集、随时间发生的变化或其他原因,这些数据集并非完全对齐。图 1 显示了街道示例,其中源要素来自商业数据提供商,而目标要素则由市政府部门构建和维护。
要素匹配过程分析源拓扑与目标拓扑,检测特定的要素模式、匹配模式,并在该模式下匹配要素。要素匹配精度取决于数据相似程度、复杂程度和质量。一般来说,两个数据集越相似,匹配结果就越好。通常,匹配成功率可以达到高百分比,然而也可能出现不确定性和错误,因此要求后检查和校正。
要素属性还有助于确定要素匹配中的正确匹配。如果指定了一对或多对匹配字段,则会基于匹配字段检查空间上匹配的要素。例如,如果某个源要素在空间上与两个候选目标要素相匹配,但是其中一个目标要素具有匹配属性值,而另一个却没有,那么会选择具有匹配属性值的目标要素作为最终匹配目标。属性匹配的条件影响要素匹配的置信度。
匹配表中有什么?
生成橡皮页变换连接线、传递属性与检测要素变化工具还可以生成匹配表。匹配表提供有助于理解结果和便于后检查和进一步分析的、包含以下字段的完整的要素匹配信息:
- SRC_FID- 源要素 ID。未匹配的源要素取值为 -1。
- TGT_FID- 目标要素 ID。未匹配的目标要素取值为 -1。
- FM_GRP- 匹配要素取值为唯一组 ID,而未匹配源要素或目标要素取值为 -1
- FM_MN- m:n 格式的源要素与目标要素之间的匹配关系,其中 m 和 m 分别为匹配组中源要素和目标要素的数量。例如,1:1 为一对一匹配;而 3:2 为三对二匹配。对于未匹配源要素或目标要素,该字段取值为 N/A,表示不适用。
- FM_CONF- 该字段存储以下代表要素匹配置信度的值:
- 100 - 得到指定匹配字段确认的匹配
- 75 - 未得到指定匹配字段确认的匹配,因为未指定匹配字段或指定匹配字段中无值
- 50 - 指定匹配字段中存在字段值差异
- 0 - 不匹配的源要素或目标要素
下一部分含有示例要素匹配实例和匹配表中的匹配信息。为简单起见,属性匹配假定为所有匹配要素,反映在值为 100 的 FM_CONF 上。
匹配组与匹配关系
由于要素匹配基于要素拓扑和空间模式,当一个或多个源要素与一个或多个目标要素被识别为具有匹配的拓扑结构或空间模式时,这些相应要素便成为一个匹配组。在每个匹配组中,匹配关系由源要素数量 (m) 与目标要素数量 (n) 的比值来定义,如下方的解释与图 2 中所示。
- 一对一 (1:1) 匹配
一个源要素与一个目标要素匹配;它们属于相同的匹配组。
- 一对多 (1:m) 匹配
一个源要素与多个目标要素匹配;它们均属于相同的匹配组。
- 多对一 (m:1) 匹配
多个源要素与一个目标要素匹配;它们均属于相同的匹配组。
- 多对多 (m:n) 匹配
多个源要素与多个目标要素匹配;它们均属于相同的匹配组。