区域之间的空间关联的工作原理

区域之间的空间关联工具用于测量同一区域的两个区域化之间的空间关联程度,其中每个区域化由一组类别(称为区域)组成。区域集之间的关联由每个区域化的区域之间的区域重叠确定,如果两个区域化的区域面积在空间上紧密对应,则关联性最高。同样,如果每个区域化的区域与另一个区域化的许多区域存在较大程度的重叠,则空间关联性最低。主要输出是空间关联的全局关联,即介于 0(无对应)到 1(区域的空间完全对齐)之间的单个数字,但是也可以使用可选输出计算和可视化任一区域化的特定区域的关联,或者两个区域化中的特定区域组合的关联。可以将每组区域作为面要素或栅格提供,并且可使用分类字段指示每个要素或栅格像元的区域。

区域之间的空间关联图示

显示了蓝色区域和橙色区域之间的高低关联的示例。

潜在的应用

可在以下示例应用中使用此工具:

  • 森林管理者可以通过将森林类型地图与森林类型的昆虫疾病风险(低、中和高)地图进行比较来计划有害生物治理。森林管理者可使用此工具确定哪些类型的森林的昆虫疾病风险最高和最低。
  • 生态学家已通过整合坡度、土地覆被和水程距离等变量为灰狼创建分类栖息地适宜性地图,该生态学家想要测量最终适宜性地图与用于创建它的每个变量的对应程度。该生态学家可以多次运行此工具,以计算适宜性地图和每个变量之间的关联的数值测量值。如果与单个变量的对应程度高,而与所有其他变量的对应程度低,可能表示单个变量对最终适宜性的影响不成比例。

关联测量

用于测量区域之间的空间关联的统计数据称为“V 度量”,用于量化可通过观测另一组区域的值获得有关某一组区域的信息量。例如,如果已知某个位置的森林类型,则您是否可以确定同一位置的土壤类型? 同样,如果已知某个位置的土壤类型,则您是否能够自信地预测森林类型? 为了理解为什么这两个问题不同,假设特定土壤类型仅出现在特定类型的森林中,但是该森林类型由许多类型的土壤组成。如果已知某个位置具有这种土壤类型,则可以确定该位置的森林类型,因为该土壤类型仅出现在一种类型的森林中。但是,如果已知某个位置是这种类型的森林,则您无法确定该位置的土壤类型,因为该类型的森林中存在许多土壤类型。森林类型划分成的不同土壤类型越多,预测该位置的土壤类型就越困难。在最坏的情况下,如果森林区域均分给每种类型的土壤,则没有理由基于另一种类型的土壤预测某一种类型的土壤。因此,要测量森林类型与土壤类型的关联,必须查看固定森林类型内土壤类型的多样性,并且必须查看固定土壤类型内森林类型的多样性。

为了清楚起见,第一组区域称为输入区域,第二组区域称为叠加区域。V 度量计算如下:测量输入区域内叠加区域的多样性和叠加区域内输入区域的多样性,然后计算这两个值的调和平均值。三种全局关联性度量如下:

  • 全局关联度量 - V 度量,即输入区域和叠加区域之间的整体关联度量。值范围介于 0(无关联)到 1(完全对应)之间。该值不取决于两个区域化中哪个指定为输入区域,哪个指定为叠加区域(输入区域和叠加区域可以反转,该值不会发生变化)。统计数据通过计算以下两个全局关联度量的调和平均值确定。
  • 输入区域内叠加区域的全局对应 - 每个输入区域中叠加类别的一致性度量,范围介于 0 到 1 之间。值 1 表示每个输入区域仅包含一个叠加区域(区域完全对应)。接近 0 的值表示输入区域均分为叠加区域的多个类别(与单个叠加区域的对应度较低)。该度量在其他资源部分中引用的论文中称为完整性。
  • 叠加区域内输入区域的全局对应 - 每个输入区域内叠加类别的一致性度量。该值与另一个全局对应值类型,但是它用于衡量叠加区域内输入区域的差异。输入区域和叠加区域反转时,这两个度量会交换值。该度量在其他资源部分中引用的论文中称为同质性。

这三个全局关联度量将显示在地理处理消息中,并作为派生输出返回。这些派生输出可在 Python 脚本中作为变量引用,或用作 ModelBuilder 中其他工具的输入。有关每个度量的公式,请参阅下面的其他资源部分中的参考资料。

在空间上研究区域对应

可以将用于计算 V 度量的两个全局对应度量分别在空间上划分为输入区域和叠加区域的每个交集。所有这些交集用于衡量输入区域和叠加区域的特定组合的对应关系,例如玉米(农作物类型)和排水良好的土壤(土壤排水分类)之间的对应关系。这些特定组合可以使用输出要素参数或输出栅格参数进行创建,具体取决于区域是指定为面还是栅格。与全局关联和对应度量不同,局部对应度量的值越小,表示区域组合的对应程度越高。最小值 0 表示完全对应,局部度量没有上限,但是几乎不会超过 2。

在添加到地图后,输出要素或栅格将同时以配色方案显示,以显示特定叠加区域内特定输入区域的对应程度和叠加区域内输入区域的对应程度。较浅蓝色阴影表示输入区域内叠加区域的对应程度较高,而较浅粉色阴影表示叠加区域内输入区域的对应程序较高。以最浅灰色阴影显示的区域表示两个方向上的对应程度最高,而最深紫色阴影表示两个方向上的对应程度最低。

二元配色方案

注:

对于要创建的二元配色方案,输入区域内叠加区域的对应和叠加区域内输入区域的对应必须至少具有三个唯一值。在这种情况下,建议查看按区域聚合的交点

例如,下图显示了温度区域和气候区域的交集。该国家/地区的最南和最北区域中的整体对应程度最高,以浅灰色交集区域表示。中西部地区沿线的对应程度最低。

气候区域和温度区域的交集

交集还附带两个图表,用于可视化特定区域组合的对应程度。第一张图表为输入区域内的叠加区域汇总,它是一个并排条形图,按输入区域的每个类别划分。每个并排条形图显示了叠加区域与输入区域的相交面积。

例如,在下图中,输入区域是森林类型,叠加区域是昆虫和疾病风险类别。对于每种森林类型,将显示每个昆虫和疾病风险类别内相交面积的条形图。最左侧的条形图显示了加利福尼亚混合针叶树森林类型大部分与无风险类别相交;但是,大约三分之一的面积为有风险或已经存在昆虫/疾病。对于美国黑松森林类型,只有大约三分之一的面积没有风险,但是只有一小部分森林已经存在昆虫/疾病。对于左右侧的矮松圆柏林地森林类型,只有一小部分由风险或当前已存在昆虫或疾病。矮松圆柏林地的所有三个条柱均比加利福尼亚混合针叶树和美国黑松短,因为这种类型的森林在研究范围内的总面积较小。

用于汇总输入区域内的叠加区域的图表

第二张图表是叠加区域内的输入区域汇总,它与第一张图表类似,但是用于显示每个叠加区域内输入区域的区域交集。

按区域聚合交集

输入区域和叠加区域之间的最大交集数等于输入区域的类别数乘以叠加区域的类别数。在如此多的潜在组合和二元配色方案下,即使使用条形图,可能也很难分辨出哪个特定输入区域与哪个特定叠加区域对应。如果组合太多而无法单独对每一个进行评估,则建议按区域聚合每个输入区域和叠加区域的对应度量。这样可以识别与其他区域化的某个区域对应的输入区域和叠加区域,但不会告知您其对应的确切区域。然后,可以使用输出要素或输出栅格和图表来识别一个或多个精确对应组合。如果输入区域和叠加区域是面,可以使用输入区域内叠加区域的对应叠加区域内输入区域的对应参数创建此类聚合。如果任一参数作为栅格提供,则聚合将另存为输出栅格的字段。添加到地图时,以较浅颜色显示的区域表示对应程度较高的区域。

聚合的交点

其他资源

有关详细信息和数学细节,请参阅以下参考文献:

  • Nowosad, J., Stepinski, T. F. (2018). “Spatial association between regionalizations using the information-theoretical V-measure." International Journal of Geographical Information Science. https://doi.org/10.1080/13658816.2018.1511794