选择固定距离范围值的最佳做法

固定距离范围可视为临时停留在每个要素上面的移动分析窗口,并在其相邻要素环境内查看该要素。以下准则和最佳做法将有助于针对分析确定适当的距离范围:

  • 根据您所了解的空间过程(支持正在研究的现象的聚类)的地理范围来选择距离。通常,您不知道这方面的内容,但如果知道,请使用您掌握的知识选择距离值。例如,假设您知道上下班路程的平均通勤距离是 15 英里。使用 15 英里作为距离范围是研究通勤数据的一个好策略。
  • 使用足够大的距离范围确保所有要素都至少具有一个相邻要素,否则结果将无效。
  • 当输入数据偏斜(且在将数据绘制为直方图时无法创建钟形曲线)时,请确保距离范围既不要过小(大多数要素只有一个或两个相邻要素)也不过大(几个要素将其他所有要素作为相邻要素包括在内),因为过小或过大会使得到的 z 得分不够可靠。
  • 只要距离范围足以确保每个要素具有数个相邻要素(大约 8 个),就能够保证 z 得分是可靠的(即使存在偏斜数据)。如果创建过大的距离范围(其中要素包含数千个相邻要素),则即使没有任何要素将其他所有要素作为相邻要素包括在内,也可能会导致性能问题和潜在的内存限制。
  • 有时,确保所有要素都至少具有一个相邻要素会导致部分要素的相邻要素达到数千个,因此不是理想结果。在某些要素为空间异常值时就会发生这种情况。要解决这个问题,找到适合所有要素(空间异常值除外)的距离范围,并使用生成空间权重矩阵工具创建一个采用此距离的空间权重矩阵文件。但是,在运行生成空间权重矩阵工具时,需要在相邻要素的数目参数中指定相邻要素的最小值。例如,假设您正在使用人口普查区域数据评估洛杉矶县内人口获取健康食品的远近。已知 90% 以上的人口居住在距离购物场所 3 英里的范围内。如果分析人口普查区域数据,就会发现市区中心的调查对象(基于人口普查区域质心)平均距离为 1,000 米,而郊区的调查对象距离则超过 18,000 米。为确保每个要素都至少有一个相邻要素,则您的距离范围需要超过 18,000 米。此分析(距离)范围不适用于您所问的问题。相应的解决方案是,使用生成空间权重矩阵工具为人口普查区域要素类创建一个空间权重矩阵文件。指定一个适用于除空间异常值外所有要素的距离范围或距离阈值值(例如,4800 米(约 3 英里))以及适用于相邻要素数参数的和最小邻域值(例如 2)。以便将 4,800 米固定距离相邻要素应用于此距离范围内相邻要素不超过两个的要素外的所有要素。对于那些异常值要素(且仅限于那些异常值要素),该距离将延伸至足以确保每个要素至少包括 2 个相邻要素。
  • 使用可反映最大空间自相关的距离范围。当看到地表上的空间聚类时,您将看到正在进行的基础空间处理。此距离范围揭示最大聚类(通过增量空间自相关工具测量),是空间聚类过程最活跃或最明显的距离。运行增量空间自相关工具并留意生成的 z 得分达到峰值的位置。使用与分析的峰值相关的距离。
    注:

    输入距离值,该值的单位应该与使用图层的空间参考或输出坐标系地理处理环境所指定的单位相同。

    • 每个峰值都表示进行空间聚类过程显著的位置的距离。多个峰值是很常见的。与较大距离相关的峰值通常反映广泛的趋势(例如,广泛的东西趋势,其中西部是大热点,而东部则是大冷点)。您通常会对与较小距离相关的峰值最感兴趣,通常为第一个峰值。
    • 不显著的峰值通常意味着在各种空间比例有很多不同的空间过程在进行。您可能希望寻找其他条件以确定对分析使用哪个固定距离(可能是用于修复的最有效距离)。
    • 如果 z 得分未出现峰值(也就是说它持续增加)并且您正在使用聚合数据(例如县),通常意味着聚合方案过于粗略;运行感兴趣的空间过程时所处的比例小于聚合单位的比例。如果可以移动到较小的分析比例(例如从县移动到普查区域),这样可能有助于查找峰值距离。如果正在处理点数据并且 z 得分未出现峰值,即意味着在多种空间比例下存在多种不同的空间处理过程,因此您可能需要使用不同的标准来确定分析中使用的固定距离。另外,当运行增量空间自相关工具时,请确认开始距离价值不会太大。
    • 如果未指定开始距离,增量空间自相关工具将使用可确保所有要素至少具有一个相邻要素的距离。如果您的数据包含空间异常值,该距离对于分析可能过大,这可能是无法在输出报表文件中看到明显峰值的原因。解决方案是,针对暂时排除所有空间异常值的选择集运行增量空间自相关工具。如果排除异常值后出现峰值,则将该峰值距离应用于所有要素(包括空间异常值)的同时使用如上所述的策略,并需要每个要素至少包括一个或两个相邻要素。如果不确定哪些要素是空间异常值,尝试以下操作:
      • 对于面数据,使用标准差渲染方案渲染面区域,并将区域大于三个标准差的面视为空间异常值。如果不具有包含面区域的字段,可使用计算字段工具创建。
      • 对于点数据,使用邻近值工具计算每个要素的最邻近距离。要执行此操作,请将邻近值工具的输入要素邻近要素参数设置为点数据集。具有含最邻近距离的字段后,使用标准差渲染方案渲染这些值并将大于三个标准差的距离视为空间异常值。
    增量空间自相关示意图
    标识进行聚类过程最显著位置的距离。
  • 不要总认为只有一个正确的距离范围。实际情况永远不会那么简单。很可能有多个或交互的空间过程推动了观察到的聚类。与其认为您需要一个距离范围,不如将模式分析工具作为在多种空间比例下浏览空间关系的有效方法。需要考虑到(通过更改距离范围值)更改分析比例时可能将会面对其他问题。假设要查看收入数据。使用小距离范围,您可以检查街区的收入模式,中比例距离可能反映社区或城市收入模式,而最大的距离范围将显示广泛的地方性的收入模式。