热点分析 (Getis-Ord Gi*) 工具可计算数据集中每个要素的 Getis-Ord Gi* 统计数据(称为 G-i-星号)。 通过得到的 z 得分和 p 值,您可以知道高值或低值要素在空间上发生聚类的位置。 此工具将对相邻要素环境中的每个要素进行评估。 高值要素往往容易引起注意,但可能不是具有显著统计学意义的热点。 要成为具有显著统计性的热点,要素应具有高值,且被其他同样具有高值的要素所包围。 某个要素及其相邻要素的局部总和将与所有要素的总和进行比较。 当局部总和与所预期的局部总和有很大差异,以致于无法成为随机产生的结果时,会产生一个具有显著统计学意义的 z 得分。 如果应用 FDR 校正,统计显著性会根据多重测试和空间依赖性进行调整。
计算
Getis-Ord Gi* 统计数据的计算如下图所示:
解释
数据集中每个要素返回的 Gi* 统计数据是 z 分数。 对于具有显著统计性的正 z 分数,z 分数越大,高值(热点)的聚类越密集。 对于具有显著统计性的负 z 分数,z 分数越小,低值(冷点)的聚类越密集。 有关确定统计显著性以及针对多重测试和空间依赖性进行校正的详细信息,请参阅什么是 z 得分? 什么是 p 值?。
输出
此工具使用 z 得分、p 值和置信区间 (Gi_Bin) 为输入要素类中的每个要素创建一个新的输出要素类。
工具运行完成后,输出要素类将添加到地图中,并且会对 Gi_Bin 字段应用渲染。
热点分析注意事项
进行热点分析时请考虑以下几点:
- 该工具可评估高值或低值(例如犯罪数量、事故严重程度或在体育用品上花费的金额)是否在空间上存在聚类。 包含这些值的字段是分析字段。 然而,对于点事件数据,您可能对评估事件强度比分析与事件相关的任何特定值的空间聚类更感兴趣。 在这种情况下,请在运行分析之前通过执行以下操作之一汇总事件数据:
- 如果研究区域存在面要素,则可使用空间连接工具对每个面中的事件进行计数。 包含每个面中的事件数的结果字段将成为热点分析 (Getis-Ord Gi*) 工具的输入字段参数值。
- 使用创建鱼网或生成镶嵌工具在点要素上构建面格网。 然后使用空间连接工具对落在每个格网面内的事件进行计数。 删除研究区域之外的所有格网面。 此外,如果研究区域内的许多格网面所包含的事件数为零,则可增加面格网的大小,如果合适的话,也可以移除那些计数为零的格网面。
- 如果具有大量的重合点,或者在短距离内存在大量点,则可以将整合工具与收集事件工具结合使用以执行如下操作:将处于彼此指定距离范围内的要素捕捉到一起,然后,使用相关联的计数属性创建一个新的要素类(每个唯一位置处都包含一个点)以指示事件/捕捉点的数量。 使用结果 ICOUNT 字段作为热点分析 (Getis-Ord Gi*) 工具的输入字段参数值。
注:
如果重合点可能成为冗余记录,则查找相同工具可帮助您找到并移除重复记录。
对于热点分析 (Getis-Ord Gi*) 工具,推荐的(和默认的)空间关系的概念化为固定距离范围。 空间时间窗、无差别的区域、K 最近邻和 Delaunay 三角测量选项也都可以正常工作。 有关确定分析距离值最佳做法和策略方面的讨论,请参阅选择空间关系的概念化的最佳做法和选择固定距离范围值的最佳做法。 有关时空热点分析的详细信息,请参阅空间-时间聚类分析。
输入字段决定您可以提出的问题类型。 如果您最感兴趣的是确定哪里有大量事件发生,或者特定属性的高值和低值在空间上的聚集位置,请对原始值或原始事件计数运行热点分析 (Getis-Ord Gi*) 工具。 这种分析对于资源分配问题特别有帮助。 或者(或另外),您可能对定位那些相对于某些其他变量具有意外高值的区域感兴趣。 例如,如果您正在分析止赎情况,那么很可能在房屋较多的地方、止赎情况也更多(也就是说,您预计止赎数量与房屋数量有关)。 如果用止赎数量除以房屋数量,则对该比值运行热点分析 (Getis-Ord Gi*) 工具,您不再询问“何处存在大量止赎,”, 相反,您会询问“若给定房屋数量,则何处存在止赎数量异常高的情况。” 通过在运行分析之前创建比率或比例,您可以控制某些预期关系(例如,犯罪数量是人口的函数;止赎数量是住房存量的函数)并识别意外的热点和冷点。
最佳做法
以下是使用热点分析 (Getis-Ord Gi*) 工具的最佳做法:
- 输入要素类参数值应至少具有 30 个要素。 如果少于 30 个要素,则结果不可靠。
- 指定适当的空间关系概念化参数值。 对于此工具,建议使用固定距离范围选项。 有关时空热点分析,请参阅选择空间关系的概念化的最佳做法。
- 指定适当的距离范围或阈值距离参数值。 有关详细信息,请参阅距离范围或阈值距离。
- 所有要素都应至少具有一个相邻要素。
- 任何要素都不应将其他所有要素作为相邻要素。
- 每个要素应具有大约 8 个相邻要素,特别是当输入字段参数值出现偏差时。 计算近邻点距离工具可用于查找平均距离,在该距离处,每个要素都有 8 个相邻要素。
可能的应用
例如,可以在犯罪分析、流行病学、投票模式分析、经济地理、零售分析、交通事件分析和人口统计中找到应用。 您可以回答以下类型的问题:
- 疫情集中爆发在哪里?
- 哪些地方的厨房火灾占所有住宅火灾的比例大于预期?
- 避难场所应设置在哪里?
- 峰值密集区出现于何处和何时?
- 我们应在哪些位置和哪些时段分配更多的资源?
其他资源
有关空间统计的其他信息,请参阅以下资源:
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.
Getis, A. and J.K. Ord. 1992."The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).
Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" in Geographical Analysis 27(4).
空间统计资源页面提供了短片、教程、web 研讨会、文章和多种其他材料,以帮助用户开始使用空间统计。
Scott, L. and N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools in ArcUser Online, April–June 2005.