高/低聚类 (Getis-Ord General G) 工具可针对指定的研究区域测量高值或低值的密度。
计算
请注意,分子与分母唯一的区别是权重 (wij)。高/低聚类(Getis-Ord General G) 工具将只处理正值。因此,如果权重为二进制 (0/1) 或始终小于 1,则 General G 的范围将在 0 与 1 之间。建议针对此统计使用二进制权重方案。针对空间关系的概念化参数,选择固定距离范围、仅邻接边、邻接边拐角、k 最近邻或者具有 Delaunay 三角测量的 .swm 文件。针对标准化参数,选择无。
解释
高/低聚类 (Getis-Ord General G) 统计是一种推论统计,这意味着分析结果将在零假设的情况下进行解释。高/低聚类 (General G) 统计的零假设规定不存在要素值的空间聚类。此工具返回的 p 值较小且在统计学上显著,则可以拒绝零假设(请参阅什么是 z 得分? 什么是 p 值?)。如果零假设被拒绝,则 z 得分的符号将变得十分重要。如果 z 得分值为正数,则观测的 General G 指数会比期望的 General G 指数要大一些,表明属性的高值将在研究区域中聚类。如果 z 得分值为负数,则观测的 General G 指数会比期望的 General G 指数要小一些,表明属性的低值将在研究区域中聚类。
当存在完全均匀分布的值并且要查找高值的异常空间峰值时,首选高/低聚类 (Getis-Ord General G) 工具。遗憾的是,高值和低值同时聚类时,它们倾向于彼此相互抵消。如果在高值和低值同时聚类时测量空间聚类,则使用空间自相关工具。
高/低聚类 (Getis-Ord General G) 和空间自相关 (Global Moran's I) 工具的零假设都具有完全空间随机性 (CSR);在数据集的要素中值是随机分布的,将在运行时反映随机空间过程。不过,高/低聚类 (Getis-Ord General G) 工具的 z 得分的解释与空间自相关 (Global Moran's I) 工具的 z 得分的解释有很大的差别,如下表所示:
结果 | 高/低聚类 | 空间自相关 |
---|---|---|
p 值不具有统计学上的显著性。 | 不能拒绝零假设。要素属性值的空间分布可能是随机空间过程的结果。也就是说,所观测到的值的空间模式很可能是完全空间随机性的众多可能结果之一。 | |
p 值具有统计学上的显著性,且 z 得分为正值。 | 可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值的空间分布与预期的空间分布相比在空间上的聚类程度更高。 | 可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值和/或低值的空间分布在空间上聚类的程度要高于预期。 |
p 值具有统计学上的显著性,且 z 得分为负值。 | 可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中低值的空间分布与预期的空间分布相比在空间上的聚类程度更高。 | 可以拒绝零假设。如果基础空间过程是完全随机的,则数据集中高值和低值的空间分布在空间上离散的程度要高于预期。离散空间模式通常会反映某种类型的竞争过程:具有高值的要素排斥具有高值的其他要素;类似地,具有低值的要素排斥具有低值的其他要素。 |
输出
高/低聚类 (Getis-Ord General G) 工具可返回四个值:General G 观测值、General G 期望值、z 得分以及 p 值。在工具执行期间,这些值会在地理处理窗格底部以消息的形式写入,并将作为派生输出值进行传递,以满足模型或脚本中的潜在使用需要。可将鼠标悬停在进度条上、单击弹出按钮或展开地理处理窗格中的消息部分来访问消息。您还可以通过地理处理历史访问之前运行工具的消息。此外,您还可以使用此工具创建一个 HTML 报表文件,其中包含了结果的图形汇总。报表路径将随附在汇总工具执行参数的消息中。单击此路径将打开报表文件。
常见问题
问题:热点分析 (Getis-Ord Gi*) 工具的输出结果用于指示统计学上显著的热点。为何来自高/低聚类(Getis-Ord General G) 工具的结果在统计学上也不具有显著性?
回答:诸如高/低聚类 (Getis-Ord General G) 工具等全局统计工具用于对数据的总体模式和趋势进行评估。如果空间模式在研究区域内保持一致,这些全局统计量最有效。局部统计量工具(如热点分析(Getis-Ord Gi*)工具)用于在相邻要素的环境下对每个要素进行评估,然后将局部情况与全局情况进行比较。请考虑一个示例。您在计算一组值的均值或平均值时,还要计算某个全局统计量。如果所有值都接近 20,则均值也将接近 20,并且该结果可以非常好地表示/概括整个数据集。但如果一半值接近 1,而另一半值接近 100,则均值将接近 50。可能不存在任何接近 50 的数据值,因此该均值并不能很好地表示/概括整个数据集。不过,创建数据值的直方图时,您将看到双峰分布。同样,当所估量的空间过程在研究区域内保持一致时,使用全局空间统计量(包括“高/低聚类(Getis-Ord General G)”工具)将最有效。这样,所得到的结果将能很好地表示和概括总体空间模式。有关详细信息,请参阅下面引用的 Getis and Ord (1992) 以及它们所提供的 SIDS 分析。
问题:高/低聚类 (Getis-Ord General G) 工具与空间自相关 (Global Moran's I) 工具生成的结果为何不同?
回答:请参见上表。因为这些工具用于估量不同的空间模式。
问题:可以针对不同研究区域将此工具生成的 z 得分或 p 值与分析结果进行比较吗?
回答:结果不能进行比较,除非用于分析的研究区域和参数是固定的(对于所有要比较的分析都一样)。但是如果研究区域由一组固定的面构成并且分析参数是固定的,则可以随时间针对特定的属性比较 z 得分。例如,要分析某个县在一定区域内非处方 (OTC) 药购买水平的聚类趋势。可以在每个时期运行高/低聚类 (Getis-Ord General G) 工具,然后创建结果的线图。如果发现 z 得分在统计学上具有显著性并且值在增加,则可以推断出高 OTC 购买的空间聚类程度在增加。
问题:要素大小是否影响分析?
回答:要素的大小可以影响结果。例如,如果非常大的面趋于获得低值而较小的面趋于获得高值,则即使高值和低值的密度同样集中,General G 观测值指数也可能高于 General G 期望值指数,因为在指定距离内存在多对小面。
潜在的应用
- 在访问急症室的次数中查找出现的异常峰值,可能表明在局部或区域的健康问题的爆发。
- 比较在城市中不同种类零售业的空间模式,利用比较购物的方式来了解哪类行业充满竞争性(如汽车经销商)以及哪类行业拒绝竞争(如健康中心/健身房)。
- 汇总空间现象聚类的程度以检查不同时期或不同位置的变化。例如,众所周知的城市及其人口聚类。使用高/低聚类 (Getis-Ord General G) 时,可以随时间来比较某个城市的人口聚类的程度(城镇发展以及密集度的分析)。
其他资源
Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.