双变量空间关联 (Lee's L) (空间统计)

摘要

使用 Lee's L 统计量计算两个连续变量之间的空间关联。

Lee's L 统计量不仅量化了变量之间的相关性程度,还描述了它们在空间聚集模式上的相似性。 该值介于 -1 到 1 之间,概念上类似于相关系数,但会根据两个变量的空间自相关性进行调整。 当 Lee's L 值接近 1 时,表示两个变量高度正相关,并且每个变量的高值和低值在空间上都有显著的聚集效应。 值接近 -1 则表示变量高度负相关,且每个变量的正向空间自相关性也很强。 值接近 0 表示两个变量无相关性,或者它们之间没有明显的空间自相关性。

Lee's L 统计量可以细化到每个输入要素,称为局部 Lee's L 统计量,展示了特定要素及其邻域的局部空间关联。 这有助于识别某些区域的空间关联是否与全局 Lee's L 统计量存在差异。 局部统计量还可根据每个要素的邻居值进行分类。 全局和局部统计量的统计显著性通过置换检验来测试。

了解更多关于双变量空间关联 (Lee's L) 的工作原理。

插图

双变量空间关联 (Lee's L) 工具图示
上排的两个变量具有正空间关联,而下排的两个变量则表现出负空间关联。

使用情况

  • 两个分析变量必须是连续型的(非二进制或分类型),且变量之间应具有线性关系。 如果关系为非线性的,则可使用变换字段工具对分析变量进行变换,使关系线性化,然后使用变换后的值重新运行该工具。

  • 该工具会生成多种输出,您可以利用这些输出来分析两个分析变量之间的空间关联性。 地理处理消息会显示 Lee's L 统计量及其 p 值,输出要素类还包含局部 Lee's L 统计量、p 值和统计显著性结果的汇总信息。 在活动地图中运行时,输出的要素图层将基于局部空间关联类别(Not SignificantHigh-HighLow-LowHigh-LowLow-High)进行可视化展示。 例如,如果局部 Lee's L 统计量的统计显著性至少达到 90%,且第一个分析变量高于平均值,第二个变量低于平均值,则会将其归为类别 High-Low

    了解关于工具输出的详细信息。

  • 全局和局部空间关联的 p 值通过置换检验来计算。

  • 建议至少使用 50 个输入要素,每个要素包含至少 8 个邻居。

  • 每个要素的邻域内始终包括该要素本身。 如果使用空间权重文件来定义邻居,即使文件中未定义权重,系统也会为自身赋予权重值 1。 所有邻域的权重都经过标准化,总和为 1。

  • 可以使用随机数生成器环境来重现置换和 p 值。 如果未指定种子值,p 值可能会因随机性而变化。 不过,如果并行处理因子环境的值大于 1(默认设置),即使使用固定的随机数生成器种子值,置换结果也可能不一致。

  • 反转两个分析变量的顺序不会改变全局或局部 Lee's L 统计量,但 p 值可能会因置换的随机性而变化。 High-LowLow-High 类别也会随之反转。

参数

标注说明数据类型
输入要素

输入要素应包含两个分析变量的字段。

Feature Layer
分析字段 1

第一个分析变量的字段。 该字段必须为数值型。

Field
分析字段 2

第二个分析变量的字段。 该字段必须为数值型。

Field
输出要素

输出要素应包含局部 Lee's L 统计量、空间关联类别、p 值及每个要素邻居的加权平均值。

Feature Class
邻域类型
(可选)

指定如何确定每个要素的邻居。 每个要素始终包含在邻域内,且所有邻域权重都会标准化为 1。

  • 固定距离范围每个要素指定临界距离内的要素将作为邻居包含在内。 这是点要素的默认选项。
  • K 最近邻最近的 k 个要素将作为邻居被包括在内。
  • 仅邻接边共享边的面要素将作为邻居包含在内。
  • 邻接边拐角共享边或拐角的面要素将作为邻居包含在内。 这是面要素的默认选项。
  • Delaunay 三角测量其 Delaunay 三角测量(泰森多边形)共享边或角的点将作为邻居包含在内。
  • 通过文件获取空间权重将由空间权重文件定义邻居和权重。
String
距离范围
(可选)

用于确定焦点要素邻居的距离范围。 如果未提供值,则使用最短距离,使每个要素至少有一个邻居。 对于多边形,将使用中心点之间的距离来确定邻居。

Linear Unit
邻居数
(可选)

指定将包括为邻居的每个要素周围的邻居数。 该值不包括要素本身。 例如,指定 6 将使用该要素及其六个最近的邻居(共七个要素)。 默认值为 8。 该值至少应为 2。

Long
权重矩阵文件
(可选)

空间权重矩阵文件的路径和文件名,用于定义邻居和要素之间权重。

File
局部权重方案
(可选)

指定计算空间关联时应用的权重方案。

  • 未加权将不会对相邻要素进行加权。 这是默认设置。
  • 双平方将使用双平方核(四次式)对邻居进行加权。
String
核带宽
(可选)

二次核的带宽。 带宽决定了权重随距离减小的速度。 较大的带宽将为距离较远的邻居赋予较大的权重。 对于 k 最近邻邻域,默认值(空)将使用与焦点要素第 (k+1) 个邻居的距离相等的自适应带宽。 对于固定距离范围邻域,默认值(空)将与距离带相同。

Linear Unit
置换检验次数
(可选)

指定计算全局和局部 p 值时使用的置换次数。 所有 p 值均使用两侧假设检验计算。

  • 99分析将使用 99 次置换检验。 如果置换次数为 99,则可能的最小 p 值为 0.02,其他所有 p 值将是该值的数倍。
  • 199分析将使用 199 次置换检验。 如果置换检验次数为 199,则可能的最小 p 值为 0.01,其他所有 p 值将是该值的数倍。
  • 499分析将使用 499 次置换检验。 如果置换检验次数为 499,则可能的最小 p 值为 0.004,其他所有 p 值将是该值的倍数。
  • 999分析将使用 999 次置换检验。 如果置换检验次数为 999,则可能的最小 p 值为 0.002,其他所有 p 值将是该值的数倍。 此选项推荐用于 90% 置信度测试。 这是默认设置。
  • 4999分析将使用 4,999 次置换检验。 如果置换检验次数为 4,999,则可能的最小 p 值为 0.0004,其他所有 p 值将是该值的倍数。 此选项推荐用于 95% 置信度测试。
  • 9999分析将使用 9,999 次置换检验。 如果置换检验次数为 9,999,则可能的最小 p 值为 0.0002,其他所有 p 值将是该值的倍数。 此选项推荐用于 99% 置信度测试。
Long

派生输出

标注说明数据类型
Lee's L

分析变量的 Lee's L 统计量。

Double
P 值

Lee's L 统计量的 p 值

Double
Pearson 相关

Pearson 相关性(原始数据) - 分析变量之间的 Pearson 相关性。

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
名称说明数据类型
in_features

输入要素应包含两个分析变量的字段。

Feature Layer
analysis_field1

第一个分析变量的字段。 该字段必须为数值型。

Field
analysis_field2

第二个分析变量的字段。 该字段必须为数值型。

Field
out_features

输出要素应包含局部 Lee's L 统计量、空间关联类别、p 值及每个要素邻居的加权平均值。

Feature Class
neighborhood_type
(可选)

指定如何确定每个要素的邻居。 每个要素始终包含在邻域内,且所有邻域权重都会标准化为 1。

  • DISTANCE_BAND每个要素指定临界距离内的要素将作为邻居包含在内。 这是点要素的默认选项。
  • K_NEAREST_NEIGHBORS最近的 k 个要素将作为邻居被包括在内。
  • CONTIGUITY_EDGES_ONLY共享边的面要素将作为邻居包含在内。
  • CONTIGUITY_EDGES_CORNERS共享边或拐角的面要素将作为邻居包含在内。 这是面要素的默认选项。
  • DELAUNAY_TRIANGULATION其 Delaunay 三角测量(泰森多边形)共享边或角的点将作为邻居包含在内。
  • GET_SPATIAL_WEIGHTS_FROM_FILE将由空间权重文件定义邻居和权重。
String
distance_band
(可选)

用于确定焦点要素邻居的距离范围。 如果未提供值,则使用最短距离,使每个要素至少有一个邻居。 对于多边形,将使用中心点之间的距离来确定邻居。

Linear Unit
num_neighbors
(可选)

指定将包括为邻居的每个要素周围的邻居数。 该值不包括要素本身。 例如,指定 6 将使用该要素及其六个最近的邻居(共七个要素)。 默认值为 8。 该值至少应为 2。

Long
weights_matrix_file
(可选)

空间权重矩阵文件的路径和文件名,用于定义邻居和要素之间权重。

File
local_weighting_scheme
(可选)

指定计算空间关联时应用的权重方案。

  • UNWEIGHTED将不会对相邻要素进行加权。 这是默认设置。
  • BISQUARE将使用双平方核(四次式)对邻居进行加权。
String
kernel_bandwidth
(可选)

二次核的带宽。 带宽决定了权重随距离减小的速度。 较大的带宽将为距离较远的邻居赋予较大的权重。 对于 k 最近邻邻域,默认值(空)将使用与焦点要素第 (k+1) 个邻居的距离相等的自适应带宽。 对于固定距离范围邻域,默认值(空)将与距离带相同。

Linear Unit
num_permutations
(可选)

指定计算全局和局部 p 值时使用的置换次数。 所有 p 值均使用两侧假设检验计算。

  • 99分析将使用 99 次置换检验。 如果置换次数为 99,则可能的最小 p 值为 0.02,其他所有 p 值将是该值的数倍。
  • 199分析将使用 199 次置换检验。 如果置换检验次数为 199,则可能的最小 p 值为 0.01,其他所有 p 值将是该值的数倍。
  • 499分析将使用 499 次置换检验。 如果置换检验次数为 499,则可能的最小 p 值为 0.004,其他所有 p 值将是该值的倍数。
  • 999分析将使用 999 次置换检验。 如果置换检验次数为 999,则可能的最小 p 值为 0.002,其他所有 p 值将是该值的数倍。 此选项推荐用于 90% 置信度测试。 这是默认设置。
  • 4999分析将使用 4,999 次置换检验。 如果置换检验次数为 4,999,则可能的最小 p 值为 0.0004,其他所有 p 值将是该值的倍数。 此选项推荐用于 95% 置信度测试。
  • 9999分析将使用 9,999 次置换检验。 如果置换检验次数为 9,999,则可能的最小 p 值为 0.0002,其他所有 p 值将是该值的倍数。 此选项推荐用于 99% 置信度测试。
Long

派生输出

名称说明数据类型
lee_l

分析变量的 Lee's L 统计量。

Double
p_value

Lee's L 统计量的 p 值

Double
corr

Pearson 相关性(原始数据) - 分析变量之间的 Pearson 相关性。

Double

代码示例

BivariateSpatialAssociation 示例 1(Python 窗口)

以下 Python 窗口脚本演示了如何使用 BivariateSpatialAssociation 函数。

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
BivariateSpatialAssociation 示例 2(独立脚本)

以下独立脚本演示了如何使用 BivariateSpatialAssociation 函数。

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

许可信息

  • Basic: 是
  • Standard: 是
  • Advanced: 是

相关主题