空间关系建模

空间统计工具箱中的许多工具和方法都需要定义要素间的空间关系。 这需要确定哪些要素互为相邻要素,以及相邻要素之间应产生多大程度的影响。 这种通过邻域类型与加权方案组合定义的结构,构成了许多空间分析的基础。

空间关系

空间统计分析和传统统计分析的一个重要区别是空间统计分析将空间关系直接整合到算法和模型中。 因此,多种工具都提供了空间关系的概念化邻域类型空间约束参数,以供用户定义要素间的空间关系。

不同的空间关系会强调空间结构的不同方面。 例如在住房市场研究中,可将每栋住宅的邻域定义为若干最近房产并按距离加权,这种设定基于附近房产销售会产生最强影响力的假设。 其他场景可能需要更广泛或更复杂的定义,例如根据城市间的旅客流量建立关联(即便地理距离较远的城市仍可能存在高度经济依赖性)。 这些选择将从空间模式检测到空间模型行为等各方面产生影响,因此必须慎重考虑何种空间关系最适合您的数据与研究问题。

当执行热点分析聚类与异常值分析等空间统计分析时,可直接通过工具参数定义空间关系。 但是,也可以创建空间权重矩阵文件 (.swm) 来存储相邻要素与权重,以便在不同工具中重复使用。

不同工具和方法提供了多种定义空间关系的选项。 虽然单一工具无法支持所有可能的空间关系,但生成空间权重矩阵工具支持最多种类的空间关系,其输出文件也可在其他分析工具中重复使用。 对于除最简单空间关系之外的所有空间关系,建议先通过空间权重矩阵文件定义空间关系,再在空间分析工具中使用该文件。

各工具支持的空间关系类型将在以下章节说明:

反距离

反距离图形

反距离空间关系是一种阻抗或距离衰减,其中相邻要素的权重值随其与焦点要素距离的增加而递减。 任何要素都会影响其他所有要素,但距离越远,影响越小。 反距离通常还会采用幂运算(如反距离平方),从而加速权重值的衰减速度。 一般建议为反距离关系设置距离阈值,以减少权重值趋近于 0 的相邻要素数量。 当指定距离阈值时,系统会自动计算默认阈值,但也可通过将距离阈值设为 0 来强制使所有要素互为相邻要素。

固定距离范围

固定距离范围图形

固定距离范围空间关系会在每个要素周围形成影响圈,落在焦点要素指定距离阈值范围内的所有要素都将成为相邻要素。 如果要评估处于特定(固定)空间尺度下数据的统计属性,此选项非常适用。 如果要研究通勤模式并且已知平均上下班路程为 15 英里,则最好使用 15 英里的固定距离进行分析。 有关有助于您确定合适的分析比例的策略,请参阅选择固定距离范围值的最佳做法

无差别的区域

无差别的区域图形

无差别的区域空间关系将固定距离范围与反距离空间关系合并为一体。 距离阈值内的所有要素都包含在对目标要素的分析中。 超过距离阈值后,影响级别(权重)会快速下降。 如果希望保持分析比例固定但又不想对目标要素计算中包含的相邻要素施加清晰的边界,适合使用此方法。

面邻域

对于面要素类,可选择使用与焦点面相邻的所有面要素来定义相邻要素。 还可选择仅共享拐角的面要素(称为 queen 邻接)或仅共享边的面要素(称为 rook 邻接)作为相邻要素。 在不同工具中,这两个选项分别称为邻接边拐角仅邻接边。 如果两个面存在重叠的部分,则将被两种邻接选项均视为相邻要素。

包含边与拐角的面邻接空间关系

面邻接还可扩展至更高阶数,其中阶数是指从焦点面移动到其相邻要素所需的步数。 一阶邻接意味着仅将焦点面的直接相邻要素(一步可达的要素)作为相邻要素。 二阶邻接则包含两步及以内可达的所有面(一阶相邻要素及其所有一阶相邻要素)作为相邻要素。 如果面呈网格状排列,更高阶数将形成以焦点面为中心的同心环。 通常建议避免使用超过 3 阶的面邻接。 可使用生成空间权重矩阵工具创建高阶邻接空间关系。

K 最近邻

K 最近邻空间关系使用指定数量 k 个最接近的要素作为相邻要素,其中 k 通过相邻要素的数目参数提供。 在要素密度高的位置处,分析的空间尺度会比较小。 与此类似,要素密度稀的位置,分析的空间尺度会比较大。 此空间关系模型的一个优势在于它可确保每个目标要素都有一些相邻要素,即使要素密度在研究区域内变化较大时也是如此。

K 最近邻空间关系

Delaunay 三角测量

Delaunay 三角测量空间关系可构造相邻要素,方法是通过点要素或要素质心创建 Voronoi 三角形,使得每个点或质心都是三角形结点。 由三角形的边连接的结点被视为相邻结点。 使用 Delaunay 三角测量可确保每个要素至少具有一个相邻要素,即使数据包含岛或变化明显的要素密度。 具有重合要素时,不要使用 Delaunay 三角测量选项。

Delaunay 三角测量空间关系

空间时间窗

使用此选项,可根据空间窗(固定距离)和时间窗(固定时间间隔)来定义要素的关系。 当您使用生成空间权重矩阵工具创建空间权重矩阵文件时,此选项可用。 选择空间时间窗选项时,需要指定日期/时间字段日期/时间间隔类型(例如,小时、天或月份)和日期/时间间隔值参数值。 间隔值为整数。 例如,如果选择小时选项作为时间间隔类型,3 作为间隔值,则两个要素的“日期/时间”字段中的值均处于对方的 3 小时内时,这两个要素将被视为相邻要素。 凭借这种概念化,如果要素处于目标要素的指定距离和指定时间间隔内,则这些要素视为相邻要素。 例如,如果要创建一个空间权重矩阵文件以便配合热点分析工具来确定空间-时间热点,则可以选择空间关系的概念化参数的空间时间窗选项。 更多详细信息,包括如何可视化结果,请参阅空间-时间分析。 其他机会可用于帮助您在 3D 中可视化 netCDF 空间-时间立方体。

通过文件获取空间权重

如果空间关系已在空间权重矩阵 (.swm) 文件中定义,可使用此选项提供文件并将自定义权重应用于分析。 可使用生成空间权重矩阵工具、生成网络空间权重工具、邻域浏览器空间分量实用工具(Moran 特征向量)工具集中的多种工具创建此类文件。

选择空间关系的最佳实践

对要素在空间中彼此交互方式构建的模型越逼真,结果就越准确。 空间关系的选择应反映要分析的要素之间的固有关系。 有时您的选择也会受到数据特征的影响。

例如,反距离方法最适合对连续数据,或最适合对符合此种情形的对象进行建模:两个要素在空间上越靠近,它们彼此交互或影响的可能性就越大。 使用此空间关系,每个要素都可能是其他各个要素的相邻要素,而对于大型数据集,这将涉及巨大的计算量。 使用反距离关系时,应始终尝试添加一个距离阈值。 这对于大型数据集尤其重要。 如果未提供距离阈值,系统将为您计算阈值距离,但这可能不是分析所需的最适当距离。 该默认距离阈值将是确保每个要素至少具有一个近邻的最小距离。

固定距离范围选项适用于点数据,在面的大小变化较大(例如,研究区域边界处的面较大而研究区域中心的面较小)而希望确保分析比例一致时,此选项对于面数据而言通常为合理的选择。 有关帮助您为分析确定适当的距离范围值的相关策略,请参阅选择固定距离范围值的最佳做法

无差别的区域选项适用于以下情况:“固定距离”适合的情况,但对邻域关系添加明显的边界不是正确的数据表示。 “无差别的区域”关系会将每个要素视为其他各个要素的相邻要素。

当面在大小和分布上类似并且空间关系是面的临近性的函数(这是指如果两个面共享一个边界,则它们之间的空间交互将增加)时,面邻关系(仅邻接边邻接边拐角)非常有效。 选择面邻接概念化时,您几乎总要为具有行标准化参数的工具选择行标准化。

如果想要确保具有一个用于分析的最小相邻要素的数目,K 最近邻选项非常有效。 特别是当与要素相关的值存在偏斜(不是正态分布)时,在至少有八个相邻要素(这只是经验规则)的环境中评估各要素将十分重要。 当数据的分布在研究区域上存在变化以致于某些要素远离其他所有要素时,该方法十分适用。 但请注意,分析的空间环境会根据要素的稀疏程度或密集程度的变化而发生变化。 当固定分析范围重要性低于固定相邻要素的数目时,K 最近邻方法是合适的。

当数据包含岛屿面(未与其他面共享任何边界的孤立面),或者当要素的空间分布非常不均匀时,适合使用 Delaunay 三角测量选项(有时称为自然邻域法)。

空间时间窗选项可以根据要素的空间和时态邻近性来定义要素的关系。 例如,如果要识别空间-时间热点或构造成员关系通过空间和时间邻近性加以约束的分组,适合使用此选项。 有关空间-时间分析的示例以及有效渲染由此类分析得出的结果所采取的策略,请参阅空间-时间分析

对于某些应用程序,最好以行程时间或行程距离对空间交互进行建模。 如果要对城市服务的访问性进行建模,例如要查找城市犯罪集中的地区,推荐借助网络对空间关系进行建模。 使用生成网络空间权重工具。

如果没有适用于分析的预定义选项,您可以按照您所希望的要素与要素之间的关系创建一个 ASCII 文本文件或表,并使用文本文件或表构建空间权重矩阵文件。 如果上述某个选项接近您的理想空间关系,可使用生成空间权重矩阵工具创建基础空间权重矩阵文件,然后按需编辑空间权重矩阵文件

加权方案

虽然反距离和无差别的区域空间关系会直接基于距离为所有相邻要素分配权重,但多种工具允许您先定义邻域结构(如距离范围或 k 最近邻),再指定相邻要素的权重分配方法。 与反距离加权类似,通常使用核函数(一种随距离递减的函数)为靠近焦点要素的相邻要素分配较高权重。 核加权的优势在于能为远近相邻要素提供稳定权重,而反距离加权在距离小于 1 时存在问题,并且权重随与焦点要素之间的距离增加急剧减小。 所有核函数都必须使用带宽(固定值或自适应值)来定义权重随距离减小的速度。 常用核函数包括双平方、高斯、三角和二次式。 有关核加权的详细信息,请参阅邻域汇总统计的工作原理

生成空间权重矩阵工具还允许在使用面邻接定义空间关系时,按共享边界长度进行加权。 这样可以为共享焦点要素更大比例边界的要素分配更高影响力。 此外,还可按字段值(如人口或面的面积)加权,为字段值较高的要素分配更高权重。 当使用共享边界或字段值加权时,所有权重都会进行按行执行标准化

距离法

多个工具将提供欧氏距离或曼哈顿距离选项。

  • 欧氏距离按以下公式计算
D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]

其中 (x1,y1) 是点 A 的坐标,(x2,y2) 是点 B 的坐标,D 是点 A 和点 B 之间的直线距离。

欧氏距离
  • 曼哈顿距离按以下公式计算
D = abs(x1–x2) + abs(y1–y2)

其中 (x1,y1) 是点 A 的坐标,(x2,y2) 是点 B 的坐标,D 是点 A 和点 B 之间垂直之差与水平之差的和。 如果限制为仅南北行驶和东西行驶,则该距离是您必须行驶的距离。 当出行仅限于街道网络并且无法获得实际的街道网络出行成本时,此方法通常比欧几里得距离更合适。

曼哈顿距离

如果未投影输入要素(即,坐标为维度和经度坐标),或者将输出坐标系设置为地理坐标系,则采用弦测量方法计算距离并禁用距离方法参数。 使用弦距离测量法是因为此方法不仅计算速度快,而且提供真实测地线距离的精确估测,至少对于彼此 30 度以内的点是这样。 弦距基于球形地球模型,给定表面上的任意两点,两点之间的弦距离是连接两点的 3D 直线距离(该直线会穿过地球内部)。 弦距离报表将以米为单位。

警告:

如果您的研究区域超过 30 度,推荐投影数据。 弦距离无法可靠估算超出 30 度的测地线距离。

自加权

多个工具允许将要素自身定义为相邻要素并分配权重,称为自加权。 例如,可使用自加权反映基于面的面积的区域内部平均出行成本。 热点分析工具可通过自身潜力字段参数提供表示自权重的字段。 生成网络空间权重邻域汇总统计数据工具允许使用包含目标要素参数包含自权重。 其他多种工具(如双变量空间关联 (Lee's L) 会自动为任何已提供的空间关系添加自权重。

行标准化

当要素的分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。 选择行标准化后,每个权重都会除以行的和(所有相邻要素的权重和),以使权重总和为 1。行标准化的权重通常与固定距离相邻要素结合使用,并且几乎总是用于基于面邻接的相邻要素。 这样可减少因为要素具有不同数量的相邻要素而产生的偏离。 行标准化创建的是相对加权方案(而非绝对方案),适用于处理行政边界等场景。

距离范围

距离范围(有时称为距离阈值)参数为多种空间关系设置了分析尺度。 选择合适的距离十分重要。 某些空间统计要求每个要素至少具有一个相邻要素才能保证分析的可靠性。 如果为距离范围过小(以致某些要素没有相邻要素),将返回一条警告消息。 计算近邻点距离工具将针对指定相邻要素的数目计算最小距离、平均距离和最大距离,并且帮助您确定可用于分析的适当距离范围值。 有关附加原则,另请参阅选择固定距离范围值的最佳做法

当未指定任何值时,将计算默认距离阈值。 下表说明了不同的空间关系对于三种可能的输入类型(负值无效)的行为方式:

反距离、反距离平方固定距离范围、无差别的区域面邻接、Delaunay 三角测量、K 最近邻

0

不应用阈值或中断值;每个要素都是其他所有要素的相邻要素。

无效。 将生成运行时错误。

已忽略

将计算默认距离。 此默认值将是确保每个要素至少有一个相邻要素的最小距离。

将计算默认距离。 此默认值将是确保每个要素至少有一个相邻要素的最小距离。

已忽略

正数

指定的非零正值将用作中断距离;邻域关系仅存在于彼此距离在该值内的要素之间。

对于“固定距离范围”,只有彼此间距离处于此指定中断范围内的要素才是相邻要素。 对于“无差别的区域”,位于彼此的指定中断范围内的要素是相邻要素;位于彼此中断之外的要素也是相邻要素,但随着距离的增加,分配到的权重或影响将越来越小。

已忽略

距离范围选项

邻居数

邻居数参数对多种空间关系具有特定作用。 对 k 最近邻而言,每个目标要素将使用最接近的 K 个要素(其中 K 为指定的相邻要素的数目)。 对于反距离和距离范围关系,距离阈值会扩展至确保要素至少包含 K 个相邻要素。 对于面邻接空间关系,将基于要素质心邻近性添加额外相邻要素以确保至少包含 K 个相邻要素。

权重矩阵文本文件

多个工具允许您通过提供空间权重矩阵 (.swm) 文件来定义各个要素之间的空间关系。 空间权重是 0 到 1 之间的数字,反映数据集中各要素与其他所有要素的交互和影响程度。 空间权重矩阵文件可通过生成空间权重矩阵工具进行创建,也可以是简单的 ASCII 文件。

当空间权重矩阵文件是简单的 ASCII 文本文件时,第一行应该是唯一 ID 字段的名称。 这使您可以在生成该文件时灵活地使用数据集中的任意数字字段作为 ID;但是,ID 字段类型必须是整型(长整型或短整型)并且每个要素都必须具有唯一值。 在第一行之后,空间权重文件应格式化为以下三列:

  • 起始要素 ID
  • 终止要素 ID
  • 权重

例如,假设有三个加油站。 要用作 ID 字段的字段称为 StationID,要素 ID 为 1、2 和 3。 假设要按照行程时间从长到短的顺序为这三个加油站之间的空间关系进行建模。 ASCII 文件内容可能如下:

ASCII 文件

手动输入空间权重矩阵文件的值可能非常繁琐。 更高效的方法是使用生成空间权重矩阵工具创建空间权重矩阵文件。

空间权重矩阵文件 (.swm)

生成空间权重矩阵工具将创建空间权重矩阵文件 (.swm),该文件根据指定的参数定义数据集中所有要素之间的空间关系。 此文件为二进制文件格式,因此无法直接查看此文件中的值。 要查看或编辑 .swm 文件中的要素关系,可使用将空间权重矩阵转换为表工具。

也可使用生成空间权重矩阵工具将该表转换为 .swm 文件。 表中需要以下字段:

字段名描述

<唯一 ID 字段名>

整型字段,每个要素具有唯一值。 字段名称和类型必须与要素的关联唯一 ID 字段匹配。 例如,如果 ID 为 6 的要素有四个相邻要素,该字段将重复四次数值 6(每个相邻要素对应一次)。

NID

包含相邻要素 ID 的整型字段。

WEIGHT

表示两要素间影响力或交互程度的权重值(0 到 1 之间的数值)。

必需的表字段

编辑含自定义权重的 .swm 文件最简单的方法是:先创建初始 .swm 文件,再将其转换为表。 该表将包含正确字段名称和属性,因此可通过创建和编辑行来分配自定义相邻要素关系和权重。 表必须按唯一 ID 和相邻要素 ID 排序。

共享空间权重矩阵文件

生成空间权重矩阵工具的输出为 .swm 文件。 .swm 文件在创建时与输入要素类、唯一 ID 字段和输出坐标系设置绑定到一起。 其他用户通过使用您的 .swm 文件可以原样复制您为分析而定义的空间关系,只要输入要素类相同或者要素类中所有要素或要素子集与匹配的 Unique ID 字段关联即可。 特别是当您计划与他人共享 .swm 文件时,请避免使用与原始要素的空间参考不同的输出坐标系。 建议先对输入要素进行投影,再为新空间参考创建空间权重矩阵文件。

网络空间权重

在某些分析中,基于网络路径的行驶距离比直线距离更能准确定义空间关系。 例如对应急响应时间进行建模时,基于道路网络的最短路径行驶时间定义相邻要素比欧氏距离更合适。 对于此类数据集,可使用生成网络空间权重工具通过网络数据集来定义空间关系,从而在基础网络结构方面定义空间关系。

相关主题