经典叠加工具(缓冲区、裁剪、融合、擦除、整合和相交)和成对叠加工具(成对缓冲、成对裁剪、成对融合、成对擦除、成对整合和成对相交)专门用于在单个桌面上处理非常大且复杂的数据集期间尽可能提高分析的性能和准确性。 功能相似的工具之间的各种功能和性能差异决定了应在工作流中使用的工具。 还有一些其他注意事项会影响所有地理处理工具,这些注意事项会影响输出准确性和分析性能,具体取决于所用工具。
工具比较
成对叠加工具集提供了许多传统叠加工具的替代工具。
成对缓冲和缓冲区
下面对成对缓冲和缓冲区工具进行了比较:
- 这两种工具都使用并行处理。 对于成对缓冲工具,默认启用并行处理。 对于缓冲区工具,可以在“并行处理因子”环境中进行启用。
- 默认情况下,成对缓冲工具的输出要素的平滑度低于通过缓冲区工具创建的输出要素。
- 成对缓冲工具可控制缓冲区输出要素的平滑度。 有关最大偏移偏差参数的信息,请参阅工具文档。
- 缓冲区工具提供了一些输出缓冲区选项,例如侧类型和末端类型。
成对裁剪和裁剪
这两种工具都使用并行处理。 对于成对裁剪工具,默认启用并行处理。 对于裁剪工具,可以在“并行处理因子”环境中进行启用。
成对融合和融合
下面将比较成对融合和融合工具:
- 这两个工具的输出相似,并且可以互换使用。
- 成对融合工具默认使用并行处理。 融合工具没有并行功能。
成对擦除和擦除
下面将比较成对擦除和擦除工具:
- 这两个工具的输出相似,并且可以互换使用。
- 这两种工具都使用并行处理。 对于成对擦除工具,默认启用并行处理。 对于擦除工具,将在“并行处理因子”环境中启用并行处理。
成对整合和整合
下面将比较成对整合和整合工具:
- 成对整合工具默认使用并行处理。
- 成对整合工具的内部容差稍稍大于整合工具,因为用于执行集成的基础引擎存在差异。
成对相交和相交
下面将比较成对相交和相交工具:
- 这两个工具的输出基本上互不相同。 在未评估工作流以及必须如何更改才能考虑不同输出的情况下,这两个工具不能互换使用。 有关详细信息,请参阅成对相交的工作原理。
- 这两种工具都使用并行处理。 对于成对相交工具,默认启用并行处理。 对于相交工具,可以在“并行处理因子”环境中进行启用。
所有分析工具的功能和性能注意事项
在决定要在工作流中使用的补充工具时,通常这两种工具都可以接受。 但是,以下信息介绍了工具之间的差异,有助于选择要使用的工具。
功能注意事项
决定要使用的工具时,主要注意事项是其输出是否满足工程的需求。 一些可比较的工具可创建等效输出,而另一些工具则不能。 上一节介绍了工具输出中的关键差异。 有关比较要使用的工具的完整详细信息,请参阅每个工具的文档。
对于所有工具,应避免在分析过程中进行动态投影。 当工具输入不具有相同的空间参考时,使用动态投影。 当设置用于修改输出坐标系(输出坐标系,XY 容差、XY 分辨率等)的地理处理环境时,也会使用动态投影。 动态投影可能会导致图层之间的未对齐数据不准确。 有关详细信息,请参阅坐标系和投影。
XY 分辨率和 XY 容差会对所有工具生成的输出产生功能性影响。 有关详细信息,请参阅要素类基础知识。 数十年来,已经进行了大量的工作来确定适当的 XY 分辨率和 XY 容差,用于在为其指定的空间参考中处理数据时生成最准确的结果。 建议对输入数据空间参考使用默认 XY 分辨率和 XY 容差,并且不要在数据生成过程中或在分析过程中使用地理处理环境对其进行修改。 为避免分析结果不准确,还建议不要使用 XY 容差工具参数。
- 每个工具都可以实施 XY 容差,但会有细微差别。
- 经典叠加工具和成对叠加工具的内部实现差别很大。 虽然这些工具由于在地理数据库中存储几何的方式而具有一些相似之处,但其处理数据的方式却根本不同,因此输出几何中应该会存在细微的差异。
- 经典叠加工具可以进行迭代,具体取决于数据的复杂性。 这意味着在分析过程中可以多次应用容差。 将 XY 容差从其默认值修改为更大或更小的值时,造成的影响会加倍。 使用的 XY 容差值与默认值相差越大,出现问题的可能性就越大。
- 在聚类过程中,当两个点之间的距离小于或等于以下值时,经典叠加工具会将两个点捕捉在一起:
2 * sqrt(2) * 容差
- 在裂化过程中,如果从点到线段内部的最近距离小于或等于以下值,则经典叠加工具将假设该点位于线段上:
在这种情况下,将对线段进行分割,并将新端点捕捉到该点。sqrt(2) * 容差
- 在聚类过程中,当两个点之间的距离小于或等于以下值时,经典叠加工具会将两个点捕捉在一起:
- 成对工具将假设以下理念:即如果随后通过经典叠加工具运行输出,则必须认为输出在拓扑上是干净的。 也就是说,在处理拓扑操作的几何时,输出不应包含任何应进行聚类的新线段交叉点或点。 为了始终做到这一点,已经调整了用于确定裂化和聚类过程中要使用的距离的计算。 此过程可能会导致工具输出之间的几何差异非常小。
有关聚类的详细信息,请参阅要素类基础知识。
- 在聚类过程中,当两个点之间的距离小于或等于以下值时,成对工具会将两个点捕捉到一起:
1.01 * sqrt(2) * (2 * 容差 + 2 * 分辨率)
- 在裂化过程中,如果从点到线段内部的最近距离小于或等于以下值,则成对工具将假定该点位于线段上:
1.01 * sqrt(2) * (容差 + 2 * 分辨率)
注:
将使用系数 1.01 来增大原始值以确保稳定性。
- 在聚类过程中,当两个点之间的距离小于或等于以下值时,成对工具会将两个点捕捉到一起:
- 错误地修改 XY 容差可能会导致故障、分析不准确、要素移动、拓扑错误,甚至崩溃。
- 错误地修改 XY 分辨率可能导致输出几何不再准确地表示输入几何,并且分析结果不正确。 将 XY 分辨率修改为小于默认值会导致要素尺寸增加。 这可能导致数据的处理方式发生变化。 对于经典叠加工具,尺寸增加可能会导致在可用资源内需要增加数据切片才能完成分析,从而导致引入特征中、跨切片边界的折点数量增加。 有关详细信息,请参阅大型数据集的切片处理。
输入要素几何必须有效。 用于处理几何的所有工具都会受到错误几何的影响,从而导致故障、分析不准确、过程冻结、崩溃,或者在最坏的情况下,没有发现问题迹象。 由用户负责确保所有输入数据都包含有效的几何。
- 与成对工具相比,经典叠加工具对无效几何可能更加敏感。
性能注意事项
所有地理处理工具的性能都取决于输入数据的大小和复杂性。 有一些趋势可能会帮助您选择更有效地处理情景的工具。
大量叠加区域
线和面的大量叠加区域可能会降低经典核心叠加工具的性能。
如果是密集打包的的缓冲区输出面,缓冲区面可能会叠加到一个点,在该点上选择数据中的单个区域会返回数十个甚至数十万个缓冲区要素。 对于核心叠加工具,例如相交或擦除,确定基于所有此类叠加创建的每个唯一面的成本高昂。 在此情况下,建议选择成对叠加工具。
如果是密集打包的相交线,则每个交点和叠加点都由经典叠加工具(相交、擦除和裁剪,在某种程度上)预先确定。 在严重的情况下,成本可能非常高。 在此情况下,建议选择成对叠加工具。
如果您的分析依赖于查找叠加的所有实例(例如使用相交或联合工具时),则必须使用经典叠加工具。 但是,如果几万或数十万个输入要素输出数亿个输出要素来表示每个唯一叠加事件,则可能需要重新考虑所用方法,以使叠加操作的结果合理。 重新评估分析目标可能会发现不同的规模和范围可以帮助您更好地理解分析结果。 当输入要素的叠加非常极端时,将数据分解为更合理的感兴趣区域可能提高经典叠加工具的性能。
超大型要素的注意事项
经典叠加工具和成对叠加工具都无法容纳超出处理数据的计算机资源的要素。
- 这些要素太大,执行分析的计算机无法容纳。 这些要素是在可用资源多于执行分析的计算机的计算机上执行栅格转面或融合操作时生成的。
- 这些要素可能无法绘制或只能部分绘制。
- 在地理处理工具使用这些要素可能会导致明显的处理冻结、内存不足错误、输出错误,在严重的情况下甚至出现崩溃。
- 一个要素在一台计算机上可能过大,但是在另一台上可能不会。 要素是否被视为过大取决于执行分析的计算机上的可用 RAM 数量。 计算机的 RAM 越多,在导致问题之前要素可能越大。
- 地理数据库中单个要素的最大大小为 2 GB。
- 如果存在过大而无法处理的要素,则必须使用切分工具对其进行分解,分析才能成功。 用于操作现有要素的其他传统工具极有可能无法编辑具有数百万个折点的要素。
过大的要素可能会在处理过程中引起问题,但是您可以使用它们执行简单的任务。 此类要素包含大量的折点,而其大小还不足以自行引起问题。 但是,足以降低性能并导致经典叠加工具和成对叠加工具发生故障。
- 这些要素已绘制,可用于简单的分析,不会导致问题,但是即使在执行这些简单操作过程中,也可能会出现明显的性能下降以及内存占用量增加。
- 在某些情况下,如果这些要跨越很大一部分的感兴趣区域,则通常必须在内存中复制该要素才能进行处理(尤其是对于并行处理)。 这最终可能导致计算机上的可用资源数量减少。 也可能会导致性能严重下降和故障。
- 此类要素会导致经典叠加工具和成对叠加工具的性能下降。 成对叠加工具的数据分析方法更加简单,并且通常所需的内存占用量较小,因此其可以更加成功地容纳此类要素。
- 如果数据具有非常大的要素,则可能需要重新评估分析目标。 例如,考虑是否需要毫米级分析精度来执行大洲海岸线分析或者定义鸟类迁徙边界。
- 当数据包含较大要素时,可以通过两种方法来改进分析。 如果不需要在数据中表示准确性级别,则可以简化数据(使用简化面或类似工具)。 为了保持要素的准确性,可以将要素分解为较小的部分。 如果要素具有很多部分,则可以使用多部分至单部分工具降低要素大小,足以成功进行分析。 如果没有,可以使用切分工具在分析之前分解要素。 可以稍后在工作流中使用融合或成对融合重新组装已分解要素,在分解之前会为每个要素分配一个唯一 ID。
空间参考注意事项和动态投影
如果要使用的地理处理工具的两个输入具有不同的空间参考,则大多数工具会将输出坐标系设置为第一个输入,而来自第二个输入、具有不同空间参考的数据将投影到该坐标系以进行分析。 动态更改动态投影可能导致性能下降(并导致图层之间的未对齐数据不准确)。 为了获得可靠的性能和输出准确性,应可能使所有输入具有相同的空间参考。