经典叠加工具与成对叠加工具的比较

经典叠加工具(缓冲区裁剪融合擦除整合相交)和成对叠加工具(成对缓冲成对裁剪成对融合成对擦除成对整合成对相交)专门用于在单个桌面上处理非常大且复杂的数据集期间尽可能提高分析的性能和准确性。 功能相似的工具之间的各种功能和性能差异决定了应在工作流中使用的工具。 还有一些其他注意事项会影响所有地理处理工具,这些注意事项会影响输出准确性和分析性能,具体取决于所用工具。

工具比较

成对叠加工具集提供了许多传统叠加工具的替代工具。

成对缓冲和缓冲区

下面对成对缓冲缓冲区工具进行了比较:

  • 这两种工具都使用并行处理。 对于成对缓冲工具,默认启用并行处理。 对于缓冲区工具,可通过“并行处理因子”环境进行启用。
  • 默认情况下,成对缓冲工具的输出要素的平滑度低于通过缓冲区工具创建的输出要素。
  • 成对缓冲工具可控制缓冲区输出要素的平滑度。 有关最大偏移偏差参数的信息,请参阅工具文档。
  • 缓冲区工具提供了一些输出缓冲区选项,例如侧类型和末端类型。

成对裁剪和裁剪

  • 这两种工具都使用并行处理。 对于成对裁剪工具,默认启用并行处理。 对于裁剪工具,可通过“并行处理因子”环境进行启用。

成对融合和融合

  • 这两个工具的输出相似,并且可以互换使用。
  • 成对融合工具默认使用并行处理。 融合工具没有并行功能。

成对擦除和擦除

  • 这两个工具的输出相似,并且可以互换使用。
  • 这两种工具都使用并行处理。 对于成对擦除工具,默认启用并行处理。 对于擦除工具,可通过“并行处理因子”环境启用并行处理。

成对整合和整合

  • 成对整合工具默认使用并行处理。
  • 成对整合工具的内部容差稍稍大于整合工具,因为用于执行集成的基础引擎存在差异。

成对相交和相交

  • 这两个工具的输出基本上互不相同。 在未评估工作流以及必须如何更改才能考虑不同输出的情况下,这两个工具不能互换使用。 有关详细信息,请参阅成对相交的工作原理
  • 这两种工具都使用并行处理。 对于成对相交工具,默认启用并行处理。 对于相交工具,可通过“并行处理因子”环境进行启用。

所有分析工具的功能和性能注意事项

在决定要在工作流中使用的补充工具时,通常这两种工具都可以接受。 但是,以下信息介绍了工具之间的差异,有助于选择要使用的工具。

功能注意事项

决定要使用的工具时,主要注意事项是其输出是否满足工程的需求。 一些可比较的工具可创建等效输出,而另一些工具则不能。 上一节介绍了工具输出中的关键差异。 有关比较要使用的工具的完整详细信息,请参阅每个工具的文档。

对于所有工具,应避免在分析过程中进行动态投影。 当工具输入不具有相同的空间参考时,使用动态投影。 当设置用于修改输出坐标系(输出坐标系,XY 容差、XY 分辨率等)的地理处理环境时,也会使用动态投影。 动态投影可能会导致图层之间的未对齐数据不准确。 有关详细信息,请参阅坐标系和投影

XY 分辨率和 XY 容差会对所有工具生成的输出产生功能性影响。 有关详细信息,请参阅要素类基础知识。 数十年来,已经进行了大量的工作来确定适当的 XY 分辨率和 XY 容差,用于在为其指定的空间参考中处理数据时生成最准确的结果。 建议对输入数据空间参考使用默认 XY 分辨率和 XY 容差,并且不要在数据生成过程中或在分析过程中使用地理处理环境对其进行修改。 为避免分析结果不准确,还建议不要使用 XY 容差工具参数。

  • 每个工具都可以实施 XY 容差,但会有细微差别。 例如,某些算法是迭代的,这意味着在分析过程中会多次应用容差。 将 XY 容差从其默认值修改为更大或更小的值时,造成的影响会加倍。 使用的 XY 容差值与默认值相差越大,出现问题的可能性就越大。
  • 错误地修改 XY 容差可能会导致故障、分析不准确、要素移动、拓扑错误等。
  • 错误地修改 XY 分辨率可能导致输出中的数据不准确,并且分析结果也会不准确。 将 XY 分辨率修改为小于默认值会导致要素尺寸增加。 这可能导致数据的处理方式发生变化。 对于经典叠加工具,尺寸增加可能会导致在可用资源内需要增加数据切片才能完成分析,从而导致引入特征中、跨切片边界的折点数量增加。 有关详细信息,请参阅大型数据集的切片处理

输入要素几何必须有效。 用于处理几何的所有工具都会受到错误几何的影响,从而导致故障、分析不准确、过程冻结、崩溃,或者在最坏的情况下,没有发现问题迹象。 由用户负责确保所有输入数据都包含有效的几何。 了解有关检查和修复几何的详细信息

  • 经典叠加工具可能会对无效的几何非常敏感。

性能注意事项

所有地理处理工具的性能都取决于输入数据的大小和复杂性。 有一些趋势可能会帮助您选择更有效地处理情景的工具。

大量叠加区域

复杂相交工具输出示例

线和面的大量叠加区域可能会降低经典核心叠加工具的性能。

如果是密集打包的的缓冲区输出面,缓冲区面可能会叠加到一个点,在该点上选择数据中的单个区域会返回数十个甚至数十万个缓冲区要素。 对于核心叠加工具,例如相交擦除,确定基于所有此类叠加创建的每个唯一面的成本高昂。 在此情况下,建议选择成对叠加工具。

如果是密集打包的相交线,则每个交点和叠加点都由经典叠加工具(相交擦除裁剪,在某种程度上)预先确定。 在严重的情况下,成本可能非常高。 在此情况下,建议选择成对叠加工具。

如果您的分析依赖于查找叠加的所有实例(例如使用相交联合工具时),则必须使用经典叠加工具。 但是,如果几万或数十万个输入要素输出数亿个输出要素来表示每个唯一叠加事件,则可能需要重新考虑所用方法,以使叠加操作的结果合理。 对分析目标的重新评估可能显示,可能需要在不同的规模和范围下进行处理,才能更好地理解分析结果。 当输入要素的叠加非常极端时,将数据分解为更合理的感兴趣区域可能提高经典叠加工具的性能。

超大型要素的注意事项

经典叠加工具和成对叠加工具都无法容纳超出处理数据的计算机资源的要素。

  • 这些要素太大,执行分析的计算机无法容纳。 这些要素是在可用资源多于执行分析的计算机的计算机上执行栅格转面融合操作时生成的。
  • 这些要素可能无法绘制或只能部分绘制。
  • 在地理处理工具使用这些要素可能会导致明显的处理冻结、内存不足错误、输出错误,在严重的情况下甚至出现崩溃。
  • 一个要素在一台计算机上可能过大,但是在另一台上可能不会。 要素是否被视为过大取决于执行分析的计算机上的可用 RAM 数量。 计算机的 RAM 越多,在导致问题之前要素可能越大。
  • 地理数据库中单个要素的最大大小为 2 GB。
  • 如果存在过大而无法处理的要素,则必须使用切分工具对其进行分解,分析才能成功。 用于操作现有要素的其他传统工具极有可能无法编辑具有数百万个折点的要素。

过大的要素可能会在处理过程中引起问题,但是您可以使用它们执行简单的任务。 此类要素包含大量的折点,而其大小还不足以自行引起问题。 但是,足以降低性能并导致经典叠加工具和成对叠加工具发生故障。

  • 这些要素已绘制,可用于简单的分析,不会导致问题,但是即使在执行这些简单操作过程中,也可能会出现明显的性能下降以及内存占用量增加。
  • 在某些情况下,如果这些要跨越很大一部分的感兴趣区域,则通常需要在内存中复制该要素才能进行处理(尤其是对于并行处理)。 这最终可能导致计算机上的可用资源数量减少。 也可能会导致性能严重下降和故障。
  • 此类要素会导致经典叠加工具和成对叠加工具的性能下降。 成对叠加工具的数据分析方法更简单,并且执行分析所需的内存占用量较小,因此可以更成功地容纳此类要素。
  • 如果数据中存在此类非常大的要素,则可能需要重新评估分析目标。 考虑是否需要毫米级分析精度来执行大洲海岸线分析或定义鸟类迁徙边界。
  • 当数据包含此类较大要素时,有两种方法可以使分析更加成功。 如果不需要在数据中表示准确性级别,可以考虑简化数据(使用简化面或类似工具)。 为了保持要素的准确性,可以将要素分解为较小的部分。 如果要素具有很多部分,则可以使用多部分至单部分工具降低要素大小,足以成功进行分析。 如果没有,可以使用切分工具在分析之前分解要素。 可以稍后在工作流中使用融合成对融合重新组装已分解要素,在分解之前会为每个要素分配一个唯一 ID。

空间参考注意事项和动态投影

如果要使用的地理处理工具的两个输入具有不同的空间参考,则大多数工具会将输出坐标系设置为第一个输入,而来自第二个输入、具有不同空间参考的数据将投影到该坐标系以进行分析。 动态更改动态投影可能导致性能下降(并导致图层之间的未对齐数据不准确)。 为了获得可靠的性能和输出准确性,应可能使所有输入具有相同的空间参考。