GeoAnalytics Desktop 工具提供了一个并行处理框架,以使用 Apache Spark 在桌面计算机上进行分析。通过聚合、回归、检测和聚类,您可以可视化、理解大数据并与其进行交互。这些工具可与大数据集配合使用,使您可以通过模式、趋势和异常来深入了解数据。这些工具在 ArcGIS Pro 中集成和运行的方式与其他桌面地理处理工具相同。
在以下情况下,GeoAnalytics Server 工具是比 GeoAnalytics Desktop 工具更好的选择:
- 数据存储在托管要素图层中。
- 分析输出将位于 ArcGIS Enterprise。
- 将使用多台机器分发分析。
- Linux、Web 应用程序或服务器计算机将用于完成分析。
- 将使用文件集合(例如分隔文件或 shapefile)或 大数据文件共享源(例如云存储、HDFS 或 Hive)。
GeoAnalytics Desktop 工具专为大型数据集而设计;因此,其他桌面工具可能更适合与较小的数据集一起使用。GeoAnalytics Desktop 工具需要初始启动时间来实现分布式处理,因此它们适用于较大的数据集(数十万或数百万条记录)。
使用 GeoAnalytics Desktop 工具时需要考虑一些事项。Spark 在运行这些工具时分配机器的内存和 CPU 内核。默认情况下,将分配机器内存的 95% 和所有 CPU 内核。只有在这些资源可用且其他服务未使用时,才会开始分析。工具完成后,这些资源将保留 30 秒。如果您在这 30 秒内在同一 ArcGIS Pro 工程中运行另一个 GeoAnalytics Desktop 工具,该工具将使用相同的保留资源。如果您打开一个新的 ArcGIS Pro 工程并尝试同时运行另一个作业,该作业也将使用相同的资源。您可以通过修改并行处理因子地理处理环境来更改分配给作业的资源量。可以指定为数字(核数)或百分比(总核数的百分比)。
工具集 | 说明 |
---|---|
此分析模式工具集包含可确定、量化并显示要素数据空间模式的工具。 | |
此工具集用于确定符合多种不同指定标准的区域。标准可基于属性查询(如闲置宗地)和空间查询(如距离河流 1 千米以内)。查找的区域可从现有要素(例如现有地块)中选择,也可创建满足所有要求的新区域。 | |
管理数据工具集包含用于地理数据日常管理的工具。 | |
汇总数据工具集包含用于计算区域内或其他要素附近的要素及其属性的总数、长度、面积以及基本描述性统计数据。 | |
邻近分析工具集包含用于回答空间分析问题“什么在什么附近?”的工具。 | |
“实用工具”工具集包含支持创建和修改大数据连接的工具。 |