GeoAnalytics Server 工具箱包含一组功能强大的工具,可用于对大数据执行空间分析。GeoAnalytics 工具 受 ArcGIS GeoAnalytics Server 支持。ArcGIS GeoAnalytics Server 可在多个服务器节点间分配分析。通过使用分布式处理,可在更短的时间内处理大型数据集。
GeoAnalytics Server 工具专为大型数据集而设计;因此,其他桌面或 Enterprise 工具可能更适合与较小的数据集一起使用。GeoAnalytics Server 工具需要初始启动时间来实现分布式处理,因此它们适用于较大的数据集(数十万或数百万条记录)。
与 ArcGIS Pro 中的其他工具类似,GeoAnalytics Server 工具的性能取决于以下因素:
- 输入数据的大小 - 例如,要素数和字段数。
- 输入数据源 - 例如,当存储在同一台计算机上时,要素服务的速度要比大数据文件共享慢。
- 正在运行的工具 - 例如,在相同数据和图格大小的情况下,聚合点将比计算密度更快完成执行。
- 您在工具中使用的参数 - 例如,使用连接要素工具时,连接距离较小时将比远距离连接性能更好。
- 您的 GeoAnalytics Server 计算机硬件。
每个 GeoAnalytics Server 工具主题均包含有关通过修改参数来提高工具性能的用法说明。
数据
运行分析时,与您的 GeoAnalytics Server 位于同一位置的数据将具有最佳性能。
输入
GeoAnalytics Server 工具支持使用以下数据源进行输入:
- 要素图层和要素服务(包括托管的)
- 大数据文件共享
- 包括 shapefile 和文件地理数据库在内的 ArcGIS Pro 本地数据。
对于大多数数据集,建议不要使用诸如 shapefile 和文件地理数据库等本地数据。除使用本地数据外,还可以将图层共享为托管要素图层或创建一个大数据文件共享。此外,使用来自其他 Enterprise 部署而非您的 GeoAnalytics Server 部署的数据时,行为与使用本地数据相似,速度可能会较慢。如果必须使用其他部署中的大型服务,则建议您通过 Enterprise Map Viewer 或 ArcGIS REST API 运行该工具。
GeoAnalytics Server 工具不支持通过以下数据源进行输入:
- Geopackage
- XY 事件图层
如果使用大数据文件共享输入,则无法在地图上可视化输入,但可以在 GeoAnalytics 工具中对其进行浏览和分析。如果需要对输入应用过滤器,则建议您转至 Enterprise Map Viewer,这会比将图层复制到 ArcGIS Data Store 并使用生成的要素服务作为输入更快速。通常,不建议您花时间移动大型数据集。相反,建议您利用大数据文件共享的灵活性以当前格式使用数据。
输出
如果想要可视化结果或将其保留在您的 Enterprise 内容中,请将结果另存为托管要素图层。这是默认设置。作为托管要素图层进行存储的结果可以存储在关系数据存储或时空数据存储(默认设置)中。存储在时空大数据存储中的结果将存储于 WGS84 中。如果要将结果存储在其他空间参考中,请将其保存至关系数据存储。
如果要将数据保存到大数据文件共享中以进行进一步分析或在组织中用于其他用途,请通过设置模板将其另存为大数据文件共享数据集。大数据文件共享输出无法在地图上可视化。将结果保存到大数据文件共享可在 ArcGIS Enterprise 10.7 或更高版本中实现,而 ArcGIS Pro 内无法完成。采用 Enterprise Map Viewer 或 ArcGIS REST API 将结果保存到大数据文件共享中。
分析
GeoAnalytics Server 工具的实现方式与其他 ArcGIS Pro 工具不同。
GeoAnalytics 的操作中不包括狭长面。在连接要素和叠加图层 GeoAnalytics 工具中,狭长面不会包括在分析中,同时某些非常小的要素也可能会从结果中排除。
GeoAnalytics Server 工具所产生的要素增密程度比其他 ArcGIS Pro 工具所产生的要素增密程度低。例如,下列图像将使用以下选项预测缓冲面上的折点结果:分析工具箱(蓝色)中的缓冲,GeoAnalytics Desktop 工具箱(橙色)中的创建缓冲区。左侧的图像将显示彼此重叠的缓冲面,右侧图像显示某些面折点的放大视图。
GeoAnalytics Server 工具不支持 in_memory 或 memory 工作区。
运行 GeoAnalytics Server 工具时,分析将在 GeoAnalytics Server 计算机的内存中进行。当正在分析的数据无法全部存入内存中时,系统会将其写入到磁盘的指定目录中。如果工具尚未完成且磁盘空间不足,则可以修改要使用的目录。
最佳做法
运行分析时,最好仅分析您感兴趣的数据。您可以通过执行以下操作来限制所分析的数据:
- 将定义查询应用到地图上的图层。这不是大数据文件共享输入选项。
- 将选择应用到地图上的要素。这不是大数据文件共享输入选项。
- 设置分析的处理范围以限制所使用的要素的空间范围。
- 使用时间滑块指定要分析的数据范围。这仅适用于地图上绘制的图层。
使用 GeoAnalytics Server 工具时,定义查询通常比选择处理速度更快。目前,您无法将过滤器应用于 GeoAnalytics Server 中的大数据文件共享图层。使用 Enterprise Map Viewer 或 ArcGIS REST API 将过滤器应用到大数据文件共享图层。
在分析中使用时间
许多 GeoAnalytics Server 工具使用或需要时间。要利用时间步长、临时连接或基于轨迹的分析(例如,使用重新构建轨迹、查找停留位置或检测事件),则图层必须启用时间。您可以在以下数据集上启用时间:
- 要素图层 - 在共享图层或编辑项目时启用时间。
- 大数据文件共享 - 编辑大数据文件共享清单以启用时间。
使用 ArcGIS Pro 中的 GeoAnalytics Server 工具时,它不会使用在时间设置中指定的时区或夏时制选项。相反,将执行以下操作:
- 要素服务 - 门户内容中的图层使用 UTC。无法修改时间设置。
- 本地图层 - 诸如本地要素类或 shapefile 等图层将转换为 UTC 时间。这将通过计算您的 GeoAnalytics Server 计算机所在时区来完成。例如,如果您的 GeoAnalytics Server 使用太平洋时间(-8:00 时),且您有一个要素的时间戳为 1 p.m,则在运行分析时该要素将为 9 p.m。建议您将图层共享到门户,以便更好地控制时区。始终采用夏时制。
- 大数据文件共享 - 这些在 ArcGIS Pro 中不会启用时间。相反,在定义清单时,您可以指定将使用的时区。
添加到地图的图层(例如要素服务和本地数据)仅分析可见时间范围内的要素。