汇总中心和离差 (GeoAnalytics)

摘要

用于查找中心要素和方向分布,并根据输入计算平均和中位数位置。

插图

“汇总中心和离差”工具图示

使用情况

  • 该工具可用于要素的中心性和离差。 以下示例是使用此工具非常有用的情况:

    • 某当地政府计划为某服务匮乏的社区开设新图书馆。 目前已从分区恰当且具有可用地块的区块组中采集了质心。 计算具有人口权重的中心要素可用于确定最适合社区的中心区块组。
    • 某 GIS 分析师希望分析 911 呼叫地点和紧急响应站(匪警、火警和急救)的位置。 平均中心结果可用于对紧急呼叫的平均中心和响应站的平均中心进行比较,以优化响应时间。
    • 某犯罪分析师在对白天事件点与夜间事件点进行对比评估时,希望确定盗窃行为的中位数中心是否发生变化。 使用一天中的时间分组计算中位数中心可用于确定白天与夜间发生犯罪的位置。
    • 某非政府组织的 GIS 分析师在分析某种传染病的传播情况。 椭圆可用于创建疾病爆发模型。

  • 对于输入线和面要素,距离计算中会使用要素的质心。

  • 权重字段参数可根据各位置的相对重要性对它们进行加权。 例如,可根据总销售额对零售连锁店进行加权,或者根据面要素的面积对面要素进行加权。 有关如何在分析中应用权重的详细信息,请参阅使用权重

  • 分组依据字段参数可将要素分组,以便单独计算中心要素或者离差。 例如,全年的野生动物观测值可按照季节或月份进行分组。 该字段可以为整型、日期或字符串类型。 具有空值的记录将被分组在一起。

  • 中心要素是与数据集中所有其他要素的最小累积距离相关联的要素。 将标识此要素并将其包含在中心要素图层输出中。 多个要素可以共享与所有其他要素的最小累积距离。 如果出现此情况,则所有处于最中央位置的要素都将包含在中心要素图层输出中。 如果指定分组依据字段参数,则将首先根据该字段值对输入要素进行分组;然后标识每个组的中心要素。 输出中心要素的几何类型将与输入要素相同。

  • 平均中心是一个根据平均 x 和 y 坐标构造的点。 平均中心要素包含在平均中心图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的平均中心。

  • 中位数中心将使用迭代算法来查找可使数据集中所有要素间的欧氏距离达到最小的点。 中位数中心要素包含在中位数中心图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的中位数中心。 与平均中心运算的结果不同,中位数中心结果受异常值要素的影响较小。

  • 将创建标准差椭圆来汇总地理要素的空间特征:中心趋势、离散和方向趋势。 可将椭圆大小设置为 1、2 或 3 个标准差。 椭圆要素包含在椭圆图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的椭圆。

  • 可以指定要输出的一种或多种汇总类型。 每种汇总类型都将输出到唯一的要素图层。

  • 如果输入图层包含时间值或几何值为空的要素,则将不会在分析中使用这些要素。

  • 除了输入图层中的字段之外,输出中心要素汇总类型结果还将包含以下字段:

    字段名描述

    CoordX

    中心要素的 x 坐标。 如果要素为线或面,则该值将表示要素的质心。

    CoordY

    中心要素的 y 坐标。 如果要素为线或面,则该值将表示要素的质心。

    instant_datetime

    如果输入图层启用了时间且时间类型为时刻,则输出结果将包含表示输出要素时间的时刻日期字段。

    start_datetime

    如果输入图层启用了时间且时间类型为间隔,则输出结果将包含表示输出要素开始时间的开始日期字段。

    end_datetime

    如果输入图层启用了时间且时间类型为间隔,则输出结果将包含表示输出要素结束时间的结束日期字段。

  • 除了分析中使用的可选按字段分组参数值之外,输出平均中心中位数中心汇总类型结果还将包含以下字段:

    字段名描述

    CoordX

    平均或中位数要素的 x 坐标。

    CoordY

    平均或中位数要素的 y 坐标。

    instant_datetime

    如果输入图层启用了时间,则输出结果将包含表示输入要素平均时间或中位数时间的时刻日期字段。 这适用于间隔时间类型和时刻时间类型的输入图层。

  • 除了分析中使用的可选按字段分组参数值之外,输出椭圆汇总类型还将包含以下字段:

    字段名描述

    CenterX

    椭圆平均中心的 x 坐标。

    CenterY

    椭圆平均中心的 y 坐标。

    CenterT

    椭圆平均中心的时间值。

    Rotation

    从顶点开始按顺时针进行测量的长轴的旋转。 旋转以输入的空间参考为单位进行测量。 例如,投影数据集可以以米为单位进行测量,而地理数据集可以以度为单位进行测量度量。

    MajStdDist

    长轴的标准距离。 旋转以输入的空间参考为单位进行测量。 例如,具有投影空间参考的数据集可以以米为单位进行测量,而具有地理空间参考的数据集可以以度为单位进行测量。

    MinStdDist

    短轴的标准距离。 旋转以输入的空间参考为单位进行测量。 例如,具有投影空间参考的数据集可以以米为单位进行测量,而具有地理空间参考的数据集可以以度为单位进行测量。

    TmStdDist

    时态标准距离。 该值是以毫秒为单位进行测量的持续时间。

  • 将使用分析的空间参考来计算坐标值属性,例如 CoordXCoordY。 默认情况下,分析的空间参考将与输入图层相同。 或者,可以使用“输出坐标系”环境变量来指定分析中使用的空间参考。

    如果要将结果写入时空数据存储,则结果要素将由 WGS 1984 (WKID 4326) 坐标系表示。 这意味着结果要素的几何值可能存储在与输出属性值不同的坐标系中。 例如,如果将平均中心图层输出到时空数据存储并指定“输出坐标系”环境值为 NAD 1983 UTM Zone 1N (WKID 26901),则 CoordXCoordY 字段的计算值将采用 NAD 1983 UTM Zone 1N (WKID 26901),但是地图上的要素将位于 WGS 1984 (WKID 4326) 坐标系中。

  • 您可以通过以下一个或多个操作来提升汇总中心和离差工具的性能:

    • 设置范围环境,以便仅分析感兴趣的数据。
    • 本地数据用于分析运行的位置。
    • 可以使用按字段分组参数来分组数据。
    • 对于较大的数据集,由于中位数中心为迭代计算,它可能是性能最低的汇总类型,因此需要在生成类型参数中使用中位数中心

  • 此地理处理工具由 ArcGIS GeoAnalytics Server 作为支持。 分析将在 GeoAnalytics Server 上完成,且结果将存储在 ArcGIS Enterprise 的内容中。

  • GeoAnalytics Server 工具运行时,GeoAnalytics Server 上的分析已完成。 要获得最佳性能,通过 ArcGIS Enterprise 门户上托管的要素图层或通过大数据文件共享,可以将数据用于 GeoAnalytics Server。 在分析开始之前,非 GeoAnalytics Server 本地数据将被转移到您的 GeoAnalytics Server。 这意味着运行工具需要更长时间,并且在某些情况下,从 ArcGIS ProGeoAnalytics Server 移动数据可能会失败。 失败的阈值取决于网络速度,以及数据的大小和复杂性。 建议您始终共享数据或创建大数据文件共享。

    了解有关将数据共享至您的门户的详细信息。

    了解有关通过 Server Manager 创建大数据文件共享的详细信息

参数

标注说明数据类型
输入图层

要进行汇总的点、线或面图层。

Feature Set
输出名称

输出要素服务的名称。

String
生成类型

指定要生成的汇总类型。 您可以使用一个或多个汇总类型。 将为每种所选汇总类型创建一个唯一图层。

  • 中心要素将创建一个图层,其中包含输入图层中最中心要素的副本。
  • 平均中心将创建一个表示输入图层平均中心的点图层。
  • 中位数中心将创建一个表示输入图层中位数中心的点图层。
  • 椭圆将创建一个表示输入图层方向椭圆的面图层。
String
椭圆大小
(可选)

指定标准差中输出椭圆的大小。

  • 一个标准差输出椭圆将覆盖输入要素的一个标准差。 这是默认设置。
  • 两个标准差输出椭圆将覆盖输入要素的两个标准差。
  • 三个标准差输出椭圆将覆盖输入要素的三个标准差。
String
权重字段
(可选)

根据各位置的相对重要性对它们进行加权的数值型字段。 这适用于所有汇总类型。

Field
分组条件字段
(可选)

该字段用于分组类似要素。 这适用于所有汇总类型。 例如,如果选择字段 PlantType,其中包含树木、矮树丛和草地的值,则将对值为树木的所有要素进行分析以获取其自已的中心或离差。 此示例将产生三个要素,针对每组树木、矮树丛和草地各产生一个要素。

Field
数据存储
(可选)

指定将用于保存输出的 ArcGIS Data Store。 默认设置为时空大数据存储。 在时空大数据存储中存储的所有结果都将存储在 WGS84 中。 在关系数据存储中存储的结果都将保持各自的坐标系。

  • 时空大数据存储输出将存储在时空大数据存储中。 这是默认设置。
  • 关系数据存储输出将存储在关系数据存储中。
String

派生输出

标注说明数据类型
中心要素图层

包含输入图层中的中心要素的图层。

Feature Class
平均中心图层

包含输入图层的平均中心表示的点图层。

Feature Class
中位数中心图层

包含输入图层的中位数中心表示的点图层。

Feature Class
椭圆图层

包含输入图层的椭圆表示的面图层。

Feature Class

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, output_name, generate_types, {ellipse_size}, {weight_field}, {group_by_field}, {data_store})
名称说明数据类型
input_layer

要进行汇总的点、线或面图层。

Feature Set
output_name

输出要素服务的名称。

String
generate_types
[generate_types,...]

指定要生成的汇总类型。 您可以使用一个或多个汇总类型。 将为每种所选汇总类型创建一个唯一图层。

  • CENTRAL_FEATURE将创建一个图层,其中包含输入图层中最中心要素的副本。
  • MEAN_CENTER将创建一个表示输入图层平均中心的点图层。
  • MEDIAN_CENTER将创建一个表示输入图层中位数中心的点图层。
  • ELLIPSE将创建一个表示输入图层方向椭圆的面图层。
String
ellipse_size
(可选)

指定标准差中输出椭圆的大小。

  • 1_STANDARD_DEVIATION输出椭圆将覆盖输入要素的一个标准差。 这是默认设置。
  • 2_STANDARD_DEVIATIONS输出椭圆将覆盖输入要素的两个标准差。
  • 3_STANDARD_DEVIATIONS输出椭圆将覆盖输入要素的三个标准差。
String
weight_field
(可选)

根据各位置的相对重要性对它们进行加权的数值型字段。 这适用于所有汇总类型。

Field
group_by_field
(可选)

该字段用于分组类似要素。 这适用于所有汇总类型。 例如,如果选择字段 PlantType,其中包含树木、矮树丛和草地的值,则将对值为树木的所有要素进行分析以获取其自已的中心或离差。 此示例将产生三个要素,针对每组树木、矮树丛和草地各产生一个要素。

Field
data_store
(可选)

指定将用于保存输出的 ArcGIS Data Store。 默认为 SPATIOTEMPORAL_DATA_STORE。 在时空大数据存储中存储的所有结果都将存储在 WGS84 中。 在关系数据存储中存储的结果都将保持各自的坐标系。

  • SPATIOTEMPORAL_DATA_STORE输出将存储在时空大数据存储中。 这是默认设置。
  • RELATIONAL_DATA_STORE输出将存储在关系数据存储中。
String

派生输出

名称说明数据类型
out_central_feature_layer

包含输入图层中的中心要素的图层。

Feature Class
out_mean_center_layer

包含输入图层的平均中心表示的点图层。

Feature Class
out_median_center_layer

包含输入图层的中位数中心表示的点图层。

Feature Class
out_ellipse_layer

包含输入图层的椭圆表示的面图层。

Feature Class

代码示例

SummarizeCenterAndDispersion(独立脚本)

以下独立脚本演示了如何使用 SummarizeCenterAndDispersion 函数。

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate a standard deviational ellipse of contagious disease 
#              data to understand the spread of the disease over time. 
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy

# Set local variables
# This example calculates a standard deviational ellipse for three standard 
# deviations of the data
inFeatures = "https://sampleserver6.com/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_myBDFS/BigDataCatalogServer/diseaseRecords"
outFS = "disease_movement_ellipse"
summaryType = "ELLIPSE"
dataStore = "RELATIONAL_DATA_STORE"

# Execute SummarizeCenterAndDispersion
arcpy.geoanalytics.SummarizeCenterAndDispersion(inFeatures, outFS, summaryType, 
                                                "3_STANDARD_DEVIATIONS", "", 
                                                "", "", "", "" dataStore)

环境

特殊情况

输出坐标系

将用于分析的坐标系。 除非由该参数进行指定,否则将基于输入坐标系完成分析。 对于 GeoAnalytics Tools,最终结果将存储于 WGS84 中的时空数据存储之内。

许可信息

  • Basic: 需要 ArcGIS GeoAnalytics Server
  • Standard: 需要 ArcGIS GeoAnalytics Server
  • Advanced: 需要 ArcGIS GeoAnalytics Server

相关主题