刷新大数据连接 (GeoAnalytics Desktop)

摘要

用于刷新现有大数据连接 (BDC),并注册已添加到源位置的所有新数据集。

使用情况

  • 此工具需要 BDC。要创建 BDC,请使用创建大数据连接工具。

  • 使用此工具可将一个或多个新数据集添加到现有大数据连接中。 此外,此工具还将重新注册已使用从大数据连接移除数据集工具移除的所有数据集。 在以下示例中,可以使用此工具:

    • 您已将数据文件夹复制到现有 BDC 源文件夹中,并需要将其表示为 BDC 中的数据集。
    • 您已使用从大数据连接移除数据集工具,并且需要将已移除的数据集添加回 BDC。

  • 该工具不会刷新已使用更新大数据连接数据集属性工具编辑的现有数据集属性。 所有已修改的属性都将保留。 以下情景包含建议工作流:

  • 工具消息将包含以下发现的数据集及其状态的相关信息:

    • 跳过 - 刷新期间将跳过所有现有数据集,并将其保持原样。
    • 成功 - 已发现新数据集并已将其添加到 BDC。
    • 失败 - 未成功添加到 BDC 的数据集。

    在 BDC 中发现数据集时,您可能会遇到以下两个问题之一:

    • 预期的数据集丢失。 在这种情况下,请确认您指定作为包含子文件夹的源文件夹的路径是否正确,以及是否为受支持的数据类型。
    • 一个或多个数据集注册失败。 如果数据集注册失败,您可能会注意到以下一些问题:

      问题解决方案示例

      数据集未采用预期格式。

      打开文件,以查看其是否按预期显示。 如果数据结构不正确,请更新并重试。

      .csv 文件只有很少的几行以及一个数据摘要,之后将仅为空行。

      文件夹中的数据集方案不匹配。

      数据集文件夹中的所有文件必须具有相同方案。 打开文件,对方案进行比较。 解决所有不匹配的方案,然后重新尝试注册数据集。

      您有一个包含 10 个字段的 .csv 文件,而另一个文件包含 8 个字段。

      文件夹中数据集的文件类型不匹配。

      数据集文件夹中的所有文件都必须具有相同的扩展名(文件类型)。 检查数据源位置的文件类型,然后移除或重新放置任何放错位置的文件。

      Shapefile 数据集与 parquet 文件位于同一文件夹中。

      存在无法识别的字段格式。

      这不太可能发生,但是如果 ORC 和 parquet 使用异常格式,则可能会发生此类情况。 确保使用有效的字段格式。

      存在包含未知字段格式的 parquet 文件。

    了解有关数据集无法添加到 BDC 文件的详细原因

  • 刷新 BDC 后,请使用描述数据集工具来验证更新数据集的显示是否符合预期。

  • 刷新大数据连接工具用于标识新数据集。 另可使用以下工具修改 BDC:

  • 此地理处理工具由 Spark 作为支持。有关大数据连接及其使用方法的详细信息,请参阅大数据连接

参数

标注说明数据类型
大数据连接文件

要刷新的 BDC 文件。

File
可见几何字段
(可选)

指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于标识几何的字段作为分析字段包括在内(可见)。 当几何字段不可见时,几何仍将应用于数据集。 可以在 BDC 中修改几何可见性设置。

  • 选中 - 几何字段将作为分析字段包括在内。 这是默认设置。
  • 未选中 - 几何字段不会作为分析字段包括在内。

Boolean
可见时间字段
(可选)

指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于指示时间的字段作为分析字段包括在内(可见)。 当时间字段不可见时,时间仍应用于数据集。 可以在 BDC 中修改时间可见性设置。

  • 选中 - 时间字段将作为分析字段包括在内。 这是默认设置。
  • 未选中 - 时间字段不会作为分析字段包括在内。

Boolean

派生输出

标注说明数据类型
更新 BDC

包含更新数据集的输入 .bdc 文件。

File

arcpy.gapro.RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
名称说明数据类型
bdc_file

要刷新的 BDC 文件。

File
visible_geometry
(可选)

指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于标识几何的字段作为分析字段包括在内(可见)。 当几何字段不可见时,几何仍将应用于数据集。 可以在 BDC 中修改几何可见性设置。

  • GEOMETRY_VISIBLE几何字段将作为分析字段包括在内。 这是默认设置。
  • GEOMETRY_NOT_VISIBLE几何字段不会作为分析字段包括在内。
Boolean
visible_time
(可选)

指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于指示时间的字段作为分析字段包括在内(可见)。 当时间字段不可见时,时间仍应用于数据集。 可以在 BDC 中修改时间可见性设置。

  • TIME_VISIBLE时间字段将作为分析字段包括在内。 这是默认设置。
  • TIME_NOT_VISIBLE时间字段不会作为分析字段包括在内。
Boolean

派生输出

名称说明数据类型
updated_bdc

包含更新数据集的输入 .bdc 文件。

File

代码示例

RefreshBDC(独立脚本)

以下 Python 脚本演示了如何使用 RefreshBDC 函数。

# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that 
#              have been added.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"

# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)

环境

此工具不使用任何地理处理环境。

许可信息

  • Basic: 否
  • Standard: 否
  • Advanced: 是

相关主题