描述
用于刷新现有大数据连接 (BDC),并注册已添加到源位置的所有新数据集。
使用方法
此工具需要 BDC。要创建 BDC,请使用创建大数据连接工具。
使用此工具可将一个或多个新数据集添加到现有大数据连接中。此外,此工具还将重新注册已使用从大数据连接移除数据集工具移除的所有数据集。在以下示例中,可以使用此工具:
- 您已将数据文件夹复制到现有 BDC 源文件夹中,并需要将其表示为 BDC 中的数据集。
- 您已使用从大数据连接移除数据集工具,并且需要将已移除的数据集添加回 BDC。
该工具不会刷新已使用更新大数据连接数据集属性工具编辑的现有数据集属性。所有已修改的属性都将保留。以下情景包含建议工作流:
- 您已修改现有源数据集的方案 - 可以使用更新大数据连接数据集属性工具修改字段。如果您要保留的 BDC 数据集中不能存在更改,您也可以使用从大数据连接移除数据集工具移除数据集,或使用刷新大数据连接。
- 您已将新文件添加到现有数据集中 - 无需其他步骤。当运行地理处理工具分析 BDC 数据时,分析中将包含 BDC 数据集中的所有文件。
- 您已删除现有数据集 - 可以使用从大数据连接移除数据集工具以从 BDC 中移除数据集
工具消息将包含以下发现的数据集及其状态的相关信息:
- 跳过 - 刷新期间将跳过所有现有数据集,并将其保持原样。
- 成功 - 已发现新数据集并已将其添加到 BDC。
- 失败 - 未成功添加到 BDC 的数据集。
在 BDC 中发现数据集时,您可能会遇到以下两个问题之一:
- 预期的数据集丢失。在这种情况下,请确认您针对包含子文件夹的源文件夹所指定的路径是否正确,以及是否为受支持的数据类型。
- 一个或多个数据集注册失败。如果数据集注册失败,您可能会注意到以下一些问题:
问题 解决方案 示例 数据集未采用预期格式。
打开文件,以查看其是否按预期显示。如果数据结构不正确,请更新并重试。
.csv 文件只有很少的几行以及一个数据摘要,之后将仅为空行。
文件夹中的数据集方案不匹配。
数据集文件夹中的所有文件必须具有相同方案。打开文件,对方案进行比较。解决所有不匹配的方案,然后重新尝试注册数据集。
您有一个包含 10 个字段的 .csv 文件,而另一个文件包含 8 个字段。
文件夹中数据集的文件类型不匹配。
数据集文件夹中的所有文件都必须具有相同的扩展名(文件类型)。检查数据源位置的文件类型,然后移除或重新放置任何放错位置的文件。
Shapefile 数据集与 parquet 文件位于同一文件夹中。
存在无法识别的字段格式。
这不太可能发生,但是如果 ORC 和 parquet 使用异常格式,则可能会发生此类情况。确保使用有效的字段格式。
存在包含未知字段格式的 parquet 文件。
刷新 BDC 后,请使用描述数据集工具来验证更新数据集的显示是否符合预期。
刷新大数据连接工具用于标识新数据集。另可使用以下工具修改 BDC:
- 从大数据连接复制数据集 - 将数据集从 BDC 复制到要素类。
- 从大数据连接预览数据集 - 创建现有 BDC 数据集的视图。
- 从大数据连接移除数据集 - 从 BDC 移除数据集。
- 更新大数据连接数据集属性 - 修改单个 BDC 数据集的属性。
- 从大数据连接预览数据集 - 预览数据集中的前十个要素以验证其是否已正确注册。
- 描述数据集 - 验证数据集的显示是否符合预期。
此地理处理工具由 Spark 作为支持。有关大数据连接及其使用方法的详细信息,请参阅大数据连接。
语法
RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
参数 | 说明 | 数据类型 |
bdc_file | 要刷新的 BDC 文件。 | File |
visible_geometry (可选) | 指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于标识几何的字段作为分析字段包括在内(可见)。当几何字段不可见时,几何仍将应用于数据集。可以在 BDC 中修改几何可见性设置。
| Boolean |
visible_time (可选) | 指定当在其他地理处理工具中使用 BDC 文件时,是否会将用于指示时间的字段作为分析字段包括在内(可见)。当时间字段不可见时,时间仍应用于数据集。可以在 BDC 中修改时间可见性设置。
| Boolean |
派生输出
名称 | 说明 | 数据类型 |
updated_bdc | 包含更新数据集的输入 .bdc 文件。 | 文件 |
代码示例
以下 Python 脚本演示了如何使用 RefreshBDC 函数。
# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that
# have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)
环境
许可信息
- Basic: 否
- Standard: 否
- Advanced: 是