使用大数据连接

可以在分析中配置、可视化和使用大数据连接 (BDC)。

使用 BDC

结构化数据后,您可以执行以下操作:

  1. 配置 BDC
  2. 可视化 BDC 数据集
  3. 在分析中使用 BDC 数据集

配置 BDC

要开始使用,您需要先创建一个 BDC。 可通过两种方式创建 BDC:

  • 使用新建大数据连接对话框。 要访问对话框,请在插入功能区上,单击连接,然后选择新建大数据连接。 对话框提供了创建 BDC 并在每个数据集上配置属性的交互式体验。
  • 使用创建大数据连接地理处理工具。

在 BDC 中发现数据集时,您可能会遇到以下两个问题之一:

  • 预期的数据集丢失。 在这种情况下,请确认您指定作为包含子文件夹的源文件夹的路径是否正确,以及是否为受支持的数据类型。
  • 一个或多个数据集注册失败。 如果数据集注册失败,您可能会注意到以下一些问题:

    问题解决方案示例

    数据集未采用预期格式。

    打开文件,以查看其是否按预期显示。 如果数据结构不正确,请更新并重试。

    .csv 文件只有很少的几行以及一个数据摘要,之后将仅为空行。

    文件夹中的数据集方案不匹配。

    数据集文件夹中的所有文件必须具有相同方案。 打开文件,对方案进行比较。 解决所有不匹配的方案,然后重新尝试注册数据集。

    您有一个包含 10 个字段的 .csv 文件,而另一个文件包含 8 个字段。

    文件夹中数据集的文件类型不匹配。

    数据集文件夹中的所有文件都必须具有相同的扩展名(文件类型)。 检查数据源位置的文件类型,然后移除或重新放置任何放错位置的文件。

    Shapefile 数据集与 parquet 文件位于同一文件夹中。

    存在无法识别的字段格式。

    这不太可能发生,但是如果 ORC 和 parquet 使用异常格式,则可能会发生此类情况。 确保使用有效的字段格式。

    存在包含未知字段格式的 parquet 文件。

如果使用分隔文件创建 BDC,但看不到标题行,则标题行可能无效。 确保所有字段都具有标题,并且所有字段都不为空。 如果使用对话框创建大数据文件共享,则可以在字段窗格中更新字段标题。 还可使用更新大数据连接数据集属性工具更新字段名称。

创建 BDC 时,将会发现每个数据集的方案、几何和时间。 通常,您可以更改使用数据集表示这些值的方式。 要验证每个数据集是否正确表示几何、时间和字段,请使用描述数据集地理处理工具。 例如,在查看数据集时,您可能想要对 BDC 中的一个或多个数据集进行以下一项或多项更改:

  • 更改分隔数据集的字段名称。
  • 修改将显示哪些字段进行分析。
  • 更改用于表示几何或时间的字段。
  • 将过滤器添加到数据集。
  • 将别名添加到数据集。
  • 从 BDC 中移除没有兴趣进行分析的数据集。
  • 刷新 BDC 以包括新添加的数据集(源文件夹下的新子文件夹)。

要进行这些可选更改,您可以使用新建大数据连接对话框或下列工具的任意组合:

可视化 BDC 数据集

可以在地图上可视化基于分隔和基于 shapefile 的 BDC 数据集。

注:
您无法可视化使用 Parquet 和 ORC 源文件的 BDC 数据集。

要将数据集添加到地图,请在目录窗格中定位 BDC 项,单击以展开数据集,然后将数据集添加到地图。

BDC 数据集在您的地图中具有简化的体验,并且具有以下限制:

  • 可视化 BDC 数据集时,不会在新图层中自动设置 BDC 数据集属性中的时间属性。 要随时间可视化数据集,请在将数据集添加到地图后设置图层的时间属性
  • 绘制分隔文件时,将缩放到 BDC 数据集的空间参考的全图范围。
  • 如果将新记录添加到现有 BDC 数据集,例如,将新行添加到现有 BDC 中的 CSV 文件,则不会绘制新记录,除非重新启动 ArcGIS Pro
  • 如果将新文件添加到现有 BDC 数据集,例如,将新 CSV 文件添加到现有 BDC 数据集,则不会绘制新记录,除非重新启动 ArcGIS Pro

在分析中使用 BDC 数据集

当 BDC 数据集用作 GeoAnalytics Desktop 工具的输入时,分析将进行优化以读取数据并在多台计算机内核中并行运行。 对于所有其他地理处理工具,BDC 数据集读取和处理未优化以并行运行,而是串行和单线程运行。

可以使用在大多数地理处理工具中基于分隔文件或 shapefile 的 BDC 数据集。

注:
使用 parquet 和 ORC 源文件的 BDC 数据集只能在 GeoAnalytics Desktop 工具中使用。

如果将 BDC 数据集用作 GeoAnalytics Desktop 工具的输入,则无法将选择内容应用于 BDC 数据集。

要在地理处理工具中使用 BDC 数据集,请将 BDC 数据集添加到地图,然后从参数选择列表中选择图层名称,或使用浏览按钮浏览至 BDC 工作空间,然后选择输入数据集。 以下工具不支持输入 BDC 文件:


在本主题中
  1. 使用 BDC