大数据连接数据集具有一个字段属性,用于定义数据集字段的字段名称、字段类型和可见性。
下面是应更新字段信息的一些示例:
- 源数据是没有标头的分隔文件集合。 默认情况下,字段以 col1、col2、col3、... coln 的形式列出。 更新字段名称和类型以与预期一致。
- 您的 CSV 数据集已注册到所有字符串字段中,并且您想要将一个或多个字段设置为数值字段以用于分析。
- 您的数据集包含许多分析不需要的字段。 可使用可见性属性将字段设置为隐藏,以将其从分析和结果中排除。
- 您想要简化字段名称以提高其可读性和直观性。
字段属性详细信息
下面是字段属性的三个组成部分:
- 名称 - 表示字段名称的必要属性。 数据集中的字段名称必须唯一,且仅可包含字母数字字符和下划线。
- 可行性 - 可选属性,用于表示该字段在地理处理工具中是否可见。 默认情况下,最初设置为时间和几何字段的字段的可见性设置为 false。 默认情况下,所有其他字段均设置为 true。
- 字段类型 - 表示字段类型的必要属性。
更改大数据连接数据集的字段属性时,不会修改源数据集。
可更新分隔文件的字段类型。 无法更新其他数据源的字段类型(例如 shapefile、ORC 或 parquet 文件)。
下表概述了源数据中的几何类型、如何在 ArcGIS Pro 中针对地理处理进行表示以及有关不同源数据类型的可用字段类型的注释。
源字段类型 | 地理处理字段类型 | 注释 |
---|---|---|
Int8 | 短整型 | |
Int16 | 短整型 | |
Int32 | 长整型 | |
Int64 | 双精度 | |
Float32 | 浮点型 | |
Float64 | 双精度 | |
字符串 | 文本 | |
二元 | Blob | Blob 字段仅适用于 parquet 和 ORC 数据集。 这些字段可用于熟知二进制 (WKB) 的几何格式化。 |
日期型 | 日期型 | 日期字段仅适用于源自 parquet、ORC 和 shapefile 的数据集。 要在 BDC 数据集上设置日期和时间,可使用时间属性。 |
布尔 | 文本 | 布尔字段仅适用于 parquet 和 ORC 数据集。 该字段将表示为文本字段,其中包含值 T (True) 和值 F (False)。 |