您可以通过两种方式在 ArcGIS Pro 中使用 Apache Parquet 文件。 每个文件具有不同的目的并且具有不同的要求,如下所示:
- 基于具有相同方案的多个 Parquet 文件创建多文件要素连接 - 使用此选项可同时分析或可视化多个文件。 有关此方法的信息和要求,请参阅多文件要素连接及其相关的帮助页面。
- 访问本地驱动器或受支持的云存储位置上存储的单个 Parquet 文件并将其添加至地图或场景 - 此方法经过优化,用于在 Parquet 文件包含 GeoParquet 格式空间字段时可视化和查询地图或场景中的要素。 所有 ArcGIS Pro 许可级别下都提供此功能。 有关此方法的要求和相关信息,请参阅以下信息。
单一 Parquet 文件的内容使用要求
要可视化存储在本地驱动器或受支持的云存储位置中的 Parquet 文件中的空间数据,该文件必须满足下文所述的要求。
文件要求
必须满足以下与文件名和格式相关的要求,才能将其用于 ArcGIS Pro:
- 文件扩展名必须为 .parquet。
- 仅支持未加密的 Parquet 文件。
- ArcGIS Pro 支持未压缩的 Parquet 文件或使用 Snappy、GZIP 或 Zstandard (Zstd) 压缩格式压缩的 Parquet 文件。 不支持其他压缩格式,包括自定义压缩格式。
- 文件名必须包含字母数字字符。 也允许使用短划线 (-) 和下划线 (_)。 缓存图层名称中的以下特殊字符将替换为下划线:
- 括号 (())
- 方括号 ([])
- 大括号 ({})
- 与号 (&)
- @ 符号 (@)
- 脱字符 (^)
- 点 (.)
- 惊叹号 (!)
- 井号 (#)
- 百分号 (%)
- 加号 (+)
- 单引号 (')
- 波形符 (~)
- 美元符号 ($)
不支持其他特殊字符。
列要求
Parquet 文件中的列必须满足以下要求才能用于 ArcGIS Pro:
- 列名称包含的字母数字字符数必须小于等于 128。 也允许使用下划线 (_)。 在缓存图层的字段名称中,空格、制表符、换行符和以下特殊字符将替换为下划线:
- 括号 (())
- 方括号 ([])
- 尖括号 (< >)
- 大括号 ({})
- 与号 (&)
- 星号 (^)
- @ 符号 (@)
- 脱字符 (^)
- 冒号 (:)
- 点 (.)
- 等号 (=)
- 惊叹号 (!)
- 井号 (#)
- 连字符 (-)
- 百分号 (%)
- 竖线 (|)
- 加号 (+)
- 分号 (;)
- 单引号 (')
- 斜线(\ 或 /)
- 波形符 (~)
- 美元符号 ($)
不支持其他特殊字符。
- 列不能嵌套。
- 文件必须包含单一空间(GeoParquet 格式)列。 X、Y 和 Z 字段、纬度、经度和高程字段此时无法识别为形状字段;这些字段会被读取为字符串或数值字段。
- 必须在 GeoParquet 标准版 1.0.0 或 1.1.0 版本中定义空间字段。
- ArcGIS Pro 不支持几何集合空间类型。
ArcGIS Pro 中支持的用法
以下是如何在此 ArcGIS Pro 版本中使用单个 Parquet 文件的摘要。 有关详细信息,请参阅关于在 ArcGIS Pro 中使用 Parquet 文件的常见问题解答。
- Parquet 文件中的数据用于在 ArcGIS Pro 中进行可视化和查询。 将数据添加到地图或场景以进行查看。
- 当您使用第三方软件替换或更改 Parquet 文件内容时,ArcGIS Pro 可识别文件已被修改,并重新构建数据的本地持久缓存(如果存在)以合并更改的数据。 有关详细信息,请参阅缓存 Parquet 数据。
- 您可以使用 Parquet 文件中的数据作为地理处理工具的输入。 您可以将 Parquet 文件中的数据添加到 ArcGIS Pro 中的地图,并在地理处理工具或 ArcPy 脚本中使用地图图层,也可以直接从文件夹或云存储连接将 Parquet 文件作为输入添加到地理处理工具或 ArcPy 函数。
- 您可以发布以下类型的 Web 图层,这些图层将所有数据复制到ArcGIS Enterprise 或 ArcGIS Online,从而生成托管图层:
- Web 要素图层
- 具有关联 web 要素图层的矢量切片图层
- 具有关联 web 要素图层的场景图层
- 表