大数据连接数据集具有一个文件属性,用于定义数据集类型及其格式。
下面是应更新字段信息的一些示例:
- 验证是否选择正确的文件类型(分隔、shapefile、ORC、parquet)
- 修改引号字符
- 修改编码
字段属性详细信息
所有数据类型都包含文件格式类型:分隔、shapefile、ORC 或 parquet。
分隔文件具有不适用于 shapefile、ORC 和 parquet 的其他属性。 其他属性如下:
- 文件扩展名 - 分隔文件的扩展名,例如 .csv。 此属性不可编辑。
- 字段分隔符 - 用于分割字段的分隔符。 此属性可编辑。
- 记录终止符 - 用于分割行的字符。 此属性可编辑。
- 引号字符 - 用于字符串内的引号的字符。 此属性可编辑。
- 转义字符 - 用于转义引号的字符。 此属性可编辑。
- 具有标题行 - 如果分隔文件具有标题行。 此属性可编辑。
- 编码 - 编码类型。 默认值为 UTF-8。 此属性可编辑。
更改大数据连接数据集的文件属性时,不会修改源数据集。