Los datasets de conexión de big data tienen una propiedad de archivo que define el tipo de dataset y su formato.
A continuación, se muestran algunos ejemplos de cuándo debe actualizar la información de campo:
- Para verificar que se ha seleccionado el tipo de archivo correcto (delimitado, shapefile, ORC, parquet)
- Para modificar el carácter de comillas
- Para modificar la codificación
Detalles de las propiedades de los campos
Cada tipo de datos incluye un tipo de formato de archivo: delimitado, shapefile, ORC o parquet.
Los archivos delimitados tienen propiedades adicionales que no son compatibles con shapefile, ORC y parquet. Estas propiedades adicionales son, entre otras:
- Extensión de archivo: las extensiones del archivo delimitado, por ejemplo, .csv. Esta propiedad no es editable.
- Delimitador de campo: el delimitador utilizado para dividir campos. Esta propiedad es editable.
- Finalizador de registro: el carácter utilizado para dividir líneas. Esta propiedad es editable.
- Carácter de comillas: carácter utilizado para las comillas en una cadena de caracteres. Esta propiedad es editable.
- Carácter de escape: el carácter utilizado como escape para las comillas. Esta propiedad es editable.
- Tiene fila de encabezado: si el archivo delimitado tiene una fila de encabezado. Esta propiedad es editable.
- Codificación: el tipo de codificación. El valor predeterminado es UTF -8. Esta propiedad es editable.
Cambiar las propiedades de los archivos del dataset de conexión de big data no modifica sus datasets de origen.