Propriétés du fichier de connexion Big Data

Les jeux de données de connexion Big Data possèdent une propriété de fichier qui définit le type de jeu de données et son format.

Voici quelques exemples de situations nécessitant une mise à jour des informations de champ :

  • Pour vérifier que le type de fichier correct a été sélectionné (délimité, shapefile, ORC, Parquet)
  • Pour modifier le caractère de délimitation
  • Pour modifier le codage

Détails des propriétés de champ

Chaque type de données inclut un type de format de fichier : délimité, shapefile, ORC ou Parquet.

Les fichiers délimités possèdent des propriétés supplémentaires qui ne sont pas prises en charge pour les fichiers de type shapefile, ORC et Parquet. Ces propriétés supplémentaires sont les suivantes :

  • File extension (Extension de fichier) : extensions du fichier délimité, par exemple, .csv. Cette propriété n’est pas modifiable.
  • Field delimiter (Délimiteur de champ) : délimiteur utilisé pour fractionner les champs. Cette propriété est modifiable.
  • Record terminator (Terminateur d’enregistrement) : caractère utilisé pour fractionner les lignes. Cette propriété est modifiable.
  • Quote character (Caractère de délimitation) : caractère utilisé pour les guillemets dans une chaîne. Cette propriété est modifiable.
  • Escape character (Caractère d’échappement) : caractère utilisé pour échapper les guillemets. Cette propriété est modifiable.
  • Has header row (Contient un en-tête de ligne) : indique si le fichier délimité comporte un en-tête de ligne. Cette propriété est modifiable.
  • Encoding (Codage) : type de codage. La valeur par défaut est UTF-8. Cette propriété est modifiable.

Si vous modifiez les propriétés de fichier du jeu de données de connexion Big Data, les jeux de données source ne sont pas modifiés.