Eigenschaften des Big-Data-Verbindungsdateiformats

Big-Data-Verbindungs-Datasets verfügen über eine Dateieigenschaft, die den Dataset-Typ und dessen Format definiert.

Nachfolgend sind einige Situationen aufgeführt, in denen die Feldinformationen aktualisiert werden sollten:

  • Beim Überprüfen, ob der richtige Dateityp ausgewählt wurde (durch Trennzeichen getrennt, Shapefile, ORC, Parquet)
  • Beim Ändern des Anführungszeichens
  • Beim Ändern der Codierung

Details der Feldeigenschaften

Jeder Datentyp enthält einen Dateiformattyp: durch Trennzeichen getrennt, Shapefile, ORC oder Parquet.

Durch Trennzeichen getrennte Dateien verfügen über zusätzliche Eigenschaften, die für Shapefile-, ORC- und Parquet-Dateien nicht unterstützt werden. Zu diesen zusätzlichen Eigenschaften zählen die folgenden:

  • Dateierweiterung: Die Erweiterung der durch Trennzeichen getrennten Datei, z. B. .csv. Diese Eigenschaft kann nicht bearbeitet werden.
  • Feldtrennzeichen: Das Trennzeichen, das zur Unterteilung von Feldern verwendet wird. Diese Eigenschaft kann bearbeitet werden.
  • Datensatzabschlusszeichen: Das Zeichen, das zur Unterteilung von Zeilen verwendet wird. Diese Eigenschaft kann bearbeitet werden.
  • Anführungszeichen: Das in einer Zeichenfolge verwendete Anführungszeichen. Diese Eigenschaft kann bearbeitet werden.
  • Escape-Zeichen: Das Escape-Zeichen, mit dem das Anführungszeichen versehen wird. Diese Eigenschaft kann bearbeitet werden.
  • Hat Kopfzeile: Gibt an, ob die durch Trennzeichen getrennte Datei über eine Kopfzeile verfügt. Diese Eigenschaft kann bearbeitet werden.
  • Codierung: Der Typ der Codierung. Die Standardeinstellung ist UTF-8. Diese Eigenschaft kann bearbeitet werden.

Beim Ändern der Dateieigenschaften für das Big-Data-Verbindungs-Dataset werden keine Änderungen an den Quellen-Datasets vorgenommen.