Свойства файла подключения больших данных

У наборов данных подключения к большим данным есть свойство файла (file), определяющее тип и формат набора данных.

Ниже приводятся примеры возможного обновления информации о полях:

  • Чтобы убедиться в том, что был выбран правильный тип файла (с разделителями, шейп-файл, ORC, parquet)
  • Чтобы изменить символ кавычки
  • Чтобы изменить кодировку

Подробные свойства полей

У каждого типа данных есть тип формата файла: с разделителями, шейп-файл, ORC, parquet.

У файлов с разделителями есть дополнительные свойства, не поддерживаемые шейп-файлами, ORC и parquet. Это следующие дополнительные свойства:

  • Расширение файла - расширение файла с разделителями, например, .csv. Это свойство не редактируется.
  • Разделитель полей - символ, используемый для разбиения полей. Это свойство можно изменять.
  • Терминатор записи - символ, использующийся для разделения строк. Это свойство можно изменять.
  • Символ кавычки - символ, использующийся в строке в качестве кавычки. Это свойство можно изменять.
  • Escape-символ - символ, использующийся в строке в качестве escape-кавычек. Это свойство можно изменять.
  • Есть строка заголовка - указывает, есть ли в файле с разделителями строка заголовка. Это свойство можно изменять.
  • Кодировка - указывает тип кодирования. По умолчанию это будет UTF-8. Это свойство можно изменять.

Изменение свойств файла для набора данных подключения больших данных не меняет исходные наборы данных.