У наборов данных подключения к большим данным есть свойство файла (file), определяющее тип и формат набора данных.
Ниже приводятся примеры возможного обновления информации о полях:
- Чтобы убедиться в том, что был выбран правильный тип файла (с разделителями, шейп-файл, ORC, parquet)
- Чтобы изменить символ кавычки
- Чтобы изменить кодировку
Подробные свойства полей
У каждого типа данных есть тип формата файла: с разделителями, шейп-файл, ORC, parquet.
У файлов с разделителями есть дополнительные свойства, не поддерживаемые шейп-файлами, ORC и parquet. Это следующие дополнительные свойства:
- Расширение файла - расширение файла с разделителями, например, .csv. Это свойство не редактируется.
- Разделитель полей - символ, используемый для разбиения полей. Это свойство можно изменять.
- Терминатор записи - символ, использующийся для разделения строк. Это свойство можно изменять.
- Символ кавычки - символ, использующийся в строке в качестве кавычки. Это свойство можно изменять.
- Escape-символ - символ, использующийся в строке в качестве escape-кавычек. Это свойство можно изменять.
- Есть строка заголовка - указывает, есть ли в файле с разделителями строка заголовка. Это свойство можно изменять.
- Кодировка - указывает тип кодирования. По умолчанию это будет UTF-8. Это свойство можно изменять.
Изменение свойств файла для набора данных подключения больших данных не меняет исходные наборы данных.