Обновить свойства набора данных из подключения больших данных (GeoAnalytics Desktop)

Сводка

Обновляет свойства подключения к набору больших данных (НБД). Инструмент обновляет поля, геометрию, время и настройки полей, определенные для набора больших данных.

Использование

  • Этот инструмент требует BDC. Чтобы создать BDC, используйте инструмент Create Big Data Connection.

  • Используйте этот инструмент для изменения схемы НБД, геометрии или времени для использования в анализе или визуализации в сценариях, например:

    • Ваш набор данных CSV был зарегистрирован с полями строкового типа, а вы хотите часть полей перевести в числовой формат для использования в анализе.
    • В вашем наборе больших данных есть атрибутивные значения для двух отдельных местоположений, например, стоянка такси и зона посадки, и вы хотите изменить геометрию для использования в анализе.
    • Для рабочего процесса анализа необходимо установить время для входного слоя.
    • Вы хотите опубликовать набор больших данных для ваших коллег, но им требуется только поднабор, поэтому вы добавите выражение для определяющего запроса и скроете часть ненужных полей.

  • Вы можете изменить следующие свойства:

    • Определяющий запрос – выражение для ограничения числа объектов для анализа.
    • Поля – имя поля, тип поля и видимость.
    • Геометрия – представление геометрии. Недоступно для редактирования в формате шейп-файла.
    • Время – представление времени.
    • Файл – свойства файла, необходимые для чтения набора данных.

  • Укажите набор больших данных, свойства которого вы хотите изменить с использованием параметра Подключение к набору больших данных. Вы можете перейти к набору данных или указать его с помощью пути, например c:\<path>\MyBDC.bdc\<dataset_name>, c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.

  • Задайте выражение для ограничения числа объектов в анализе с помощью параметра Выражение. Добавление фильтра к набору больших данных подобно применению определяющего запроса к набору данных на карте: укажите выражение SQL для выбора интересующих объектов.

  • Вы можете обновить тип поля только для файлов с разделителями. Вы не можете обновить тип поля для других источников данных (например шейп-файлы, ORC или parquet).

  • Вы можете изменить геометрию для файлов с разделителями, ORC и parquet. Вы не можете изменить геометрию для источников данных на основе шейп-файлов.

  • В следующей таблице показано, как указывать форматы для параметров Время начала и Время окончания при редактировании набора больших данных. В примере показано, как представляется следующий момент времени: 2 января 2016 года в 21:45:02.05.

    Форматы времени в подключениях к наборам больших данных

    СимволЗначениеПример

    гг

    Год выражается двумя цифрами.

    16

    гггг

    Год выражается четырьмя цифрами.

    2016

    MM

    Месяц выражается числом.

    01 или 1

    MMM

    Месяц выражается трехбуквенным обозначением.

    Jan

    MMMM

    Месяц выражается полным названием.

    January

    дд

    День.

    02 или 2

    ЧЧ

    Час в 24-часовой системе (значения от 0 до 23).

    21

    чч

    Час в 12-часовой системе; значения от 1 до 12).

    9

    мм

    Минута; значения в диапазоне от 0 до 59.

    45

    сс

    Секунда; значения в диапазоне от 0 до 59.

    02

    ССС

    Миллисекунда; значения в диапазоне от 0 до 999.

    50

    a

    Маркер AM/PM.

    PM

    epoch_millis

    Время в миллисекундах с epoch.

    1509581781000

    epoch_seconds

    Время в секундах с epoch.

    1509747601

    Z

    Смещение часового пояса, выраженное в часах.

    -0100 или -01:00

    ZZZ

    Смещение часового пояса, выраженное с помощью ID.

    America/Los_Angeles

    ''

    Используйте одинарные кавычки для добавления текста, который не представляет значение, описанное в этой таблице.

    'T'

    В следующей таблице содержатся примеры различных форматов представления одной и той же даты: 2 января 2016 года в 21:45:02.05:

    Примеры формата времени

    Входная датаФормат даты

    01/02/2016 9:45:02PM

    ММ/дд/гггг чч:мм:ссa

    Jan02-16 21:45:02

    ММММдд-гг ЧЧ:мм:сс

    January 02 2016 9:45:02.050PM

    ММММ дд гггг чч:мм:сс.СССa

    01/02/2017T9:45:14:05-0000

    ММ/дд/гггг чч:мм:ссa

    Вы можете указать часовой пояс с помощью следующих опций:
    • Полное имя часового пояса: Pacific Standard Time
    • Смещение часового пояса, выраженное в часах: -0100 или -01:00
    • Аббревиатуры UTC или GMT
  • Вы можете изменить следующие свойства для файлов с разделителями:

    • Разделитель полей – определяет разделитель для каждого поля. Стандартными разделителями являются , и ;.
    • Ограничитель записей – определяет ограничитель для каждой строки данных. Стандартными ограничителями являются \n и \t.
    • Символ кавычки – символ кавычки в исходном наборе данных.
    • Содержит строку заголовка – значение истина или ложь для определения, содержит ли исходный набор данных заголовки. Если в наборе данных есть строка заголовка, для имен полей будут использоваться заголовки.
    • Кодировка – тип кодировки для набора данных. По умолчанию это UTF-8.

  • Инструмент Обновить свойства подключения к набору больших данных обновляет свойства подключения к отдельному набору. Для изменения наборов больших данных используйте следующие инструменты:

  • Вы можете дополнительно отредактировать свой файл BDC вручную. Вы всегда должны изменять файл .bdc вручную в следующих ситуациях:

    • У вас есть одно или несколько полей, используемых для представления координат x,y или z.
    • Вы хотите обновить путь для источника.

    Более подробно о форматировании файлов подключения больших данных.

  • Этот инструмент геообработки работает от Spark. Чтобы изучить вопросы, посвященные подключениям больших данных и работе с ними, см. раздел Подключения больших данных.

Синтаксис

UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
ParameterОбъяснениеТип данных
bdc_dataset

Набор больших данных для обновления. Опции для редактирования будут отличаться друг от друга в зависимости от источников данных (шейп-файлы, файлы с разделителями, ORC или файлы parquet).

Table View
expression
(Дополнительный)

Выражение для ограничения числа объектов для анализа.

SQL Expression
field_properties
[field_properties,...]
(Дополнительный)

Указывает имена полей и свойства для изменения.

  • SHORTЭто поле будет типа short.
  • LONGЭто поле будет типа long
  • DOUBLEЭто поле будет типа double.
  • FLOATЭто поле будет типа float.
  • STRINGЭто поле будет типа string.
  • DATEЭто поле будет типа date.
  • BLOBЭто поле будет типа BLOB.

Указывает, будут ли поля видимы или скрыты.

  • TRUEПоля видимы и доступны для использования в инструментах геообработки. Это значение по умолчанию.
  • FALSEПоля будут скрыты и не могут быть использованы в инструментах геообработки.
Value Table
geometry_type
(Дополнительный)

Указывает тип геометрии, который будет использован для пространственного представления набора данных. Геометрию нельзя изменить для наборов данных на основе шейп-файлов.

  • POINTТип геометрии – точка.
  • LINEТип геометрии – полилиния.
  • POLYGONТип геометрии – полигон.
  • NONEОтсутствует тип геометрии
String
spatial_reference
(Дополнительный)

Значение WKID или строка WKT будет использована для пространственного представления набора данных. По умолчанию WKID 4326 (WGS84). Пространственную привязку нельзя изменить для наборов данных на основе шейп-файлов.

String
geometry_format_type
(Дополнительный)

Указывает, как может быть отформатирована геометрия. Геометрию нельзя изменить для наборов данных на основе шейп-файлов.

  • XYZДва или более полей будут представлять x, y и, дополнительно z.
  • WKTГеометрия будет представлена одним полем в формате стандартного текстового поля.
  • WKBГеометрия будет представлена одним полем в формате стандартного бинарного поля.
  • GEOJSONГеометрия будет представлена одним полем в формате GeoJSON.
  • ESRIJSONГеометрия будет представлена одним полем в формате EsriJSON.
String
geometry_field
(Дополнительный)

Единое поле, использующееся для представления геометрии. Это поле будет использовано, если формат геометрии: WKT, WKB, GeoJSON или EsriJSON.

String
x_field
(Дополнительный)

Поле, используемое для представления местоположения x. Если местоположение x представлено более чем одним полем, измените файл .bdc вручную.

String
y_field
(Дополнительный)

Поле, используемое для представления местоположения y. Если местоположение y представлено более чем одним полем, измените файл .bdc вручную.

String
z_field
(Дополнительный)

Поле, используемое для представления местоположения z. Если местоположение z представлено более чем одним полем, измените файл .bdc вручную.

String
time_type
(Дополнительный)

Указывает тип времени, используемый для временного представления набора данных.

  • INTERVALТип времени может быть представлен временным интервалом или временем начала и временем окончания.
  • INSTANTЭтот тип времени будет представлять мгновение во времени.
  • NONEВремя не активно.
String
time_zone
(Дополнительный)

Часовой пояс набора данных..

String
start_time_format
[start_time_format,...]
(Дополнительный)

Поля используемые для определения формата времени начала и времени окончания.

Value Table
end_time_format
[end_time_format,...]
(Дополнительный)

Поля используемые для определения формата времени начала и времени окончания.

Value Table
file_extension
(Дополнительный)

Расширение файла исходного набора данных. Этот параметр не может быть изменен.

String
field_delimiter
(Дополнительный)

Разделитель поля, используемый в исходном наборе данных.

String
record_terminator
(Дополнительный)

Ограничитель записи, используемый в исходном наборе данных.

String
quote_character
(Дополнительный)

Символ кавычки, используемый в исходном наборе данных.

String
has_header_row
(Дополнительный)

Указывает, содержит ли исходный набор данных строку заголовка.

  • HAS_HEADERИсходный набор данных содержит строку заголовка.
  • NO_HEADERИсходный набор данных не содержит строку заголовка.
Boolean
encoding
(Дополнительный)

Тип кодировки, используемый исходным набором данных. По умолчанию используется UTF-8.

String

Производные выходные данные

NameОбъяснениеТип данных
updated_bdc

Файл обновленного набора больших данных с измененными свойствами примененными к указанному набору данных.

Файл

Пример кода

UpdateBDCDatasetProperties, пример (автономный скрипт)

Скрипт Python, демонстрирующий выполнение функции UpdateBDCDatasetProperties.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Environments

Этот инструмент не использует параметры среды геообработки

Информация о лицензиях

  • Basic: Нет
  • Standard: Нет
  • Advanced: Да

Связанные разделы