Подготовка данных

Вы можете использовать инструменты Data engineering для очистки и подготовки своих данных. Поднабор инструментов обработки доступен в виде Data Engineering, он поможет подготовить ваши данные для использования на карте или в анализе. Инструменты сгруппированы в следующие категории:

  • Очистка – очистка данных. Например, вы можете удалить ненужные поля. Вы также можете изменить поля или заполнить пропущенные значения.
  • Построение – создайте поля на основе существующих полей или свойств слоя. Например, вы можете добавить и вычислить новое поле, стандартизировать, трансформировать или переклассифицировать существующее поле, а также добавить поле на основе геометрии входного слоя.
  • Интеграция – интегрируйте или добавляйте данные из другого источника во входную таблицу или класс объектов. Например, вы можете присоединить или добавить поля, обогатив данные.
  • Форматирование – измените форматы полей или переорганизуйте поля в таблице или классе объектов. Например, вы можете конвертировать поля времени, перекодировать категорийные поля или сократить измерения в существующих полях.

Примечание:

Некоторые инструменты геообработки в виде Data Engineering недоступны для не редактируемых слоев. В этом случае рекомендуется сделать редактируемую копию слоя и открыть новый вид Data Engineering.

Доступ к этим группам и инструментам можно получить в виде Data Engineering, выполнив одно из следующего:

Лента Data Engineering

Когда вид Data Engineering станет активным, в верхней части приложения появится контекстная лента. На ленте будет доступ к командам и инструментам для изучения и подготовки данных.

Лента Data Engineering

Группа Данные на ленте предоставляет доступ к виду полей и таблице атрибутов для слоя, связанного с активным видом Data Engineering. В группе Инструменты представлены четыре галереи инструментов: Очистка, Построения, Интеграция и Форматирование. Каждая галерея инструментов содержит поднабор инструментов геообработки для соответствующей задачи инженерии данных. По умолчанию слой, связанный с активным видом Data Engineering используется для автоматического заполнения параметра входных объектов для этих инструментов. В группе Пространственные, Отобразить данные XY и Геокодировать таблицу преобразовывают ваши непространственные автономные таблицы в пространственные данные.

Инструменты Data Engineering

Следующие таблицы описывают все инструменты, доступные на ленте Data Engineering

Примечание:

Некоторые из этих инструментов недоступны для непространственных данных, например таких, как автономные таблицы.

Очистка

Следующие инструменты доступны в категории Очистка:

ИнструментОписание

Удалить поле

Удаляет один или несколько полей из класса пространственных объектов, таблицы, слоя объектов или набора растровых данных.

Изменить поле

Переименовывает поля и их псевдонимы или изменяет свойства поля.

Проецировать

Проецирует пространственные данные из одной системы координат в другую.

Заполнить пропущенные значения

Заменяет пропущенные (null) значения на вычисленные на основе значений пространственных соседей, пространственно-временных соседей, временных рядов или значений глобальной статистики.

Определение пространственных выбросов

Определяет глобальные и локальные пространственные выбросы у точечных объектов.

Построить

Следующие инструменты доступны в категории Построение:

ИнструментОписание

Вычислить поле

Вычисляет значения в заданном поле класса объектов, векторного слоя или растра.

Добавить поле

Добавляет новое поле в автономную таблицу или таблицу класса пространственных объектов или векторного слоя, а также в растры с таблицами атрибутов.

Вычислить атрибуты геометрии

Добавляет информацию к полям атрибутов объектов, представляющим геометрические характеристики и местоположение каждого объекта, например, длину, площадь, координаты x, y, z и m.

Трансформировать поле

Трансформирует непрерывные значения в одно или несколько полей, путем применения математических функций к каждому значению и изменению формы распределения. Методы трансформирования в инструменте включают логарифм, квадратный корень, Box-Cox, множественную инверсию, квадрат, экспоненты и обратный Box-Cox.

Стандартизировать поле

Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию.

Уменьшение измерений

Уменьшает количество измерений набора непрерывных переменных, агрегируя максимально возможное количество дисперсии в меньшее количество компонентов с помощью анализа по методу главных компонент (PCA) или линейного дискриминантного анализа пониженного ранга (LDA).

Сглаживание временных рядов

Сглаживает данные временных рядов, что помогает учесть краткосрочные колебания, чтобы выявить долгосрочные тенденции и циклы. Инструмент может использовать числовую переменную одного или нескольких временных рядов с использованием центрированных, прямых и обратных скользящих средних, а также адаптивного метода, основанного на локальной линейной регрессии.

Интегрировать

Следующие инструменты доступны в категории Интеграция:

ИнструментОписание

Пространственное соединение

Присоединяет атрибуты из одного объекта к другому на основании пространственного взаиморасположения. В выходной класс объектов записываются целевые объекты (исходного класса) с присоединенными атрибутами из другого класса.

Соединение полей

Соединяет содержание таблицы с другой таблицей на основе общего атрибутивного поля. Входная таблица обновляется, чтобы содержать поля из присоединенной таблицы. Вы можете выбрать, какие поля из присоединяемой таблицы будут добавлены во входную таблицу.

Ближайший объект

Вычисляет расстояние и дополнительную информацию о близости входных объектов и ближайшего объекта в другом слое или классе пространственных объектов.

Суммировать в пределах

Выполняет наложение полигонального слоя на другой слой для суммирования числа точек, длин линий и площадей полигонов, а также вычисляющий статистику атрибутивных полей этих объектов внутри полигонов.

Суммировать близлежащие

Находит объекты, расположенные в пределах заданного расстояния от объектов входного слоя, и вычисляет статистику для этих ближайших объектов.

Пример из растра

Создает таблицу или класс точечных объектов, содержащие значения ячеек растра или набора растров, для конкретных местоположений. Местоположения определяются ячейками растра, точками, полилиниями или полигонами.

Обогатить

Обогащает данные, добавляя демографические и географические сведения о людях и местах в местоположениях ваших данных и рядом с ними. Выходными данными является копия входных данных с дополнительными атрибутивными полями. Для этого инструмента требуется учетная запись организации ArcGIS Online или локально установленный набор данных Business Analyst.

Полигон разделения

Суммирует атрибуты входного полигонального слоя на основе пространственного наложения целевого полигонального слоя и назначает итоговые атрибуты целевым полигонам. Целевые полигоны имеют суммированные числовые атрибуты, полученные из входных полигонов, которые перекрываются каждым целевым полигоном.

Формат

Следующие инструменты доступны в категории Форматирование:

ИнструментОписание

Конвертировать поле времени

Конвертирует значения даты и времени, хранящиеся в поле, в другое поле. Инструмент можно использовать для конвертации значений между полями разных типов (текстовое, числовое или даты), или для конвертации значений в другой формат, например, дд/мм/гг чч:мм:сс в гггг-мм-дд.

Конвертировать часовой пояс

Конвертирует временные значения, записанные в поле дат, из одного часового пояса в другой.

Сводная таблица

Создает таблицу из входной таблицы за счет сокращения избыточных записей и сжатия отношений один-ко-многим.

Транспонировать поля

Трансформирует данные в полях или столбцах в строки в новой таблице или классе объектов.

Переклассифицировать поле

Переклассифицирует значения в числовом или текстовом поле в классы на основе границ, определенных вручную, или применяя метод переклассификации.

Кодировать поле

Преобразует категорийные значения (строка, целое число или дата) в несколько числовых полей, каждое из которых представляет определенную категорию. Закодированные числовые поля могут использоваться в большинстве научных данных и статистических рабочих процессов, включая регрессионные модели.

Примечание:

Большинство операций геообработки, изменяющих входные данные, нельзя отменить.

Связанные разделы