Подготовка данных

Вы можете использовать инструменты Data engineering для очистки и подготовки своих данных. Поднабор инструментов обработки доступен в виде Data Engineering, он поможет подготовить ваши данные для использования на карте или в анализе. Инструменты сгруппированы в следующие категории:

  • Очистка – очистка данных. Например, вы можете удалить ненужные строки или поля. Вы также можете изменить поля или заполнить пропущенные значения.
  • Построение – создайте поля на основе существующих полей или свойств слоя. Например, вы можете добавить и вычислить новое поле, стандартизировать, трансформировать или переклассифицировать существующее поле, а также добавить поле на основе геометрии входного слоя.
  • Интеграция – интегрируйте или добавляйте данные из другого источника во входную таблицу или класс объектов. Например, вы можете присоединить или добавить поля, обогатив данные.
  • Форматирование – измените форматы полей или переорганизуйте поля в таблице или классе объектов. Например, вы можете конвертировать поля времени, перекодировать категорийные поля или сократить измерения в существующих полях.

Примечание:

Некоторые инструменты геообработки в виде Data Engineering недоступны для не редактируемых слоев. В этом случае рекомендуется сделать редактируемую копию слоя и открыть новый вид Data Engineering.

Доступ к этим группам и инструментам можно получить в виде Data Engineering, выполнив одно из следующего:

Лента Data Engineering

Когда вид Data Engineering станет активным, в верхней части приложения появится контекстная лента. На ленте будет доступ к командам и инструментам для изучения и подготовки данных.

Лента Data Engineering

Группа Данные на ленте предоставляет доступ к виду полей и таблице атрибутов для слоя, связанного с активным видом Data Engineering. В группе Инструменты представлены четыре галереи инструментов: Очистка, Построения, Интеграция и Форматирование. Каждая галерея инструментов содержит поднабор инструментов геообработки для соответствующей задачи инженерии данных. По умолчанию слой, связанный с активным видом Data Engineering используется для автоматического заполнения параметра входных объектов для этих инструментов.

Инструменты Data Engineering

Следующие таблицы описывают все инструменты, доступные на ленте Data Engineering

Примечание:

Некоторые из этих инструментов недоступны для непространственных данных, например таких, как автономные таблицы.

Очистка

Следующие инструменты доступны в категории Очистка:

ИнструментОписание

Заполнить пропущенные значения

Заменяет пропущенные (null) значения на вычисленные на основе значений пространственных, пространственно-временных и временных соседей.

Удалить поле

Удаляет один или несколько полей из класса пространственных объектов, таблицы, слоя объектов или набора растровых данных.

Определение пространственных выбросов

Определяет пространственные выбросы у точечных объектов, вычисляя локальный фактор выброса (LOF) каждого объекта. Пространственные выбросы - это объекты в местах, которые являются аномально изолированными, а LOF является измерением, которое описывает, насколько изолированным является местоположение от локальной окрестности.

Проект

Проецирует пространственные данные из одной системы координат в другую.

Построить

Следующие инструменты доступны в категории Построение:

ИнструментОписание

Вычислить атрибуты геометрии

Добавляет информацию к полям атрибутов объектов, представляющим геометрические характеристики и местоположение каждого объекта, например, длину, площадь, координаты x, y, z и m.

Вычислить поле

Вычисляет значения в заданном поле класса объектов, векторного слоя или растра.

Трансформировать поле

Трансформирует непрерывные значения в одно или несколько полей, путем применения математических функций к каждому значению и изменению формы распределения. Методы трансформирования в инструменте включают логарифм, квадратный корень, Box-Cox, множественную инверсию, квадрат, экспоненты и обратный Box-Cox.

Стандартизировать поле

Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию.

Добавить поле

Добавляет новое поле в автономную таблицу или таблицу класса пространственных объектов или векторного слоя, а также в растры с таблицами атрибутов.

Уменьшение измерений

Уменьшает количество измерений набора непрерывных переменных, агрегируя максимально возможное количество дисперсии в меньшее количество компонентов с помощью анализа по методу главных компонент (PCA) или линейного дискриминантного анализа пониженного ранга (LDA).

Сглаживание временных рядов

Сглаживает данные временных рядов, что помогает учесть краткосрочные колебания, чтобы выявить долгосрочные тенденции и циклы. Инструмент может использовать числовую переменную одного или нескольких временных рядов с использованием центрированных, прямых и обратных скользящих средних, а также адаптивного метода, основанного на локальной линейной регрессии.

Интегрировать

Следующие инструменты доступны в категории Интеграция:

ИнструментОписание

Поле соединения

Соединяет содержание таблицы с другой таблицей на основе общего атрибутивного поля. Входная таблица обновляется, чтобы содержать поля из присоединенной таблицы. Вы можете выбрать, какие поля из присоединяемой таблицы будут добавлены во входную таблицу.

Обогатить

Обогащает данные, добавляя демографические и географические сведения о людях и местах в местоположениях ваших данных и рядом с ними. Выходными данными является копия входных данных с дополнительными атрибутивными полями. Для этого инструмента требуется учетная запись организации ArcGIS Online или локально установленный набор данных Business Analyst.

Ближайший объект

Вычисляет расстояние и дополнительную информацию о близости входных объектов и ближайшего объекта в другом слое или классе пространственных объектов.

Пространственное соединение

Присоединяет атрибуты из одного объекта к другому на основании пространственного взаиморасположения. В выходной класс объектов записываются целевые объекты (исходного класса) с присоединенными атрибутами из другого класса.

Суммировать в пределах

Выполняет наложение полигонального слоя на другой слой для суммирования числа точек, длин линий и площадей полигонов, а также вычисляющий статистику атрибутивных полей этих объектов внутри полигонов.

Извлечь по образцу

Создает таблицу или класс точечных объектов, содержащую(-ий) значения ячеек растра или набора растров, для конкретных местоположений. Местоположения определяются ячейками растра, точками, полилиниями или полигонами.

Суммировать близлежащие

Находит объекты, расположенные в пределах заданного расстояния от объектов входного слоя, и вычисляет статистику для этих ближайших объектов.

Полигон разделения

Суммирует атрибуты входного полигонального слоя на основе пространственного наложения целевого полигонального слоя и назначает итоговые атрибуты целевым полигонам. Целевые полигоны имеют суммированные числовые атрибуты, полученные из входных полигонов, которые перекрываются каждым целевым полигоном.

Формат

Следующие инструменты доступны в категории Форматирование:

ИнструментОписание

Кодировать поле

Преобразует категорийные значения (строка, целое число или дата) в несколько числовых полей, каждое из которых представляет определенную категорию. Закодированные числовые поля могут использоваться в большинстве научных данных и статистических рабочих процессов, включая регрессионные модели.

Конвертировать поле времени

Конвертирует значения времени, хранящиеся в строковом или числовом поле, в поле даты. Этот инструмент также позволяет конвертировать значения времени, хранящиеся в строках, числовых полях или полях времени, в пользовательские форматы, такие как день недели и месяц года.

Транспонировать поля

Трансформирует данные в полях или столбцах в строки в новой таблице или классе объектов.

Конвертировать часовой пояс

Конвертирует временные значения, записанные в поле дат, из одного часового пояса в другой.

Переклассифицировать поле

Переклассифицирует значения в числовом или текстовом поле в классы на основе границ, определенных вручную, или применяя метод переклассификации.

Сводная таблица

Создает таблицу из входной таблицы за счет сокращения избыточных записей и сжатия отношений один-ко-многим.

Примечание:

Большинство операций геообработки, изменяющих входные данные, нельзя отменить.

Связанные разделы