Обучение модели классификации облака точек (3D Analyst)—ArcGIS Pro

Краткая информация

Тренирует модель глубокого обучения для классификации облака точек.

Более подробно об обучении модели классификации облака точек

Использование

Для этого инструмента требуется установка Deep Learning Essentials, который содержит несколько решений нейронных сетей, включая нейронные архитектуры для классификации облаков точек.
Чтобы настроить компьютер на работу в среде глубокого обучения в ArcGIS Pro, см. раздел Установка сред глубокого обучения для ArcGIS.
Модель классификации облака точек может быть обучена с помощью видеокарты NVIDIA с поддержкой CUDA или CPU. Использование графического процессора обычно быстрее, чем использование центрального процессора. Используйте ЦПУ только, если нет доступного графического процессора. При использовании центрального процессора для обучения, начните с использования архитектуры RandLA-Net, так как она использует меньше памяти, чем PointCNN. Также можно поэкспериментировать с использованием наименьших возможных обучающих выборок, чтобы оценить время обработки данных, до обучения с полным набором обучающих данных.
При использовании графического процессора для обучения модели на компьютере с несколькими видеокартами инструмент выберет самую быструю видеокарту на компьютере. Так же можно указать GPU при помощи параметра среды GPU ID. Если на компьютере установлено несколько видеокарт, вы можете максимально повысить производительность обучения, выделив видеокарту с наибольшими вычислительными ресурсами для обучения и видеокарту с меньшими ресурсами для отображения. Если выбранный графический процессор также используется для отображения, его доступная память будет уменьшена операционной системой и любыми приложениями, использующими дисплей во время процесса обучения.
Использование предварительно обученной модели выгодно, особенно если вы сталкиваетесь с ограничениями в данных, времени или вычислительных ресурсах. Предварительно обученные модели сокращают потребность в тщательном обучении и являются надежной отправной точкой, которая может ускорить создание полезной модели. Чтобы воспользоваться преимуществами предварительно обученной модели, новые обучающие данные должны быть совместимы с предварительно обученной моделью. Убедитесь, что новые обучающие данные имеют те же атрибуты и коды классов, что и обучающие данные, которые использовались для создания предварительно обученной модели. Если коды классов в обучающих данных не соответствуют классам в предварительно обученной модели, классы обучающих данных необходимо соответствующим образом пересчитать.
Когда инструмент запущен, индикатор выполнения отображает сообщение, содержащее следующую статистику результатов обучения, полученных для каждой эпохи:
- Эпоха — номер эпохи, с которой связан результат
- Потери обучения - результат функции потерь энтропии, который усредняется с данными обучения
- Потери проверки - результат функции потерь энтропии, который выявляется при применении обученной модели в эпоху данных проверки
- Accuracy (Корректность) - отношение точек в данных проверки, которые корректно классифицированы моделью обученной данную в эпоху (истинно положительные) ко всем точкам в данных проверки
- Precision (точность) - общая средняя точность для всех кодов классов
- Recall (полнота) - общее среднее найденных значений для всех кодов классов
- Оценка F1 — гармоническое среднее общего среднего значений точности и полноты для всех кодов классов
Модель, с низкими потерями при обучении, но высокими потерями при проверке, считается перенаполненной обучающими данными, в результате чего она обнаруживает закономерности из артефактов в обучающих данных, в результате чего модель некорректно работает для данных проверки. Модель, с высокими потерями при обучении и высокими потерями при проверке считается не подогнанной к обучающим данным, так как отсутствуют эффективно выученные закономерности, что свидетельствует о неподходящей модели.
Более подробно о доступе к результатам классификации облака точек
Создается папка для хранения контрольных моделей, которые являются моделями, созданными в конце каждой эпохи. Имя этой папки такое же, как у модели, с суффиксом .checkpoints и хранится в значении параметра Местоположение выходной модели. После завершения обучения в папке контрольных точек создается таблица CSV, имя которой начинается со значения параметра Имя выходной модели и заканчивается на _stats.csv. Таблица содержит следующие поля, в зависимости от результатов, получаемых для каждого кода класса и каждой эпохи:
- Epoch— номер эпохи, связанный с результатом в строке. Значение, соответствующее модели, созданной в парке контрольных точек моделей. Результаты получаются путем применения модели, обученной в эпоху присутствия данных проверки.
- Class_Code— код класса для которого получены результаты.
- Precision— отношение точек, которые были корректно классифицированы (истинно положительные) и всех классифицированных точек (истинно положительные и ложно положительные).
- Recall— отношение точек, которые были корректно классифицированы (истинно положительные), и всех точек, которые должны быть классифицированы по этому значению (истинно положительные и ложно отрицательные).
- F1_Score— гармоническое среднее точности и вызванного значения.
Выделенная память, используемая во время обучения, представляет собой сумму памяти, выделенной для среды глубокого обучения, и объема данных, обрабатываемых в каждом пакете итерации в заданную эпоху. Размер данных в каждом пакете зависит от числа дополнительных атрибутов точек, указанных в параметре Выбор атрибутов, общего числа точек в каком-либо блоке и от числа обрабатываемых в каждом пакете блоков, как указано в параметре Размер пакета. Максимальное количество точек на блок определяется при экспорте обучающих данных, и это значение следует принимать при оценке потенциального объема памяти для операции обучения.
Опция Относительная высота параметра Выбор атрибутов добавляет атрибут, определяющий высоту точки относительно опорной поверхности, такой как модель рельефа голой земли. Использование этого атрибута может потенциально улучшить способность модели изучать направленные отношения в процессе обучения.

Параметры

Подпись	Описание	Тип данных
Входные обучающие данные	Обучающие данные облака точек (файл *.pctd), которые будут использованы для тренировки модели классификации.	File
Местоположение выходной модели	Существующая папка, в которой будет храниться новый каталог, содержащий модель глубокого обучения.	Folder
Имя выходной модели	Имя выходного файла определения модели Esri (.emd), пакета глубокого обучения (.dlpk) и каталог, который будет создан для их хранения.	String
Предварительно обученная модель (Дополнительный)	Предварительно обученная модель, которая будет доработана. Если указана предварительно обученная модель, входные обучающие данные должны иметь те же атрибуты, коды классов и максимальное количество точек, которые использовались обучающими данными, создавшими эту модель.	File
Выбор атрибутов (Дополнительный)	Задает атрибуты точек, которые будут использоваться для обучения модели. Доступны будут только те атрибуты, которые есть в обучающих данных облака точек. По умолчанию дополнительные атрибуты не включаются. Интенсивность—Будет использоваться мера величины отраженного сигнала импульса лидара. Номер отраженного сигнала—Будет использоваться порядковый номер точки, полученный из заданного сигнала импульса лидара. Количество отраженных сигналов—Будет использоваться общее количество отраженных лидаром сигналов, которые были идентифицированы как точки из импульса, связанного с заданной точкой. Красный канал—Будет использоваться значение в красном канале из облака точек с цветовой информацией. Зеленый канал—Будет использоваться значение в зеленом канале из облака точек с цветовой информацией. Синий канал—Будет использоваться значение в синем канале из облака точек с цветовой информацией. Ближний инфракрасный канал—Будет использоваться значение в ближнем инфракрасном канале из облака точек с информацией в ближнем инфракрасном диапазоне. Относительная высота—Будет использоваться высота каждой точки по относительно базовой поверхности, которой обычно является цифровая модель рельефа земной поверхности.	String
Минимальное количество точек на блок (Дополнительный)	Минимальное число точек, которое должно присутствовать в данном блоке, чтобы он использовался при обучении модели. Значение по умолчанию равно 0.	Long
Перекодировка классов (Дополнительный)	Определяет, как значения кодов классов будут сопоставлены с новыми значениями перед обучением Модели глубокого обучения.	Value Table
Коды классов интереса (Дополнительный)	Коды классов, которые будут для фильтрации блоков в обучающих данных. Если заданы коды классов интереса, все остальные коды классов будут пересчитаны на код класса фона.	Long
Код класса фона (Дополнительный)	Значение кода класса, которое будет использовано для всех остальных кодов классов, если указаны коды классов интереса.	Long
Описание класса (Дополнительный)	Описание каждого кода класса, представленного в обучающих данных.	Value Table
Критерии выборки модели (Дополнительный)	Определяет статистическое смещение, которое будет использовано для определения финальной модели. Потери проверки—Будет использована модель, получившая наименьший результат функции потерь энтропии, примененная к данным проверки. Полнота—Будет использована модель, получившая наилучшее общее среднее найденных значений для всех кодов классов. Каждое найденное значение кода класса определяется отношением точек, которые были корректно классифицированы (истинно положительные), и всех точек, которые были классифицированы по этому значению (ожидаемо положительные). Это значение по умолчанию Оценка F1—Будет использована модель, получившая наилучшее гармоническое среднее точности и найденных значений для всех кодов классов. Таким образом обеспечивается балан между точностью и полнотой найденных значений, что обеспечивает максимальную производительность. Точность—Будет использована модель, получившая наилучшую общую среднюю точность для всех кодов классов. Точность каждого кода класса определяется отношением точек, которые были корректно классифицированы (истинно положительные) и всех классифицированных точек (истинно положительные и ложно положительные). Точность—Будет использована модель, получившая максимальное отношение корректно классифицированных точек и всех точек в данных проверки.	String
Максимальное число эпох (Дополнительный)	Число раз, которое каждый блок данных будет передан вперед и назад через нейронную сеть. Значение по умолчанию равно 25.	Long
Итераций на период времени (%) (Дополнительный)	Процент данных, которые будут обработаны за каждую эпоху обучения. По умолчанию используется 100.	Double
Скорость обучения (Дополнительный)	Скорость, с которой существующая информация будет перезаписываться новыми данными. Если значение не задано, оптимальная скорость обучения будет извлечена из кривой обучения в процессе обучения. Используется по умолчанию.	Double
Размер пакета (Дополнительный)	Количество блоков обучающих данных, которые будут обработаны в любой момент времени. Значение по умолчанию равно 2.	Long
Остановка обучения, если модель более не улучшается. (Дополнительный)	Определяет, будет ли обучение модели остановлено, если метрика, указанная в параметре Критерии выбора модели, не регистрирует никаких улучшения по прошествии 5 последовательных эпох. Отмечено - обучение будет остановлено, если модель более не улучшается. Это значение по умолчанию Не отмечено - обучение модели будет продолжено, пока не будет достигнуто максимально возможное число эпох.	Boolean
Стратегия скорости обучения (Дополнительный)	Определяет, как будет изменяться скорость обучения во время обучения. Скорость одного цикла обучения—Скорость обучения будет циклически изменяться в течение каждой эпохи с использованием реализации Fast.AI методики 1cycle для обучения нейронных сетей, что поможет оптимизировать обучение сверточной нейронной сети. Используется по умолчанию. Фиксированная скорость обучения—На протяжении всего процесса обучения скорость обучения будет одинаковой.	String
Архитектура модели (Дополнительный)	Определяет архитектуру нейронной сети, которая будет использоваться для обучения модели. Если указывается предварительно обученная модель, архитектура, использованная для создания этой модели, будет задана автоматически. PointCNN—Будет использоваться архитектура PointCNN. RandLA-Net—Будет использоваться архитектура RandLA-Net. RandLA-Net построена на принципах простой случайной выборки и агрегирования локальных объектов. Semantic Query Network—Будет использоваться архитектура Semantic Query Network (SQN). SQN не требует комплексной классификации обучающих данных, как это делают другие архитектуры нейронных сетей. Point Transfomer V3—Будет использована архитектура Point Transformer V3. Это значение по умолчанию	String
Функция потерь (Дополнительный)	Определяет функцию потерь, которая будет использоваться во время обучения. Кросс энтропийная потеря—Будет использована кросс энтропийная потеря. Эта функция лучше всего подходит для обучающих данных, в которых каждый класс набирает сходное количество точек по сравнению с другими классами. Это значение по умолчанию Focal Loss—Будут использоваться фокальные потери. Эта функция лучше всего подходит для обучающих данных, в которых количество точек в разных классах, проходящих обучение, может сильно различаться.	String

Производные выходные данные

Подпись	Описание	Тип данных
Выходная модель	Результирующая модель, созданная этим инструментом.	File
Выходная статистика модели	Файл .csv, содержащий точность, полноту и оценки F1 для каждого кода класса и эпохи.	Text File
Выходная статистика эпохи	Файл .csv, содержащий потери при обучении, потери при проверке, точность, достовенность, отзыв и оценки F1, полученные в каждую эпоху.	Text File

arcpy.ddd.TrainPointCloudClassificationModel(in_training_data, out_model_location, out_model_name, {pretrained_model}, {attributes}, {min_points}, {class_remap}, {target_classes}, {background_class}, {class_descriptions}, {model_selection_criteria}, {max_epochs}, {epoch_iterations}, {learning_rate}, {batch_size}, {early_stop}, {learning_rate_strategy}, {architecture}, {loss_function})

Имя	Описание	Тип данных
in_training_data	Обучающие данные облака точек (файл *.pctd), которые будут использованы для тренировки модели классификации.	File
out_model_location	Существующая папка, в которой будет храниться новый каталог, содержащий модель глубокого обучения.	Folder
out_model_name	Имя выходного файла определения модели Esri (.emd), пакета глубокого обучения (.dlpk) и каталог, который будет создан для их хранения.	String
pretrained_model (Дополнительный)	Предварительно обученная модель, которая будет доработана. Если указана предварительно обученная модель, входные обучающие данные должны иметь те же атрибуты, коды классов и максимальное количество точек, которые использовались обучающими данными, создавшими эту модель.	File
attributes [attributes,...] (Дополнительный)	Задает атрибуты точек, которые будут использоваться для обучения модели. Доступны будут только те атрибуты, которые есть в обучающих данных облака точек. По умолчанию дополнительные атрибуты не включаются. INTENSITY—Будет использоваться мера величины отраженного сигнала импульса лидара. RETURN_NUMBER—Будет использоваться порядковый номер точки, полученный из заданного сигнала импульса лидара. NUMBER_OF_RETURNS—Будет использоваться общее количество отраженных лидаром сигналов, которые были идентифицированы как точки из импульса, связанного с заданной точкой. RED—Будет использоваться значение в красном канале из облака точек с цветовой информацией. GREEN—Будет использоваться значение в зеленом канале из облака точек с цветовой информацией. BLUE—Будет использоваться значение в синем канале из облака точек с цветовой информацией. NEAR_INFRARED—Будет использоваться значение в ближнем инфракрасном канале из облака точек с информацией в ближнем инфракрасном диапазоне. RELATIVE_HEIGHT—Будет использоваться высота каждой точки по относительно базовой поверхности, которой обычно является цифровая модель рельефа земной поверхности.	String
min_points (Дополнительный)	Минимальное число точек, которое должно присутствовать в данном блоке, чтобы он использовался при обучении модели. Значение по умолчанию равно 0.	Long
class_remap [class_remap,...] (Дополнительный)	Определяет, как значения кодов классов будут сопоставлены с новыми значениями перед обучением Модели глубокого обучения.	Value Table
target_classes [target_classes,...] (Дополнительный)	Коды классов, которые будут для фильтрации блоков в обучающих данных. Если заданы коды классов интереса, все остальные коды классов будут пересчитаны на код класса фона.	Long
background_class (Дополнительный)	Значение кода класса, которое будет использовано для всех остальных кодов классов, если указаны коды классов интереса.	Long
class_descriptions [class_descriptions,...] (Дополнительный)	Описание каждого кода класса, представленного в обучающих данных.	Value Table
model_selection_criteria (Дополнительный)	Определяет статистическое смещение, которое будет использовано для определения финальной модели. VALIDATION_LOSS—Будет использована модель, получившая наименьший результат функции потерь энтропии, примененная к данным проверки. RECALL—Будет использована модель, получившая наилучшее общее среднее найденных значений для всех кодов классов. Каждое найденное значение кода класса определяется отношением точек, которые были корректно классифицированы (истинно положительные), и всех точек, которые были классифицированы по этому значению (ожидаемо положительные). Это значение по умолчанию F1_SCORE—Будет использована модель, получившая наилучшее гармоническое среднее точности и найденных значений для всех кодов классов. Таким образом обеспечивается балан между точностью и полнотой найденных значений, что обеспечивает максимальную производительность. PRECISION—Будет использована модель, получившая наилучшую общую среднюю точность для всех кодов классов. Точность каждого кода класса определяется отношением точек, которые были корректно классифицированы (истинно положительные) и всех классифицированных точек (истинно положительные и ложно положительные). ACCURACY—Будет использована модель, получившая максимальное отношение корректно классифицированных точек и всех точек в данных проверки.	String
max_epochs (Дополнительный)	Число раз, которое каждый блок данных будет передан вперед и назад через нейронную сеть. Значение по умолчанию равно 25.	Long
epoch_iterations (Дополнительный)	Процент данных, которые будут обработаны за каждую эпоху обучения. По умолчанию используется 100.	Double
learning_rate (Дополнительный)	Скорость, с которой существующая информация будет перезаписываться новыми данными. Если значение не задано, оптимальная скорость обучения будет извлечена из кривой обучения в процессе обучения. Используется по умолчанию.	Double
batch_size (Дополнительный)	Количество блоков обучающих данных, которые будут обработаны в любой момент времени. Значение по умолчанию равно 2.	Long
early_stop (Дополнительный)	Определяет, будет ли обучение модели остановлено, если метрика, указанная в параметре model_selection_criteria, не регистрирует никаких улучшения по прошествии 5 последовательных эпох. EARLY_STOP—Обучение будет остановлено, если модель более не улучшается. Это значение по умолчанию NO_EARLY_STOP—Обучение модели будет продолжено, пока не будет достигнуто максимально возможное число эпох.	Boolean
learning_rate_strategy (Дополнительный)	Определяет, как будет изменяться скорость обучения во время обучения. ONE_CYCLE—Скорость обучения будет циклически изменяться в течение каждой эпохи с использованием реализации Fast.AI методики 1cycle для обучения нейронных сетей, что поможет оптимизировать обучение сверточной нейронной сети. Используется по умолчанию. FIXED—На протяжении всего процесса обучения скорость обучения будет одинаковой.	String
architecture (Дополнительный)	Определяет архитектуру нейронной сети, которая будет использоваться для обучения модели. Если указывается предварительно обученная модель, архитектура, использованная для создания этой модели, будет задана автоматически. POINTCNN—Будет использоваться архитектура PointCNN. RANDLANET—Будет использоваться архитектура RandLA-Net. RandLA-Net построена на принципах простой случайной выборки и агрегирования локальных объектов. SQN—Будет использоваться архитектура Semantic Query Network (SQN). SQN не требует комплексной классификации обучающих данных, как это делают другие архитектуры нейронных сетей. POINT_TRANSFORMER_V3—Будет использована архитектура Point Transformer V3. Это значение по умолчанию	String
loss_function (Дополнительный)	Определяет функцию потерь, которая будет использоваться во время обучения. CROSS_ENTROPY_LOSS—Будет использована кросс энтропийная потеря. Эта функция лучше всего подходит для обучающих данных, в которых каждый класс набирает сходное количество точек по сравнению с другими классами. Это значение по умолчанию FOCAL_LOSS—Будут использоваться фокальные потери. Эта функция лучше всего подходит для обучающих данных, в которых количество точек в разных классах, проходящих обучение, может сильно различаться.	String

Производные выходные данные

Имя	Описание	Тип данных
out_model	Результирующая модель, созданная этим инструментом.	File
out_model_stats	Файл .csv, содержащий точность, полноту и оценки F1 для каждого кода класса и эпохи.	Text File
out_epoch_stats	Файл .csv, содержащий потери при обучении, потери при проверке, точность, достовенность, отзыв и оценки F1, полученные в каждую эпоху.	Text File

Пример кода

TrainPointCloudClassificationModel, пример 1 (автономный скрипт)

В следующем примере показано использование этого инструмента в окне Python:

import arcpy

arcpy.env.workspace = "D:/Deep_Learning_Workspace"
arcpy.ddd.TrainPointCloudClassificationModel(
    "Powerline_Training.pctd", "D:/DL_Models", "Powerline", 
    attributes=['INTENSITY', 'RETURN_NUMBER', 'NUMBER_OF_RETURNS'],
    target_classes=[14, 15], background_class=1,
    class_descriptions=[[1, "Background"], [14, "Wire Conductor"], [15, "Transmission Tower"]],
    model_selection_criteria="F1_SCORE", max_epochs=10)

Параметры среды

Тип процессора, GPU ID

Информация о лицензиях

Basic: Обязательно 3D Analyst
Standard: Обязательно 3D Analyst
Advanced: Обязательно 3D Analyst

Связанные разделы

Отзыв по этому разделу?

Краткая информация

Использование

Параметры

Производные выходные данные

Производные выходные данные

Пример кода

Параметры среды

Информация о лицензиях

Связанные разделы

В этом разделе