Обучение модели преобразования текста (GeoAI)

ArcGIS Pro 3.4 | | Архив справки

Краткая информация

Обучает модель преобразования текста для преобразования, перевода или суммирования текста.

Более подробно о том, как работает инструмент Преобразовать текст

Использование

  • Для этого инструмента требуются установленные системы глубокого изучения. Чтобы настроить компьютер на работу в среде глубокого обучения в ArcGIS Pro, см. раздел Установка сред глубокого обучения для ArcGIS.

  • Этот инструмент также можно использовать для тонкой настройки существующей обученной модели.

  • Чтобы запустить этот инструмент с помощью графического процессора, установите для параметра Тип процессора значение GPU. Если у вас более одного графического процессора, вместо этого задайте параметр среды GPU ID.

  • Входными данными для этого инструмента являются таблица или класс объектов, которые содержат данные обучения, с текстовым полем, где хранится входной текст, и полем метки, где хранится преобразованный текст.

  • Этот инструмент использует опорные модели на основе преобразователей для обучения моделей преобразования текста, а также поддерживает контекстное обучение с подсказками с использованием Mistral LLM. Чтобы установить Mistral backbone, см. ArcGIS Mistral Backbone.

  • Информацию о требованиях к запуску этого инструмента и проблемах, с которыми вы можете столкнуться, см. в разделе Часто задаваемые вопросы по глубокому обучению.

Параметры

ПодписьОписаниеТип данных
Входная таблица

Класс объектов или таблица, который содержит текстовое поле с входным текстом для модели и поле меток с преобразованным текстом.

Feature Layer; Table View
Поле текста

Текстовое поле во входном классе или таблице, содержащее входной текст, который будет преобразован моделью.

Field
Поле меток

Текстовое поле во входном классе объектов или таблице, которое содержит преобразованный текст для обучения модели.

Field
Выходная модель

Местоположение выходной папки, в которой будет храниться обученная модель.

Folder
Файл предварительно обученной модели
(Дополнительный)

Предварительно обученная модель, которая будет использоваться для тонкой настройки новой модели. Входными данными является файл определения модели Esri (.emd) или файл пакета глубокого обучения (.dlpk).

Предварительно обученную модель, которая выполняет аналогичную задачу, можно дополнительно настроить, чтобы она соответствовала обучающим данным. Предварительно обученная модель должна быть обучена с тем же типом модели и опорной моделью, которые будут использоваться для обучения новой модели.

File
Максимальное число периодов времени
(Дополнительный)

Максимальное количество периодов времени, для которых будет обучаться модель. Максимальное значение эпохи, равное 1, означает, что набор данных будет передаваться через нейронную сеть один раз. Значение по умолчанию 5.

Long
Опорная модель
(Дополнительный)

Указывает предварительно настроенную нейронную сеть, которая будет использоваться в качестве архитектуры для обучения новой модели.

  • t5-smallНовая модель будет обучена с использованием нейронной сети T5. T5 - унифицированная среда, в которой каждая языковая задача конвертируется в формат текст-в-текст. t5-small - уменьшенный вариант T5.
  • t5-baseНовая модель будет обучена с использованием нейронной сети T5. T5 - унифицированная среда, в которой каждая языковая задача конвертируется в формат текст-в-текст. t5-base - базовый вариант T5.
  • t5-largeНовая модель будет обучена с использованием нейронной сети T5. T5 - унифицированная среда, в которой каждая языковая задача конвертируется в формат текст-в-текст. t5-large - максимальный вариант T5.
  • mistralМодель будет обучена с использованием большой языковой модели (LLM) Mistral. Mistral - это преобразование только декодирования, которое использует токенизаторы Sliding Window Attention, Grouped Query Attention и Byte-fallback BPE. Чтобы установить Mistral backbone, см. ArcGIS Mistral Backbone.
String
Размер пакета
(Дополнительный)

Количество обучающих выборок, которые будут обрабатываться за один раз. Значение по умолчанию – 2.

Увеличение размера пакета может улучшить производительность инструмента, но при этом увеличение размера пакета приводит к расходованию большего объема памяти. Если возникает ошибка нехватки памяти, используйте меньший размер пакета.

Double
Аргументы модели
(Дополнительный)

Дополнительные аргументы, которые будут использоваться для инициализации модели. Поддерживаемый аргумент модели — sequence_length, который используется для установки максимальной длины последовательности обучающих данных, которые будут учитываться при обучении модели.

Value Table
Скорость обучения
(Дополнительный)

Размер шага, показывающий, как можно настроить веса модели в ходе процесса обучения. Если значение не указано, оптимальная скорость обучения будет вычислена автоматически.

Double
Процент проверки
(Дополнительный)

Процент обучающих выборок, которые будут использоваться для проверки модели. Значение по умолчанию — 10 для опорных сетей на основе преобразователей и 50 для опорной сети Mistral.

Double
Завершить, когда модель перестанет улучшаться
(Дополнительный)

Определяет, остановится ли обучение модели, если модель больше не улучшается, или обучение продолжится до достижения значения параметра Максимальное число эпох.

  • Отмечено — обучение модели остановится, когда модель перестанет улучшаться, независимо от значения параметра Максимальное число эпох. Это значение по умолчанию
  • Не отмечено — обучение модели будет продолжено, пока не будет достигнуто значение Максимальное число эпох.
Boolean
Сделать опорную модель обучаемой
(Дополнительный)

Указывает, будут ли закреплены опорные слои в предварительно обученной модели, чтобы веса и смещения оставались такими, как они были изначально разработаны.

  • Отмечено — опорные слои не будут закреплены, а веса и смещения параметра Опорная модель могут быть изменены для соответствия обучающим выборкам. Это требует больше времени для обработки, но обычно дает лучшие результаты. Это значение по умолчанию
  • Не отмечено — опорные слои будут закреплены, а предопределенные веса и смещения в значении параметра Опорная модель не будут изменены в ходе обучения.

Boolean
Удалить теги HTML
(Дополнительный)

Определяет, будут ли теги HTML удалены из входного текста.

  • Отмечено — теги HTML будут удалены из входного текста. Это значение по умолчанию
  • Не отмечено — теги HTML не будут удалены из входного текста.

Boolean
Удалить URL
(Дополнительный)

Определяет, будут ли адреса URL удалены из входного текста.

  • Отмечено — адреса URL будут удалены из входного текста. Это значение по умолчанию
  • Не отмечено — адреса URL не будут удалены из входного текста.

Boolean
Запрос
(Дополнительный)

Определенные входные данные или инструкция, передаваемая большой языковой модели (LLM) для генерации ожидаемого результата.

Значение по умолчанию - Преобразовать введенный текст из текстового поля в преобразованный текст, присутствующий в поле метки.

String

Параметры среды

Информация о лицензиях

  • Basic: Нет
  • Standard: Нет
  • Advanced: Да

Связанные разделы