Классификация

Доступно с лицензией Image Analyst.

Доступно с лицензией Spatial Analyst.

Классификация изображения

При использовании инструмента Классифицировать для классификации пикселов или объектов в наборе растровых данных можно выбрать технику классификации с обучением или без обучения. Чтобы отобразить инструмент Классифицировать, выберите растр, который необходимо классифицировать, на панели Содержание, а затем на вкладке Изображения щелкните стрелку раскрывающегося списка Инструменты классификации.

Чтобы выполнить классификацию с обучением, вам понадобится файл обучающих выборок. Вы можете создать обучающие выборки с помощью Менеджера обучающих выборок в раскрывающемся списке Инструменты классификации или выбрать существующий файл обучающих выборок. Это могут быть либо шейп-файлы, либо классы объектов, которые содержат ваши обучающие выборки. В файле обучающей выборки должны быть поля со следующими именами:

  • classname – текстовое поле с указанием имени категории класса.
  • classvalue – поле типа long integer, содержащее целочисленное значение для каждой категории класса

Для анализа изображения на основе объектов необходимо предоставить сегментированное изображение. Вы можете создать сегментированное изображение с помощью инструмента Сегментация в ниспадающем списке Инструменты классификации.

Для классификации данных доступно пять Классификаторов:

  • Изокластер – классификатор Изокластер выполняет классификацию без обучения. Этот классификатор может обрабатывать очень большие сегментированные изображения, атрибутивная таблица которых может оказаться большой. Кроме того, этот инструмент может принимать сегментированный растр RGB из стороннего приложения. Инструмент работает со стандартными, поддерживаемыми Esri растровыми файлами, а также с сегментированными наборами растровых данных.
  • Максимальное подобие – классификатор Максимальное подобие является обычным методом классификации изображений. Он основан на двух принципах: 1) значения пикселов в выборке для каждого класса в многомерном пространстве подчиняются закону нормального распределения; 2) для принятия решений используется теорема Байе.
  • Произвольные деревья – классификатор произвольных деревьев является мощным механизмом классификации изображений, устойчивым к чрезмерной подгонке и способным работать с сегментированными изображениями и другими дополнительными наборами растровых данных. Для стандартных входных изображений, инструмент принимает многоканальные изображения любой битовой глубины и выполняет классификацию методом произвольных деревьев по пикселам на основе входного файла обучающих объектов.
  • Метод опорных векторов (SVM) – классификатор Метод опорных векторов обеспечивает полнофункциональный метод классификации с обучением, который способен обрабатывать сегментированные растровые входные данные или стандартные изображения. Данный метод менее восприимчив к шуму, коррелированным каналам и несбалансированному количеству и размеру обучающих местоположений в пределах каждого класса. Этот метод классификации широко используется исследователями.
  • Обучение классификатора K-ближайших соседей. Классификатор K-ближайших соседей - это непараметрический метод классификации, который классифицирует пиксел или сегмент по множеству голосов его соседей. K - определенное количество соседей, используемых при голосовании.

Типы доступных для инструмента Классификация изображений описаны ниже.

Изокластер

Выполнить классификацию без обучения, используя алгоритм Изокластер, который определяет характеристики естественного группирования ячеек в многомерном пространстве атрибутов.

Имя параметраОписание

Максимальное количество классов

Максимальное количество требуемых классов для группировки пикселов или сегментов. Его следует задавать на основе числа классов в легенде.

Возможно, что вы получите меньше классов, чем указано этим параметром. Если необходимо больше классов, увеличьте это значение и агрегируйте классы после завершения процесса обучения.

Максимальное количество итераций

Максимальное число итераций для запуска процесса кластеризации.

Рекомендованный диапазон находится между 10 и 20 итерациями. Увеличение этого значения линейно увеличивает время обработки.

Максимальное число слияний кластеров на итерацию

Максимальное число слияний кластеров. При увеличении числа слияний число создаваемых классов уменьшится. Меньшее значение приведет к созданию большего числа классов.

Максимальное расстояние слияния

Увеличение расстояния сделает возможным слияние большего числа кластеров, что позволит получить меньше классов. Меньшее значение приведет к созданию большего числа классов.

Природа расстояния является спектральной и основана на цветах RGB. Например, расстояние между пикселами со значениями RGB 100, 100, 100 удалено на 50 от пиксела со значениями RGB 100, 130, 120. Хотя вы можете выбрать любое значение, значения в диапазоне от 0 до 5 позволяют получить наилучшие результаты.

Минимальное число выборок в кластере

Минимальное число пикселов или сегментов в действительном кластере или классе.

Показано, что значение 20, используемое по умолчанию, эффективно при создании статистически значимых классов. Вы можете увеличить это число, чтобы получить более точные классы; однако это может ограничить общее число создаваемых классов.

Коэффициент пропуска

Максимальное число пропускаемых пиксел для входного пиксельного изображения. Если входным изображением является сегментированное, укажите число пропускаемых сегментов.

Сегментированное изображение

Дополнительно введите сегментированное изображение, чтобы выполнить классификацию на базе объекта.

Атрибуты сегмента

Если вы используете сегментированное изображение, можно выбрать, какие из его атрибутов будут использоваться:

  • Цвет средней хроматичности – цвет средней хроматичности по каждому сегменту.
  • Среднее число – средний цифровой номер (DN), выведенный из дополнительного пиксельного изображения, на основе каждого сегмента.
  • Стандартное отклонение – стандартное отклонение, полученное из дополнительного пиксельного изображения, по каждому сегменту.
  • Число пикселов – число пикселов, составляющих сегмент, по каждому сегменту.
  • Компактность – степень, согласно которой сегмент является компактным или круглым, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует кругу.
  • Прямоугольность – степень, в которой сегмент является прямоугольным, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует прямоугольнику.

Выходной классифицированный набор данных

Выберите имя и расположение выходных классифицированных данных.

Выходной файл определения классификатора

Это файл JSON, который содержит информацию об атрибутах, статистику, гиперплоскостные векторы и другую информацию, необходимую для классификатора. Создается файл с расширением .ecd.

Максимальное подобие

Выполнить классификацию по методу максимального правдоподобия, основанную на двух принципах: значения пикселов в выборке для каждого класса в многомерном пространстве подчиняются закону нормального распределения, и для принятия решений используется теорема Байе.

Имя параметраОписание

Обучающие выборки

Выберите файл обучающей выборки или слой, который определяет районы обучающей выборки. Это могут быть либо шейп-файлы, либо классы объектов, которые содержат ваши обучающие выборки.

Сегментированное изображение

Дополнительно введите сегментированное изображение, чтобы выполнить классификацию на базе объекта.

Атрибуты сегмента

Если вы используете сегментированное изображение, можно выбрать, какие из его атрибутов будут использоваться:

  • Цвет средней хроматичности – цвет средней хроматичности по каждому сегменту.
  • Среднее число – средний цифровой номер (DN), выведенный из дополнительного пиксельного изображения, на основе каждого сегмента.
  • Стандартное отклонение – стандартное отклонение, полученное из дополнительного пиксельного изображения, по каждому сегменту.
  • Число пикселов – число пикселов, составляющих сегмент, по каждому сегменту.
  • Компактность – степень, согласно которой сегмент является компактным или круглым, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует кругу.
  • Прямоугольность – степень, в которой сегмент является прямоугольным, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует прямоугольнику.

Выходной классифицированный набор данных

Выберите имя и расположение выходных классифицированных данных.

Выходной файл определения классификатора

Это файл JSON, который содержит информацию об атрибутах, статистику, гиперплоскостные векторы и другую информацию, необходимую для классификатора. Создается файл с расширением .ecd.

Классификатор произвольного дерева

Выполняет классификацию произвольных деревьев, при которой используются деревья решений, получаемые при использовании небольших изменений данных обучающей выборки. При классификации выборки наибольшее из обучающих деревьев выбирается в выходной класс. Этот набор деревьев менее уязвим для чрезмерной подгонки данных, чем отдельное дерево.

Имя параметраОписание

Обучающие выборки

Выберите файл обучающей выборки или слой, который определяет районы обучающей выборки. Это могут быть либо шейп-файлы, либо классы объектов, которые содержат ваши обучающие выборки.

Максимальное количество деревьев

Максимальное количество деревьев в лесу. Увеличение числа деревьев приведет к большей точности оценки, но в какой-то момент эти улучшения сойдут на нет. Число деревьев пропорционально увеличивает время обработки.

Максимальная глубина дерева

Максимальная глубина каждого дерева в лесу. Глубина - другой способ задания количества правил, допустимых для каждого создаваемого дерева, с целью принятия решения. Деревья не будут расти глубже этого параметра.

Максимальное число выборок в классе

Максимальное количество образцов для определения каждого класса.

Когда входными данными являются несегментированные растры, то рекомендуется использовать значение по умолчанию, равное 1000.

Значение, которое меньше или равно 0, означает, что система будет использовать все образцы из обучающих местоположений для обучения классификатора.

Сегментированное изображение

Дополнительно введите сегментированное изображение, чтобы выполнить классификацию на базе объекта.

Атрибуты сегмента

Если вы используете сегментированное изображение, можно выбрать, какие из его атрибутов будут использоваться:

  • Цвет средней хроматичности – цвет средней хроматичности по каждому сегменту.
  • Среднее число – средний цифровой номер (DN), выведенный из дополнительного пиксельного изображения, на основе каждого сегмента.
  • Стандартное отклонение – стандартное отклонение, полученное из дополнительного пиксельного изображения, по каждому сегменту.
  • Число пикселов – число пикселов, составляющих сегмент, по каждому сегменту.
  • Компактность – степень, согласно которой сегмент является компактным или круглым, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует кругу.
  • Прямоугольность – степень, в которой сегмент является прямоугольным, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует прямоугольнику.

Выходной классифицированный набор данных

Выберите имя и расположение выходных классифицированных данных.

Выходной файл определения классификатора

Это файл JSON, который содержит информацию об атрибутах, статистику, гиперплоскостные векторы и другую информацию, необходимую для классификатора. Создается файл с расширением .ecd.

Метод опорных векторов

Выполнение классификации методом опорных векторов, которая из входных векторов данных создает карту многомерного пространства признаков для оптимального разделения данных в различные классы. Метод опорных векторов может обрабатывать очень большие изображения, менее восприимчив к шуму, коррелированным каналам и несбалансированному количеству и размеру обучающих местоположений в пределах каждого класса.

Имя параметраОписание

Обучающие выборки

Выберите файл обучающей выборки или слой, который определяет районы обучающей выборки. Это могут быть либо шейп-файлы, либо классы объектов, которые содержат ваши обучающие выборки.

Максимальное число выборок в классе

Максимальное количество образцов для определения каждого класса.

Когда входными данными являются несегментированные растры, то рекомендуется использовать значение по умолчанию 500.

Значение, которое меньше или равно 0, означает, что система будет использовать все образцы из обучающих местоположений для обучения классификатора.

Сегментированное изображение

Дополнительно введите сегментированное изображение, чтобы выполнить классификацию на базе объекта.

Атрибуты сегмента

Если вы используете сегментированное изображение, можно выбрать, какие из его атрибутов будут использоваться:

  • Цвет средней хроматичности – цвет средней хроматичности по каждому сегменту.
  • Среднее число – средний цифровой номер (DN), выведенный из дополнительного пиксельного изображения, на основе каждого сегмента.
  • Стандартное отклонение – стандартное отклонение, полученное из дополнительного пиксельного изображения, по каждому сегменту.
  • Число пикселов – число пикселов, составляющих сегмент, по каждому сегменту.
  • Компактность – степень, согласно которой сегмент является компактным или круглым, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует кругу.
  • Прямоугольность – степень, в которой сегмент является прямоугольным, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует прямоугольнику.

Выходной классифицированный набор данных

Выберите имя и расположение выходных классифицированных данных.

Выходной файл определения классификатора

Это файл JSON, который содержит информацию об атрибутах, статистику, гиперплоскостные векторы и другую информацию, необходимую для классификатора. Создается файл с расширением .ecd.

К ближайших соседей

Выполняет непараметрический метод классификации, который классифицирует пиксел или сегмент по множеству голосов его соседей. K - определенное количество соседей, используемых при голосовании.

Имя параметраОписание

Обучающие выборки

Выберите файл обучающей выборки или слой, который определяет районы обучающей выборки. Это могут быть либо шейп-файлы, либо классы объектов, которые содержат ваши обучающие выборки.

Поле значения измерения

Содержит значения измерений во входном классе объектов обучающей выборки.

Этот параметр требуется для классификации растровых данных временных рядов с помощью выходного растра анализа изменений из инструмента Анализ изменений с помощью CCDC.

K ближайших соседей

Количество соседей, которые будут использоваться при поиске каждого входного пиксела или сегмента. Увеличение числа соседей уменьшит влияние каждого отдельного соседа на результат классификации. Значение по умолчанию равно 1.

Максимальное число выборок в классе

Максимальное число образцов в классе, которые будут использоваться для каждого класса. Когда входными данными являются несегментированные растры, то рекомендуется использовать значение по умолчанию, равное 1000. Значение, которое меньше или равно 0, означает, что система будет использовать все образцы из обучающих местоположений для обучения классификатора.

Сегментированное изображение

Дополнительно введите сегментированное изображение, чтобы выполнить классификацию на базе объекта.

Атрибуты сегмента

Если вы используете сегментированное изображение, можно выбрать, какие из его атрибутов будут использоваться:

  • Цвет средней хроматичности – цвет средней хроматичности по каждому сегменту.
  • Среднее число – средний цифровой номер (DN), выведенный из дополнительного пиксельного изображения, на основе каждого сегмента.
  • Стандартное отклонение – стандартное отклонение, полученное из дополнительного пиксельного изображения, по каждому сегменту.
  • Число пикселов – число пикселов, составляющих сегмент, по каждому сегменту.
  • Компактность – степень, согласно которой сегмент является компактным или круглым, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует кругу.
  • Прямоугольность – степень, в которой сегмент является прямоугольным, по каждому сегменту. Значения находятся в диапазоне от 0 до 1, где 1 соответствует прямоугольнику.

Выходной классифицированный набор данных

Выберите имя и расположение выходных классифицированных данных.

Выходной файл определения классификатора

Это файл JSON, который содержит информацию об атрибутах, статистику, гиперплоскостные векторы и другую информацию, необходимую для классификатора. Создается файл с расширением .ecd.

Дополнительные методы классификации и распознавание образов

Дополнительные методы классификации и распознавание образов включены в набор инструментов Image Analyst, как описано ниже.

  • Классификация растра с использованием спектра — классифицирует многоканальный набор растровых данных с использованием спектральных методов сопоставления изображений, основанные либо на угле вектора, либо на расхождении спектральной информации между входным изображением и эталонным спектральным профилем. Выходные данные содержат классифицированный растр, файл определения классификатора и растр оценки. Выходной растр оценки - это многоканальный растр, хранящий соответствующие результаты для каждого конечного участника.
  • Регрессионная модель произвольных деревьев с обучением - моделирует отношения между независимыми переменными и целевым набором данных (зависимой переменной). Инструмент может использоваться для обучения различных типов данных. Входными растрами (независимыми переменными) может быть один растр или список растров, одноканальных или многоканальных, в которых каждый канал является независимой переменной, многомерным растром, в котором переменные являются независимыми переменными, или комбинацией этих типов данных.

    Выходные данные включают следующее:

    • таблицу, которая содержит информацию, описывающую значимость каждой независимой переменной, использованной при создании модели.
    • точечные диаграммы обучающих данных, тестовых данных и тестовых данных местоположений
    • определение регрессии (.ecd), которое содержит информацию об атрибутах, статистику и другую информацию, необходимую для классификатора

  • Прогнозировать, используя регрессионную модель - прогнозирует значения данных с помощью выходных данных инструмента Регрессионная модель произвольных деревьев с обучением. Выходными данными является растр прогнозируемых значений.

Связанные разделы