Прогнозирование только присутствия (MaxEnt) (Пространственная статистика)

Краткая информация

Моделирует присутствие явления на основании известных местоположений присутствия и независимых переменных, используя подход максимальной энтропии (MaxEnt) Инструмент создает выходные объекты и растры, которые включают вероятность присутствия, и он применяется к тем задачам, где присутствие явления известно, а отсутствие неизвестно.

Более подробно о том, как работает Прогнозирование только присутствия (MaxEnt)

Иллюстрация

Иллюстрация инструмента Прогнозирование только присутствия (MaxEnt)

Использование

  • Инструмент работает с тремя основными входными элементами для создания модели прогнозирования присутствия: известные местоположения присутствия, область изучения, где присутствие возможно, и независимые переменные.

    • Параметр Входные точечные объекты используется для определения известных местоположений присутствия изучаемого явления.
    • Область изучения характеризуется точками фона. Точки фона - это местоположения, распределенные по изучаемой области, где присутствие интересующего явления возможно, но неизвестно. Они могут создаваться инструментом автоматически, или вручную добавляться во входные точечные объекты включением параметра Содержит точки фона.
    • Инструмент использует независимые переменные в виде растров, полей или объектов расстояния.

  • Инструмент можно запустить с одной из двух моделей, которые определяются параметром Содержит точки фона:

    • Не отмечено - инструмент будет запущен в режиме только точки присутствия и будет использовать в качестве независимых переменных только растры.
    • Отмечено - инструмент будет запущен с использованием точек присутствия и фона, и допускает такие источники независимых переменных, как растры, поля и объекты расстояния.

  • Для использования растров в качестве входных данных или выходных данных инструмента требуется лицензия ArcGIS Spatial Analyst extension.

  • Параметр Выходной файл обученной модели можно использовать для сохранения результатов обученной модели в виде файла многократного использования. Инструмент Прогнозировать, используя файл модели пространственной статистики можно использовать для прогнозирования новых объектов с использованием файла модели.

  • Для выполнения инструмента и построения модели необходимо, как минимум, две точки присутствия. Если входные объекты содержат точки фона, инструменту также необходимо, как минимум, две точки фона для построения модели.

  • Параметр Независимые обучающие объекты расстояния не активен, если параметр Содержит точки фона не отмечен. Для добавления расстояний до объектов в качестве независимых переменных для данных только присутствия, можно вычислить растры расстояния с помощью инструментов Накопление расстояния, и включите их в параметр Независимые обучающие растры.

  • Пространственное разрешение Независимых обучающих растров важно по следующим причинам:

    • Размер ячейки имеет существенное влияние на время обработки. Чем выше разрешение растра, тем больше время обработки.
    • Инструмент будет использовать центроиды ячеек растра для создания точек фона если параметр Содержит точки фона не отмечен. Соотношение точек фона к точкам присутствия влияет на модель; рекомендуется учитывать размер ячейки растровых данных и анализировать результирующие точки фона, с использованием параметра Выходные обученные объекты, чтобы убедиться, что ваши предположения по области изучения соответствуют вопросу.
      Примечание:

      Для понижения пространственного разрешения независимых обучающих растров можно использовать инструмент Изменить разрешение.

  • Заданная изучаемая область, либо с помощью параметра Изучаемая область, либо на основании местоположений входных точечных объектов, которые включают точки фона, влияет на результат модели. Указанный экстент определяет, какие ячейки растра будут использованы в качестве точек фона. Это определяет условия среды, которые сравниваются с условиями присутствия, и, таким образом, устанавливается относительная частота встречаемости, влияющая на результаты прогнозирования.

  • Используйте параметр Относительный вес присутствия к фону для определения значимости точек фона. Используйте значение 100, если точки фона представляют местоположения с неизвестным присутствием. Используйте значение 1, если точки фона представляют местоположения с наблюдаемым отсутствием.

    • Значение влияет на обработку модели, и на результирующие прогнозирования. Если значение близко к 100, модель определяет каждую неверно классифицированную точку присутствия в 100 раз больше, чем каждую неверно классифицированную точку фона (предполагая, что верная классификация точки фона - отсутствие), и применяется традиционный подход MaxEnt. Если значение равно 1, модель определяет каждую точку присутствия и фона одинаково, и процесс подобен логистической регрессии.
    • Значение 1 следует использовать с осторожностью в режиме только присутствия (параметр Содержит точки фона отключен), так как инструмент создает точки фона, которые интерпретируются как отсутствие, и им присваивается равный вес с точками присутствия.

  • Смещение выборки присуще большинству данных присутствия и влияет на результаты анализа. Чтобы снизить этот эффект, вы можете использовать параметр Пространственное прореживание. Но, хотя пространственное прореживание является действенным способом устранения влияния смещения выборки, рекомендуется использовать данные структурированных обследований для минимизации последствий смещения выборки.

  • Диагностики классификации доступны из сообщений геообработки и в диаграмме Процент результатов классификации, которая есть в результирующем слое, указанном в параметре Выходные обученные объекты. Диаграмма показывает результат сравнения наблюдаемой и прогнозируемой классификаций, и может быть использована для оценки способности модели в производительности прогнозирования известных точек присутствия. Например, вы можете оценить пригодность модели для прогнозирования присутствия, в частности, частей неверно классифицированных точек присутствия в обучающих входных точечных объектах. В случае, если важно прогнозирование присутствия точек фона, диаграмму также можно использовать для просмотра и выбора точек фона, которые прогнозируются как точки присутствия.

  • Инструмент можно использовать двумя способами. Вы можете сфокусироваться на обучении и оценке моделей-кандидатов, или на прогнозировании возможности присутствия в новом наборе данных.

    • Обучение и оценка моделей-кандидатов — запустите инструмент без оказания опций для анализа диагностик модели, включенных в сообщения геообработки. Если результаты диагностики выглядят подходящими, укажите Выходные обученные объекты и используйте диаграмму диагностик классификаций для будущей оценки производительности прогнозирования в обучающих данных. Диаграммы, включенные в Выходную таблицу чувствительности и Выходную таблицу кривой ответов, являются метриками диагностики для обучающих данных и их также можно использовать для настройки и поиска подходящей модели.
    • Прогнозирование — укажите параметры в Результатах прогнозирования для применения модели к новым местоположениям, не являющимся частью обучающих данных. Параметры Входные объекты прогнозирования и результирующие Выходные объекты прогнозирования представляют новые точечные местоположения, в которых требуется прогнозирование. В дополнение к точечным объектам можно создать поверхность прогнозирования, указав параметр Выходной растр прогнозирования. Объекты прогнозирование и растры прогнозирования должны использоваться в комплексе, с совпадающими независимыми переменными, в той же форме, которая применялась в обучающих данных (растрах, полях и объектах расстояний).

  • Пространственное прореживание может привести к тому, что в обучающих данных будут не все входные точечные объекты. Чтобы протестировать производительность модели по всем точкам, если применялось пространственное прореживание, укажите одинаковый класс объектов для Входных точечных объектов и Входных объектов прогнозирования.

  • Инструмент определяет систему координат выходных наборов данных, поддерживая систему координат набора классов объектов, указанного в выходном пути. Или инструмент будет использовать систему координат, указанную в параметре среды Выходная система координат. Если вы не указали набор классов объектов или параметр среды, инструмент использует следующий подход для каждого выходного набора:

    • Для Выходных обучающих объектов и Выходных обучающих растров инструмент будет использовать систему координат из Входных точечных объектов.
    • Для Выходных объектов прогнозирования инструмент будет использовать систему координат из Входных объектов прогнозирования.
    • Для Выходные растров прогнозирования инструмент будет использовать систему координат из Входных объектов прогнозирования. Если Выходные объекты прогнозирования не указаны, инструмент будет использовать систему координат первого растра, указанного в параметре Сопоставление независимых растров.

  • Для параметра Расширения объясняющей переменной (Базисные функции) есть ограничения. Опции Сглаженный шаг (Петля) и Дискретный шаг (Порог) взаимоисключающие - если выбрана одна, вторая не может быть указана. Если независимая переменная указана как Категорийная, может использоваться только опция Исходный (Линейный).

  • Если параметр Схема пересчета установлен на Произвольный, инструмент будет группировать данные и проверять производительность модели на поднаборе группированных данных. Для каждой обучающей группы соблюдаются те же требования, что и для основной модели - необходимо, как минимум, две точки присутствия и две точки фона. Если требования не соблюдены после 10 попыток, инструмент прекратит выполнять перекрестную проверку и выдаст предупреждение, что перекрестная проверка невозможна.

Параметры

ПодписьОписаниеТип данных
Входные точечные объекты

Точечные объекты, представляющие местоположения, где присутствие интересующего явления известно.

Feature Layer
Содержит точки фона
(Дополнительный)

Указывает, содержат ли входные точечные объекты точки фона.

Если входные точечные объекты не содержат точки фона, инструмент создаст точки фона, используя ячейки независимых обучающих растров. Инструмент использует точки фона для моделирования характеристик ландшафта в неизвестных местоположениях и сравнения их с характеристиками ландшафта в известных местоположениях. То есть точки фона определяют область изучения. В общем, это местоположения, где присутствие интересующего явления известно. Тем не менее, если какая-либо информация о точках фона известна, можно использовать параметр Относительный вес присутствия к фону для указания этой информации.

  • Отмечено - входные точечные объекты содержат точки фона.
  • Не отмечено - входные точечные объекты не содержат точки фона. Это значение по умолчанию
Boolean
Поле индикатора присутствия
(Дополнительный)

Поле входных точечных объектов, содержащие бинарные значения, указывающие, является ли точка присутствием (1) или фоном (0). Поле должно быть числовым (короткое целое, длинное целое, с плавающей точкой, двойной точности)

Field
Независимые переменные обучения
(Дополнительный)

Список полей, представляющих независимые переменные, которые помогут прогнозировать вероятность присутствия. Вы можете указать, является ли переменная категорийной или числовой. Включите опцию Категорийная для любых переменных, которые представляют классы или категории.

Value Table
Независимые объекты расстояния обучения
(Дополнительный)

Список векторных слоев или классов объектов, которые используются для автоматического создания независимых переменных, представляя расстояние от входных точечных объектов до ближайших объектов расстояния. Если входные независимые обучающие объекты расстояния являются полигонами или линиями, атрибуты расстояния вычисляются как расстояние между ближайшими сегментом и точкой.

Feature Layer
Независимые обучающие растры
(Дополнительный)

Список растров, которые будут использованы для автоматического создания в модели независимых обучающих переменных, значения которых извлекаются из растров. Для каждого объекта (точек присутствия или фона) во входных точечных объектах значение ячейки растра извлекается в именно в этом местоположении.

Билинейный пересчет растра используется, если значение растра извлекается из непрерывных растров. Метод ближайшего соседа используется, если значение растра извлекается из категориальных растров.

Вы можете указать, является ли значение растра категорийным или числовым. Включите опцию Категорийная для каждого растра, который представляют классы или категории (например почвенно-растительный покров).

Value Table
Расширения независимой переменной (базисные функции)
(Дополнительный)

Указывает базисную функцию, которая будет использована для преобразования указанных независимых переменных, используемых в модели. Если выбрано несколько базисных функций, инструмент попытается выполнить преобразование нескольких переменных для использования их в модели.

  • Исходный (Линейный)Будет применено линейное преобразование к входным переменным. Используется по умолчанию
  • Попарное взаимодействие (Продукт)Будет использоваться попарное умножение для непрерывных независимых переменных, что приведет к взаимодействию переменных. Применение этой опции возможно только при использовании нескольких независимых переменных.
  • Сглаженный шаг (Петля)Непрерывные значения независимых переменных буду конвертированы в два сегмента, статический сегмент (состоящий их 0 и 1), и сегмент линейной функции (возрастающий или уменьшающийся)
  • Дискретный шаг (Порог)Непрерывные значения независимых переменных буду конвертированы в бинарную переменную , состоящую из 0 и 1.
  • В квадрате (Квадратический)Возвращается квадрат каждого значения независимой переменной.
String
Число узлов
(Дополнительный)

Число узлов, которое будет использовано расширениями независимой переменной Петля или Порог Значение определяет количество создаваемых пороговых значений, которые используются для создания нескольких расширений независимых переменных с использованием каждого порога. Значение должно быть в диапазоне от 2 до 50. Значение по умолчанию равно 10.

Long
Область изучения
(Дополнительный)

Указывает тип области изучения, который будет использован для определения, где присутствие возможно, если входные точечные объекты не содержат точки фона.

  • Выпуклая оболочкаБудет использован наименьший выпуклый полигон, включающий все точки присутствия входных точечных объектов. Используется по умолчанию
  • Экстент растраБудет использован экстент пересечения всех независимых обучающих растров.
  • Полигональная область изученияБудет использована пользовательская изучаемая область, задаваемая классом полигональных объектов.
String
Полигон изучаемой области
(Дополнительный)

Класс объектов, содержащий полигоны, которые определяют пользовательскую изучаемую область. Входные точечные объекты должны быть расположены в пределах пользовательской изучаемой области, покрываемой полигональными объектами. Изучаемая область состоит из нескольких полигонов.

Feature Layer
Применить пространственное прореживание
(Дополнительный)

Устанавливает, будет ли пространственное прореживание применено к точкам присутствия и фона перед обучением модели.

Пространственное прореживание помогает снизить смещение выборки путем удаления точек и проверки того, что оставшиеся точки содержат минимальное расстояние ближайшего соседства, установленное в параметре Минимум ближайших соседей. Пространственное прореживание также применяется к точкам фона, независимо от того, указываются ли они как входные точечные объекты, или создаются инструментом.

  • Отмечено - пространственное прореживание будет применено.
  • Не отмечено - пространственное прореживание не будет применено. Это значение по умолчанию
Boolean
Минимальное расстояние ближайшего соседства
(Дополнительный)

Минимальное расстояние между двумя любыми точками присутствия или фона, если применено пространственное прореживание.

Linear Unit
Число итераций прореживания
(Дополнительный)

Число запусков, которое будетиспользовано для поиска оптимального решения пространственного прореживания, возвращаясь к началу с настолько минимальным количеством точек присутствия и фона, насколько возможно, пока не будет достигнуто состояние, при котором в пределах Минимального расстояния ближайшего соседства не будет двух точек присутствия или двух точек фона. Минимально возможное число итераций - 1, а максимально - 50. Значение по умолчанию равно 10.

Этот параметр применяется только для пространственного прореживания, используемого для точек присутствия и фона во входных точечных объектах. Пространственное прореживание, применяемое к точкам фона, созданным из ячеек растра, к которым применено пространственное прореживание путем пересчета ячеек растра в указанное значение параметра Минимальное ближайшее расстояние без необходимости повторения для оптимального решения.

Long
Относительный вес присутствия к фону
(Дополнительный)

Значение от 1 до 100, которое указывает относительный вес информации о точке присутствия к точке фона. По умолчанию используется 100.

Более высокое значение указывает на то, что точки присутствия являются главным источником информации; неизвестно, представляют ли точки фона присутствие или отсутствие, и точки фона получают меньший вес в модели. Более низкое значение указывает на то, что точки фона также дополняют информацию, которая может использоваться в комбинации с информацией о точках присутствия; есть высокая вероятность, что точки фона представляют отсутствие, и эта информация может использовать в модели для указания местоположений отсутствия.

Long
Преобразование вероятности присутствия (функция связи)
(Дополнительный)

Определяет функцию, которая преобразует неограниченные выходные данные модели в число от 0 до 1. Значение можно интерпретировать как вероятность присутствия в местоположении. Каждая опция конвертирует одно и то же непрерывное значение в разную вероятность.

  • C-log-logФункция C-log-log будет использована для конвертации прогнозирований в вероятности. Рекомендуется использовать эту опцию, если местоположение и наличие явления явно и без неопределенности, например, если точки присутствия представляют местоположения произрастания видов растений. Это значение по умолчанию
  • ЛогистическийФункция Logistic будет использована для конвертации прогнозирований в вероятности. Рекомендуется использовать эту опцию, если местоположение и наличие явления не определено, например, если точки присутствия представляют местоположения мигрирующих видов животных.
String
Предельное значение вероятности присутствия
(Дополнительный)

Предельное значение между 0.01 и 0.99, которое определяет, какие вероятности соответствуют присутствию в результирующей классификации. Предельное значение используется для оценки производительности модели с помощью обучающих данных и известных точек присутствия. Диагностики классификации доступны из сообщений геообработки и в выходных обученных объектах.

Double
Выходные обученные объекты
(Дополнительный)

Выходной класс объектов, который будет содержать все объекты и независимые переменные, используемые в обучении модели.

Feature Class
Выходной обученный растр
(Дополнительный)

Выходной растр со значениями ячеек, указывающими на вероятность присутствия, вычисленную с помощью выбранной функцией связи. По умолчанию в качестве размера ячейки используется максимальный размер ячеек входных независимых обучающих растров. Выходной обученный растр создается только если входные точечные объекты не содержат точки фона.

Raster Dataset
Выходная таблица кривой ответов
(Дополнительный)

Выходная таблица, которая будет содержать диагностики обучающей модели, отражающие вклад каждой независимой переменной в вероятность присутствия после учета усредненных эффектов всех независимых переменных в модели.

К таблице могут быть добавлены до двух диаграмм частичной зависимости: набор линейных графиков для непрерывных переменных, и набор столбчатых диаграмм для категорийных переменных.

Table
Выходная таблица чувствительности
(Дополнительный)

Выходная таблица, которая будет содержать диагностики точности обучающей модели, выраженные через предельное значение вероятности присутствия, меняющееся от 0 до 1.

Table
Входные объекты прогнозирования
(Дополнительный)

Класс объектов, представляющих местоположения, где будет выполняться прогнозирование. Этот класс объектов должен содержать любые независимые переменные, представленные в виде полей, входных точечных объектов.

При применении пространственного прореживания вы можете использовать исходные входные точечные объекты как входные объекты прогнозирования для вычисления прогнозов по всему набору данных.

Feature Layer
Выходные объекты прогнозирования
(Дополнительный)

Выходной класс объектов, который будет содержать результаты модели прогнозирования, примененные к входным объектам прогнозирования.

Feature Class
Выходной растр прогнозирования
(Дополнительный)

Выходной растр, содержащий результаты прогнозирования в каждой ячейке сопоставленных независимых растров. По умолчанию в качестве размера ячейки используется максимальный размер ячеек входных независимых обучающих растров.

Raster Dataset
Сопоставление независимых переменных
(Дополнительный)

Сопоставление полей независимой переменной входных точечных объектов и входных объектов прогнозирования.

Value Table
Сопоставление объектов расстояния
(Дополнительный)

Сопоставление объектов расстояния для обучения и прогнозирования.

Value Table
Сопоставить независимые растры
(Дополнительный)

Сопоставление растров для обучения и прогнозирования.

Value Table
Разрешить прогнозирование вне диапазонов данных
(Дополнительный)

Определяет, будет ли прогнозирование допускать экстраполяцию, если значения независимой переменной находятся за пределами диапазона значений, используемых для обучения.

  • Отмечено - прогнозирование допускает экстраполяцию за пределами диапазона значений, используемых для обучения. Это значение по умолчанию
  • Не отмечено - прогнозирование не допускает экстраполяцию за пределами диапазона значений, используемых для обучения.
Boolean
Схема пересчета
(Дополнительный)

Определяет метод, который будет использован для выполннения перекрестной проверки модели прогнозирования. Перекрестная проверка исключает фрагмент данных в процессе обучения модели и использует их для проверки производительности модели после обучения.

  • НетПерекрестная проверка не выполняется. Используется по умолчанию
  • ПроизвольноТочки будут произвольно разбиты на группы, и каждая группа будет однократно использована при выполнении перекрестной проверки. Число групп определяется параметром Число групп.
String
Число групп
(Дополнительный)

Число групп, которое будет использовано в перекрестной проверке для произвольной схемы пересчета. Поле выходных обученных объектов, указывающее группу, которая назначена каждой точке. Значение по умолчанию равно 3. Допускается минимум 2, и максимум 10 групп.

Long
Выходной файл обученной модели.
(Дополнительный)

Файл выходной модели, в котором будет сохранена обученная модель, которую позже можно будет использовать для прогнозирования.

File

arcpy.stats.PresenceOnlyPrediction(input_point_features, {contains_background}, {presence_indicator_field}, {explanatory_variables}, {distance_features}, {explanatory_rasters}, {basis_expansion_functions}, {number_knots}, {study_area_type}, {study_area_polygon}, {spatial_thinning}, {thinning_distance_band}, {number_of_iterations}, {relative_weight}, {link_function}, {presence_probability_cutoff}, {output_trained_features}, {output_trained_raster}, {output_response_curve_table}, {output_sensitivity_table}, {features_to_predict}, {output_pred_features}, {output_pred_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {allow_predictions_outside_of_data_ranges}, {resampling_scheme}, {number_of_groups}, {output_trained_model})
ИмяОписаниеТип данных
input_point_features

Точечные объекты, представляющие местоположения, где присутствие интересующего явления известно.

Feature Layer
contains_background
(Дополнительный)

Указывает, содержат ли входные точечные объекты точки фона.

Если входные точечные объекты не содержат точки фона, инструмент создаст точки фона, используя ячейки независимых обучающих растров. Инструмент использует точки фона для моделирования характеристик ландшафта в неизвестных местоположениях и сравнения их с характеристиками ландшафта в известных местоположениях. То есть точки фона определяют область изучения. В общем, это местоположения, где присутствие интересующего явления известно. Тем не менее, если какая-либо информация о точках фона известна, можно использовать параметр relative_weight для указания этой информации.

  • PRESENCE_AND_BACKGROUND_POINTSВходные точечные объекты содержат точки фона.
  • PRESENCE_ONLY_POINTSВходные точечные объекты не содержат точки фона. Это значение по умолчанию
Boolean
presence_indicator_field
(Дополнительный)

Поле входных точечных объектов, содержащие бинарные значения, указывающие, является ли точка присутствием (1) или фоном (0). Поле должно быть числовым (короткое целое, длинное целое, с плавающей точкой, двойной точности)

Field
explanatory_variables
[[Variable, Categorical],...]
(Дополнительный)

Список полей, представляющих независимые переменные, которые помогут прогнозировать вероятность присутствия. Вы можете указать, является ли переменная категорийной или числовой. Включите опцию CATEGORICAL для любых переменных, которые представляют классы или категории (например, почвенно-растительный покров).

Value Table
distance_features
[distance_features,...]
(Дополнительный)

Список векторных слоев или классов объектов, которые используются для автоматического создания независимых переменных, представляя расстояние от входных точечных объектов до ближайших объектов расстояния. Если входные независимые обучающие объекты расстояния являются полигонами или линиями, атрибуты расстояния вычисляются как расстояние между ближайшими сегментом и точкой.

Feature Layer
explanatory_rasters
[[Variable, Categorical],...]
(Дополнительный)

Список растров, которые будут использованы для автоматического создания в модели независимых обучающих переменных, значения которых извлекаются из растров. Для каждого объекта (точек присутствия или фона) во входных точечных объектах значение ячейки растра извлекается в именно в этом местоположении.

Билинейный пересчет растра используется, если значение растра извлекается из непрерывных растров. Метод ближайшего соседа используется, если значение растра извлекается из категориальных растров.

Вы можете указать, является ли значение растра категорийным или числовым. Включите опцию CATEGORICAL для любых растров, которые представляют классы или категории (например, почвенно-растительный покров).

Value Table
basis_expansion_functions
[basis_expansion_functions,...]
(Дополнительный)

Указывает базисную функцию, которая будет использована для преобразования указанных независимых переменных, используемых в модели. Если выбрано несколько базисных функций, инструмент попытается выполнить преобразование нескольких переменных для использования их в модели.

  • LINEARБудет применено линейное преобразование к входным переменным. Используется по умолчанию
  • PRODUCTБудет использоваться попарное умножение для непрерывных независимых переменных, что приведет к взаимодействию переменных. Применение этой опции возможно только при использовании нескольких независимых переменных.
  • HINGEНепрерывные значения независимых переменных буду конвертированы в два сегмента, статический сегмент (состоящий их 0 и 1), и сегмент линейной функции (возрастающий или уменьшающийся)
  • THRESHOLDНепрерывные значения независимых переменных буду конвертированы в бинарную переменную , состоящую из 0 и 1.
  • QUADRATICВозвращается квадрат каждого значения независимой переменной.
String
number_knots
(Дополнительный)

Число узлов, которое будет использовано расширениями независимой переменной Петля или Порог Значение определяет количество создаваемых пороговых значений, которые используются для создания нескольких расширений независимых переменных с использованием каждого порога. Значение должно быть в диапазоне от 2 до 50. Значение по умолчанию равно 10.

Long
study_area_type
(Дополнительный)

Указывает тип области изучения, который будет использован для определения, где присутствие возможно, если входные точечные объекты не содержат точки фона.

  • CONVEX_HULLБудет использован наименьший выпуклый полигон, включающий все точки присутствия входных точечных объектов. Используется по умолчанию
  • RASTER_EXTENTБудет использован экстент пересечения всех независимых обучающих растров.
  • STUDY_POLYGONБудет использована пользовательская изучаемая область, задаваемая классом полигональных объектов.
String
study_area_polygon
(Дополнительный)

Класс объектов, содержащий полигоны, которые определяют пользовательскую изучаемую область. Входные точечные объекты должны быть расположены в пределах пользовательской изучаемой области, покрываемой полигональными объектами. Изучаемая область состоит из нескольких полигонов.

Feature Layer
spatial_thinning
(Дополнительный)

Устанавливает, будет ли пространственное прореживание применено к точкам присутствия и фона перед обучением модели.

Пространственное прореживание помогает снизить смещение выборки путем удаления точек и проверки того, что оставшиеся точки содержат минимальное расстояние ближайшего соседства, установленное в параметре thinning_distance_band. Пространственное прореживание также применяется к точкам фона, независимо от того, указываются ли они как входные точечные объекты, или создаются инструментом.

  • THINNINGПространственное прореживание будет применено.
  • NO_THINNINGПространственное прореживание не будет применено. Это значение по умолчанию
Boolean
thinning_distance_band
(Дополнительный)

Минимальное расстояние между двумя любыми точками присутствия или фона, если применено пространственное прореживание.

Linear Unit
number_of_iterations
(Дополнительный)

Число запусков, используемое для поиска оптимального решения пространственного прореживания, возвращаясь к началу с настолько минимальным количеством точек присутствия и фона, насколько возможно, пока не будет достигнуто состояние, при котором в пределах thinning_distance_band не будет двух точек присутствия или двух точек фона. Минимально возможное число итераций - 1, а максимально - 50. Значение по умолчанию равно 10.

Этот параметр применяется только для пространственного прореживания, используемого для точек присутствия и фона во входных точечных объектах. Пространственное прореживание, применяемое к точкам фона, созданным из ячеек растра, к которым применено пространственное прореживание путем пересчета ячеек растра в указанное значение параметра thinning_distance_band без необходимости повторения для оптимального решения.

Long
relative_weight
(Дополнительный)

Значение от 1 до 100, которое указывает относительный вес информации о точке присутствия к точке фона. По умолчанию используется 100.

Более высокое значение указывает на то, что точки присутствия являются главным источником информации; неизвестно, представляют ли точки фона присутствие или отсутствие, и точки фона получают меньший вес в модели. Более низкое значение указывает на то, что точки фона также дополняют информацию, которая может использоваться в комбинации с информацией о точках присутствия; есть высокая вероятность, что точки фона представляют отсутствие, и эта информация может использовать в модели для указания местоположений отсутствия.

Long
link_function
(Дополнительный)

Определяет функцию, которая преобразует неограниченные выходные данные модели в число от 0 до 1. Значение можно интерпретировать как вероятность присутствия в местоположении. Каждая опция конвертирует одно и то же непрерывное значение в разную вероятность.

  • CLOGLOGФункция C-log-log будет использована для конвертации прогнозирований в вероятности. Рекомендуется использовать эту опцию, если местоположение и наличие явления явно и без неопределенности, например, если точки присутствия представляют местоположения произрастания видов растений. Это значение по умолчанию
  • LOGISTICФункция Logistic будет использована для конвертации прогнозирований в вероятности. Рекомендуется использовать эту опцию, если местоположение и наличие явления не определено, например, если точки присутствия представляют местоположения мигрирующих видов животных.
String
presence_probability_cutoff
(Дополнительный)

Предельное значение между 0.01 и 0.99, которое определяет, какие вероятности соответствуют присутствию в результирующей классификации. Предельное значение используется для оценки производительности модели с помощью обучающих данных и известных точек присутствия. Диагностики классификации доступны из сообщений геообработки и в выходных обученных объектах.

Double
output_trained_features
(Дополнительный)

Выходной класс объектов, который будет содержать все объекты и независимые переменные, используемые в обучении модели.

Feature Class
output_trained_raster
(Дополнительный)

Выходной растр со значениями ячеек, указывающими на вероятность присутствия, вычисленную с помощью выбранной функцией связи. По умолчанию в качестве размера ячейки используется максимальный размер ячеек входных независимых обучающих растров. Выходной обученный растр создается только если входные точечные объекты не содержат точки фона.

Raster Dataset
output_response_curve_table
(Дополнительный)

Выходная таблица, которая будет содержать диагностики обучающей модели, отражающие вклад каждой независимой переменной в вероятность присутствия после учета усредненных эффектов всех независимых переменных в модели.

К таблице могут быть добавлены до двух диаграмм частичной зависимости: набор линейных графиков для непрерывных переменных, и набор столбчатых диаграмм для категорийных переменных.

Table
output_sensitivity_table
(Дополнительный)

Выходная таблица, которая будет содержать диагностики точности обучающей модели, выраженные через предельное значение вероятности присутствия, меняющееся от 0 до 1.

Table
features_to_predict
(Дополнительный)

Класс объектов, представляющих местоположения, где будет выполняться прогнозирование. Этот класс объектов должен содержать любые независимые переменные, представленные в виде полей, входных точечных объектов.

При применении пространственного прореживания вы можете использовать исходные входные точечные объекты как входные объекты прогнозирования для вычисления прогнозов по всему набору данных.

Feature Layer
output_pred_features
(Дополнительный)

Выходной класс объектов, который будет содержать результаты модели прогнозирования, примененные к входным объектам прогнозирования.

Feature Class
output_pred_raster
(Дополнительный)

Выходной растр, содержащий результаты прогнозирования в каждой ячейке сопоставленных независимых растров. По умолчанию в качестве размера ячейки используется максимальный размер ячеек входных независимых обучающих растров.

Raster Dataset
explanatory_variable_matching
[[Prediction, Training],...]
(Дополнительный)

Сопоставление полей независимой переменной входных точечных объектов и входных объектов прогнозирования.

Value Table
explanatory_distance_matching
[[Prediction, Training],...]
(Дополнительный)

Сопоставление объектов расстояния для обучения и прогнозирования.

Value Table
explanatory_rasters_matching
[[Prediction, Training],...]
(Дополнительный)

Сопоставление растров для обучения и прогнозирования.

Value Table
allow_predictions_outside_of_data_ranges
(Дополнительный)
  • ALLOWEDПрогнозирование допускает экстраполяцию за пределами диапазона значений, используемых для обучения. Это значение по умолчанию
  • NOT_ALLOWEDПрогнозирование не допускает экстраполяцию за пределами диапазона значений, используемых для обучения.
Boolean
resampling_scheme
(Дополнительный)

Определяет метод, который будет использован для выполннения перекрестной проверки модели прогнозирования. Перекрестная проверка исключает фрагмент данных в процессе обучения модели и использует их для проверки производительности модели после обучения.

  • NONEПерекрестная проверка не выполняется. Используется по умолчанию
  • RANDOMТочки будут произвольно разбиты на группы, и каждая группа будет однократно использована при выполнении перекрестной проверки. Число групп определяется параметром number_of_groups.
String
number_of_groups
(Дополнительный)

Число групп, которое будет использовано в перекрестной проверке для произвольной схемы пересчета. Поле выходных обученных объектов, указывающее группу, которая назначена каждой точке. Значение по умолчанию равно 3. Допускается минимум 2, и максимум 10 групп.

Long
output_trained_model
(Дополнительный)

Файл выходной модели, в котором будет сохранена обученная модель, которую позже можно будет использовать для прогнозирования.

File

Пример кода

PresenceOnlyPrediction, пример 1 (окно Python)

Скрипт Python, демонстрирующий использование функции PresenceOnlyPrediction.


# Import system modules 
import arcpy 

# Call Presence-only Prediction (MaxEnt)
arcpy.stats.PresenceOnlyPrediction(
    input_point_features=r"C:\MyData.gdb\Presence_Points", 
    contains_background="PRESENCE_ONLY_POINTS",
    presence_indicator_field=None,
    explanatory_variables=None,
    distance_features=None,
    explanatory_rasters=[[r"C:\MyData.gdb\Elevation", "false"], 
                         [r"C:\MyData.gdb\Canopy", "false"], 
                         [r"C:\MyData.gdb\ClimacticWaterDeficit", "false"], 
                         [r"C:\MyData.gdb\LandCoverClassification", "true"], 
                         [r"C:\MyData.gdb\UpperSlope", "false"],
                         [r"C:\MyData.gdb\LowerSlope", "false"]], 
    basis_expansion_functions="LINEAR;QUADRATIC;PRODUCT;HINGE",
    number_knots=10,
    study_area_type="CONVEX_HULL",
    study_area_polygon=None,
    spatial_thinning="THINNING",
    thinning_distance_band="500 Meters", 
    number_of_iterations=10
    relative_weight=100
    link_function="CLOGLOG"
    presence_probability_cutoff=0.5
    output_trained_features=r"C:\MyData.gdb\Out_Trained_Features"
    output_trained_raster=r"C:\MyData.gdb\Out_Trained_Raster"
    output_response_curve_table=r"C:\MyData.gdb\Out_Response_Curve_Table"
    output_sensitivity_table=r"C:\MyData.gdb\Out_Sensitivity_Table"
    features_to_predict=r"C:\MyData.gdb\In_Prediction_Features"
    output_pred_features=r"C:\MyData.gdb\Out_Prediction_Features"
    output_pred_raster=r"C:\MyData.gdb\Out_Prediction_Raster",
    explanatory_variable_matching=None
    explanatory_distance_matching=None
    explanatory_rasters_matching=[[r"C:\MyData.gdb\Prediction_Elevation", "false"], 
                                  [r"C:\MyData.gdb\Prediction_Canopy", "false"], 
                                  [r"C:\MyData.gdb\Prediction_ClimacticWaterDeficit", "false"], 
                                  [r"C:\MyData.gdb\Prediction_LandCoverClassification", "true"], 
                                  [r"C:\MyData.gdb\Prediction_UpperSlope", "false"],
                                  [r"C:\MyData.gdb\Prediction_LowerSlope", "false"]], 
    allow_predictions_outside_of_data_ranges="ALLOWED"
    resampling_scheme="RANDOM"
    number_of_groups=3)
PresenceOnlyPrediction, пример 2 (автономный скрипт)

Скрипт Python, демонстрирующий использование функции PresenceOnlyPrediction.


# This example is a simple run of the tool using presence-only points and 
# explanatory training rasters to train an initial model. No outputs are 
# specified, as the intent is to interrogate geoprocessing messages to gain 
# an initial sense of model performance. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_ONLY_POINTS”
    
    # Set the explanatory Training variables, using only explanatory rasters
    # Note the categorical setting for the LandCoverClassification raster
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    
    # Set basis functions, adding quadratic to use the square of each variable
    basis_functions = "LINEAR;QUADRATIC"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_rasters=explanatory_rasters,
        basis_expansion_functions=basis_functions,
        study_area_type=study_area_type,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)
PresenceOnlyPrediction, пример 3 (автономный скрипт)

Скрипт Python, демонстрирующий использование функции PresenceOnlyPrediction.


# This example uses presence and background points and explanatory 
# variables from rasters, fields, and distance features to train a 
# model, using additional parameters to apply basis functions, use 
# spatial thinning, perform cross-validation, and receive diagnostic 
# training outputs. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 

    ### MODEL INPUTS ###
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_AND_BACKGROUND_POINTS
    presence_indicator_field = "Presence"
    
    # Set the explanatory Training variables
    explanatory_fields = [["Survey_Region", "true"], 
                          ["Temperature", "false"], 
                          ["Humidity", "false"]]
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    explanatory_dist_features = [["Streams", "false"], 
                                 ["Lakes", "false"], 
                                 ["Roads", "false"]]                           
    
    ### MODEL CONFIGURATION ###

    # Set basis functions
    basis_functions = "LINEAR;QUADRATIC;PRODUCT;HINGE"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None

    # Set spatial thinning 
    spatial_thinning = "THINNING"
    min_nearest_neighbor_distance = "500 Meters"
    number_of_iterations = 10

    # Set the relative weight of presence to background and link function, using
    # background points as observed absence
    relative_weight = 1
    link_function = "LOGISTIC"

    # Set the presence probability cutoff
    cutoff = 0.3

    ### MODEL OUTPUTS AND VALIDATION ###

    # Set training outputs for model evaluation
    out_trained_features = "Out_Trained_Features"
    out_trained_raster = "Out_Trained_Raster"
    out_response_curve_table = "Out_Response_Curves"
    out_sensitivity_table = "Out_Sensitivity_Table"
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_variables=explanatory_fields,
        explanatory_rasters=explanatory_rasters,
        distance_features=explanatory_dist_features,
        basis_expansion_functions=basis_functions,
        number_knots=number_knots,
        study_area_type=study_area_type,
        spatial_thinning=spatial_thinning,
        thinning_distance_band=min_nearest_neighbor_distance,
        number_of_iterations=number_of_iterations,
        relative_weight=relative_weight,
        link_function=link_function,
        presence_probability_cutoff=cutoff,
        output_trained_features=out_trained_features,
        output_trained_raster=out_trained_raster,
        output_response_curve_table=out_response_curve_table,
        output_sensitivity_table=out_sensitivity_table,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)

Параметры среды

Особые случаи

Коэффициент параллельной обработки

Параллельные процессы используются только если выполняются прогнозы.

Генератор случайных чисел

В качестве генератора случайных чисел всегда используется Mersenne Twister.

Информация о лицензиях

  • Basic: Ограниченные
  • Standard: Ограниченные
  • Advanced: Ограниченные

Связанные разделы