Создать независимые переменные пространственного компонента (Пространственная статистика)

Краткая информация

Создает набор полей пространственных компонентов, которые наилучшим образом описывают пространственные закономерности одного или нескольких числовых полей и служат полезными независимыми переменными в модели прогнозирования или регрессии.

Входные поля должны быть независимыми и зависимыми переменными, которые будут использоваться в модели прогнозирования. Полученные поля пространственных компонентов (называемые собственными векторами Морана) можно использовать в качестве независимых переменных (в дополнение к исходным независимым переменным), что часто улучшает предсказательную силу модели за счет учета пространственных закономерностей других переменных.

Более подробно о собственных векторах Морана

Иллюстрация

Иллюстрация инструмента Создать независимые переменные пространственного компонента

Использование

  • Инструмент создает пространственные компоненты, которые могут наиболее точно предсказать значения входных полей. Каждый компонент представляет собой пространственное распределение, и выбранными компонентами будут те, распределения которых наиболее близки распределениям входных полей. Например, если поле имеет широкий тренд с запада на восток, но также содержит небольшие кластеры низких и высоких значений, распределение может быть представлено путем объединения двух компонентов: один представляет тренд с запада на восток, а другой представляет кластеры. При включении независимых переменных, которые напоминают пространственное распределение независимых и зависимых переменных, пространственные эффекты учитываются в инструментах прогнозирования и регрессии, таких как Обобщенная линейная регрессия и Классификация на основе леса, расширенная классификация с бустингом и регрессия. Учет пространственных эффектов позволит этим непространственным моделям прогнозирования выполнять прогнозирование более точно, а пространственное смещение (такое как пространственное распространение в невязках) часто будет уменьшено. Это важно, чтобы определенные области не были систематически недооценены или переоценены моделью. Кроме того, коэффициенты независимых переменных могут легче интерпретироваться, поскольку они будут оценивать прямую связь между независимой и зависимой переменными, отфильтровывая шум, вносимый пространственными эффектами.

  • Этот инструмент предназначен для создания независимых переменных, которые могут использоваться в моделях прогнозирования; однако инструмент Фильтровать пространственную автокорреляцию из поля также может быть использован для этой цели путем удаления пространственной автокорреляции из поля невязок или стандартизированной невязки модели прогнозирования. Пространственные компоненты, которые эффективно фильтруют автокорреляцию невязок, часто являются полезными независимыми переменными и могут обеспечить эквивалентное улучшение модели для этого инструмента, используя меньшее количество компонентов в качестве независимых переменных. Рекомендуется попробовать оба инструмента и сравнить результаты включения пространственных компонентов из каждого из них в исходную модель прогнозирования (например, сравнивая скорректированные значения R-квадрата или AIC).

  • Пространственные компоненты будут возвращены как поля в выходном классе объектов, и когда инструмент запускается на активной карте, выходной слой объектов будет отображать первый пространственный компонент. Входные поля также будут включены в выходной класс объектов, так что исходные независимые переменные и независимые переменные пространственного компонента могут использоваться для прогнозирования зависимой переменной в инструментах прогнозирования без необходимости объединения входных и выходных классов объектов.

  • Сообщения геообработки включают следующие две таблицы, которые суммируют выборку пространственных компонентов, используемых для пространственной фильтрации входного поля:

    • История поиска соседей — для каждой из 28 протестированных матриц пространственных весов (SWM) отображаются сведения о SWM (например, количество соседей и схема взвешивания), p-значение и выровненное значение R-квадрат при использовании всех компонентов, выровненное значение R-квадрата при использовании только выбранных компонентов и количество выбранных компонентов. SWM с самым высоким выровненным значением R-квадрат с использованием выбранных компонентов будет использоваться для создания компонентов и будет обозначен жирным текстом и звездочкой.
    • История поиска пространственных компонентов — для выбранного SWM отображаются значение идентификатора каждого компонента (например, ID 4 означает четвертый пространственный компонент), значение I Морана и p-значение компонента, а также выровненное значение R-квадрат компонента (включая все ранее выбранные компоненты). Строки упорядочены по компонентам, которые индивидуально предсказали входные поля наиболее эффективно (наивысшее значение R-квадрат).

  • Инструмент выбирает SWM для входных объектов (если только он не указан в параметре Входной файл матрицы пространственных весов) и выбирает независимые переменные компонента, используя следующую процедуру:

    1. Для каждого из 28 кандидатов SWM проверяется на статистическую значимость путем прогнозирования входных полей с использованием всех пространственных компонентов в качестве независимых переменных. Тест значимости использует объединенный R-квадрат из всех входных полей и выполняет поправку Шидака к p-значению для учета количества протестированных SWM. Любая SWM, которая не является статистически значимой, будет удалена из списка кандидатов.
    2. Для каждого из оставшихся кандидатов SWM пространственные компоненты последовательно добавляются в качестве независимых переменных до тех пор, пока либо следующий компонент не станет статистически значимым сам по себе (p-значение больше 0,05), либо выровненное значение R-квадрат компонента (и всех ранее выбранных компонентов) не превысит выровненное значение R-квадрата при использовании всех компонентов SWM. При прогнозировании входных полей каждый новый компонент выбирается путем нахождения компонента с наивысшей статистической значимостью (наименьшее p-значение).
    3. Файл SWM с наибольшим выровненным значением R-квадрат выбирается в качестве окончательного SWM, а связанный набор выбранных пространственных компонентов возвращается в качестве полей в выходном классе объектов.

    Эта процедура называется методом выборки FWD (Прямая) и полностью описана в следующей ссылке:

    • Blanchet, F. Guillaume, Pierre Legendre, Daniel Borcard. 2008. "Предварительный выбор объясняющих переменных". Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.

    .

Параметры

ПодписьОписаниеТип данных
Входные объекты

Входные объекты, содержащие поля независимых и зависимых переменных, которые будут использоваться в модели прогнозирования.

Feature Layer
Входные поля

Входные поля независимых и зависимых переменных, которые будут использоваться в модели прогнозирования.

Field
Выходные объекты

Выходные объекты, которые будут содержать поля пространственных компонентов, которые могут использоваться в качестве дополнительных независимых переменных в модели прогнозирования.

Feature Class
Присоединить все поля из входных объектов
(Дополнительный)

Указывает, будут ли все поля скопированы из входных объектов в выходной класс объектов.

  • Отмечено – все поля из входных пространственных объектов будут скопированы в выходной класс пространственных объектов. Используется по умолчанию.
  • Не отмечено — только входные поля будут скопированы в выходной класс объектов.
Boolean
Выходной файл матрицы пространственных весов
(Дополнительный)

Входной файл SWM (.swm). Если значение задано, файл будет использоваться для определения соседей и весов входных объектов. Если значение не задано, инструмент проверит 28 различных окрестностей и использует ту, которая создает компоненты, наиболее эффективные в качестве независимых переменных.

File
Выходной файл матрицы пространственных весов
(Дополнительный)

Выходной файл SWM (.swm) соседей и весов, выбранных инструментом. Этот параметр не применяется, если вы предоставляете входной файл .swm.

File
Поле уникального ID
(Дополнительный)

Поле уникального ID выходного файла .swm. Поле должно быть целочисленным и иметь уникальное значение для каждого входного объекта.

Field

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field})
ИмяОписаниеТип данных
in_features

Входные объекты, содержащие поля независимых и зависимых переменных, которые будут использоваться в модели прогнозирования.

Feature Layer
input_fields
[input_fields,...]

Входные поля независимых и зависимых переменных, которые будут использоваться в модели прогнозирования.

Field
out_features

Выходные объекты, которые будут содержать поля пространственных компонентов, которые могут использоваться в качестве дополнительных независимых переменных в модели прогнозирования.

Feature Class
append_all_fields
(Дополнительный)

Указывает, будут ли все поля скопированы из входных объектов в выходной класс объектов.

  • ALLВсе поля из входных пространственных объектов будут скопированы в выходной класс пространственных объектов. Используется по умолчанию.
  • NO_FIELDSТолько входные поля будут скопированы в выходной класс объектов.
Boolean
in_swm
(Дополнительный)

Входной файл SWM (.swm). Если значение задано, файл будет использоваться для определения соседей и весов входных объектов. Если значение не задано, инструмент проверит 28 различных окрестностей и использует ту, которая создает компоненты, наиболее эффективные в качестве независимых переменных.

File
out_swm
(Дополнительный)

Выходной файл SWM (.swm) соседей и весов, выбранных инструментом. Этот параметр не применяется, если вы предоставляете входной файл .swm.

File
id_field
(Дополнительный)

Поле уникального ID выходного файла .swm. Поле должно быть целочисленным и иметь уникальное значение для каждого входного объекта.

Field

Пример кода

CreateSpatialComponentExplanatoryVariables, пример 1 (окно Python)

Следующий скрипт окна Python демонстрирует использование функции CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)
CreateSpatialComponentExplanatoryVariables, пример 2 (автономный скрипт)

В следующем автономном скрипте показано использование функции CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы