Локальные бивариантные отношения (Пространственная статистика)—ArcGIS Pro

Сводка

Анализирует две переменные на предмет статистически значимых отношений с использованием локальной энтропии. Каждый объект классифицируется в одной из шести категорий на основании типа отношений. Выходные данные можно использовать для визуализации областей, где существуют отношения между переменными и изучения изменений отношений в пределах области изучения.

Более подробно о том, как работает инструмент Локальные бивариантные отношения

Иллюстрация

Локальные отношения между двумя переменными

Обнаружение и визуализация локального отношения между двумя переменными.

Использование

Инструмент использует точки или полигоны в качестве входных данных и для переменных требует непрерывные данные. Не подходит для бинарных или категорийных данных.
Рекомендуется хранить Выходные объекты в базе геоданных, а не в шейп-файле (.shp). Шейп-файлы не могут хранить значения null в атрибутах и диаграммы во всплывающих диалоговых окнах.
Каждому входному объекту присваивается одна из следующих категорий отношений, исходя из того, насколько достоверно Независимая переменная может спрогнозировать значения Зависимой переменной:
- Не значимы – между переменными не выявлено статистически значимых отношений.
- Линейные положительные – зависимая переменная линейно возрастает с ростом независимой переменной.
- Линейные отрицательные - зависимая переменная линейно снижается с ростом независимой переменной.
- Вогнутые - зависимая переменная изменяется, образуя вогнутую кривую с ростом независимой переменной.
- Выпуклые - зависимая переменная изменяется, образуя выпуклую кривую с ростом независимой переменной.
- Сложные неопределенные - переменные значимо связаны, но тип отношений не может быть корректно описан какой-либо категорией.
Наличие или отсутствие отношения между двумя переменными не зависят от того, какая из них назначается независимой, а какая - зависимой. Например, если диабет связан с ожирением, то и ожирение аналогично связано с диабетом. Тем не менее, классификация типов отношений может меняться, в зависимости от того, какая из переменных назначается независимой, а какая - зависимой. Вполне возможно, что одна переменная точно прогнозирует значения второй переменной, при этом вторая переменная прогнозирует значения первой значительно менее точно. Если вы не уверены, какая переменную стоит назначить зависимой, а какую – независимой, запустите инструмент два раза и попробуйте оба варианта.
Инструмент поддерживает параллельную обработку и использует до 50 % доступной мощности процессора по умолчанию. Количество используемых процессоров можно изменить при помощи параметра среды Коэффициент параллельной обработки.

Синтаксис

arcpy.stats.LocalBivariateRelationships(in_features, dependent_variable, explanatory_variable, output_features, {number_of_neighbors}, {number_of_permutations}, {enable_local_scatterplot_popups}, {level_of_confidence}, {apply_false_discovery_rate_fdr_correction}, {scaling_factor})

Parameter	Объяснение	Тип данных
in_features	Класс объектов, содержащий поля, представляющие dependent_variable и explanatory_variable.	Feature Layer
dependent_variable	Числовое поле, представляющее значения зависимой переменной. В категориях отношений, explanatory_variable используется для прогнозирования значений dependent_variable.	Field
explanatory_variable	Числовое поле, представляющее значения независимой переменной. В категориях отношений, explanatory_variable используется для прогнозирования значений dependent_variable.	Field
output_features	Выходной класс объектов, содержащий все входные объекты с полями, представляющими dependent_variable, explanatory_variable, оценку энтропии, псевдо вероятность (p), уровень достоверности, тип категории отношения, и диагностику, относящуюся к категориям.	Feature Class
number_of_neighbors (Дополнительный)	Число соседних объектов вокруг каждого объекта (включая сам объект) которое будет использовано для тестирования локальных отношений между переменными. Число соседних объектов должно быть в пределах 30 и 1000, по умолчанию – 30. Указанное значение должно быть достаточно большим для выявления отношений между объектами, но достаточно небольшим для сохранения возможности идентификации локальных закономерностей.	Long
number_of_permutations (Дополнительный)	Указывает число перестановок для расчета псевдо (p) вероятности для каждого объекта. Выбор числа перестановок является компромиссом между точностью псевдо p-значением и временем обработки. 99 —С 99 перестановками, минимально возможное псевдо p-значение равно 0.01, а все остальные псевдо p-значения будут кратны этому значению. 199 —С 199 перестановками, минимально возможное псевдо p-значение равно 0.005, а все остальные псевдо p-значения будут кратны этому значению. Используется по умолчанию 499 —С 499 перестановками, минимально возможное псевдо p-значение равно 0.002, а все остальные псевдо p-значения будут кратны этому значению. 999 —С 999 перестановками, минимально возможное псевдо p-значение равно 0.001, а все остальные псевдо p-значения будут кратны этому значению.	Long
enable_local_scatterplot_popups (Дополнительный)	Указывает, будут ли созданы точечные диаграммы во всплывающих окнах для каждого выходного объекта. Каждая точечная диаграмма отображает значения независимой (горизонтальная ось) и зависимой (вертикальная ось) переменных, а также линию или кривую соответствия, визуализирующую форму отношения. Точечные диаграммы не поддерживаются, если выходные данные заданы в виде шейп-файла. CREATE_POPUP —Будут созданы локальные точечные диаграммы во всплывающих окнах для каждого выходного объекта в наборе данных. Используется по умолчанию. NO_POPUP —Локальные точечные диаграммы во всплывающих окнах не будут созданы.	Boolean
level_of_confidence (Дополнительный)	Определяет уровень достоверности для гипотезы значимости отношений. 90% —90% уровень достоверности. Используется по умолчанию. 95% —95% уровень достоверности. 99% —99% уровень достоверности.	String
apply_false_discovery_rate_fdr_correction (Дополнительный)	Указывает, будет ли применена коррекция средней доли ложных отклонений гипотезы (FDR) для псевдо p-значений. APPLY_FDR —Статистическая значимость будет рассчитана с учетом коррекции FDR. Используется по умолчанию. NO_FDR —Статистическая значимость будет рассчитана с учетом псевдо p-значения.	Boolean
scaling_factor (Дополнительный)	Контролирует чувствительность к определению неявных отношений между переменными. Большие значения (близко к единице) позволяют выявить относительно слабо выраженные отношения, а небольшие значения (близкие к нулю) позволяют выявить только явно выраженные отношения. Небольшие значения также больше устойчивы к выбросам. Значения должны быть в пределах от 0.01 и 1, по умолчанию – 0.5.	Double

Пример кода

LocalBivariateRelationships пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование инструмента LocalBivariateRelationships.

import arcpy
arcpy.env.workspace = 'C:\\LBR\\MyData.gdb'
arcpy.LocalBivariateRelationships_stats('ObesityDiabetes', 'ObesityRate', 
                   'DiabetesRate','LBR_Results', 30, '199', 'CREATE_POPUP', 
                   '95%', 'APPLY_FDR', 0.5)

LocalBivariateRelationships пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать инструмент LocalBivariateRelationships.

# Use the Local Bivariate Relationships tool to study the relationship between
# obesity and diabetes.
# Import system modules.
import arcpy
import os
# Set property to overwrite existing output by default.
arcpy.env.overwriteOutput = True
try:
    # Set the workspace and input features.
    arcpy.env.workspace = r"C:\\LBR\\MyData.gdb"
    inputFeatures = 'ObesityDiabetes'
    # Set the output workspace and output name.
    outws = 'C:\\LBR\\outputs.gdb'
    outputName = 'LBR_Results'
    # Set input features, dependent variable, and explanatory variable.
    depVar = 'DiabetesRate'
    explVar = 'ObesityRate'
    # Set number of neighbors and permutations.
    numNeighbors = 50
    numPerms = '999'
    # Choose to create popups.
    popUps = 'CREATE_POPUP'
    # Choose confidence level and apply False Discovery Rate correction.
    confLevel = '95%'
    fdr = 'APPLY_FDR'
    # Set the scaling factor.
    scaleFactor = 0.5
    # Run Local Bivariate Regression.
    arcpy.LocalBivariateRelationships_stats(inputFeatures, depVar, explVar, 
                                            os.path.join(outws, outputName), 
                                            numNeighbors, numPerms, popUps, 
                                            confLevel, fdr, scaleFactor)
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Environments

Выходная система координат, Коэффициент параллельной обработки, Генератор случайных чисел

Информация о лицензиях

Basic: Да
Standard: Да
Advanced: Да

Связанные разделы

Отзыв по этому разделу?