Бивариантная пространственная связь (L-статистика Ли) (Пространственная статистика)

Краткая информация

Вычисляет пространственную связь между двумя непрерывными переменными с использованием L-статистики Ли.

L-статистика Ли характеризует как степень корреляции, так и степень совпадения (подобия пространственной кластеризации) между переменными. Это значение будет находиться в диапазоне от -1 до 1 и концептуально аналогично коэффициенту корреляции, но скорректировано с учетом пространственной автокорреляции двух переменных. Значения L Ли, близкие к 1, указывают на то, что переменные в высшей степени положительно коррелируют и что каждая переменная имеет высокую пространственную автокорреляцию (высокие и низкие значения каждой из переменных имеют тенденцию к совместной кластеризации). Значения, близкие к -1, указывают на то, что переменные в высшей степени отрицательно коррелируют и что каждая переменная имеет сильно положительную пространственную автокорреляцию. Значения, близкие к 0, указывают на то, что переменные некоррелированы, не имеют пространственную автокорреляцию или и то, и другое вместе.

L-статистика Ли может быть распределена по каждому входному объекту, это называется локальной L-статистикой Ли, которая показывает локальную пространственную связь объекта и его соседей. Это может быть использовано для определения областей, которые имеют более высокую или более низкую пространственную связь, чем глобальная L-статистика Ли. Локальная статистика также может быть классифицирована по одной из нескольких категорий на основе значений соседних объектов для каждого объекта. Как глобальная, так и локальная статистика проверяются на статистическую значимость с использованием перестановок.

Более подробно о том, как работает инструмент Бивариантная пространственная связь (L-статистика Ли)

Иллюстрация

Иллюстрация инструмента Бивариантная пространственная связь (L-статистика Ли)
Две переменные в верхнем ряду имеют положительную пространственную связь, а две переменные в нижнем ряду - отрицательную.

Использование

  • Две переменные анализа должны быть непрерывными (не бинарными или категорийными), также переменные должны иметь линейную зависимость. Если зависимость не является линейной, используйте инструмент Трансформировать поле, чтобы применить преобразования к переменным анализа для линеаризации зависимости и повторно запустить инструмент с преобразованными значениями.

  • Инструмент возвращает множество выходных данных, которые позволяют вам исследовать пространственную связь между двумя переменными анализа. Сообщения геообработки отображают L-статистику Ли и p-значение, а выходной класс объектов содержит поля, обобщающие локальную статистику L, p-значения и результаты статистической значимости. При запуске на активной карте выходной слой будет объектов отображаться на основе категорий локальных пространственных связей: Not Significant, High-High, Low-Low, High-Low и Low-High. Например, если локальная L-статистика Ли статистически значима по крайней мере на 90 процентов, первая переменная анализа выше среднего значения, а вторая переменная ниже среднего значения, то категория будет равна High-Low.

    Более подробно о выходных данных инструмента

  • Значения p для проверки глобальных и локальных пространственных связей на статистическую значимость рассчитываются с использованием перестановок.

  • Используйте не менее 50 входных объектов и включите не менее 8 соседей для каждого объекта.

  • Окрестности каждого объекта всегда включают в себя этот объект. Если для определения соседей используется файл пространственных весов, то для веса объекта по отношению к нему самому будет задан вес, равный 1, даже если вес в файле пространственных весов не определен. Веса каждой окрестности стандартизированы по строкам таким образом, что в сумме они равны 1.

  • Параметр среды Генератор случайных чисел может быть использован для воспроизведения перестановок и p-значений. Если начальное значение не указано, глобальные и локальные значения p могут изменяться случайным образом. Однако, если для параметра среды Коэффициент параллельной обработки задано значение, превышающее 1 (значение по умолчанию), перестановки не будут согласованными, даже при фиксированном начальном значении генератора случайных чисел.

  • Изменение порядка двух переменных анализа не приведет к изменению глобальной или локальной L-статистики Ли, но значения p могут измениться из-за случайности перестановок. Категории High-Low и Low-High также поменяются местами.

Параметры

ПодписьОписаниеТип данных
Входные объекты

Входные объекты, содержащие поля двух переменных анализа.

Feature Layer
Поле анализа 1

Поле первой переменной анализа. Поле Y должно быть числовым.

Field
Поле анализа 2

Поле второй переменной анализа. Поле Y должно быть числовым.

Field
Выходные объекты

Выходные объекты, содержащие локальную L-статистику Ли, категории пространственной связи, p-значения и средневзвешенные значения соседей каждого объекта.

Feature Class
Тип окрестности
(Дополнительный)

Задает способ определения соседей каждого объекта. Объект всегда включается в окрестности, и все веса окрестностей нормализуются, чтобы в сумме получить значение 1.

  • Полоса фиксированных расстоянийК соседям будут отнесены объекты, находящиеся от каждого объекта в пределах заданного расстояния. Для точечных объектов эта опция используется по умолчанию.
  • K ближайших соседейБлижайшие k объекты будут включены в качестве соседей.
  • Только совпадающие ребраК соседям будут отнесены полигональные объекты, имеющие общие ребра.
  • Совпадающие ребра и углыК соседям будут отнесены полигональные объекты, имеющие общие ребра или углы. Для полигональных объектов эта опция используется по умолчанию.
  • Триангуляция ДелонеТочки, у которых в триангуляции Делоне (полигоны Тиссена) есть общее ребро или угол, будут считаться соседними.
  • Получить пространственные веса из файлаСоседи и веса будут заданы файлом пространственных весов.
String
Диапазон расстояний
(Дополнительный)

Диапазон расстояний, который будет использоваться для определения соседей вокруг фокального объекта. Если значение не указано, то расстояние будет кратчайшим расстоянием, таким, чтобы каждый объект имел по крайней мере еще одного соседа в окрестности. Для полигонов для определения соседей используется расстояние между центроидами.

Linear Unit
Число соседей
(Дополнительный)

Число соседей вокруг каждого объекта, которые будут использоваться как соседи. Это значение не включает сам объект. Например, при задании числа 6 будет использоваться объект и его шесть ближайших соседей (всего семь объектов). Значение по умолчанию - 8. Это значение должно быть не менее 2.

Long
Файл матрицы весов
(Дополнительный)

Путь и имя файла матрицы пространственных весов, который задает соседей и веса между объектами.

File
Локальная схема весов
(Дополнительный)

Задает схему взвешивания, которая будет применяться к соседям при вычислении пространственных связей.

  • Не взвешеннаяСоседи взвешиваться не будут. Это значение по умолчанию
  • БиквадратнаяСоседи будут взвешены с использованием биквадратного (квартичного) ядра.
String
Ширина ядра
(Дополнительный)

Ширина канала биквадратного ядра. Ширина канала определяет, насколько быстро вес уменьшается с увеличением расстояния. Большая ширина канала обеспечит сравнительно большие веса соседним объектам, расположенным дальше от объекта. Для окрестности k ближайших соседей значение по умолчанию (пусто) позволяет использовать адаптивную полосу пропускания, равную расстоянию до (k+1)-го соседа фокального объекта. Для окрестности диапазона фиксированных расстояний значение по умолчанию (пусто) будет соответствовать тому же значению, что и для диапазона расстояний.

Linear Unit
Число перестановок
(Дополнительный)

Задает количество перестановок, которые будут использоваться для создания эталонных распределений при вычислении глобальных и локальных p-значений. Все значения p рассчитываются с использованием двусторонних тестов гипотез.

  • 99Анализ будет использовать 99 перестановок. С 99 перестановками минимально возможное p-значение равно 0.02, все остальные p-значения будут кратны этому.
  • 199Анализ будет использовать 199 перестановок. С 199 перестановками, минимально возможное p-значение равно 0.01, а все остальные p-значения будут кратны этому.
  • 499Анализ будет использовать 499 перестановок. С 499 перестановками, минимально возможное p-значение равно 0.004, а все остальные p-значения будут кратны этому.
  • 999Анализ будет использовать 999 перестановок. С 999 перестановками, минимально возможное p-значение равно 0.002, а все остальные p-значения будут кратны этому значению. Этот параметр рекомендуется использовать для тестов с 90-процентной достоверностью. Это значение по умолчанию
  • 4999Анализ будет использовать 4999 перестановок. С 4999 перестановками, минимально возможное p-значение равно 0.0004, а все остальные p-значения будут кратны этому. Этот параметр рекомендуется использовать для тестов с 95-процентной достоверностью.
  • 9999Анализ будет использовать 9999 перестановок. С 9999 перестановками, минимально возможное p-значение равно 0.0002, а все остальные p-значения будут кратны этому значению. Этот параметр рекомендуется использовать для тестов с 99-процентной достоверностью.
Long

Производные выходные данные

ПодписьОписаниеТип данных
L-статистика Ли

L-статистика Ли для переменных анализа.

Double
P-значение

P-значение для L-статистики Ли.

Double
Корреляция Пирсона

Корреляция Пирсона между переменными анализа.

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
ИмяОписаниеТип данных
in_features

Входные объекты, содержащие поля двух переменных анализа.

Feature Layer
analysis_field1

Поле первой переменной анализа. Поле Y должно быть числовым.

Field
analysis_field2

Поле второй переменной анализа. Поле Y должно быть числовым.

Field
out_features

Выходные объекты, содержащие локальную L-статистику Ли, категории пространственной связи, p-значения и средневзвешенные значения соседей каждого объекта.

Feature Class
neighborhood_type
(Дополнительный)

Задает способ определения соседей каждого объекта. Объект всегда включается в окрестности, и все веса окрестностей нормализуются, чтобы в сумме получить значение 1.

  • DISTANCE_BANDК соседям будут отнесены объекты, находящиеся от каждого объекта в пределах заданного расстояния. Для точечных объектов эта опция используется по умолчанию.
  • K_NEAREST_NEIGHBORSБлижайшие k объекты будут включены в качестве соседей.
  • CONTIGUITY_EDGES_ONLYК соседям будут отнесены полигональные объекты, имеющие общие ребра.
  • CONTIGUITY_EDGES_CORNERSК соседям будут отнесены полигональные объекты, имеющие общие ребра или углы. Для полигональных объектов эта опция используется по умолчанию.
  • DELAUNAY_TRIANGULATIONТочки, у которых в триангуляции Делоне (полигоны Тиссена) есть общее ребро или угол, будут считаться соседними.
  • GET_SPATIAL_WEIGHTS_FROM_FILEСоседи и веса будут заданы файлом пространственных весов.
String
distance_band
(Дополнительный)

Диапазон расстояний, который будет использоваться для определения соседей вокруг фокального объекта. Если значение не указано, то расстояние будет кратчайшим расстоянием, таким, чтобы каждый объект имел по крайней мере еще одного соседа в окрестности. Для полигонов для определения соседей используется расстояние между центроидами.

Linear Unit
num_neighbors
(Дополнительный)

Число соседей вокруг каждого объекта, которые будут использоваться как соседи. Это значение не включает сам объект. Например, при задании числа 6 будет использоваться объект и его шесть ближайших соседей (всего семь объектов). Значение по умолчанию - 8. Это значение должно быть не менее 2.

Long
weights_matrix_file
(Дополнительный)

Путь и имя файла матрицы пространственных весов, который задает соседей и веса между объектами.

File
local_weighting_scheme
(Дополнительный)

Задает схему взвешивания, которая будет применяться к соседям при вычислении пространственных связей.

  • UNWEIGHTEDСоседи взвешиваться не будут. Это значение по умолчанию
  • BISQUAREСоседи будут взвешены с использованием биквадратного (квартичного) ядра.
String
kernel_bandwidth
(Дополнительный)

Ширина канала биквадратного ядра. Ширина канала определяет, насколько быстро вес уменьшается с увеличением расстояния. Большая ширина канала обеспечит сравнительно большие веса соседним объектам, расположенным дальше от объекта. Для окрестности k ближайших соседей значение по умолчанию (пусто) позволяет использовать адаптивную полосу пропускания, равную расстоянию до (k+1)-го соседа фокального объекта. Для окрестности диапазона фиксированных расстояний значение по умолчанию (пусто) будет соответствовать тому же значению, что и для диапазона расстояний.

Linear Unit
num_permutations
(Дополнительный)

Задает количество перестановок, которые будут использоваться для создания эталонных распределений при вычислении глобальных и локальных p-значений. Все значения p рассчитываются с использованием двусторонних тестов гипотез.

  • 99Анализ будет использовать 99 перестановок. С 99 перестановками минимально возможное p-значение равно 0.02, все остальные p-значения будут кратны этому.
  • 199Анализ будет использовать 199 перестановок. С 199 перестановками, минимально возможное p-значение равно 0.01, а все остальные p-значения будут кратны этому.
  • 499Анализ будет использовать 499 перестановок. С 499 перестановками, минимально возможное p-значение равно 0.004, а все остальные p-значения будут кратны этому.
  • 999Анализ будет использовать 999 перестановок. С 999 перестановками, минимально возможное p-значение равно 0.002, а все остальные p-значения будут кратны этому значению. Этот параметр рекомендуется использовать для тестов с 90-процентной достоверностью. Это значение по умолчанию
  • 4999Анализ будет использовать 4999 перестановок. С 4999 перестановками, минимально возможное p-значение равно 0.0004, а все остальные p-значения будут кратны этому. Этот параметр рекомендуется использовать для тестов с 95-процентной достоверностью.
  • 9999Анализ будет использовать 9999 перестановок. С 9999 перестановками, минимально возможное p-значение равно 0.0002, а все остальные p-значения будут кратны этому значению. Этот параметр рекомендуется использовать для тестов с 99-процентной достоверностью.
Long

Производные выходные данные

ИмяОписаниеТип данных
lee_l

L-статистика Ли для переменных анализа.

Double
p_value

P-значение для L-статистики Ли.

Double
corr

Корреляция Пирсона между переменными анализа.

Double

Пример кода

BivariateSpatialAssociation, пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование функции BivariateSpatialAssociation.

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
BivariateSpatialAssociation, пример 2 (автономный скрипт)

В следующем автономном скрипте показано использование функции BivariateSpatialAssociation.

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы