Пространственная автокорреляция (Глобальный индекс Морана I) (Пространственная статистика)

Краткая информация

Измеряет пространственную автокорреляцию на основе местоположений пространственных объектов и атрибутивных значений, используя статистику общего индекса I Морана.

Более подробно о том, как работает Пространственная автокорреляция (Глобальный индекс Морана I)

Иллюстрация

Иллюстрация инструмента Индекс I Морана

Использование

  • Инструмент Пространственная автокорреляция возвращает пять значений: Индекс I Морана, Ожидаемый индекс, Дисперсия, z-оценка и p-значение. Эти значения записываются в сообщениях в нижней части панели Геообработка во время выполнения инструмента и передаются в качестве выходных значений для последующего использования в моделях и скриптах. Чтобы получить доступ к сообщениям, поместите курсор мыши над индикатором выполнения и щелкните всплывающую кнопку, или разверните раздел сообщений на панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента из панели История геообработки. Дополнительно вы можете использовать этот инструмент для создания файла отчета HTML с графическим представлением результатов. Путь к файлу отчета будет доступен в сообщениях, в которых будет содержаться вся информация о параметрах запущенного инструмента. Щелкните этот путь, чтобы открыть файл отчета.

  • Исходя из предложенного набора объектов и связанных с ними атрибутов, этот инструмент оценивает, является ли модель сгруппированной (кластерной), рассредоточенной (дисперсионной) или случайной. Когда z-оценка или p-значение указывают на статистическую значимость, положительный индекс Морана I свидетельствует о тенденции к кластеризации, в то время как отрицательные значения индекса Морана говорят о тенденции к дисперсному распределению объектов (явлений).

  • Этот инструмент вычисляет z-оценку и p-значение, по которым принимается решение об отклонении нулевой гипотезы. Для этого инструмента нулевая гипотеза утверждает, что значения, связанные с объектами, распределены хаотично.
  • z-оценка и p-значение являются показателями статистической значимости. Эти значения могут помочь определить, следует ли отклонять нулевую гипотезу. Для этого инструмента нулевая гипотеза утверждает, что значения, связанные с объектами, распределены хаотично.

  • Значение параметра Входное поле должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Если вы хотите использовать данный инструмент для анализа пространственных закономерностей случайных данных по происшествиям, попробуйте агрегировать ваши случайные данные. Для анализа пространственных закономерностей случайных данных может также использоваться инструмент Оптимизированный анализ горячих точек.

    Примечание:

    Данными по случайным инцидентам являются точки, представляющие события (преступления, дорожно-транспортное происшествия) или объекты (деревья, магазины), по отношению к которым ваше внимание концентрируется скорее на их наличии или отсутствии, чем на атрибутах, свойственных каждой такой точке.

  • Когда значение параметра Входной класс объектов не имеет проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают хорошие оценки истинных геодезических расстояний, по крайней мере для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипосиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.

    Внимание:

    Следует обязательно производить проецирование ваших данных, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.

  • Когда при анализе используются хордовые расстояния, параметр Диапазон расстояний или пороговое расстояние, если он указывается, должен быть выражен в метрах.

  • Для линейных или полигональных объектов, при расчете расстояний используются центроиды. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.

  • Выбор параметра Определение пространственных взаимоотношений должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Выбор определения пространственных взаимоотношений: рекомендации. Ниже приводится несколько дополнительных советов:

    • Полоса фиксированных расстояний

      Параметр Диапазон расстояний или пороговое расстояние гарантирует, что каждый объект имеет, по крайней мере, одного соседа. Это важно, но часто значение, заданное по умолчанию, не будет являться самым подходящим расстоянием для вашего анализа. В разделе Диапазон расстояний (сфера влияния) приведены дополнительные стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.

    • Обратное расстояние или Квадрат обратного расстояния

      Когда для параметра Диапазон расстояний или пороговое расстояние указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется пороговое значение по умолчанию.

      Веса для расстояний менее 1 становятся не стабильны после обращения. Следовательно, при взвешивании для объектов, разделенных менее чем одной единицей расстояния, получают вес 1.

      Для опций обратного расстояния (Обратное расстояние, Квадрат обратного расстояния и Зона индифферентности) любым двум совпадающим точкам будет присвоен вес 1, чтобы избежать деления на ноль. Это будет гарантировать, что объекты не исключены из анализа.

    • FIXED_DISTANCE_BAND

      Параметр Диапазон расстояний или пороговое расстояние гарантирует, что каждый объект имеет, по крайней мере, одного соседа. Это важно, но часто значение, заданное по умолчанию, не будет являться самым подходящим расстоянием для вашего анализа. В разделе Диапазон расстояний или пороговое расстояние приведены дополнительные стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.

    • INVERSE_DISTANCE или INVERSE_DISTANCE_SQUARED

      Когда для параметра Диапазон расстояний или пороговое расстояние указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется пороговое значение по умолчанию.

      Веса для расстояний менее 1 становятся не стабильны после обращения. Следовательно, при взвешивании для объектов, разделенных менее чем одной единицей расстояния, получают вес 1.

      При использовании опции обратного расстояния (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED или ZONE_OF_INDIFFERENCE) любым двум совпадающим точкам придается значение веса 1 во избежание деления на 0. Это будет гарантировать, что объекты не исключены из анализа.

  • В Python полученный результат работы этого инструмента содержит значение индекса Морана I, z-оценку, p-значение и файл отчета HTML. Например, если вы назначили объект инструмента Result переменной с именем MoranResult, то MoranResult[0] сохранит значение индекса Морана I, MoranResult[1] сохранит z-оценку, MoranResult[2] сохранит p-значение, а MoranResult[3] сохранит путь к файлу с HTML отчетом. Если вы не создаете выходной файл отчета HTML с помощью параметра Построить отчет, то последний из полученных результатов будет пустой строкой.

  • Дополнительные опции для параметра Определение пространственных взаимоотношений, включая 3D- и пространственно-временные отношения доступны при использовании инструмента Построить матрицу пространственных весов. Чтобы использовать эти дополнительные опции, до выполнения анализа постройте файл с матрицей пространственных весов; для параметра Определение пространственных взаимоотношений используйте опцию Взять пространственные веса из файла, а для параметра Файл матрицы весов задайте путь к файлу с пространственными весами, который вы создали.

  • Слои карты могут быть указаны в качестве значения параметра Входной класс объектов. Если в слое есть выборка, в анализ будут включены только выбранные объекты.

  • Если вы укажете значение параметра Файл матрицы весов с расширением .swm, ожидается, что файл матрицы пространственных весов будет создан с помощью инструмента Построить матрицу пространственных весов; иначе инструмент ожидает файл матрицы весов в формате ASCII. В некоторых случаях, поведение различно в зависимости от типа использованной матрицы весов:

    • ASCII-файл с матрицей пространственных весов:
      • Веса буду использоваться без изменений. Отсутствующие отношения объект к объекту будут рассматриваться как нули.
      • Если веса нормализованы, то результаты могут быть непригодны для анализа выбранного набора. Для выполнения анализа выбранного набора данных, конвертируйте ASCII-файл с матрицей весов в файл .swm, считав данные ASCII-файла в таблицу и используя опцию Конвертировать таблицу инструмента Построить матрицу пространственных весов.
    • Файл матрицы пространственных весов в формате SWM:
      • Если веса уже нормализованы, то они будут нормализованы вновь для выбранного набора данных. В противном случае они будут использоваться без изменений.

  • Для выполнения анализа с ASCII-файлом с матрицей пространственных весов требуется большой объем памяти. При анализе более 5000 объектов, ASCII-файл с матрицей пространственных весов следует конвертировать в SWM-файл. Сначала вставьте ваш ASCII-файл с весами в форматированную таблицу (например, с помощью Excel). Затем запустите инструмент Построить матрицу пространственных весов, задав значение Конвертировать таблицу для параметра Определение пространственных взаимоотношений. В результате будет создан SWM-файл с матрицей пространственных весов.

  • Примечание:

    Во время работы инструмента может обнаружиться нехватка памяти. Так может произойти, когда вы выбираете Определение пространственных взаимоотношений и Диапазон расстояний или Пороговое расстояние, что приводит к тому, что у объектов очень много соседей. Как правило, не требуется задавать пространственные отношения, в которых у каждого объекта имеется несколько тысяч соседей. Все объекты должны иметь как минимум 1 соседа, и почти все объекты должны иметь по крайней мере восемь соседей.

  • Для полигональных объектов используйте опцию Строка для параметра Стандартизация. Стандартизация строк нивелирует отклонение в ситуациях, когда количество соседей каждого объекта является функцией агрегирования или выборки, нежели отражением реального пространственного распределения анализируемой переменной.

  • Для получения дополнительной информации о параметрах этого инструмента см. раздел справки Моделирование пространственных отношений.

  • Внимание:

    Шейп-файлы не могут хранить пустые значения. Инструменты или другие процедуры, создающие шейп-файлы из других типов входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях пустые значения в шейп-файлах хранятся как большие отрицательные числа, что может привести к непредсказуемым результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.

Параметры

ПодписьОписаниеТип данных
Входной класс объектов

Класс объектов, для которого будет рассчитываться пространственная автокорреляция.

Feature Layer
Входное поле

Числовое поле, используемое в оценке пространственной автокорреляции.

Field
Сгенерировать отчет
(Дополнительный)

Указывает, будет ли Графическая сводка представлена в формате файла .html.

  • Отмечено — результаты будут представлены в графической форме.
  • Не отмечено – результаты не будут представлены в графической форме. Это значение по умолчанию
Boolean
Определение пространственных взаимоотношений

Определяет, как заданы пространственные отношения между объектами.

  • Обратное расстояниеБлизко расположенные соседние объекты оказывают большее влияние на вычисления для целевого объекта, нежели удаленные объекты.
  • Обратное расстояние в квадратеТо же самое, что и Обратное расстояние только угол наклона острее, влияние объектов уменьшается быстрее, и лишь ближайшие соседи окажут существенное влияние на вычисления для рассматриваемого объекта.
  • Полоса фиксированных расстоянийКаждый объект анализируется в контексте соседних объектов. Соседние объекты в пределах указанного критического расстояния (Диапазон расстояний или пороговое расстояние) получают вес 1 и влияют на расчеты для целевого объекта. Соседние объекты за пределами указанного критического расстояния получают вес 0 и не оказывают влияния на расчеты для целевого объекта.
  • Зона индифферентностиОбъекты, расположенные в пределах указанного критического расстояния (Диапазон расстояний или пороговое расстояние) от целевого объекта, получают вес 1 и влияют на расчеты для него. Как только критическое расстояние превышено, веса (и влияние соседнего объекта на расчеты целевого объекта) начинают уменьшаться с расстоянием.
  • Ближайшая окрестность KБлижайшие K объектов включаются в анализ. Количество соседей (К), которое нужно включить в анализ, указывается с помощью параметра Количество соседей.
  • Только совпадающие ребраТолько соседние полигональные объекты, которые имеют смежную границу или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • Совпадающие ребра и углыПолигональные объекты, которые имеют общую границу, общий узел или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • Получить пространственные веса из файлаПространственные отношения определены в файле пространственных весов. Путь к файлу с пространственными весами указан в параметре Файл Матрицы весов.
String
Метод расстояний

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • ЕвклидовоБудет использоваться расстояние по прямой линии между двумя точками (как ворона летает).
  • МанхэттенскоеБудет использоваться расстояние между двумя точками, измеренное вдоль осей под прямыми углами (городской квартал). Оно вычисляется путем суммирования (абсолютной) разности между координатами x и y
String
Нормализация

Задает применение стандартизации пространственных весов. Нормализация ряда рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации.

  • НетНормализация ряда пространственных весов не применяется.
  • СтрокаПространственные веса нормализуются; каждый вес делится на его сумму ряда (сумму весов всех соседних объектов). Это значение по умолчанию
String
Диапазон расстояний или пороговое расстояние
(Дополнительный)

Пороговое расстояние для параметров Обратное расстояние и Фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако для Зоны индифферентности влияние объектов, расположенных за пределами данного расстояния, сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно совпадать с расстоянием по выходной системе координат.

При использовании концептуализации обратных расстояний для вычисления пространственных отношений значение 0 обозначает, что пороговое расстояние не применялось; когда данный параметр остается пустым, при анализе рассчитывается и применяется пороговое значение по умолчанию. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Этот параметр не оказывает никакого влияния, если выбрано примыкание полигонов (Только совпадающие ребра, Совпадающие ребра и углы) или пространственные концептуализации Получить пространственные веса из файла.

Double
Файл матрицы весов
(Дополнительный)

Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами.

File
Число соседей
(Дополнительный)

Целое число, определяющее число соседей, которое будет включено в анализ.

Long

Производные выходные данные

ПодписьОписаниеТип данных
Индекс

Значение индекса Морана.

Double
Очки Z

z-оценка.

Double
P-значение

p-значение.

Double
Файл отчета

Файл HTML с графическим итоговым представлением результатов.

File

arcpy.stats.SpatialAutocorrelation(Input_Feature_Class, Input_Field, {Generate_Report}, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {number_of_neighbors})
ИмяОписаниеТип данных
Input_Feature_Class

Класс объектов, для которого будет рассчитываться пространственная автокорреляция.

Feature Layer
Input_Field

Числовое поле, используемое в оценке пространственной автокорреляции.

Field
Generate_Report
(Дополнительный)

Указывает, будет ли Графическая сводка представлена в формате файла .html.

  • NO_REPORTРезультаты не будут представлены в графической форме. Это значение по умолчанию
  • GENERATE_REPORTБудет создана графическая сводка.
Boolean
Conceptualization_of_Spatial_Relationships

Определяет, как заданы пространственные отношения между объектами.

  • INVERSE_DISTANCEБлизко расположенные соседние объекты оказывают большее влияние на вычисления для целевого объекта, нежели удаленные объекты.
  • INVERSE_DISTANCE_SQUAREDТо же самое, что и INVERSE_DISTANCE, только угол наклона острее, влияние объектов уменьшается быстрее, и лишь ближайшие соседи окажут существенное влияние на вычисления для рассматриваемого объекта.
  • FIXED_DISTANCE_BANDКаждый объект анализируется в контексте соседних объектов. Соседние объекты в пределах указанного критического расстояния (Distance_Band_or_Threshold) получают вес 1 и влияют на расчеты для целевого объекта. Соседние объекты за пределами указанного критического расстояния получают вес 0 и не оказывают влияния на расчеты для целевого объекта.
  • ZONE_OF_INDIFFERENCEОбъекты в пределах указанного критического расстояния (Distance_Band_or_Threshold) получают вес 1 и влияют на расчеты для целевого объекта. Как только критическое расстояние превышено, веса (и влияние соседнего объекта на расчеты целевого объекта) начинают уменьшаться с расстоянием.
  • K_NEAREST_NEIGHBORSБлижайшие K объектов включаются в анализ. Число соседей (К), которое нужно включить в анализ, определяется параметром number_of_neighbors.
  • CONTIGUITY_EDGES_ONLYТолько соседние полигональные объекты, которые имеют смежную границу или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • CONTIGUITY_EDGES_CORNERSПолигональные объекты, которые имеют общую границу, общий узел или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • GET_SPATIAL_WEIGHTS_FROM_FILEПространственные отношения определены в файле пространственных весов. Путь к файлу пространственных весов указывается в параметре Weights_Matrix_File.
String
Distance_Method

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • EUCLIDEAN_DISTANCEБудет использоваться расстояние по прямой линии между двумя точками (как ворона летает).
  • MANHATTAN_DISTANCEБудет использоваться расстояние между двумя точками, измеренное вдоль осей под прямыми углами (городской квартал). Оно вычисляется путем суммирования (абсолютной) разности между координатами x и y
String
Standardization

Задает применение стандартизации пространственных весов. Нормализация ряда рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации.

  • NONEНормализация ряда пространственных весов не применяется.
  • ROWПространственные веса нормализуются; каждый вес делится на его сумму ряда (сумму весов всех соседних объектов). Это значение по умолчанию
String
Distance_Band_or_Threshold_Distance
(Дополнительный)

Пороговое расстояние для параметров Обратное расстояние и Фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако, для ZONE_OF_INDIFFERENCE влияние объектов, расположенных за пределами данного расстояния, сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно совпадать с расстоянием по выходной системе координат.

При использовании концептуализации обратных расстояний для вычисления пространственных отношений значение 0 показывает, что пороговое расстояние не применялось; когда данный параметр остается пустым, при анализе рассчитывается и применяется пороговое значение по умолчанию. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Этот параметр не оказывает никакого влияния, если выбрано примыкание полигонов (CONTIGUITY_EDGES_ONLY или CONTIGUITY_EDGES_CORNERS) либо пространственные концептуализации GET_SPATIAL_WEIGHTS_FROM_FILE.

Double
Weights_Matrix_File
(Дополнительный)

Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами.

File
number_of_neighbors
(Дополнительный)

Целое число, определяющее число соседей, которое будет включено в анализ.

Long

Производные выходные данные

ИмяОписаниеТип данных
Index

Значение индекса Морана.

Double
ZScore

z-оценка.

Double
PValue

p-значение.

Double
Report_File

Файл HTML с графическим итоговым представлением результатов.

File

Пример кода

SpatialAutocorrelation, пример 1 (окно Python)

Пример скрипта в окне Python для использования функции SpatialAutocorrelation.

import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.stats.SpatialAutocorrelation("olsResults.shp", "Residual", "NO_REPORT", 
                                   "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN DISTANCE", 
                                   "NONE", "#", "euclidean6Neighs.swm")
SpatialAutocorrelation, пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать функцию SpatialAutocorrelation.

# Analyze the growth of regional per capita incomes in U.S.
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression

# Import system modules
import arcpy

# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Growth as a function of {log of starting income, dummy for South
    # counties, interaction term for South counties, population density}
    # Process: Ordinary Least Squares... 
    ols = arcpy.stats.OrdinaryLeastSquares("USCounties.shp", "MYID", 
                        "olsResults.shp", "GROWTH",
                        "LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
                        "olsCoefTab.dbf",
                        "olsDiagTab.dbf")

    # Create Spatial Weights Matrix (can be based on input or output FC)
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.stats.GenerateSpatialWeightsMatrix("USCounties.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 
                        

    # Calculate Moran's I Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.stats.SpatialAutocorrelation("olsResults.shp", "Residual",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "euclidean6Neighs.swm")

except:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Параметры среды

Особые случаи

Выходная система координат

До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат. Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат. Если выходная система координат выражена в градусах, минутах и секундах, то геодезические расстояния рассчитываются с помощью хордовых расстояний.

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы