Как работает инструмент Пространственная автокорреляция (Глобальный индекс Морана I)

Инструмент Пространственная автокорреляция (Общий индекс I Морана) (Spatial Autocorrelation (Global Moran's I)) измеряет пространственную автокорреляцию, основанную одновременно на расположении объектов и их значениях. Исходя из предложенного набора объектов и связанных с ними атрибутов, инструмент Пространственной автокорреляции оценивает, имеется ли кластеризация объектов или они распределены разбросанно, или случайно. Инструмент рассчитывает Индекс I Морана, а также z-оценку и p-значение, чтобы оценить значимость индекса. P-значения – это числовые выражения области, расположенной под кривой, для известного распределения, ограниченного статистическим тестом.

Вычисления

Математические расчеты для статистического показателя Общий индекс I Морана

См. дополнительные математические расчеты для статистического показателя Общий индекс I Морана

Математические расчеты Глобального индекса проиллюстрированы выше. Инструмент рассчитывает среднее значение и дисперсию для атрибутов, которые оцениваются. Затем из значения каждого объекта вычитается среднее, создавая отклонение от среднего. Значения отклонений для всех соседних объектов (например, объекты в пределах указанного диапазона расстояний) умножаются друг на друга, чтобы создать векторное произведение. Заметьте, что числитель Глобального Индекса Морана включает суммированные векторные произведения. Предположим, что объекты А и B – соседи, и среднее значение для них – 10. Заметьте, что диапазон возможных векторных произведений следующий:

Значения объектов

Отклонения

Векторные произведения

A=50

B=40

40

30

1200

A= 8

B=6

-2

-4

8

A=20

B=2

10

-8

-80

Когда значения соседних объектов либо выше среднего, либо ниже, векторное произведение будет положительным. Когда одно значение меньше среднего, а другое – больше, векторное произведение будет негативным. Во всех случаях, чем больше отклонение от среднего, тем больше векторное произведение. Если значения в наборах данных пространственно кластеризуются (высокие значения располагаются рядом с другими высокими значениями; низкие значения – рядом с другими низкими); Индекс Морана будет позитивным. Когда высокие значения отвергают другие высокие значения и располагаются вблизи низких значений, Индекс будет отрицательным. Если положительное векторное произведение балансирует с негативным векторным произведением, Индекс будет около 0. Числитель нормализуется по вариации, поэтому Индекс принимает значения от -1 до +1 (см. раздел с часто задаваемыми вопросами).

После того, как инструмент Пространственная автокорреляция (Общий индекс I Морана) вычисляет значение индекса, он вычисляет Ожидаемое значение индекса (Expected Index). Ожидаемое и Наблюдаемое значения Индекса потом сравниваются. Задав количество объектов в наборе данных и вариацию для значений, инструмент рассчитывает z-оценку и p-значение, свидетельствующие о том, статистически значимая или нет разница. Значение Индекса не может быть интерпретировано непосредственно; оно должно интерпретироваться в рамках теории нулевой гипотезы.

Интерпретация

Инструмент Пространственная автокорреляция (Общий индекс I Морана) это статистический показатель, который означает, что результаты анализа интерпретируются в контексте нулевой гипотезы. Для показателя Глобальный Индекс Морана, нулевая гипотеза утверждает, что анализируемые атрибуты распределены случайно между объектами в вашей области изучения; или говоря иначе, пространственные процессы, создавшие наблюдаемую структуру значений, носят случайный характер. Представьте, что можно собрать значения атрибутов объектов, которые вы анализируете и разбросать их на объекты, позволяя им упасть куда угодно. Данные процесс – пример случайных пространственных процессов.

Когда p-значение, полученное в результате работы данного инструмента, мало и статистически значимо, нулевая гипотеза может быть отвергнута. Таблица ниже представляет интерпретацию результатов:

P-значение статистически не значимо.

Вы не можете отклонить нулевую гипотезу. Вполне возможно, что пространственное распределение значений атрибутов объектов – результат случайных пространственных процессов. Наблюдаемая пространственная структура значений может быть одним из возможных вариантов полной пространственной хаотичности.

P-значение статистически значимо, и z-оценка – положительная.

Вы можете отклонить нулевую гипотезу. Пространственное распределение высоких/низких значений в наборе данных пространственно более кластеризовано, чем это ожидалось бы, если бы обозначенные пространственные процессы были действительно случайными.

P-значение статистически не значимо, и z-оценка – негативная.

Вы можете отклонить нулевую гипотезу. Пространственное распределение высоких и низких значений в наборе данных более разбросано пространственно, нежели это наблюдалось бы, если обозначенные пространственные процессы были бы действительно случайными. Дисперсная пространственная модель часто отражает некоторый тип конкурентного процесса: объект с высокими значениями располагается рядом с другими объектами с высокими значениями, объект с низкими значениями располагается рядом с другими объектами с низкими значениями.

Выходные данные

Инструмент Пространственная автокорреляция (Spatial Autocorrelation) возвращает пять значений: Индекс I Морана (Moran's I Index), Ожидаемый индекс (Expected Index), Дисперсия (Variance), z-оценка (z-score) и p-значение (p-value). Эти значения записываются в сообщениях в нижней части панели Геообработка во время выполнения инструмента и передаются в качестве выходных значений для последующего использования в моделях и скриптах. Вы можете получить доступ к сообщениям, переместив курсор мыши на индикатор выполнения, щелкнув на всплывшую кнопку или развернув раздел сообщений в панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента из панели История геообработки. Этот инструмент может также создать отчета файл в формате HTML с графическим представлением результатов. Путь к файлу отчета будет доступен в сообщениях, в которых будет содержаться вся информация о параметрах запущенного инструмента. При двойном щелчке мыши на этом пути откроется файл отчета.

Практическое применение

  • Содержит ли Входной класс объектов по меньшей мере 30 объектов? Результаты ненадежны при использовании менее 30 объектов.
  • Подходит ли выбранная вами Определение пространственных взаимоотношений? См. Выбор Представления пространственных отношений (Conceptualization of Spatial Relationships).
  • Выбранный вами Диапазон расстояний или пороговое расстояние являются подходящими? См. Выбор Фиксированного расстояния.
    • Все объекты должны иметь, по крайней мере, одного соседа.
    • Никакой из объектов не должен иметь всех других объектов в качестве соседей.
    • Особенно, если значения в Входном поле (Input Field) искажены, вам потребуется, чтобы у каждого объекта было не менее 8 соседей.
  • Следует ли выполнить Стандартизацию рядов (Row Standardize)? Для полигональных объектов стандартизация рядов выполняется практически всегда. См. Стандартизация (Standardization).

Часто задаваемые вопросы

В. Результаты работы инструмента Анализ горячих точек (Getis-Ord Gi*) (Hot Spot Analysis (Getis-Ord Gi*)) показывают статистическую значимость "горячих" точек. Почему результаты, полученные из инструмента Пространственная автокорреляция (Общий индекс I Морана), не являются статистически значимыми?

О. Глобальные статистические показатели, такие как Пространственная автокорреляция (Общий индекс I Морана), оценивают общую структуру и тренд ваших данных. Они наиболее эффективны, когда пространственные закономерности устойчивы в пределах области интереса. Локальные статистические показатели (такие как Анализ горячих точек (Getis-Ord Gi*)) оценивают каждый объект в контексте соседних объектов и сравнивают локальные ситуации с глобальной ситуацией. Рассмотрим пример. Когда вы рассчитываете среднее значение для набора значений, вы также выполняете расчет глобальных статистических параметров. Если все значения около 20, тогда среднее значение тоже будет около 20, и этот результат даст вам хорошее представление о наборе данных в целом. Но, если половина значений близка к 1, а другая половина близка к 100, этот будет означать, что среднее значение где-то около 50. На самом деле, может и вообще не быть значений, близких к 50. Поэтому, среднее значение не является хорошей характеристикой набора данных в целом. Если вы создали гистограмму значений ваших данных, вы увидите картину бимодального распределения. Таким же образом, глобальные пространственные статистические показатели, включая инструмент Пространственная автокорреляция (Общий индекс I Морана), наиболее эффективны, когда анализируемые пространственные процессы последовательны в пределах области изучения. Тогда результаты будут хорошим представлением всей пространственной модели. Более подробно см.Getis and Ord (1992) и анализ SIDS, который они представляют.

 

В. Почему результаты инструмента Кластеризация с высокими/низкими значениями (Общий показатель Getis-Ord G) (High Low Clustering (Getis-Ord General G)) отличаются от результатов инструмента Пространственная автокорреляция (Общий индекс I Морана) (Spatial Autocorrelation (Global Moran's I))?

О. Эти инструменты измеряют разные пространственные структуры. Нажмите для получения более подробной информации

 

В. Можно ли сравнить z-оценки или p-значения с результатами анализа различных областей изучения?

О. Результаты не сравнимы для различных областей изучения. Когда область изучения фиксированная (например, все анализы для земель в Калифорнии), Входное поле сравнимо (например, вы анализируете население), и параметры инструмента такие же, (Фиксированное расстояние, заданное с диапазоном расстояний или пороговым расстоянием, составляет 5 000 метров, и выполнена стандартизация в ряд), можно сравнивать статистически значимые z-оценки, чтобы оценить интенсивность пространственной кластеризации или дисперсии или для лучшего понимания трендов во времени. Вы можете также запустить анализ для серии увеличивающихся значений Диапазон расстояний или порогового расстояния (Distance Band or Threshold Distance), чтобы понять расстояние/масштаб, где процессы, обеспечивающие пространственную кластеризацию, наиболее очевидны.

 

В. Почему я получаю Индекс Морана больше 1 или меньше -1?

О. В общем случае Индекс Морана ограничен интервалом от -1 до 1. Это всегда верно, если ваши веса стандартизованы в ряд. Когда вы не стандартизуете веса в ряд, могут быть случаи, когда значения Индекса выпадают за эти пределы, и это говорит о проблеме с параметрами настройки. Наиболее распространенные проблемы следующие:

  • Входное поле сильно искажено (создайте гистограмму распределения данных, чтобы посмотреть это), и Представление пространственных данных (Conceptualization of Spatial Relationships) или Диапазон расстояний (Distance Band) таковы, что некоторые объекты имеют очень мало соседей. Статистика для Общего индекса I Морана асимптотически нормальна. Это означает, что для искаженных данных требуется, чтобы у каждого объекта было не менее 8 соседей. Рассчитанное по умолчанию значение параметра Диапазон расстояний или пороговое значение (Distance Band or Threshold Distance) гарантирует, что каждый объект имеет как минимум 8 соседей, но этого может быть недостаточно, если Входное поле сильно искажено.
  • Используется Представление пространственных отношений (Conceptualization of Spatial Relationships) обратного расстояния, и обратные расстояния очень малы.
  • Стандартизация ряда не выбрана, но это необходимо. Каждый раз, когда ваши данные агрегированы, кроме случаев, когда схема агрегации непосредственно относится к области, которую вы анализируете, вам необходимо выбрать стандартизацию ряда.

Возможное применение

  • Позволяет определить подходящее расстояние соседства для большинства методов пространственного анализа вычисляя расстояние, где пространственная автокорреляция наиболее сильна.
  • Измеряет общие тренды в этнической или расовой сегрегации во времени – увеличивается или уменьшается сегрегация?
  • Подводит итог распространению идей, заболеваний, или трендов в пространстве и во времени – идея, болезнь или тренд остаются изолированными или распространяются?

Дополнительные ресурсы

Следующие книги и статьи содержат детальную информацию по этому инструменту:

Getis, Arthur, and J. K. Ord. "Анализ пространственный взаимосвязей с использованием статистики расстояний." Географический анализ 24, no. 3. 1992.

Майкл Гудчайлд (Goodchild, Michael F.) Пространственная автокорреляция. Catmog 47, Geo Books. 1986.

Дэниэл Гриффит (Griffith, Daniel). Пространственная автокорреляция: A Primer. Resource Publications in Geography, Association of American Geographers. 1987.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.