Как работает инструмент Анализ горячих точек

Инструмент Анализ горячих точек (Getis-Ord Gi*) рассчитывает статистический показатель Getis-Ord Gi* для каждого объекта в наборе данных. Итоговые z-оценки и p-значения указывают на то, в какой области пространства кластеризуются объекты с высокими или низкими значениями. Этот инструмент оценивает каждый пространственный объект в контексте соседних объектов. Объект с высоким значением интересен, но, возможно, не является статистически существенной горячей точкой. Чтобы быть статистически существенной горячей точкой, объект должен иметь высокое значение и быть окружён другими объектами с высокими значениями. Локальная сумма для объекта и его соседей сравнивается пропорционально с суммой всех объектов. Когда локальная сумма очень отличается от ожидаемой локальной суммы, и когда это отличие является слишком большим, чтобы быть результатом случайного процесса, получается статистически значимая z-оценка. Когда применяется коррекция FDR, статистическая значимость настраивается для множественного тестирования и пространственных зависимостей.

Вычисления

Вычисление статистики Getis-Ord Gi* показано на следующем рисунке:

Математические расчеты для статистики Gi*

Интерпретация

Статистическая величина Gi*, возвращенная для каждого объекта в наборе данных, является z-оценкой. Для статистически значимых положительных z-оценок, чем больше z-оценка, тем более интенсивна кластеризация высоких значений (горячая точка). Для статистически значимых негативных z-оценок, чем меньше z-оценка, тем более интенсивна кластеризация низких значений (холодная точка). Более подробно об определении статистической значимости и корректировки для множественного тестирования и пространственных зависимостей см. в разделе Что такое z-оценка? Что такое p-значение?.

Выходные данные

Инструмент создает выходной класс объектов с z-оценкой, p-значением и уровнем достоверности (Gi_Bin) для каждого входного объекта.

После выполнения инструмента, выходной класс объектов добавляется к карте с типом визуализации на основе поля Gi_Bin.

Основы Анализа горячих точек

Перед применением анализа горячих точек стоит рассмотреть следующие соображения:

  • Инструмент оценивает, кластеризуются ли в пространстве высокие или низкие значения (например, число преступлений, серьезных несчастных случаев). Поле, содержащее эти значения, является Полем анализа. Тем не менее, для точечных данных об инцидентах, вы можете больше интересоваться оценкой интенсивности инцидента, нежели анализом пространственного объединения в кластеры любого значения, связанного с инцидентами. В этом случае агрегируйте данные об инциденте перед запуском анализа, выполнив одно из перечисленных действий:
    • Если у вас есть полигональные объекты в изучаемой области, используйте инструмент Пространственное соединение, чтобы посчитать количество событий в каждом полигоне. Результирующее поле, содержащее число событий в каждом полигоне становится значением параметра Входное поле в инструменте Анализ горячих точек (Getis-Ord Gi*).
    • Используйте инструмент Построить сетку или Создать замощение для построения полигонального слоя сетки поверх ваших точечных объектов. Затем используйте инструмент Пространственное соединение, чтобы посчитать количество событий в пределах каждого полигона сетки. Удалите любые полигоны сетки за пределами области изучения. Также, в случаях, где большое количество полигонов сетки в изучаемой области содержат нули для числа событий, увеличьте размер сетки полигона, если удастся, или удалите полигоны сетки с нулевыми значениями.
    • Если у вас есть много совпадающих точек или пунктов на небольшом расстоянии друг от друга, вы можете использовать инструменты Интегрировать и Собрать события, чтобы связать объекты в пределах указанного расстояния друг от друга вместе и создать новый класс объектов, содержащий точку на каждом уникальном местоположении со связанным числовым атрибутом, который соответствует количеству событий (связанных точек). Используйте результирующее поле ICOUNT в качестве значения параметра Входное поле для инструмента Анализ горячих точек (Getis-Ord Gi*).
      Примечание:

      Если совпадающие точки превращаются в избыточные записи, инструмент Найти идентичные может помочь найти и удалить дубликаты.

    Примеры использования описанных выше инструментов для агрегирования данных об инцидентах показаны на следующем рисунке:
    Примеры агрегирования данных инцидентов
    Стратегии агрегирования данных об инцидентах.
  • Рекомендованное (по умолчанию) значение параметра Определение пространственных взаимоотношений для инструмента Анализ горячих точек (Getis-Ord Gi*) – это Фиксированный диапазон расстояний. Также могут использоваться такие значения, как Пространственно-временное окно, Зона индифферентности, K ближайших соседей и Триангуляция Делоне. Для изучения лучших методов и стратегий определения значения расстояния для анализа, смотрите Практические примеры при выборе определения пространственных отношений и Практические примеры при выборе фиксированного расстояния. Дополнительные сведения о пространственно-временном анализе горячих точек см. в разделе Пространственно-временной анализ.

  • Входное поле для анализа определяет тип вопросов, которые вы можете задать. Если вы заинтересованы в определении мест, где есть много инцидентов, или где высокие/низкие значения для определенного атрибута кластеризуются в пространстве, запустите Анализ горячих точек (Getis-Ord Gi*) для подсчета исходных значений или числа инцидентов. Этот тип анализа особенно полезен для расчета распределения ресурсов. Альтернативно (или в добавление), вы можете интересоваться поиском областей с неожиданно высокими значениями относительно некоторой другой переменной. Если вы анализируете обращения взысканий на недвижимость, то вы, вероятно, ожидаете рост числа взысканий в местах с большим количеством домов (то есть, вы предполагаете, что число взысканий является функцией от числа домов). Если вы разделите число взысканий на число домов, и запустите инструмент Анализ горячих точек (Getis-Ord Gi*) для этого соотношения, вы больше не будете спрашивать "Где больше всего взысканий? Вместо этого вы будете спрашивать "Где выявляется неожиданно большое количество взысканий в проекции на число домов?" Создавая уровень или отношение перед запуском анализа, вы можете управлять определенными ожидаемыми связями (например, число преступлений – функция населения; число потерь права выкупа – функция жилищного фонда), и идентифицируйте неожиданные горячие и холодные точки.

Рекомендации

Ниже описан практический пример использования инструмента Анализ горячих точек (Getis-Ord Gi*):

  • В параметре Входной класс объектов должен быть класс объектов с числом объектов не меньше 30. Результаты ненадежны при использовании менее 30 объектов.
  • Укажите соответствующую опцию в параметре Определение пространственных отношений. Для этого инструмента опция Диапазон фиксированного расстояния. Для информации о пространственно-временном анализе горячих точек см. Практические примеры при выборе определения пространственных взаимоотношений.
  • Укажите подходящее значение Диапазона расстояний или Порогового расстояния. См. Диапазон расстояний или пороговое расстояние для дополнительной информации.
    • Все объекты должны иметь, по крайней мере, одного соседа.
    • Ни один объект не должен иметь в качестве соседей все другие объекты.
    • Необходимо, чтобы у каждого объекта было не менее 8 соседей, особенно если значения во Входном поле искажены. Вы можете использовать инструмент Вычислить диапазон расстояний до числа соседних объектов для нахождения среднего расстояния от каждого объекта до 8 соседних объектов.

Возможное применение

Применение может быть найдено в анализе преступлений, эпидемиологии, голосовании, экономической географии, розничной торговле, транспортном анализе и демографии. Вы можете ответить на следующие типы вопросов:

  • Где сконцентрирована вспышка болезни?
  • Где пожары на кухне составляют высокую долю среди прочих бытовых пожаров?
  • Где следует расположить центры эвакуации?
  • Где и когда случаются пики интенсивности?
  • Каким местоположениям и на протяжении каких периодов времени мы должны выделять больше ресурсов?

Дополнительные ресурсы

Дополнительные сведения по теории пространственной статистики см. в следующих ресурсах:

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.

Getis, A. and J.K. Ord. 1992."The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).

Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" в Geographical Analysis 27(4).

На странице описания пространственной статистики имеются кроткие видеоролики, учебные пособия, онлайн-семинары, статьи и другие материалы, которые помогут вам начать работу с пространственной статистикой.

Scott, L. and N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools (Расширенный анализ преступности с использованием инструментов пространственной статистики ArcGIS) в ArcUser Online, April–June 2005.