Анализ горячих точек (Пространственная статистика)

Краткая информация

Приведенный набор взвешенных объектов, определяет статистическую значимость "горячих" точек и "холодных" точек на основе статистического показателя Getis-Ord Gi*.

Подробнее, как работает Анализ горячих точек (Getis-Ord Gi*)

Иллюстрация

Иллюстрация работы инструмента Анализ горячих точек

Использование

  • Этот инструмент идентифицирует статистически значимые пространственные кластеры высоких значений (горячих точек) и низких значений (холодных точек). Он создает Выходной класс объектов с z-оценкой, p-значением и полем бина уровня достоверности (Gi_Bin) для каждого объекта во Входном классе объектов.

  • Z-оценки и р-значения являются измерениями статистической значимости, которая определяет, можно ли отклонить нулевую гипотезу, по каждому объекту. В действительности, они указывают, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений. Поля p-значений и z-оценки не отражают никакой тип коррекции средней доли ложных отклонений гипотезы (FDR).

  • Поле Gi_Bin определяет статистическую значимость горячих и холодных точек, вне зависимости от применения коррекции FDR. Объекты с +/-3 bins отражают статистическую значимость с уровнем достоверности 99 процентов; объекты с +/-2 bins отражают статистическую значимость с уровнем достоверности 95 процентов; объекты с +/-1 bins отражают статистическую значимость с уровнем достоверности 90 процентов; а кластеризация для объектов в bin 0 не имеет статистической значимости. Без коррекции FDR статистическая значимость основывается на полях p-значения и z-оценки. При включении параметра Применить коррекцию средней доли ложных отклонений гипотезы (FDR), критические p-значения, определяющие уровни достоверности, уменьшаются в соответствии с множественным тестированием и пространственной зависимостью.

  • Высокая z-оценка и низкое р-значение для объекта свидетельствует о пространственной кластеризации высоких значений. Низкая негативная z-оценка и низкое р-значение для объекта свидетельствуют о пространственной кластеризации низких значений. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка, стремящаяся к нулю, указывает на отсутствие очевидного объединения в кластеры.

  • z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?

  • Когда входные объекты не имеют проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают очень хорошие оценки истинных геодезических расстояний, по крайней мере для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипосиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.

    Внимание:

    Следует обязательно производить проецирование ваших данных, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.

  • Когда при анализе используются хордовые расстояния, параметр Диапазон расстояний или пороговое расстояние, если он указывается, должен быть выражен в метрах.

  • Для линейных или полигональных объектов, при расчете расстояний используются центроиды. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.

  • Входное поле должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Чтобы использовать данный инструмент для анализа пространственных закономерностей случайных данных, попробуйте агрегировать данные инцидентов или используйте инструмент Оптимизированный анализ горячих точек.

    Примечание:

    Инцидентными данными являются точки, представляющие события (преступление, дорожно-транспортное происшествие) или объекты (деревья, магазины), по отношению к которым ваше внимание концентрируется скорее на их наличии или отсутствии, чем на атрибутах, свойственных каждой такой точке.

  • Инструмент Оптимизированный анализ горячих точек обрабатывает данные и автоматически выбирает настройки параметров для оптимизации горячих точек. Он агрегирует случайные данные, выбирает соответствующий масштаб анализа и настраивает результаты для множественного тестирования и пространственной зависимости. Выбранные опции параметров записываются в сообщения и могут быть полезны для более точной настройки параметров. Инструмент предлагает полный контроль и гибкую настройку параметров.

  • Выбор параметра Определение пространственных взаимоотношений должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимоотношения пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Лучшие практики для выбора определения пространственных отношений. Ниже приведены дополнительные советы:

    • По умолчанию выбрана опция Полоса фиксированных расстояний. Параметр Диапазон расстояний или пороговое расстояние гарантирует, что каждый объект имеет, по крайней мере, одного соседа. Это важно, но часто значение, заданное по умолчанию, не будет являться самым подходящим расстоянием для анализа. В разделе Практические примеры при выборе диапазона фиксированных расстояний приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.

    • При использовании опций Обратное расстояние или Квадрат обратного расстояния, когда для параметра Диапазон расстояний или Пороговое расстояние указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется расстояние по умолчанию.

      Веса для расстояний менее 1 становятся не стабильны после обращения. Следовательно, при взвешивании для объектов, разделенных менее чем одной единицей расстояния, получают вес 1.

      Для опций обратного расстояния (Обратное расстояние, Квадрат обратного расстояния и Зона индифферентности) любым двум совпадающим точкам будет присвоен вес 1, чтобы избежать деления на ноль. Это гарантирует, что объекты не будут исключены из анализа.

  • Дополнительные опции для параметра Определение пространственных взаимоотношений, включая пространственно-временные отношения, доступны при использовании инструмента Построить матрицу пространственных весов. Чтобы эффективно применять дополнительные опции, до выполнения анализа постройте файл матрицы пространственных весов; выберите Получить пространственные веса из файла для параметра Определение пространственных взаимоотношений, а для параметра Файл матрицы весов задайте путь к файлу с пространственными весами, который вы создали.

  • Дополнительные сведения о пространственно-временном кластерном анализе см. в документе Пространственно-временной анализ.

  • Слои карты можно использовать для определения Входного класса объектов. Если в слое есть выборка, только выбранные объекты будут включены в анализ.

  • Если указан файл матрицы весов с расширением .swm, инструмент предполагает получение файла матрицы весов, созданного с помощью инструментов Построить матрицу пространственных весов или Построить матрицу пространственных весов для сети, в противном случае предполагается файл матрицы весов в формате ASCII. В некоторых случаях, поведение инструмента различается в зависимости от типа используемого файла матрицы весов:

    • ASCII-файл с матрицей пространственных весов:
      • Веса используются без изменений. Отсутствующие отношения объект к объекту рассматриваются как нули.
      • Вес по умолчанию для собственного потенциала равен 0, если не указать значение параметра Поле собственного потенциала или точно указать веса собственного потенциала.
      • Учитываются асимметричные отношения, это позволяет объекту получить соседний объект, который сам не имеет соседства. Это означает, что соседний объект включается в локальные вычисления среднего значения для исходного объекта, но не включается в вычисления глобального среднего.
      • Если веса нормализованы, то результаты могут быть непригодны для анализа выбранного набора. Для выполнения анализа выбранного набора данных, конвертируйте ASCII-файл с матрицей весов в файл .swm, считав данные ASCII-файла в таблицу и используя опцию Конвертировать таблицу для параметра Определение пространственных взаимоотношений с инструментом Построить матрицу пространственных весов.
    • Файл матрицы пространственных весов в формате SWM:
      • Если веса уже были нормализованы, то они будут нормализованы вновь для выбранного набора данных. В противном случае они будут использоваться без изменений.
      • Вес по умолчанию для собственного потенциала – 1, если не указать значение параметра Поле собственного потенциала.

  • Для выполнения анализа с ASCII-файлом с матрицей пространственных весов требуется большой объем памяти. При анализе более 5000 объектов, ASCII-файл с матрицей пространственных весов следует конвертировать в SWM-файл. Сначала вставьте ваш ASCII-файл с весами в форматированную таблицу (например, с помощью Excel). Затем запустите инструмент Построить матрицу пространственных весов, задав значение Конвертировать таблицу для параметра Определение пространственных взаимоотношений. В результате будет создан SWM-файл с матрицей пространственных весов.

  • Выходной класс объектов инструмента автоматически добавляется к таблице содержания с использованием способа отображения по умолчанию, примененного к полю Gi_Bin. Применяемое отображение со шкалой «от горячего к холодному» определяется файлом слоя в <ArcGIS Pro>\Resources\ArcToolBox\Templates\Layers. Способ отображения по умолчанию, если это необходимо, можно применить заново путем изменения символов слоя шаблона.

  • Выходные данные этого инструмента включают гистограмму значений входного поля, которую можно открыть в разделе Выходной класс пространственных объектов на панели Содержание.

  • Дополнительную информацию о параметрах инструмента см. в справочной статье Моделирование пространственных отношений.

  • Внимание:

    При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.

    Прежние версии:

    Стандартизация строк не влияет на этот инструмент. Результаты выполнения инструмента будут совпадать при запуске со стандартизацией строк и без нее. Параметр Стандартизация отключен, он используется только для обеспечения обратной совместимости инструмента.

  • При использовании этого инструмента в Python, объект result, возвращаемый при запуске инструмента, содержит следующие выходные данные:

    Положение индексаОписаниеТип данных

    0

    Выходной класс объектов

    Класс пространственных объектов

    1

    Имя поля Результаты (GiZScore)

    Поле

    2

    Имя поля Вероятность (GiPValue)

    Поле

    3

    Имя поля ID источника (SOURCE_ID)

    Поле

Параметры

ПодписьОписаниеТип данных
Входной класс объектов

Это класс объектов, по которому будет выполняться анализ горячих точек.

Feature Layer
Входное поле

Числовое поле (количество жертв, тяжесть преступления и т.д.), которое должно быть оценено.

Field
Выходной класс объектов

Выходной класс объектов для получения результирующих z-оценки и р-значения.

Feature Class
Определение пространственных взаимоотношений

Определяет, как задаются пространственные отношения между объектами.

  • Обратное расстояниеБлизко расположенные соседние объекты оказывают большее влияние на вычисления для целевого объекта, нежели удаленные объекты.
  • Обратное расстояние в квадратеТо же самое, что и Обратное расстояние только угол наклона острее, влияние объектов уменьшается быстрее, и лишь ближайшие соседи окажут существенное влияние на вычисления для рассматриваемого объекта.
  • Полоса фиксированных расстоянийКаждый объект анализируется в контексте соседних объектов. Соседние объекты в пределах указанного критического расстояния (Диапазон расстояний или пороговое расстояние) получают вес 1 и влияют на расчеты для целевого объекта. Соседние объекты за пределами указанного критического расстояния получают вес 0 и не оказывают влияния на расчеты для целевого объекта.
  • Зона индифферентностиОбъекты, расположенные в пределах указанного критического расстояния (Диапазон расстояний или пороговое расстояние) от целевого объекта, получают вес 1 и влияют на расчеты для него. Как только критическое расстояние превышено, веса (и влияние соседнего объекта на расчеты целевого объекта) начинают уменьшаться с расстоянием.
  • K ближайших соседейБлижайшие K объектов включаются в анализ, где K — определенный числовой параметр.
  • Только совпадающие ребраТолько соседние полигональные объекты, которые имеют смежную границу или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • Совпадающие ребра и углыПолигональные объекты, которые имеют общую границу, общий узел или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • Получить пространственные веса из файлаПространственные отношения определены в файле пространственных весов. Путь к файлу с пространственными весами указан в параметре Файл Матрицы весов.
String
Метод расстояний

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • ЕвклидовоБудет использоваться расстояние по прямой линии между двумя точками (как ворона летает).
  • МанхэттенскоеБудет использовано расстояние между двумя точками, измеренное вдоль осей (городских кварталов); рассчитывается суммированием абсолютных разностей между координатами х и у.
String
Нормализация

Стандартизация строк не влияет на этот инструмент. Результаты выполнения инструмента будут совпадать при запуске со стандартизацией строк и без нее. Этот параметр отключен, он используется только для обеспечения обратной совместимости инструмента.

  • НетНормализация ряда пространственных весов не применяется.
  • СтрокаНормализация ряда пространственных весов не применяется.
String
Диапазон расстояний или пороговое расстояние
(Дополнительный)

Пороговое значение расстояния для параметров обратное расстояние и фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако, для Зоны индифферентности влияние объектов, расположенных за пределами данного расстояния, сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно совпадать со значением выходной системы координат.

При использовании обратного расстояния для вычисления пространственных отношений значение 0 показывает, что пороговое расстояние не применялось; когда данный параметр остается пустым, при анализе рассчитывается и применяется пороговое значение по умолчанию. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Этот параметр не оказывает никакого влияния, если указаны примыкание полигонов (Только совпадающие ребра или Совпадающие ребра и углы) или пространственное отношение Получить пространственные веса из файла.

Double
Поле собственного потенциала
(Дополнительный)

Поле, представляющее собственный потенциал – это расстояние или вес между одним и тем же объектом.

Field
Файл матрицы весов
(Дополнительный)

Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами.

File
Применить коррекцию средней доли ложных отклонений гипотезы (FDR)
(Дополнительный)

Указывает, будет ли присваиваться статистическая значимость с или без коррекции FDR.

  • Отмечено – статистическая значимость будет рассчитана с учетом коррекции FDR.
  • Не отмечено – статистическая значимость основывается на полях p-значения и z-оценки, а не на коррекции FDR. Это значение по умолчанию
Boolean
Число соседей
(Дополнительный)

Целое, задающее число соседств, которое будет включено в анализ.

Long

Производные выходные данные

ПодписьОписаниеТип данных
Поле результатов

Имя поля результатов (GiZScore).

Field
Поле вероятности

Имя поля вероятности (GiPValue).

Field
Идентификатор источника

Имя поля ID источника (SOURCE_ID).

Field

arcpy.stats.HotSpots(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Self_Potential_Field}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction}, {number_of_neighbors})
ИмяОписаниеТип данных
Input_Feature_Class

Это класс объектов, по которому будет выполняться анализ горячих точек.

Feature Layer
Input_Field

Числовое поле (количество жертв, тяжесть преступления и т.д.), которое должно быть оценено.

Field
Output_Feature_Class

Выходной класс объектов для получения результирующих z-оценки и р-значения.

Feature Class
Conceptualization_of_Spatial_Relationships

Определяет, как задаются пространственные отношения между объектами.

  • INVERSE_DISTANCEБлизко расположенные соседние объекты оказывают большее влияние на вычисления для целевого объекта, нежели удаленные объекты.
  • INVERSE_DISTANCE_SQUAREDТо же самое, что и INVERSE_DISTANCE, только угол наклона острее, влияние объектов уменьшается быстрее, и лишь ближайшие соседи окажут существенное влияние на вычисления для рассматриваемого объекта.
  • FIXED_DISTANCE_BANDКаждый объект анализируется в контексте соседних объектов. Соседние объекты в пределах указанного критического расстояния (Distance_Band_or_Threshold) получают вес 1 и влияют на расчеты для целевого объекта. Соседние объекты за пределами указанного критического расстояния получают вес 0 и не оказывают влияния на расчеты для целевого объекта.
  • ZONE_OF_INDIFFERENCEОбъекты в пределах указанного критического расстояния (Distance_Band_or_Threshold) от целевого объекта получают вес 1 и влияют на расчеты для этого объекта. Как только критическое расстояние превышено, веса (и влияние соседнего объекта на расчеты целевого объекта) начинают уменьшаться с расстоянием.
  • K_NEAREST_NEIGHBORSБлижайшие K объектов включаются в анализ, где K — определенный числовой параметр.
  • CONTIGUITY_EDGES_ONLYТолько соседние полигональные объекты, которые имеют смежную границу или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • CONTIGUITY_EDGES_CORNERSПолигональные объекты, которые имеют общую границу, общий узел или перекрываются, повлияют на расчеты для целевого полигонального объекта.
  • GET_SPATIAL_WEIGHTS_FROM_FILEПространственные отношения определены в файле пространственных весов. Путь к файлу пространственных весов указывается в параметре Weights_Matrix_File.
String
Distance_Method

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • EUCLIDEAN_DISTANCEБудет использоваться расстояние по прямой линии между двумя точками (как ворона летает).
  • MANHATTAN_DISTANCEБудет использовано расстояние между двумя точками, измеренное вдоль осей (городских кварталов); рассчитывается суммированием абсолютных разностей между координатами х и у.
String
Standardization

Стандартизация строк не влияет на этот инструмент. Результаты выполнения инструмента будут совпадать при запуске со стандартизацией строк и без нее. Этот параметр отключен, он используется только для обеспечения обратной совместимости инструмента.

  • NONEНормализация ряда пространственных весов не применяется.
  • ROWНормализация ряда пространственных весов не применяется.
String
Distance_Band_or_Threshold_Distance
(Дополнительный)

Пороговое значение расстояния для параметров обратное расстояние и фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако, для ZONE_OF_INDIFFERENCE влияние объектов, расположенных за пределами данного расстояния, сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно совпадать со значением выходной системы координат.

При использовании обратного расстояния для вычисления пространственных отношений значение 0 показывает, что пороговое расстояние не применялось; когда данный параметр остается пустым, при анализе рассчитывается и применяется пороговое значение по умолчанию. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа.

Этот параметр не оказывает никакого влияния, если указано примыкание полигонов (CONTIGUITY_EDGES_ONLY или CONTIGUITY_EDGES_CORNERS) либо определение пространственных отношений GET_SPATIAL_WEIGHTS_FROM_FILE.

Double
Self_Potential_Field
(Дополнительный)

Поле, представляющее собственный потенциал – это расстояние или вес между одним и тем же объектом.

Field
Weights_Matrix_File
(Дополнительный)

Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами.

File
Apply_False_Discovery_Rate__FDR__Correction
(Дополнительный)

Указывает, будет ли присваиваться статистическая значимость с или без коррекции FDR.

  • APPLY_FDRСтатистическая значимость будет рассчитана с учетом коррекции FDR.
  • NO_FDRСтатистическая значимость основывается на полях p-значения и z-оценки, а не на коррекции FDR. Это значение по умолчанию
Boolean
number_of_neighbors
(Дополнительный)

Целое, задающее число соседств, которое будет включено в анализ.

Long

Производные выходные данные

ИмяОписаниеТип данных
Results_Field

Имя поля результатов (GiZScore).

Field
Probability_Field

Имя поля вероятности (GiPValue).

Field
Source_ID

Имя поля ID источника (SOURCE_ID).

Field

Пример кода

HotSpots, пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование функции HotSpots.

import arcpy
arcpy.env.workspace = "C:/data"
arcpy.stats.HotSpots("911Count.shp", "ICOUNT", "911HotSpots.shp",
                     "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", 
                     "NONE", "#", "#", "euclidean6Neighs.swm", "NO_FDR")
HotSpots, пример 2 (автономный скрипт)

В следующем автономном скрипте Python показано использование функции HotSpots.


# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot Spot Analysis Tool (Local Gi*)

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables...
workspace = "C:/Data"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")

    integrate = arcpy.management.Integrate("911Copied.shp #", "500 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp", "Count", "#")

    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.management.AddField("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.management.CalculateField("911Count.shp", "MyID", "[FID]", "VB")

    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.stats.GenerateSpatialWeightsMatrix("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6,
                        "NO_STANDARDIZATION") 

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    hs = arcpy.stats.HotSpots("911Count.shp", "ICOUNT", "911HotSpots.shp", 
                     "GET_SPATIAL_WEIGHTS_FROM_FILE",
                     "EUCLIDEAN_DISTANCE", "NONE",
                     "#", "#", "euclidean6Neighs.swm", "NO_FDR")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Параметры среды

Особые случаи

Выходная система координат

До начала анализа геометрия пространственных объектов проецируется в выходную систему координат, поэтому значения параметров Диапазон расстояний или пороговое расстояние должны быть выражены в единицах измерения, заданных в выходной системе координат. Все математическое вычисления основаны на пространственной привязке выходной системы координат. Если выходная система координат выражена в градусах, минутах и секундах, геодезические расстояния рассчитываются с помощью хордовых расстояний в метрах.

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы