Анализ возникновения горячих точек (Углубленный анализ пространственно-временных закономерностей)

Краткая информация

Определяет тренды в кластерах плотностей точек (количествах) или значениях в кубе пространство-время, созданным с помощью инструментов Создать куб пространство-время по агрегации точек, Создать Куб пространство-время из указанных местоположений или Создать Куб пространство-время на основе многомерного растрового слоя. К категориям холодных и горячих точек относятся: новая, последовательная, возрастающая, постоянная, убывающая, спорадическая, колеблющаяся и историческая.

Подробнее о том, как работает инструмент Анализ возникновения горячих точек

Иллюстрация

Анализ закономерностей горячих точек

Использование

  • Этот инструмент может принимать только файлы netCDF, созданные с помощью инструментов Создать куб пространство-время по агрегации точек, Создать куб пространство-время из указанных местоположений или Создать куб пространство-время из многомерного растрового слоя.

  • Каждый бин в кубе пространства-времени содержит значение LOCATION_ID, time_step_ID, COUNT и любое из Полей суммирования или Переменных, агрегированных при создании куба. Набор бинов, связанный с одним и тем же местоположением, имеет одинаковый идентификатор местоположения и представляет собой временной ряд. Набор бинов, связанный с одним и тем же временным интервалом, имеет одинаковый идентификатор шага времени и представляет собой временной срез. Значение в каждом бине представляет число инцидентов или записей, которые присутствуют в определенном местоположении и определенном временном интервале.

    Каждый бин содержит идентификатор местоположения, идентификатор временного шага и количество.

  • Данный инструмент анализирует вариабельность во Входном кубе пространства-времени netCDF, используя пространственно-временную интерпретацию статистики Getis-Ord Gi*.

  • Выходные объекты добавляются на панель Таблице содержания и представляют обобщенный результат анализа пространства-времени для всех проанализированных местоположений. Если вы укажете Полигональную маску анализа, будут проанализированы только те местоположения, которые попадают в пределы маски анализа; в ином случае будут проанализированы местоположения, которые имеют как минимум одну точку в как минимум одном временном интервале.

    Местоположения куба с данными и без них

  • Кроме создания Выходных объектов, отчет об анализе записывается в виде сообщений, которые появляются в нижней части панели Геообработка во время выполнения этого инструмента. Вы можете получить доступ к сообщениям, переместив курсор мыши на индикатор выполнения, щелкнув на всплывающую кнопку Открыть всплывающее окно или развернув раздел сообщений на панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента из панели История геообработки.

  • Инструмент Анализ возникновения горячих точек выявляет по восемь специфичных трендов для горячих и холодных точек: новая, последовательная, возрастающая, постоянная, убывающая, спорадическая, колеблющаяся и историческая. Смотрите Более подробно о том, как работает инструмент Анализ возникновения горячих точек для дополнительной информации об определениях выходных категорий и о том, как работает алгоритм инструмента.

  • Для выявления интенсивности кластеризации объектов во времени, инструмент использует пространственно-временную интерпретацию статистики Getis-Ord Gi*, при этом вычисляется значение каждого бина, которое сопоставляется со значениями в соседних бинах.

  • Чтобы идентифицировать бины, которые будут включены в каждую окрестность анализа, инструмент сначала выявляет бины, которые попадают в заданное Определение пространственных взаимоотношений. Затем для каждого бина определяются бины, расположенные в том же местоположении, но в пределах N предшествующих временных шагов, где N – Временной шаг окрестности, указанный во входных параметрах.

  • Выбор параметра Определение пространственных взаимоотношений должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Выбор Концептуализации пространственных отношений: рекомендации.

  • По умолчанию для параметра Определение пространственных взаимоотношений устанавливается Фиксированное расстояние. Бин считается соседним, если его центроид попадает в указанные вами пределы Расстояния окрестности, а его временной интервал попадает в пределы Временного шага окрестности. Если вы не указываете Расстояние окрестности, оно будет рассчитано по умолчанию на основании пространственного распределения ваших данных. Если вы не указываете Интервал временного шага, то инструмент будет использовать значение по умолчанию, которое составляет 1 интервал временного шага.

  • Параметр Число соседей может замещать Расстояние соседства для опции Фиксированное расстояние либо расширять поиск соседей для опций Только соседние ребра и Углы соседних ребер. В этих случаях Число соседей используется, как минимальное значение. Например, если вы зададите Фиксированное расстояние с опцией Расстояние соседства равным 10, и значение 3 для параметра Количество соседей, то у каждого из бинов будет минимум по 3 пространственных соседа, даже если для того, чтобы найти их, пришлось бы увеличить Расстояние соседства. Расстояние увеличивается только в тех случаях, где минимальное Количество соседей не найдено. Точно так же с опциями смежности: для бинов с меньшим этого числа смежных соседей будут выбраны дополнительные соседи на основе близости центроидов.

  • Значение Временного шага окрестности – это количество интервалов временных шагов, включенных в окрестность анализа. Если интервал временного шага в вашем кубе составляет 3 месяца, и вы указали значение 2 для параметра Временной шаг окрестности – все бины, расположенные в пределах Расстояния окрестности и все связанные с ними бины в двух предшествующих интервалах временных шагов (в совокупности 9 месяцев) будут включены в окрестность анализа.

  • Слой Полигональной маски анализа может содержать один или несколько полигонов, определяющих область анализа. Эти полигоны определяют область, в которой могут встретиться анализируемые точки, и исключают области, в которых точки для анализа не встречаются. Например, если вы анализируете ограбления в жилых кварталах, вы можете использовать Полигональную маску анализа чтобы исключить крупные водоемы, парки и другие области, где нет жилых домов.

  • Полигон маски для анализа пересекается с экстентом Входного куба Пространство-Время, но не выходит за пределы куба.

  • Если Полигональная маска анализа, которую вы используете для задания области изучения, покрывает область, выходящую за границы экстента входных объектов, которые были использованы для первоначального создания куба, может потребоваться заново создать куб, используя эту Полигональную маску анализа как параметр Выходной экстент. Это позволит гарантировать, что вся область, покрываемая Полигональной маской анализа, будет включена в Анализ возникновения горячих точек. Используя Полигональную маску анализа как параметр среды Выходной экстент при создании куба, можно гарантировать, что куб будет соответствовать экстенту Полигональной маски анализа.

  • Инструмент Анализ возникновения горячих точек добавит некоторые результаты анализа ко входному netCDF-файлу Куба Пространство-Время. Инструментом выполняются три вида анализа:

    • Каждый бин анализируется совместно с бинами в ближайшей окрестности для определения интенсивности кластеризации как для высокого так и для низкого значений. В качестве результатов анализа рассчитывается z-оценка, значение P и категория бининга для каждого бина в кубе Пространство-время.
    • Временные ряды вычисленных z-оценок в анализируемом местоположении далее обрабатываются с использованием статистики Манна-Кендалла. Результатом этого анализа будет расчет тренда кластеризации по z-оценке, значению P и категории бининга для каждого местоположения.
    • И наконец временные ряды значений количества в анализируемом местоположении также обрабатываются с использованием статистики Манна-Кендалла. Результатом этого анализа будет расчет тренда по z-оценке, значению P и категории бининга в каждом местоположении.

    Сводные расчеты по переменным, которые добавляются ко Входному кубу Пространство-Время , перечислены ниже:

    Имя переменнойОписаниеИзмерение

    EMERGING_{ANALYSIS_VARIABLE}_HS_PVALUE

    Рассчитанное с использованием статистики Getis-Ord Gi* Значение P, определяющее статистическую значимость кластеризации высоких значений (горячих точек) и низких значений (холодных точек).

    Три измерения: одно значение P для каждого бина в кубе Пространство-время.

    EMERGING_{ANALYSIS_VARIABLE}_HS_ZSCORE

    Рассчитанная с использованием статистики Getis-Ord Gi* Z-оценка, определяющая интенсивность кластеризации высоких значений (горячих точек) и низких значений (холодных точек).

    Три измерения: одна z-оценка для каждого бина в кубе Пространство-Время.

    EMERGING_{ANALYSIS_VARIABLE}_HS_BIN

    Результирующая категория, используемая для классификации каждого бина как статистически значимой горячей или холодной точки. Бины классифицируются с применением коррекции FDR.

    • -3: холодная точка с вероятностью 99%
    • -2: холодная точка с вероятностью 95%
    • -1: холодная точка с вероятностью 90%
    • 0: не является статистически значимой горячей или холодной точкой
    • 1: горячая точка с вероятностью 90%
    • 2: горячая точка с вероятностью 95%
    • 3: горячая точка с вероятностью 99%

    Три измерения: одна категория бининга для каждого бина в кубе Пространство-Время. Бины классифицируются с применением коррекции FDR.

    {ANALYSIS_VARIABLE}_TREND_PVALUE

    Рассчитанное с помощью статистики Манна-Кендалла значение P статистически подтверждает наличие тренда по значениям в местоположении.

    Два измерения: одно значение P для каждого анализируемого местоположения.

    {ANALYSIS_VARIABLE}_TREND_ZSCORE

    Z-оценка, рассчитанная с помощью статистики Манна-Кендалла, указывает на наличие тренда, возрастающего или уменьшающегося, связанного со значениями в местоположении. Положительная z-оценка свидетельствует о возрастающем тренде; отрицательная z-оценка показывает уменьшающийся тренд.

    Два измерения: одна z-оценка для каждого анализируемого местоположения.

    {ANALYSIS_VARIABLE}_TREND_BIN

    Результирующая категория, используемая для классификации каждого местоположения на предмет наличия статистически значимого возрастающего или уменьшающегося тренда для значений.

    • -3: уменьшение с вероятностью 99%
    • -2: уменьшение с вероятностью 95%
    • -1: уменьшение с вероятностью 90%
    • 0: значимый тренд не выявлен
    • 1: возрастание с вероятностью 90%
    • 2: возрастание с вероятностью 95%
    • 3: возрастание с вероятностью 99%

    Два измерения: одна категория бининга для каждого анализируемого местоположения.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_PVALUE

    Рассчитанное с помощью статистики Манна-Кендалла значение P показывает статистическую значимость тренда для z-оценок горячих/холодных точек в местоположении.

    Два измерения: одно значение P для каждого анализируемого местоположения.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_ZSCORE

    Z-оценка, рассчитанная с помощью статистики Манна-Кендалла, указывает на наличие тренда, возрастающего или уменьшающегося, связанного с трендом z-оценок горячих/холодных точек в местоположении. Положительная z-оценка свидетельствует о возрастающем тренде; отрицательная z-оценка показывает уменьшающийся тренд.

    Два измерения: одна z-оценка для каждого анализируемого местоположения.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_BIN

    Результирующая категория, используемая для классификации каждого местоположения на предмет наличия статистически значимого возрастающего или уменьшающегося тренда для z-оценок горячих/холодных точек.

    • -3: уменьшение с вероятностью 99%
    • -2: уменьшение с вероятностью 95%
    • -1: уменьшение с вероятностью 90%
    • 0: значимый тренд не выявлен
    • 1: возрастание с вероятностью 90%
    • 2: возрастание с вероятностью 95%
    • 3: возрастание с вероятностью 99%

    Два измерения: одна категория бининга для каждого анализируемого местоположения.

    EMERGING_{ANALYSIS_VARIABLE}_CATEGORY

    Одна из 17 категорий, от 1 до 8, 0, и от -1 до -8.

    • 1, новая горячая точка
    • 2, последовательная горячая точка
    • 3, возрастающая горячая точка
    • 4, постоянная горячая точка
    • 4, убывающая горячая точка
    • 6, спорадическая горячая точка
    • 7, колеблющаяся горячая точка
    • 8, историческая горячая точка
    • 0, закономерность не обнаружена
    • -1, новая холодная точка
    • -2, последовательная холодная точка
    • -3, возрастающая холодная точка
    • -4, постоянная холодная точка
    • -5, убывающая холодная точка
    • -6, спорадическая холодная точка
    • -7, колеблющаяся холодная точка
    • -8, историческая холодная точка

    Два измерения: одна категория бининга для каждого анализируемого местоположения.

Параметры

ПодписьОписаниеТип данных
Входной куб Пространство-Время

Куб netCDF для анализа. Файл должен иметь расширение (.nc) и должен быть создан с помощью инструмента Создать куб Пространство-Время по агрегации точек или Создать куб Пространство-Время из указанных местоположений.

File
Переменная анализа

Имя числовой переменной в файле netCDF, которую вы хотите проанализировать.

String
Выходные объекты

Результаты выходного класса объектов Данный класс объектов будет представлять собой двумерное картографическое представление закономерностей в горячих и холодных точках в ваших данных. Вы сможете, например, увидеть новые или возрастающие горячие точки.

Feature Class
Расстояние до соседних объектов
(Дополнительный)

Пространственный экстент области анализа соседей. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.

Linear Unit
Интервал шкалы времени для соседних объектов
(Дополнительный)

Количество интервалов временных шагов для включения в окрестность анализа. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.

Long
Полигональная маска анализа
(Дополнительный)

Полигональный класс объектов с одним или несколькими полигонами, определяющими область анализа. Вы можете использовать полигональную маску анализа, например, для того, чтобы исключить из анализа большое озеро. Все бины во Входном кубе Пространство-Время, находящиеся вне пределов маски, не будут участвовать в анализе.

Этот параметр используется только для сетчатых кубов.

Feature Layer
Определение пространственных взаимоотношений
(Дополнительный)

Определяет, как заданы пространственные отношения между бинами.

  • Фиксированное расстояние — Каждый бин анализируется в контексте соседних. Соседние бины в пределах указанного критического расстояния (Расстояние соседства) получают вес 1 и влияют на расчеты для целевого бина. Соседние бины, которые выходят за пределы критического расстояния, получают значение веса, равное нулю, и не влияют на вычисления целевого бина.
  • Ближайшая окрестность K — Ближайшие k бинов включаются в анализ для целевого бина, где k – определенный числовой параметр.
  • Только совпадающие ребра — Только соседние бины с общими ребрами будут влиять на вычисления для целевого полигонального бина.
  • Совпадающие ребра и углы — Бины с общими ребрами или узлами будут влиять на вычисления для целевого полигонального бина.
String
Число пространственных соседей
(Дополнительный)

Целое число, определяющее минимальное или конкретное число соседей, которые будут включаться в вычисления для целевого бина. В случае K ближайших соседей у каждого бина будет число соседей, в точности равное заданному. В случае Фиксированного расстояния у каждого объекта будет по крайней мере это заданное количество соседей (для этого, если потребуется, пороговое расстояние будет временно увеличено). Когда выбран один из вариантов смежности, каждому бину будет присвоено это минимальное число соседей. Для бинов с меньшим числом соседей, чем число соседей со смежными границами, дополнительное количество соседей определяется по принципу близости центроидов объектов.

Long
Определить глобальное окно
(Дополнительный)

Статистика работает путем сравнения локальной статистики, вычисленной из окрестности для каждого бина, с глобальным значением. Этот параметр можно использовать для управления тем, какие ячейки используются для вычисления глобального значения.

  • Весь куб —Каждый соседний объект анализируется по сравнению со всем кубом. Это значение по умолчанию
  • Интервал шкалы времени для соседних объектов —Каждый соседний объект анализируется в сравнении с ячейками, содержащимися в заданном Интервале шкалы времени для соседних объектов.
  • Отдельный временной шаг —Каждый соседний объект анализируется в сравнении с бинами в том же временном шаге.
String

arcpy.stpm.EmergingHotSpotAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, {neighborhood_time_step}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
ИмяОписаниеТип данных
in_cube

Куб netCDF для анализа. Файл должен иметь расширение (.nc) и должен быть создан с помощью инструмента Создать куб Пространство-Время по агрегации точек или Создать куб Пространство-Время из указанных местоположений.

File
analysis_variable

Имя числовой переменной в файле netCDF, которую вы хотите проанализировать.

String
output_features

Результаты выходного класса объектов Данный класс объектов будет представлять собой двумерное картографическое представление закономерностей в горячих и холодных точках в ваших данных. Вы сможете, например, увидеть новые или возрастающие горячие точки.

Feature Class
neighborhood_distance
(Дополнительный)

Пространственный экстент области анализа соседей. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.

Linear Unit
neighborhood_time_step
(Дополнительный)

Количество интервалов временных шагов для включения в окрестность анализа. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.

Long
polygon_mask
(Дополнительный)

Полигональный класс объектов с одним или несколькими полигонами, определяющими область анализа. Вы можете использовать полигональную маску анализа, например, для того, чтобы исключить из анализа большое озеро. Все бины in_cube, находящиеся вне пределов маски, не будут участвовать в анализе.

Этот параметр используется только для сетчатых кубов.

Feature Layer
conceptualization_of_spatial_relationships
(Дополнительный)

Определяет, как заданы пространственные отношения между бинами.

  • FIXED_DISTANCEКаждый бин анализируется в контексте соседних. Соседние бины в пределах указанного критического расстояния (neighborhood_distance) получают вес 1 и влияют на расчеты для целевого бина. Соседние бины, которые выходят за пределы критического расстояния, получают значение веса, равное нулю, и не влияют на вычисления целевого бина.
  • K_NEAREST_NEIGHBORSБлижайшие k бинов включаются в анализ для целевого бина, где k – определенный числовой параметр.
  • CONTIGUITY_EDGES_ONLYТолько соседние бины с общими ребрами будут влиять на вычисления для целевого полигонального бина.
  • CONTIGUITY_EDGES_CORNERSБины с общими ребрами или узлами будут влиять на вычисления для целевого полигонального бина.
String
number_of_neighbors
(Дополнительный)

Целое число, определяющее минимальное или конкретное число соседей, которые будут включаться в вычисления для целевого бина. В случае K_NEAREST_NEIGHBORS каждый бин будет иметь это точно заданное число соседей. В случае FIXED_DISTANCE_BAND каждый бин будет иметь по крайней мере это заданное количество соседей, (для этого, если потребуется, пороговое расстояние будет временно увеличено). Когда выбран один из вариантов смежности, каждому бину будет присвоено это минимальное число соседей. Для бинов с меньшим числом соседей, чем число соседей со смежными границами, дополнительное количество соседей определяется по принципу близости центроидов объектов.

Long
define_global_window
(Дополнительный)

Статистика работает путем сравнения локальной статистики, вычисленной из окрестности для каждого бина, с глобальным значением. Этот параметр можно использовать для управления тем, какие ячейки используются для вычисления глобального значения.

  • ENTIRE_CUBEКаждый соседний объект анализируется по сравнению со всем кубом. Это значение по умолчанию
  • NEIGHBORHOOD_TIME_STEPКаждый соседний объект анализируется в сравнении с ячейками, содержащимися в заданном Интервале шкалы времени для соседних объектов.
  • INDIVIDUAL_TIME_STEPКаждый соседний объект анализируется в сравнении с бинами в том же временном шаге.
String

Пример кода

EmergingHotSpotAnalysis, пример 1 (окно Python)

В следующем скрипте окна Python показано, как используется инструмент EmergingHotSpotAnalysis.

import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", "5 Miles", 2, "#", "FIXED_DISTANCE", "3")
EmergingHotSpotAnalysis, пример 2 (автономный скрипт)

Следующий автономный скрипт Python демонстрирует, как использовать инструмент EmergingHotSpotAnalysis.

# Create Space Time Cube of homicide incidents in a metropolitan area

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\STPM"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace

    # Create Space Time Cube of homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube 
    cube = arcpy.CreateSpaceTimeCube_stpm("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS",
																																										"HEXAGON_GRID")

    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.MinimumBoundingGeometry_management("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")

    # Emerging Hot Spot Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step to detect hot spots
    # Process: Emerging Hot Spot Analysis 
    cube = arcpy.EmergingHotSpotAnalysis_stpm("Homicides.nc", "COUNT", "EHS_Homicides.shp", 
                                              "5 Miles", 2, "bounding.shp", "FIXED_DISTANCE", "3")

except arcpy.ExecuteError:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Связанные разделы