Как работает инструмент Кластеризация с высокими/низкими значениями (Общий показатель Getis-Ord G)

ArcGIS Pro 3.4 | | Архив справки

Инструмент Кластеризация с высокими/низкими значениями (Getis-Ord General G) измеряет концентрацию высоких или низких значений в изучаемой области.

Вычисления

Математические расчеты для статистики Общего индекса G

Смотрите дополнительные расчеты Общего индекса G.

Заметьте, что только разница между числителем и знаменателем является взвешиванием (wij). Кластеризация с высокими/низкими значениями работает только с положительными значениями. Следовательно, если ваши веса двоичные (0/1) или всегда меньше 1, диапазон для Общего индекса G будет между 0 и 1. Для этого статистического показателя рекомендуется двоичное взвешивание. Выберите Полоса фиксированных расстояний, Только совпадающие ребра, Совпадающие ребра и углы, K ближайшие соседи или файл .swm с триангуляцией Делоне для параметра Концептуализация пространственных отношений. Выберите Нет для параметра Стандартизация.

Интерпретация

Статистика Кластеризация с высокими/низкими значениями (Getis-Ord General G) – это статистический показатель, который означает, что результаты анализа интерпретируются в контексте нулевой гипотезы. Нулевая гипотеза для статистического показателя Кластеризация с высокими/низкими значениями утверждает, что нет пространственной кластеризации в значениях объектов. Когда p-значение, полученное в результате работы данного инструмента, мало и статистически значимо, нулевая гипотеза может быть отвергнута (см. Что такое z-оценка? Что такое p-значение?). Если нулевая гипотеза отвергнута, знак z-оценки имеет значение. Если z-оценка положительна, наблюдаемый Общий индекс G больше ожидаемого Общего индекса G, указывающего на кластеризацию высоких атрибутивных значений в области изучения. Если z-оценка отрицательная, наблюдаемый Общий индекс G меньше ожидаемого Общего индекса G, указывающего на кластеризацию низких атрибутивных значений в области изучения.

Инструмент Кластеризация с высокими/низкими значениями (Общий показатель Getis-Ord G) подходит наилучшим образом, когда данные распределены достаточно равномерно, но вам нужно найти неожиданные всплески высоких значений в пространстве. К сожалению, когда и высокие и низкие значения кластеризуются, они имеют тенденцию к отмене друг друга. Если вы заинтересованы в измерении пространственной кластеризации как высоких, так и низких значений, используйте инструмент Пространственная автокорреляция .

Нулевая гипотеза для инструментов Кластеризация с высокими/низкими значениями (Getis-Ord General G), и Пространственная автокорреляция (Global Moran I) основана на полной пространственной случайности. Величины случайно распределены среди объектов в наборе данных, отражающих случайные пространственные процессы. Однако, интерпретация z-оценок для инструмента Кластеризация с высокими/низкими значениями отличается от интерпретации z-оценок для инструмента Пространственная автокорреляция (Global Moran's I), как показано в следующей таблице:

РезультатКластеризация с высокими/низкими значениямиПространственная автокорреляция

P-значение статистически не значимо.

Вы не можете отклонить нулевую гипотезу. Возможно, что пространственное распределение значений атрибутов объектов – результат случайных пространственных процессов. Иначе говоря, наблюдаемая пространственная структура значений может быть одним из возможных вариантов полной пространственной случайности.

P-значение статистически значимо, и z-оценка – положительная.

Вы можете отклонить нулевую гипотезу. Пространственное распределение высоких значений в наборе данных более кластеризовано пространственно, чем, если бы обозначенные пространственные процессы были действительно случайными.

Вы можете отклонить нулевую гипотезу. Пространственное распределение высоких/низких значений в наборе данных пространственно более кластеризовано, чем это наблюдалось бы, если обозначенные пространственные процессы были бы действительно случайными.

P-значение статистически не значимо, и z-оценка – негативная.

Вы можете отклонить нулевую гипотезу. Пространственное распределение низких значений в наборе данных более кластеризовано пространственно, чем, если бы обозначенные пространственные процессы были действительно случайными.

Вы можете отклонить нулевую гипотезу. Пространственное распределение высоких и низких значений в наборе данных более дисперсно пространственно, чем, если бы обозначенные пространственные процессы были действительно случайными. Дисперсная пространственная модель часто отражает некоторый тип конкурентного процесса: объект с высокими значениями располагается рядом с другими объектами с высокими значениями, объект с низкими значениями располагается рядом с другими объектами с низкими значениями.

Выходные данные

Инструмент Кластеризация с высокими/низкими значениями (Getis-Ord General G) возвращает четыре значения: Наблюдаемое общее G, Ожидаемое общее G, z-оценка и p-значение. Эти значения записываются в сообщениях в нижней части панели Геообработка, и они передаются в качестве производных выходных данных для использования в моделях и скриптах. Вы можете получить доступ к сообщениям, удерживая курсор над индикатором выполнения, щелкнув на кнопке всплывающего окна или развернув раздел сообщений на панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента через историю геообработки. Дополнительно вы можете использовать этот инструмент для создания файла отчета HTML с графическим представлением результатов. Путь к файлу отчета будет доступен в сообщениях, в которых будет содержаться вся информация о параметрах запущенного инструмента. Щелкните этот путь, чтобы открыть файл отчета.

Часто задаваемые вопросы

В. Результаты работы инструмента Анализ горячих точек (Getis-Ord Gi*) показывают статистическую значимость "горячих" точек. Почему результаты, полученные из инструмента Кластеризация с высокими/низкими значениями (Getis-Ord General G) не являются тоже статистически значимыми?

О. Глобальные статистические показатели такие как Кластеризация с высокими/низкими значениями (Getis-Ord General G) оценивают общую структуру и тренд в ваших данных. Они наиболее эффективны, когда пространственные закономерности устойчивы в пределах области интереса. Локальные статистические показатели (такие как Анализ горячих точек) оценивают каждый объект в контексте соседних объектов и сравнивают локальные ситуации с глобальной ситуацией. Рассмотрим пример. Когда вы рассчитываете среднее значение для набора значений, вы также выполняете расчет глобальных статистических параметров. Если все значения около 20, тогда среднее значение тоже будет около 20, и этот результат даст вам хорошее представление о наборе данных в целом. Но если половина значений около 1, а вторая половина около 100, среднее будет около 50. Значения данных около 50 могут отсутствовать, поэтому среднее значение не является хорошим представлением о наборе данных в целом. Если вы создаете гистограмму значений данных, тем не менее, вы увидите картину бимодального распределения. Таким же образом, глобальная пространственная статистика, включая инструмент Кластеризация с высокими/низкими значениями, наиболее эффективна, когда анализируемые пространственные процессы последовательны по области изучения. Результаты будут хорошим представлением всей пространственной модели. Более подробно см.Getis and Ord (1992) и анализ SIDS, который они представляют.

В. Почему результаты инструмента Кластеризация с высокими/низкими значениями (Getis-Ord General G) отличаются от результатов инструмента Пространственная автокорреляция (Global Moran's I)?

О. См. таблицу выше. Эти инструменты измеряют разные пространственные структуры.

В. Можно сравнивать z-оценки или p-значения с результатами анализа различных областей изучения?

О. Результаты на самом деле нельзя сравнивать до тех пор, пока области изучения и параметры анализа не зафиксированы (то же и для всех типов анализа, которые вы хотите сравнить). Однако, если область изучения состоит из фиксированного набора полигонов, и анализ параметров фиксированный, вы можете сравнить z-оценки для определенного атрибута во времени. Например, вы хотите проанализировать тренды в кластеризации медицинских покупок на региональном уровне для определенной страны. Вы можете запустить инструмент Кластеризация с высокими/низкими значениями (Getis-Ord General G) для каждого временного периода, а затем создать линейный граф с результатами. Если вы обнаружили, что z-оценки – статистически значимые и увеличивающиеся, вы можете сделать заключение, что интенсивность пространственной кластеризации для больших покупок увеличивалась.

В. Влияет ли размер объекта на анализ?

О. Размер ваших объектов может влиять на результат. Если, к примеру, ваши большие полигоны имеют низкие значения и ваши маленькие полигоны имеют высокие значения, даже если концентрация высоких и низких значений приблизительна равная, наблюдаемый Общий индекс G может быть выше, чем ожидаемый Общий индекс G, т.к. имеется меньше пар маленьких полигонов в пределах указанных расстояний.

Возможное применение

  • Поиск неожиданных всплесков в числе обращений в больницу, что может свидетельствовать об обострении локальных или региональных проблем со здоровьем.
  • Сравнение пространственных закономерностей различных типов розничной продажи в городе, чтобы увидеть, какие типы кластеризуются с конкуренцией для использования в сравнении покупок (автомобильные представительства, например) и какие типы отражают конкуренцию (центры/спортзалы, например).
  • Определяя уровень, на котором пространственные явления кластеризуются, чтобы проверить изменения в различные временные периоды и в различных местах. Например, известно, что города и их население являются кластерами. Используя инструмент Кластеризация с высокими/низкими значениями (Getis-Ord General G), вы можете сравнивать уровень населения, которое кластеризуется в пределах одного города во времени (анализ роста урбанизации и плотности).

Дополнительные ресурсы

Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.