Пошаговая пространственная автокорреляция (Пространственная статистика)

Краткая информация

Измеряет пространственную автокорреляцию для серии расстояний и при необходимости создает линейный график этих расстояний и соответствующих z-оценок. z-оценки отражают интенсивность пространственной кластеризации, а статистически значимые и увеличивающиеся пиковые z-оценки обозначают расстояния, на которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Эти пиковые расстояния часто нужно использовать в инструментах с параметром Диапазон расстояний или Радиус расстояний.

Иллюстрация

пошаговая пространственная автокорреляция
Пиковые z-оценки соответствует расстояниям, при которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены.

Использование

  • Этот инструмент помогает выбрать нужное значение параметра Порог расстояния или Радиус для инструментов с этими параметрами, такие как Анализ горячих точек и Плотность точек.

  • Инструмент Пошаговая пространственная автокорреляция измеряет пространственную автокорреляцию для последовательности приращений расстояния и для каждого приращения показывает соответствующие индекс Морана, Ожидаемый индекс, Дисперсию, z-оценку и p-значение. Эти значения отображается в виде сообщений, которые появляются в нижней части панели Геообработка во время выполнения инструмента. Вы можете получить доступ к сообщениям, переместив курсор мыши на индикатор выполнения, щелкнув на всплывшую кнопку или развернув раздел сообщений в панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента из панели История геообработки. Этот инструмент может создать отчета файл в формате PDF с графическим представлением результатов. Путь к файлу отчета будет доступен в сообщениях, в которых будет содержаться вся информация о параметрах запущенного инструмента. При двойном щелчке мыши на этом пути откроется файл отчета.

  • Если присутствует несколько статистически значимых пиков, на каждом из этих расстояний имеется выраженная кластеризация. Выберите пиковое расстояние, которое лучше всего соответствует масштабу нужного анализа. Часто это первый обнаруженный статистически значимый пик.

  • Входное поле должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Если вы хотите использовать данный инструмент для анализа пространственных закономерностей случайных данных, попробуйте агрегировать ваши случайные данные.

  • Когда Входной класс объектов не имеет проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают очень хорошие оценки истинных геодезических расстояний, по крайней мере, для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипсоиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.

    Внимание:

    Следует обязательно производить проецирование ваших данных, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.

  • Если при анализе используются хордовые расстояния, параметры Начальное расстояние и Приращение расстояния, если они указываются, должны быть выражены в метрах.

  • Для линейных или полигональных объектов, при расчете расстояний используются центроиды. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.

  • Слои карты можно использовать для определения Входного класса объектов. Если в слое есть выборка, только выбранные объекты будут включены в анализ.

  • Для полигональных объектов практически всегда необходимо выбирать значение Строка для параметра Нормализация ряда. Нормализация ряда нивелирует отклонение в ситуациях, когда количество соседей каждого объекта является функцией агрегирования или выборки, нежели отражением реального пространственного распределения анализируемой переменной.

  • Если значение параметра Начальное расстояние не указано, значением по умолчанию является минимальное расстояние, при котором у каждого объекта в наборе данных есть хотя бы один соседний объект. Это может быть не самое лучшее начальное расстояние, если набор данных содержит выбросы.

  • Если Приращение расстояния (Increment Distance) не задано, используется наименьшее из либо среднего расстояния до ближайшего соседа, либо (Td – B) / I, где Td является максимальным пороговым расстоянием, BНачальное расстояние (Beginning Distance), а IЧисло интервалов расстояний (Number of Distance Bands). Этот алгоритм гарантирует, что вычисления всегда будут выполнены для указанного Числа интервалов расстояний, и что наибольший интервал расстояния не будет настолько велик, что у некоторых объектов соседями окажутся все или почти все остальные объекты.

  • Если заданные значения Начального расстояния и/или Приращения расстояния приведет к появлению интервала расстояния, большего, чем максимальный порог, Приращение расстояния будет автоматически уменьшено. Чтобы избежать этого, можно уменьшить указанные значения Приращения расстояния и/или Числа интервалов расстояний.

  • Во время работы инструмента может обнаружиться нехватка памяти. Так обычно получается, когда вы выбираете параметры Начальное расстояние и/или Приращение расстояния, это приводит к тому, что у объектов очень много соседей. Обычно не нужно создавать пространственные отношения, в которых у каждого объекта несколько тысяч соседей. Используйте меньшее значение для параметра Приращение расстояния и временно удалите выбросы по местоположению, чтобы можно было начать с меньших значений Начального расстояния.

  • Если вы разрешаете инструменту вычислять Начальное расстояние и Приращение расстояния за вас, то время обработки может быть увеличиться для больших наборов данных. Вы можете улучшить производительность следующими способами:

    • Временно удалите выбросы по местоположению
    • Вместо того чтобы запускать анализ для всех объектов, выберите объекты только в представленной части изучаемой области и запустите анализ только для этих объектов.
    • Выберите случайный набор объектов из набора данных и запустите анализ только на этих случайных объектах.

  • Расстояния всегда должны основываться на параметре среды Выходная система координат. Значение по умолчанию для параметра Выходная система координат равно Как у входных данных. Входные объекты проецируются в выходную систему координат до выполнения анализа.

  • Дополнительная Выходная таблица будет содержать значение расстояния на каждой итерации, значение индекса Морана I, ожидаемое значение индекса Морана I, дисперсию, z-оценку и p-значение. Пиком будет увеличение z-оценки, за которым следует уменьшение z-оценки. Например, если инструмент найдет следующую последовательность z-оценок для расстояний 50, 100 и 150 метров (2,95, 3,68, 3,12), пиком будет 100 метров.

  • Дополнительный выходной файл отчета создается в формате PDF и доступен из сообщений в нижней части панели Геообработка.

  • На компьютерах с языковыми пакетами ArcGIS для арабского языка и других языков, которые читаются справа налево, в PDF-файле выходного отчета может отсутствовать текст или элементы форматирования. Эти проблемы описаны в этой статье.

  • Если пиковые z-оценки не указаны, первая пиковая z-оценка и максимальная пиковая z-оценка дают пустое значение.

  • При использовании этого инструмента в скрипте Python, объект-результат, возвращенный инструментом, содержит следующие выходные данные:

    ПоложениеОписаниеТип данных

    0

    Первый пик

    Double

    1

    Макс. пик

    Double

Параметры

ПодписьОписаниеТип данных
Входные объекты

Класс объектов, для которого будет рассчитываться пространственная автокорреляция для последовательности расстояний.

Feature Layer
Входное поле

Числовое поле, используемое в оценке пространственной автокорреляции.

Field
Число интервалов расстояний

Количество раз для увеличения размера соседства и анализа набора данных для выявления пространственной автокорреляции. Начальная точка и размер приращения указываются в качестве параметров Начальное расстояние и Приращение расстояние.

Long
Начальное расстояние
(Дополнительный)

Расстояние, на котором необходимо начать анализ пространственной автокорреляции и расстояние, от которого необходимо начать приращение. Значение этого параметра должно измеряться в единицах параметра среды Выходная система координат.

Double
Приращение расстояния
(Дополнительный)

Расстояние, на которое необходимо увеличивать при каждой последующей итерации. Расстояние, используемое в этом анализе, начинается от значения параметра Начальное расстояние и увеличивается на количество, указанное в параметре Приращение расстояния. Значение этого параметра должно измеряться в единицах параметра среды Выходная система координат.

Double
Метод определения расстояния
(Дополнительный)

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • Евклидово — Расстояние по прямой линии между двумя точками (как ворона летает)
  • Манхэттенское — Расстояние между двумя точками, измеренное вдоль осей, расположенных под прямым углом друг к другу (городские кварталы); рассчитывается суммированием абсолютных разностей между координатами х и у.
String
Стандартизация строк
(Дополнительный)

Нормализация ряда рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации.

  • Отмечено – пространственные веса нормализуются; каждый вес делится на сумму значений его ряда (сумму весов всех соседних объектов).
  • Не отмечено – Нормализация пространственных весов не применяется.
Boolean
Выходная таблица
(Дополнительный)

Таблица, создаваемая с каждым диапазоном расстояний и связанным результатом z-оценки.

Table
Выходной файл отчета
(Дополнительный)

Создаваемый PDF-файл, содержащий линейный график со сводными результатами.

File

Производные выходные данные

ПодписьОписаниеТип данных
Первый пик

Первая пиковая z-оценка.

Double
Максимальное пиковое

Максимальная пиковая z-оценка.

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
ИмяОписаниеТип данных
Input_Features

Класс объектов, для которого будет рассчитываться пространственная автокорреляция для последовательности расстояний.

Feature Layer
Input_Field

Числовое поле, используемое в оценке пространственной автокорреляции.

Field
Number_of_Distance_Bands

Количество раз для увеличения размера соседства и анализа набора данных для выявления пространственной автокорреляции. Начальная точка и размер приращения указываются в параметрах Beginning_Distance и Distance_Increment соответственно.

Long
Beginning_Distance
(Дополнительный)

Расстояние, на котором необходимо начать анализ пространственной автокорреляции и расстояние, от которого необходимо начать приращение. Значение этого параметра должно измеряться в единицах параметра среды Выходная система координат.

Double
Distance_Increment
(Дополнительный)

Расстояние, на которое необходимо увеличивать при каждой последующей итерации. Расстояние, используемое в этом анализе, начинается от значения параметра Beginning_Distance и увеличивается на количество, указанное в параметре Distance_Increment . Значение этого параметра должно измеряться в единицах параметра среды Выходная система координат.

Double
Distance_Method
(Дополнительный)

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • EUCLIDEANРасстояние по прямой линии между двумя точками (как ворона летает)
  • MANHATTANРасстояние между двумя точками, измеренное вдоль осей, расположенных под прямым углом друг к другу (городские кварталы); рассчитывается суммированием абсолютных разностей между координатами х и у.
String
Row_Standardization
(Дополнительный)

Нормализация ряда рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации.

  • ROW_STANDARDIZATIONПространственные веса нормализуются по ряду. Каждый вес делится на сумму его ряда.
  • NO_STANDARDIZATIONНормализация ряда пространственных весов не применяется.
Boolean
Output_Table
(Дополнительный)

Таблица, создаваемая с каждым диапазоном расстояний и связанным результатом z-оценки.

Table
Output_Report_File
(Дополнительный)

Создаваемый PDF-файл, содержащий линейный график со сводными результатами.

File

Производные выходные данные

ИмяОписаниеТип данных
First_Peak

Первая пиковая z-оценка.

Double
Max_Peak

Максимальная пиковая z-оценка.

Double

Пример кода

IncrementalSpatialAutocorrelation, пример 1 (окно Python)

В следующем скрипте окна Python показано, как используется инструмент IncrementalSpatialAutocorrelation.

import arcpy, os
import arcpy.stats as SS
arcpy.env.workspace = r"C:\ISA"
SS.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", "20", "", "", "EUCLIDEAN",
                                     "ROW_STANDARDIZATION", "outTable.dbf", "outReport.pdf")
IncrementalSpatialAutocorrelation, пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать инструмент IncrementalSpatialAutocorrelation.

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tool
# Import system modules
import arcpy
import os
import arcpy.stats as SS
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables
workspace = r"C:\ISA"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Copy the input feature class and integrate the points to snap together at 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp","#", 0, 0, 0)
    integrate = arcpy.Integrate_management("911Copied.shp #", "30 Feet")
    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = SS.CollectEvents("911Copied.shp", "911Count.shp")
    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = SS.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", "", "EUCLIDEAN",
                                               "ROW_STANDARDIZATION", "outTable.dbf", "outReport.pdf")
    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = SS.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Параметры среды

Выходная система координат

До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат. Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат. Если выходная система координат выражена в градусах, минутах и секундах, то геодезические расстояния рассчитываются с помощью хордовых расстояний.

Связанные разделы