Среднее Ближайшее соседство (Пространственная статистика)

Сводка

Вычисляет индекс ближайшего соседства на основе среднего расстояния от каждого объекта до ближайшего к нему соседнего объекта.

Более подробно о том, как работает инструмент Расстояние Среднего ближайшего соседства

Иллюстрация

Иллюстрация, показывающая Среднее Ближайшее соседство

Использование

  • Инструмент Среднее ближайшее соседство возвращает результаты вычислений: Наблюдаемое Среднее Расстояние, Ожидаемое Среднее Расстояние, Индекс Ближайшего Соседства, z-оценка и p-значение. Эти значения записываются в сообщениях в нижней части панели Геообработка, и они передаются в качестве производных выходных данных для использования в моделях и скриптах. Вы можете получить доступ к сообщениям, переместив курсор мыши на индикатор выполнения, щелкнув на всплывшую кнопку или развернув раздел сообщений в панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента из панели История геообработки. Этот инструмент может также создать отчета файл в формате HTML с графическим представлением результатов. Путь к файлу отчета будет доступен в сообщениях, в которых будет содержаться вся информация о параметрах запущенного инструмента. При двойном щелчке мыши на этом пути откроется файл отчета.

    Доступ к сообщениям и отчетам

  • Результаты вычислений z-оценка и р-значение являются показателями статистической значимости, опираясь на которые можно принять решение об отклонении NULL-гипотезы. Тем не менее, примите во внимание, что статистическая значимость данного метода сильно зависит от размера области изучения (см. ниже). Для статистической величины Среднее ближайшее соседство, NULL-гипотеза утверждает, что значения распределены хаотично.

  • Индекс Ближайшего Соседства выражается как отношение Наблюдаемого Среднего Расстояния к Ожидаемому Среднему Расстоянию. Ожидаемое расстояние – среднее расстояние между соседями в гипотетическом случайном распределении. Если индекс меньше чем 1, распределение представляет кластеризацию; если индекс больше чем 1, имеется тенденция к дисперсии или спорным результатам.

  • Метод среднего ближайшего соседства очень чувствителен к значению Площадь (небольшие изменения значения параметра Область могут привести к значительным изменениям в результатах z-оценки и p-значений). Следовательно, инструмент Среднее Ближайшее Соседство наиболее эффективен для сравнения различных объектов в определенной области исследования. Приведенный ниже рисунок демонстрирует классический пример, как идентично расположенные объекты могут кластеризоваться или располагаться рассеянно в зависимости от указанной области изучения.

    Распределения могут кластеризоваться или располагаться рассеянно в зависимости от размеров области изучения.

  • Если значение параметра Площадь не указано, по умолчанию используется площадь минимального описывающего прямоугольника. В отличие от экстента минимальный описывающий прямоугольник может не совпадать с осями Х и У.

  • Когда Входной класс объектов не имеет проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают очень хорошие оценки истинных геодезических расстояний, по крайней мере, для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипсоиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.

    Внимание:

    Следует обязательно производить проецирование ваших данных, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.

  • Когда при анализе используются хордовые расстояния, параметр Площадь, если он указывается, должен быть выражен в метрах.

  • Есть особые случаи входных объектов, которые могут привести к нулевой площади минимального прямоугольника. В этих случаях маленькое значение, полученное из допуска водных координат XY, будет использоваться, чтобы создать минимальный прямоугольник. Например, если все объекты совпадают (то есть, все имеют те же самые X и Y координаты), в вычислениях будет использоваться область для очень маленького квадратного многоугольника вокруг единственного местоположения. Другой пример – если все объекты были выровнены идеально (например, 3 точки на прямой линии), в вычислениях будет использоваться область прямоугольника с очень маленькой шириной вокруг объектов. Всегда лучше использовать значение Площадь, когда вы используете инструмент Среднее Ближайшее Соседство.

  • Хотя этот инструмент работает с полигональными или линейными данными, он наилучшим образом подходит для событий, случаев и других точечных данных пространственных объектов. Для линейных или полигональных объектов в расчетах используются точные геометрические центроиды для каждого пространственного объекта. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроиды рассчитываются как средневзвешенное среднее значение центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.

  • Слои карты можно использовать для определения Входного класса объектов. Если в слое есть выборка, только выбранные объекты будут включены в анализ.

  • Внимание:

    При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или оперировать ими как нулем. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.

Синтаксис

AverageNearestNeighbor(Input_Feature_Class, Distance_Method, {Generate_Report}, {Area})
ParameterОбъяснениеТип данных
Input_Feature_Class

Класс пространственных объектов, как правило, точечный класс объектов, для которого будет вычислено расстояние среднего ближайшего соседства.

Feature Layer
Distance_Method

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • EUCLIDEAN_DISTANCEРасстояние по прямой линии между двумя точками (как ворона летает)
  • MANHATTAN_DISTANCEРасстояние между двумя точками, измеренное вдоль осей, расположенных под прямым углом друг к другу (городские кварталы); рассчитывается суммированием абсолютных разностей между координатами х и у.
String
Generate_Report
(Дополнительный)
  • NO_REPORTРезультаты не будут представлены в графической форме. Используется по умолчанию.
  • GENERATE_REPORTГрафическая сводка будет представлена в формате HTML-файла.
Boolean
Area
(Дополнительный)

Числовое поле, показывающее размер области изучения. Значение по умолчанию – область минимального прямоугольника, который охватил бы все объекты (или все отобранные объекты). Единицы должны совпадать с выходной системой координат.

Double

Производные выходные данные

NameОбъяснениеТип данных
NNRatio

Значение индекса ближайшего соседства.

Double
NNZScore

z-оценка.

Double
PValue

p-значение.

Double
NNExpected

Ожидаемое среднее расстояние.

Double
NNObserved

Наблюдаемое среднее расстояние.

Double
Report_File

Файл HTML с графическим представлением результатов.

Файл

Пример кода

AverageNearestNeighbor Пример 1 (окно Python)

Следующий скрипт окна Python демонстрирует, как использовать инструмент AverageNearestNeighbor.

import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.AverageNearestNeighbor_stats("burglaries.shp", "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
AverageNearestNeighbor, пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать инструмент AverageNearestNeighbor.

# Analyze crime data to determine if spatial patterns are statistically significant
 
# Import system modules
import arcpy
 
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
 
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
 
    # Obtain Nearest Neighbor Ratio and z-score
    # Process: Average Nearest Neighbor...
    nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
    
    # Create list of Average Nearest Neighbor output values by splitting the result object
    print("The nearest neighbor index is: " + nn_output[0])
    print("The z-score of the nearest neighbor index is: " + nn_output[1])
    print("The p-value of the nearest neighbor index is: " + nn_output[2])
    print("The expected mean distance is: " + nn_output[3])
    print("The observed mean distance is: " + nn_output[4])
    print("The path of the HTML report: " + nn_output[5])
 
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Environments

Выходная система координат

До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат. Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат. Если выходная система координат выражена в градусах, минутах и секундах, то геодезические расстояния рассчитываются с помощью хордовых расстояний.

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы