Перекрестная проверка (Geostatistical Analyst)

Доступно с лицензией Geostatistical Analyst.

Сводка

Удаляет из данных одну точку и интерполирует значение в соответствующем местоположении на основе оставшихся данных. Этот инструмент используется, прежде всего, для сравнения проинтерполированного значения с измеренным значением для получения важной информации о некоторых параметрах модели.

Более подробно о перекрестной и обычной проверках

Использование

  • При использовании этого инструмента в Python объект result содержит и класс пространственных объектов, и CrossValidationResult, имеющий следующие свойства:

    • Число – общее количество используемых опорных точек.
    • Средняя ошибка – усредненная разность между измерением и проинтерполированным значением.
      Средняя ошибка
    • Среднеквадратичная ошибка указывает, насколько близко модель прогнозирует замеренные значения. Чем меньше эта ошибка, тем лучше.
      Среднеквадратичная ошибка
    • Средняя стандартная ошибка – среднее значение стандартных ошибок интерполяции.
      Средняя стандартная ошибка
    • Средняя нормированная ошибка – среднее значение нормированной ошибки. Это значение должно быть близко к 0.
      Средняя нормированная ошибка
    • Среднеквадратичная нормированная ошибка – должна быть близка к единице в случае, если стандартные ошибки интерполяции допустимы. Если среднеквадратичная нормированная ошибка больше единицы, значит в проинтерполированных значениях недооценена вариабельность. Если среднеквадратичная нормированная ошибка меньше единицы, значит, в проинтерполированных значениях вариабельность переоценена.
      Среднеквадратичная нормированная ошибка
    • Процент в интервале 90% – процент точек, который находится в диапазоне 90% доверительного интервала перекрестной проверки. Это значение должно быть близко к 90.
    • Процент в интервале 95% – процент точек, который находится в диапазоне 95% доверительного интервала перекрестной проверки. Это значение должно быть близко к 95.
    • Средний CRPS – континуальное ранжированное значение вероятности (CRPS) всех точек. CRPS позволяет измерить отклонение от функции прогнозируемого совокупного распределения для каждого найденного значения данных. Это значение должно быть как можно меньше. Этот способ оценки имеет преимущества по сравнению с другими оценками перекрестной проверки, потому что он сравнивает данные с полным распределением, а не с прогнозами для конкретной точки. Вычисление этой статистики включает симуляции, поэтому оно не может быть записано простой формулой.

    Для инструментов ОВР, Интерполяция по методу глобального полинома, Радиальные базисные функции, Интерполяция диффузии с барьерами и Интерполяция ядра с барьерами доступны только результаты среднее и среднеквадратичная ошибка.

    Процент в интервале 90%, Процент в интервале 95% и Средний CRPS доступны только для моделей Эмпирический байесовский кригинг и Прогнозирование регрессии ЭБК.

  • Поля в дополнительном классе выходных точечных объектов описаны в инструменте Слой GA в точки.

Синтаксис

arcpy.ga.CrossValidation(in_geostat_layer, {out_point_feature_class})
ParameterОбъяснениеТип данных
in_geostat_layer

Анализируемый геостатический слой.

Geostatistical Layer
out_point_feature_class
(Дополнительный)

Хранит статистику перекрестной проверки по каждому положению в геостатистическом слое.

Feature Class

Производные выходные данные

NameОбъяснениеТип данных
count

Общее количество используемых опорных точек.

Long
mean_error

Средняя ошибка (Mean Error) – усредненная разность между измерением и проинтерполированным значением.

Double
root_mean_square

Среднеквадратичная ошибка (Root Mean Square Error) указывает, насколько близко модель прогнозирует замеренные значения.

Double
average_standard

Средняя стандартная ошибка (Average Standard Error) – среднее значение стандартных ошибок интерполяции.

Double
mean_standardized

Средняя нормированная ошибка – среднее значение нормированной ошибки.

Double
root_mean_square_standardized

Среднеквадратичная нормированная ошибка – стремится к 1 в случае, если стандартные ошибки интерполяции допустимы.

Double
percent_in_90_interval

Процент в интервале 90% – процент точек, который находится в диапазоне 90% доверительного интервала перекрестной проверки. Это значение должно быть близко к 90.

Double
percent_in_95_interval

Процент в интервале 95% – процент точек, который находится в диапазоне 95% доверительного интервала перекрестной проверки. Это значение должно быть близко к 95.

Double
average_crps

Средний CRPS – континуальное ранжированное значение вероятности (CRPS) всех точек. CRPS позволяет измерить отклонение от функции прогнозируемого совокупного распределения для каждого найденного значения данных. Это значение должно быть как можно меньше. Этот способ оценки имеет преимущества по сравнению с другими оценками перекрестной проверки, потому что он сравнивает данные с полным распределением, а не с прогнозами для конкретной точки. Вычисление этой статистики включает симуляции, поэтому оно не может быть записано простой формулой.

Double

Пример кода

CrossValidation, пример 1 (окно Python)

Выполните перекрестную проверку на входном геостатистическом слое.

import arcpy
arcpy.env.workspace = "C:/gapyexamples/data"
cvResult = arcpy.CrossValidation_ga("C:/gapyexamples/data/kriging.lyr")
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))
CrossValidation, пример 2 (автономный скрипт)

Выполните перекрестную проверку на входном геостатистическом слое.

# Name: CrossValidation_Example_02.py
# Description: Perform cross validation on an input geostatistical layer.
# Requirements: Geostatistical Analyst Extension

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gapyexamples/data"

# Set local variables
inLayer = "C:/gapyexamples/data/kriging.lyr"

# Execute CrossValidation
cvResult = arcpy.CrossValidation_ga(inLayer)
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))

Информация о лицензиях

  • Basic: Требуется Geostatistical Analyst
  • Standard: Требуется Geostatistical Analyst
  • Advanced: Требуется Geostatistical Analyst

Связанные разделы