Исследовательская интерполяция (Geostatistical Analyst)

Краткая информация

Создает различные результаты интерполяции из входных точек и значений поля. Полученные результаты интерполяции затем сравниваются и ранжируются на основе настраиваемых критериев с учетом статистики перекрестной проверки.

Результаты интерполяции могут ранжироваться на основе одного критерия (например, максимальной точности прогнозирования или минимального смещения), средневзвешенных рангов нескольких критериев или иерархической сортировки нескольких критериев (при которой совпадения в каждом из критериев нарушаются последующими критериями в иерархии). Критерии исключения также можно использовать для исключения из сравнения результатов интерполяции, которые не соответствуют минимальным стандартам качества. Выходными данными является таблица, суммирующая статистику перекрестной проверки и ранги для каждого результата интерполяции. При желании есть возможность получить выходной геостатистический слой результата интерполяции с наивысшим рангом для его использования в дальнейших рабочих процессах.

Иллюстрация

Иллюстрация инструмента Исследовательская интерполяция
Разные методы интерполяции применяются, сравниваются и ранжируются.

Использование

  • Перекрестная проверка – это метод получения результатов интерполяции "убрать одну точку". Этот метод позволяет последовательно удалить каждую точку набора данных и использовать для прогнозирования значения исключенной точки все оставшиеся точки. Затем прогнозирование перекрестной проверки сравнивается с реальным значением убранной точки, и полученная разница считается ошибкой перекрестной проверки (ошибка может быть положительной или отрицательной). Важность использования перекрестной проверки заключается в том, что если результат интерполяции эффективен для прогнозирования значений скрытых точек, он также должен быть эффективен и для прогнозирования неизвестных значений в новых местах, что и является целью интерполяции. Все критерии, используемые этим инструментом, основываются на сводной статистике результатов перекрестной проверки.

    Хотя оценка результатов интерполяции с использованием сводной статистики перекрестной проверки является удобным и эффективным способом сравнения нескольких результатов интерполяции, она не заменяет экспертное знание данных и интерактивное исследование результатов. Просмотр диаграмм и отдельных ошибок перекрестной проверки часто выявляет закономерности в результатах, которые не очевидны из сводной статистики. Например, в ошибках перекрестной проверки часто присутствуют пространственные закономерности, когда одни области недооцениваются, а другие переоцениваются. Закономерности, подобные этому, могут быть не описываться сводной статистикой.

    Подробнее об использовании перекрестной проверки для оценки результатов интерполяции

  • У параметра Метод сравнения есть три варианта сравнения статистики перекрестной проверки результатов интерполяции. У каждого варианта есть свои преимущества и недостатки:

    • Один критерий - для сравнения и ранжирования результатов применяется один критерий. Вы можете ранжировать результаты по максимальной точности прогнозирования, минимальному смещению, наименьшей ошибке в худшем случае, наибольшей точности стандартной ошибки и наивысшей точности. Критерий задается параметром Критерий.
      • Преимущества - этот вариант представляет собой простой и распространенный метод сравнения результатов интерполяции, если известно, что они стабильны и не противоречат друг другу. Он применим также для выбора между очень похожими результатами.
      • Недостатки - результаты интерполяции часто оказываются неплохими по одним критериям неудовлетворительными - по другим, что может быть вызвано, например, высокой точностью прогнозирования с одновременным высоким значением смещения. В этом случае при ранжировании по одному критерию будут присваиваться высокие ранги нестабильным или вводящим в заблуждение результатам. При ранжировании по одному критерию рекомендуется использовать различные варианты Критерия исключения, чтобы обеспечить удаление нестабильных или вводящих в заблуждение результатов перед сравнением.
    • Иерархическая сортировка с допусками - иерархическая сортировка используется для сравнения и ранжирования результатов. Несколько критериев задаются в порядке приоритета (сначала идет наивысший приоритет) в параметре Иерархия критериев. Результаты интерполяции ранжируются по первому критерию, а любые совпадения отменяются вторым. Совпадения во втором критерии отменяются третьим и т.д. Этот процесс моделируется Пользовательской сортировкой и иерархической сортировкой в программном обеспечении для работы с электронными таблицами (сортировка по A, затем по B, затем по C и т. д.). Однако статистика перекрестной проверки представлена непрерывными значениями и, как правило, не имеет точных совпадений, поэтому можно указать допуски (процентные или абсолютные) для создания связей в каждом из критериев.
      • Преимущества — этот вариант использует несколько критериев и учитывает относительные различия статистики перекрестной проверки. Например, если один результат интерполяции оказывается намного лучше остальных по критерию наивысшего приоритета, этот результат получит наивысший ранг независимо от следующих в иерархии критериев.
      • Недостатки - эффективность иерархической сортировки зависит от заданных значений допуска. Если допуски слишком малы, некоторые критерии могут оказаться неприменимыми, поскольку нет совпадений, которые можно было бы отменить. Если допуски слишком велики, в рейтингах может быть много совпадающих связей, вызванных тем, что многие результаты находятся в пределах допусков друг друга.
    • Средневзвешенный ранг - средневзвешенный ранг нескольких критериев используется для сравнения и ранжирования результатов. Несколько критериев и связанных с ними весов указаны в параметре Взвешенные критерии. Результаты интерполяции ранжируются независимо по каждому из критериев, и для окончательного определения рангов используется средневзвешенное значение рангов. Критерии с высоким весом будут сильнее влиять на итоговые ранги, поэтому их можно использовать для задания предпочтения одних критериев над другими.
      • Преимущества — этот вариант использует несколько критериев, позволяя отдать предпочтение одним критериям по сравнению с другими, и всегда применяет все критерии при сравнении.
      • Недостатки — игнорируются относительные различия в значениях статистики перекрестной проверки. Например, все среднеквадратичные ошибки могут находиться в пределах очень небольшого допуска (что указывает на то, что все результаты имеют приблизительно одинаковую точность прогнозирования), но они все равно будут ранжированы от 1 до N по точности прогнозирования (для N результатов интерполяции). Однако значения средней ошибки могут сильно различаться в результатах (что указывает на большие различия в смещениях результатов), но они также будут ранжированы от 1 до N по критерию смещения. Взвешенное среднее использует только ранги критериев, и относительные различия в статистике перекрестной проверки в ранжировании игнорируются.

  • Выходными данными является таблица, суммирующая статистику перекрестной проверки, описание результатов интерполяции и ранжирования, а также может включать презентацию или отчет. Статистика перекрестной проверки будет включена в таблицу, только если она применима хотя бы к одному результату интерполяции. Например, если использовалась интерполяция по методу взвешенных расстояний и по радиальным базисным функциям, выходная таблица не будет содержать поле значений средней стандартной ошибки, так как в этих методах средняя стандартная ошибка не вычисляется. Если статистика применяется к некоторым результатам интерполяции, но не ко всем, значение будет пустым для результатов, в которых статистика не применялась. Дополнительно, если Эмпирический байесовский кригинг выбран в Методах интерполяции, несколько результатов статистики перекрестной проверки будут включены в таблицу, которая не используется критериями этого инструмента; они добавлены с информационными целями, и будут содержать пустые значения для других методов интерполяции. Если используется усредненный ранг, в таблицу включаются ранги для всех критериев и их взвешенное среднее.

    Дополнительно вы можете использовать Выходной геостатистический слой с самым высоким рангом для создания геостатистического слоя результата интерполяции с самым высоким рангом. Это позволяет получить карту с лучшим результатом интерполяции и использовать ее в других рабочих процессов.

  • Во время работы инструмента сообщения геообработки и сообщения индикатора выполнения отображают вычисляемый в настоящий момент результат интерполяции. После вычисления и сравнения всех результатов, ранги выводятся в виде сообщений геообработки. Ранги также можно найти в выходной таблице перекрестной проверки.

  • Инструмент Сравнить геостатистические слои выполняет такое же сравнение перекрестных проверок, но сравнивает заранее созданные результаты интерполяции (геостатистические слои).

  • В следующей таблице перечислены доступные критерии, статистика перекрестной проверки, которая их измеряет, и формулы, используемые для присвоения оценки каждому результату интерполяции (чем меньше оценка - тем лучше). Ранги для критериев определяются путем сортировки оценок каждого результата интерполяции.

    Примечание:

    По трем критериям оценка равна статистике перекрестной проверки.

    КритерийСтатистика перекрестной проверкиФормула оценки

    Высшая точность прогнозирования

    Среднеквадратичная ошибка

    Результаты ранжируются по возрастанию среднеквадратичной ошибки.

    Score = RootMeanSquareError

    Наименьшее смещение

    Средняя ошибка

    Результаты ранжируются, начиная от ближайшей к нулю средней ошибки.

    Score = AbsoluteValue( MeanError )

    Наименьшая худшая ошибка

    Максимальная абсолютная ошибка

    Результаты ранжируются по минимальной максимальной абсолютной ошибке.

    Score = MaximumAbsoluteError

    Наивысшая точность стандартных ошибок

    Среднеквадратичная нормированная ошибка

    Результаты ранжируются по ближайшей к единице среднеквадратичной нормрованной ошибке.

    Score = AbsoluteValue( RMSStdError - 1 )

    Наивысшая точность

    Средняя стандартная ошибка

    Результаты ранжируются по минимальной средней стандартной ошибке.

    Score = AverageStandardError

  • Если есть совпадения по какому-либо критерию, все связанные результаты получают одинаковый ранг, равный самому высокому общему рангу (где более высокий ранг соответствует меньшему номеру ранга). Например, упорядоченные от лучшего к худшему значения среднеквадратичной ошибки (12, 14, 14, 15, 16, 16, 18) получат ранги (1, 2, 2, 4, 5, 5, 7) в соответствии с критерием точности прогнозирования. Ранги 3 и 6 пропускаются из-за совпадающих значений.

    Совпадения могут иметь место на разных стадиях сравнения. Совпадения чаще всего встречаются при использовании иерархической сортировки, поскольку все результаты, попадающие в пределы допуска, считаются совпадающими, и все результаты, находящиеся за пределами допуска, также считаются совпадающими. Совпадения также встречаются в средневзвешенном ранжировании, когда результаты интерполяции имеют разные ранги по разным критериям, что может привести к одинаковым средневзвешенным значениям рангов. Хотя и нечасто, совпадения могут также возникать при сравнении отдельных критериев (например, если у всех точки будет одинаковое значение). Совпадения по одному критерию также повлияют на средневзвешенный ранг, если в средневзвешенном ранжировании используются критерии.

  • Для иерархической сортировки задайте допуски относительно оценки критерия, а не статистики перекрестной проверки. Для критериев, в которых оценка равна значению статистики (высшая точность прогнозирования, наименьшая худшая ошибка и наибольшая точность), соответствующие значения допуска обычно очевидны. Например, если наименьшее значение среднеквадратичной ошибки результатов интерполяции равно 200, то 10-процентный допуск позволит включать все результаты со значениями среднеквадратичной ошибки, меньшими или равными 220: 200 + (10/100) x 200 = 220. И аналогично, 15-процентный абсолютный допуск позволит включать все результаты со значениями среднеквадратичной ошибки, меньшими или равными 215: 200 + 15 = 215.

    Однако для критериев, в которых оценка не равна значению статистики (наименьшее смещение и наивысшая точность стандартных ошибок), соответствующие значения допуска менее ясны. Для статистики средней ошибки систематическая ошибка оценивается по абсолютному значению средней ошибки. Это означает, например, что средние значения ошибок -4 и 6 имеют относительную разницу в 50 процентов, потому что они на 50 процентов отличаются по абсолютной величине: ABS(-4) + (50/100) x ABS(-4) = ABS(6). Однако их абсолютная разница равна 2: ABS(-4) + 2 = ABS(6).

    Для статистики среднеквадратичной нормированной ошибки точность стандартной ошибки оценивается по абсолютной разнице между значением среднеквадратичной нормированной ошибки и идеальным значением, равным 1. Это означает, например, что у значений среднеквадратичной нормированной ошибки 0,2 и 2,4 относительная разница равна 75 процентам. Это происходит потому, что сравнив значения 0,2 и 2,4 с идеальным значением, равным 1, мы получаем разницу в 1,75 раза (то есть увеличение на 75 процентов) - поскольку абсолютные разницы равны, соответственно, 0,8 и 1,4: ABS(0.2 - 1) + (75/100) x ABS(0.2 - 1) = ABS(2.4 - 1). Однако их абсолютная разница равна 0,6: ABS(0.2 - 1) + 0.6 = ABS(2.4 - 1).

  • Различные критерии требуют наличия всех результатов интерполяции для поддержки типа выходной стандартной ошибки. По умолчанию Методы интерполяции допускают все опции для всех параметров. Тем не менее, если выбраны Интерполяция по методу обратно взвешенных расстояний, Радиальные базисные функции или Интерполяция по методу глобального полинома, некоторые опции для различных параметров становятся недоступны, так как эти методы не вычисляют стандартную ошибку прогнозирования. Недоступные опции это - точность стандартных ошибок, точность, среднеквадратичная нормированная ошибка или средняя стандартная ошибка.

    Более подробно о том, какие методы интерполяции вычисляют стандартную ошибку прогнозирования.

  • Значение Минимальное процентное уменьшение ошибки параметра Критерии исключения особенно полезен, когда неизвестны значения или диапазон интерполируемых точек (например, в автоматизированной среде). Эта опция позволяет исключить результаты интерполяции, которые недостаточно точны по сравнению с базовой непространственной моделью, прогнозирующей глобальное среднее значение во всех точках на карте. Эта относительная точность измеряется путем сравнения значения среднеквадратичной ошибки со среднеквадратическим отклонением значений интерполируемых точек. Среднеквадратичная ошибка должна быть, как минимум, на указанный процент меньше среднеквадратического отклонения, чтобы быть включенной в сравнение. Например, значение 10 означает, что среднеквадратичная ошибка должна быть как минимум на 10 процентов меньше среднеквадратического отклонения, чтобы ее можно было включить в сравнение и ранжирование.

    В различных дисциплинах стандарты приемлемого уменьшения ошибок в результатах интерполяции различны. В физических науках при измерениях с высокой плотностью выборок ошибки часто уменьшаются более чем на 90 процентов. Однако в социальных науках уменьшение ошибок даже на 10–20% часто является очень значительным для исследователей.

  • Каждый параметр Методов интерполяции создает от 1 до 5 результатов интерполяции. По умолчанию создаются 11 результатов. Если выбраны все опции, создаются 20 результатов. В следующей таблицы приведены 20 возможных значений в поле Description параметра Выходная таблица перекрестной проверки вместе с подробной информацией о результатах. Для дальнейшего изучения любого из этих результатов третий столбец предоставляет шаги для создания геостатистического слоя результатов с использованием Мастера операций геостатистики.

    Примечание:

    В инструкциях по созданию результата интерполяции предполагается, что вы открыли Geostatistical Wizard, выбрали метод интерполяции в панели слева и указали точки и поле значений в панели справа. Для простого, ординарного и универсального кригинга, тип кригинга указывается на второй странице мастера; на первой странице укажите Кригинг/Кокригинг для всех типов. Если инструкции начинаются на конкретной странице мастера, щелкните Далее чтобы перейти к нужной странице без изменения параметров. Выполнив инструкции, нажмите Готово и щелкните OK для добавления результатов интерполяции на карту.

    Значение поляОписаниеСоздание

    Простой кригинг - по умолчанию

    Модель простого кригинга с параметрами по умолчанию. По умолчанию простой кригинг использует преобразование.

    Изменения не требуются.

    Простой кригинг - оптимизированный

    Модель простого кригинга с оптимизированными параметрами.

    На странице вариограммы (страница 4) щелкните кнопку Оптимизировать модель Оптимизировать.

    Простой кригинг - тренд

    Модель простого кригинга с удалением тренда и без преобразования.

    На второй странице измените Тип преобразования на Нет, и Порядок удаления тренда на Первый.

    Простой кригинг - тренд и преобразование

    Модель простого кригинга с удалением тренда и с преобразованием.

    На второй странице измените Порядок удаления тренда на Первый.

    Ординарный кригинг - по умолчанию

    Модель ординарного кригинга с параметрами по умолчанию.

    Изменения не требуются.

    Ординарный кригинг - оптимизированный

    Модель ординарного кригинга с оптимизированными параметрами.

    На странице вариограммы (страница 4) щелкните кнопку Оптимизировать модель Оптимизировать.

    Универсальный кригинг - по умолчанию

    Модель универсального кригинга с удалением тренда первого порядка и параметрами по умолчанию.

    На второй странице измените Порядок удаления тренда на Первый.

    Универсальный кригинг - оптимизированный

    Модель универсального кригинга с удалением тренда первого порядка и оптимизированными параметрами.

    На второй странице измените Порядок удаления тренда на Первый. На странице вариограммы (страница 4) щелкните кнопку Оптимизировать модель Оптимизировать.

    Эмпирический байесовский кригинг - по умолчанию

    Модель эмпирического байесовского кригинга с параметрами по умолчанию.

    Изменения не требуются.

    Эмпирический байесовский кригинг - расширенный

    Расширенный эмпирический байесовский кригинг использует большие поднаборы, удаление трендов и больше перекрытий и имитаций.

    На второй странице измените следующие параметры на указанные значения:

    • Размер поднабора — 200
    • Коэффициент перекрытия — 300
    • Число имитаций — 2
    • Преобразование — эмпирическое
    • Тип вариограммы — распределение K-Бесселя с исключенным трендом

    Интерполяция ядра (метод локальных полиномов)

    Интерполяция ядра (метод локальных полиномов) с параметрами по умолчанию

    Изменения не требуются. И Интерполяция ядра и Интерполяция по методу локальных полиномов доступны на первой странице Эти методы используют интерполяцию ядра, но вы должны ожидать схожие результаты от интерполяции по методу локальных полиномов, так как эти методы похожи.

    Обратно взвешенные расстояния - по умолчанию

    Обратно взвешенные расстояния - со значением степени, равным 2 (по умолчанию).

    Изменения не требуются.

    Обратно взвешенные расстояния - оптимизированный

    Модель интерполяции по методу обратно взвешенных расстояний - с оптимизированным значением степени

    На второй странице щелкните кнопку Оптимизировать Оптимизировать, которая будет рядом с параметром Степень.

    Радиальные базисные функции - полностью регуляризованный сплайн

    Модель интерполяции по методу радиальных базисных функций с использованием функции ядра полностью регуляризованного сплайна

    Изменения не требуются. Полностью регуляризованный сплайн - функция ядра по умолчанию для радиальных базисных функций.

    Радиальные базисные функции - сплайн с натяжением

    Модель интерполяции по методу радиальных базисных функций с использованием функции ядра сплайна с натяжением

    На второй странице измените Функцию ядра на Сплайн с натяжением.

    Радиальные базисные функции - мультиквадратичная

    Модель интерполяции по методу радиальных базисных функций с использованием мультиквадратичной функции ядра

    На второй странице измените Функцию ядра на Мультиквадратичную.

    Радиальные базисные функции - обратная мультиквадратичная

    Модель интерполяции по методу радиальных базисных функций с использованием обратной мультиквадратичной функции ядра

    На второй странице измените Функцию ядра на Обратную мультиквадратичную.

    Радиальные базисные функции - плоский сплайн

    Модель интерполяции по методу радиальных базисных функций с использованием функции ядра плоского сплайна

    На второй странице измените Функцию ядра на Плоский сплайн.

    Интерполяция по методу глобального полинома - второй порядок

    Интерполяция по методу глобального полинома с трендом второго порядка (квадратический).

    На второй странице измените параметр Порядок полинома на 2.

    Интерполяция по методу глобального полинома - третий порядок

    Интерполяция по методу глобального полинома с трендом второго порядка (кубический).

    На второй странице измените параметр Порядок полинома на 3.

Параметры

ПодписьОписаниеТип данных
Входные объекты

Входные точки, представляющие местоположения точек для интерполяции.

Feature Layer
Поле значений

Поле , содержащее значения, которые будут интерполированы.

Field
Выходная таблица перекрестной проверки

Выходная таблица содержит статистику перекрестной проверки и ранги для каждого результата интерполяции. Итоговые ранги результатов интерполяции сохраняются в поле RANK.

Table
Выходной геостатистический слой с самым высоким рангом
(Дополнительный)

Выходной геостатистический слой результата интерполяции с самым высоким рангом. У этого результата интерполяции будет значение 1 в поле RANK выходной таблицы перекрестной проверки. Если для результата интерполяции с наивысшим рангом есть совпадения или все результаты исключены по критериям исключения, слой не будет создан, даже если указано значение . Если это произойдет, инструмент возвратит сообщения с предупреждениями.

Geostatistical Layer
Методы интерполяции
(Дополнительный)

Указывает методы интерполяции, которые будут выполнены для входных объектов и значений поля. Для каждого указанного метода будут созданы от 1 до 5 результатов интерполяции. По умолчанию результаты создаются для всех методов, кроме интерполяции по методу обратно взвешенных расстояний, радиальных базисных функций и интерполяции по методу глобального полинома (так как в этих методах не вычисляется стандартная ошибка прогнозирования). По умолчанию создаются 11 результатов интерполяции. Если выбраны все опции, будет создано 20 результатов интерполяции.

  • Простой кригингДля простого кригинга создаются следующие результаты: по умолчанию, оптимизированный, с удалением тренда и преобразование с удалением тренда.
  • Ординарный кригингДля ординарного кригинга создаются следующие результаты: по умолчанию и оптимизированный.
  • Универсальный кригингДля универсального кригинга создаются следующие результаты: по умолчанию и оптимизированный.
  • Эмпирический байесовский кригингДля эмпирического байесовского кригинга создаются следующие результаты: по умолчанию и расширенный.
  • Интерполяция ядра (метод локальных полиномов)Один результат пол умолчанию создается для интерполяции ядра (локальных полиномов).
  • Метод обратных взвешенных расстоянийДва результата создаются для интерполяции по методу обратно взвешенных расстояний: по умолчанию и оптимизированный.
  • Радиальные базисные функцииДля интерполяции по методу радиальных базисных функций создается 5 результатов, по одному для каждой из 5 функций ядер.
  • Интерполяция по методу глобального полиномаДва результата создаются для интерполяции по методу глобального полинома: линейный (тренд первого порядка) и квадратический (тренд второго порядка).
String
Метод сравнения
(Дополнительный)

Задает метод, используемый для сравнения и ранжирования результатов интерполяции.

  • Один критерийДля сравнения и ранжирования результатов будет использоваться один критерий, например высшая точность прогнозирования или наименьшее смещение. Будет использоваться критерий из параметра Критерий.
  • Иерархическая сортировка с допускамиДля сравнения результатов будет применена иерархическая сортировка. Несколько критериев задаются в порядке приоритета (сначала идет наивысший приоритет) в параметре Иерархия критериев. Результаты интерполяции ранжируются по первому критерию, а любые совпадения отменяются вторым. Совпадения во втором критерии отменяются третьим и т.д. Статистика перекрестной проверки является непрерывным значением и, как правило, не имеет точных совпадений, поэтому можно указать допуски (процентные или абсолютные) для создания связей в каждом из критериев.
  • Средневзвешенный рангСредневзвешенный ранг нескольких критериев будет использоваться для сравнения результатов. Несколько критериев и связанных с ними весов указаны в параметре Взвешенные критерии. Результаты интерполяции ранжируются независимо по каждому из критериев, и для окончательного определения рангов используется средневзвешенное значение рангов. Критерии с высоким весом будут сильнее влиять на итоговые ранги, поэтому веса можно использовать для задания предпочтения одних критериев над другими.
String
Критерий
(Дополнительный)

Задает критерий, используемый для сравнения и ранжирования результатов интерполяции.

  • Высшая точность прогнозированияРезультаты будут ранжироваться по возрастанию среднеквадратичной ошибки. Эта опция позволяет измерить, насколько точно, в среднем, прогнозирования перекрестной проверки соответствуют истинным значениям. Это значение по умолчанию
  • Наименьшее смещениеРезультаты будут ранжироваться, начиная от ближайшей к нулю средней ошибки. Эта опция позволяет измерить, насколько прогнозирования перекрестной проверки в среднем завышают или занижают истинные значения. Результаты интерполяции с положительными средними ошибками систематически завышают истинные значения (положительное смещение), а с отрицательными средними ошибками систематически занижают истинные значения (отрицательное смещение).
  • Наименьшая худшая ошибкаРезультаты будут ранжироваться по минимальной максимальной абсолютной ошибке. Эта опция выполняет только одно наименее точное прогнозирование перекрестной проверки (положительное или отрицательное). Она может быть полезной, если вас больше всего беспокоят наихудшие сценарии, а не точность в стандартных условиях.
  • Наивысшая точность стандартных ошибокРезультаты будут ранжироваться, начиная от ближайшей к единице среднеквадратичной нормированной ошибки. Эта опция измеряет, насколько близко вариабильность прогнозов перекрестной проверки соответствует предполагаемым стандартным ошибкам. Она применима, если вы собираетесь создать доверительные интервалы или пределы погрешности для прогнозирования.
  • Наивысшая точностьРезультаты будут ранжироваться по возрастанию средней стандартной ошибки. При создании доверительных интервалов или пределов погрешности для прогнозируемых значений у более точных результатов будут более узкие интервалы вокруг прогнозов. Измеряется не то, правильно ли оцениваются стандартные ошибки, а только то, что стандартные ошибки малы. При использовании этой опции рекомендуется в качестве критериев исключения включать минимальные и максимальные значения среднеквадратичной нормированной ошибки, чтобы гарантировать точность и разброс стандартных ошибок.
String
Иерархия критериев
(Дополнительный)

Иерархия критериев, которая будет использоваться для иерархической сортировки с допусками. Введите несколько критериев в порядке уменьшения их приоритета. Результаты интерполяции ранжируются по первому критерию, а любые совпадения отменяются вторым. Совпадения во втором критерии отменяются третьим и т.д. Статистика перекрестной проверки является непрерывным значением и, как правило, не имеет точных совпадений, поэтому можно указать допуски для создания совпадений в каждом из критериев. Для каждой строки задайте критерий в первом столбце, тип допуска (в процентах или абсолютный) во втором столбце и значение допуска - в третьем. Если значение допуска не указано, допуск использоваться не будет. Этот вариант подходит для последней строки, чтобы не было совпадений для результата интерполяции с наивысшим рангом.

Для каждой строки (уровня иерархии) доступны следующие критерии:

  • Среднеквадратичная ошибка (точность) - результаты будут ранжированы с высшей точностью.
  • Средняя ошибка (смещение) - результаты будут ранжированы по наименьшему смещению.
  • Максимальная абсолютная ошибка (наихудшая ошибка) - результаты будут ранжированы по наименьшей наихудшей ошибке.
  • Нормированная RMSE (точность стандартной ошибки) - результаты будут ранжированы по уменьшению точности стандартной ошибки.
  • Средняя стандартная ошибка (точность) - результаты будут ранжированы по убыванию точности.

Например, можно задать значение Среднеквадратичной ошибки (точности) с допуском 5 процентов в первой строке и значение Средней ошибки (смещения) без допуска - во второй строке. Такие параметры сначала ранжируют результаты интерполяции по наименьшей среднеквадратичной ошибке (высшей точности прогнозирования), и все результаты интерполяции, значения среднеквадратичной ошибки которых находятся в пределах 5 процентов от наиболее точного результата, будут считаться совпадающими по точности прогнозирования. Среди совпадающих результатов результат со средней ошибкой, ближайшей к нулю (наименьшим смещением), получит наивысший ранг.

Value Table
Взвешенный критерий
(Дополнительный)

Несколько критериев с весами, используемыми для ранжирования результатов интерполяции. Введите критерий и вес для каждой строки. Результаты интерполяции будут ранжированы независимо по каждому из критериев, и для окончательного определения рангов результатов интерполяции будет использоваться средневзвешенное значение рангов.

  • Высшая точность прогнозирования - результаты будут ранжированы по наименьшей среднеквадратичной ошибке.
  • Наименьшее смещение - результаты будут ранжироваться по ближайшей к нулю средней ошибке.
  • Наименьшая худшая ошибка - результаты будут ранжироваться по наименьшей максимальной абсолютной ошибке.
  • Наивысшая точность стандартных ошибок - результаты будут ранжироваться, начиная от ближайшей к единице среднеквадратичной нормированной ошибки.
  • Наивысшая точность - результаты будут ранжироваться по наименьшей средней стандартной ошибке.

Value Table
Критерий исключения
(Дополнительный)

Критерий и связанные значения, которые будут использоваться для исключения результатов интерполяции из сравнения. Исключенные результаты не получат рангов и получат значение No в поле Included выходной таблицы перекрестной проверки.

  • Максимальная среднеквадратичная ошибка - результаты будут исключены, если среднеквадратичная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет точность прогнозирования
  • Максимальная абсолютная ошибка - результаты будут исключены, если максимальная абсолютная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет наименьшую худшую ошибку.
  • Максимальная среднеквадратичная нормированная ошибка - результаты будут исключены, если среднеквадратичная нормированная ошибка превысит заданное значение. Значение должно быть больше или равно 1. Эта опция измеряет точность стандартной ошибки.
  • Минимальная среднеквадратичная нормированная ошибка - результаты будут исключены, если среднеквадратичная нормированная ошибка не превышает заданное значение. Значение должно быть между 0 и 1. Эта опция измеряет точность стандартной ошибки.
  • Максимальная средняя ошибка - результаты будут исключены, если средняя ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет смещение.
  • Максимальная средняя ошибка - результаты будут исключены, если средняя ошибка не превысит заданное значение. Значение не должно быть положительным. Эта опция измеряет смещение.
  • Максимальная средняя стандартная ошибка - результаты будут исключены, если средняя стандартная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет точность.
  • Минимальное уменьшение процента ошибки - результаты будут исключены, если результат интерполяции не так точен, как базовая непространственная модель, прогнозирующая глобальное среднее значение во всех точках на карте. Эта относительная точность измеряется путем сравнения значения среднеквадратичной ошибки со среднеквадратическим отклонением значений интерполируемых точек. Среднеквадратичная ошибка должна быть, как минимум, на указанный процент меньше среднеквадратического отклонения, чтобы быть включенной в сравнение. Например, значение 10 означает, что среднеквадратичная ошибка должна быть как минимум на 10 процентов меньше среднеквадратического отклонения, чтобы ее можно было включить в сравнение и ранжирование. Значение должно быть в диапазоне от 0 до 100. Эта опция измеряет точность прогнозирования.

Value Table

arcpy.ga.ExploratoryInterpolation(in_features, value_field, out_cv_table, {out_geostat_layer}, {interp_methods}, {comparison_method}, {criterion}, {criteria_hierarchy}, {weighted_criteria}, {exclusion_criteria})
ИмяОписаниеТип данных
in_features

Входные точки, представляющие местоположения точек для интерполяции.

Feature Layer
value_field

Поле , содержащее значения, которые будут интерполированы.

Field
out_cv_table

Выходная таблица содержит статистику перекрестной проверки и ранги для каждого результата интерполяции. Итоговые ранги результатов интерполяции сохраняются в поле RANK.

Table
out_geostat_layer
(Дополнительный)

Выходной геостатистический слой результата интерполяции с самым высоким рангом. У этого результата интерполяции будет значение 1 в поле RANK выходной таблицы перекрестной проверки. Если для результата интерполяции с наивысшим рангом есть совпадения или все результаты исключены по критериям исключения, слой не будет создан, даже если указано значение . Если это произойдет, инструмент возвратит сообщения с предупреждениями.

Geostatistical Layer
interp_methods
[interp_methods,...]
(Дополнительный)

Указывает методы интерполяции, которые будут выполнены для входных объектов и значений поля. Для каждого указанного метода будут созданы от 1 до 5 результатов интерполяции. По умолчанию результаты создаются для всех методов, кроме интерполяции по методу обратно взвешенных расстояний, радиальных базисных функций и интерполяции по методу глобального полинома (так как в этих методах не вычисляется стандартная ошибка прогнозирования). По умолчанию создаются 11 результатов интерполяции. Если выбраны все опции, будет создано 20 результатов интерполяции.

  • SIMPLE_KRIGINGДля простого кригинга создаются следующие результаты: по умолчанию, оптимизированный, с удалением тренда и преобразование с удалением тренда.
  • ORDINARY_KRIGINGДля ординарного кригинга создаются следующие результаты: по умолчанию и оптимизированный.
  • UNIVERSAL_KRIGINGДля универсального кригинга создаются следующие результаты: по умолчанию и оптимизированный.
  • EBKДля эмпирического байесовского кригинга создаются следующие результаты: по умолчанию и расширенный.
  • KERNEL_INTERPOLATIONОдин результат пол умолчанию создается для интерполяции ядра (локальных полиномов).
  • IDWДва результата создаются для интерполяции по методу обратно взвешенных расстояний: по умолчанию и оптимизированный.
  • RBFДля интерполяции по методу радиальных базисных функций создается 5 результатов, по одному для каждой из 5 функций ядер.
  • GPIДва результата создаются для интерполяции по методу глобального полинома: линейный (тренд первого порядка) и квадратический (тренд второго порядка).
String
comparison_method
(Дополнительный)

Задает метод, используемый для сравнения и ранжирования результатов интерполяции.

  • SINGLEДля сравнения и ранжирования результатов будет использоваться одна статистика перекрестной проверки, например, высшая точность прогнозирования или наименьшее смещение. Будет использоваться критерий из параметра criterion.
  • SORTINGДля сравнения результатов будет применена иерархическая сортировка. Несколько критериев задаются в порядке приоритета (сначала идет наивысший приоритет) в параметре criteria_hierarchy. Результаты интерполяции ранжируются по первому критерию, а любые совпадения отменяются вторым. Совпадения во втором критерии отменяются третьим и т.д. Статистика перекрестной проверки является непрерывным значением и, как правило, не имеет точных совпадений, поэтому можно указать допуски (процентные или абсолютные) для создания связей в каждом из критериев.
  • AVERAGE_RANKСредневзвешенный ранг нескольких критериев будет использоваться для сравнения результатов. Несколько критериев и связанных с ними весов указаны в параметре weighted_criteria. Результаты интерполяции ранжируются независимо по каждому из критериев, и для окончательного определения рангов используется средневзвешенное значение рангов. Критерии с высоким весом будут сильнее влиять на итоговые ранги, поэтому веса можно использовать для задания предпочтения одних критериев над другими.
String
criterion
(Дополнительный)

Задает критерий, используемый для сравнения и ранжирования результатов интерполяции.

  • ACCURACYРезультаты будут ранжироваться по возрастанию среднеквадратичной ошибки. Эта опция позволяет измерить, насколько точно, в среднем, прогнозирования перекрестной проверки соответствуют истинным значениям. Это значение по умолчанию
  • BIASРезультаты будут ранжироваться, начиная от ближайшей к нулю средней ошибки. Эта опция позволяет измерить, насколько прогнозирования перекрестной проверки в среднем завышают или занижают истинные значения. Результаты интерполяции с положительными средними ошибками систематически завышают истинные значения (положительное смещение), а с отрицательными средними ошибками систематически занижают истинные значения (отрицательное смещение).
  • WORST_CASEРезультаты будут ранжироваться по минимальной максимальной абсолютной ошибке. Эта опция выполняет только одно наименее точное прогнозирование перекрестной проверки (положительное или отрицательное). Она может быть полезной, если вас больше всего беспокоят наихудшие сценарии, а не точность в стандартных условиях.
  • STANDARD_ERRORРезультаты будут ранжироваться, начиная от ближайшей к единице среднеквадратичной нормированной ошибки. Эта опция измеряет, насколько близко вариабильность прогнозов перекрестной проверки соответствует предполагаемым стандартным ошибкам. Она применима, если вы собираетесь создать доверительные интервалы или пределы погрешности для прогнозирования.
  • PRECISIONРезультаты будут ранжироваться по возрастанию средней стандартной ошибки. При создании доверительных интервалов или пределов погрешности для прогнозируемых значений у более точных результатов будут более узкие интервалы вокруг прогнозов. Измеряется не то, правильно ли оцениваются стандартные ошибки, а только то, что стандартные ошибки малы. При использовании этой опции рекомендуется в качестве критериев исключения включать минимальные и максимальные значения среднеквадратичной нормированной ошибки, чтобы гарантировать точность и разброс стандартных ошибок.
String
criteria_hierarchy
[[criteria1, tol_type1, tol_val1], [criteria2, tol_type2, tol_val2],...]
(Дополнительный)

Иерархия критериев, которая будет использоваться для иерархической сортировки с допусками. Введите несколько критериев в порядке уменьшения их приоритета. Результаты интерполяции ранжируются по первому критерию, а любые совпадения отменяются вторым. Совпадения во втором критерии отменяются третьим и т.д. Статистика перекрестной проверки является непрерывным значением и, как правило, не имеет точных совпадений, поэтому можно указать допуски для создания совпадений в каждом из критериев. Для каждой строки задайте критерий в первом столбце, тип допуска (в процентах или абсолютный) во втором столбце и значение допуска - в третьем. Если значение допуска не указано, допуск использоваться не будет. Этот вариант подходит для последней строки, чтобы не было совпадений для результата интерполяции с наивысшим рангом.

Для каждой строки (уровня иерархии) доступны следующие критерии:

  • ACCURACY - результаты будут ранжированы по высшей точности.
  • BIAS - результаты будут ранжированы по наименьшему смещению.
  • WORST_CASE - Результаты будут ранжированы по наименьшей худшей ошибке.
  • STANDARD_ERROR - результаты будут ранжированы по наибольшей точности стандартной ошибке.
  • PRECISION - результаты будут ранжированы по высшей точности.

Например, можно задать значение ACCURACY с допуском 5 процентов в первой строке и значение BIAS без допуска - во второй строке. Такие параметры сначала ранжируют результаты интерполяции по наименьшей среднеквадратичной ошибке (высшей точности прогнозирования), и все результаты интерполяции, значения среднеквадратичной ошибки которых находятся в пределах 5 процентов от наиболее точного результата, будут считаться совпадающими по точности прогнозирования. Среди совпадающих результатов результат со средней ошибкой, ближайшей к нулю (наименьшим смещением), получит наивысший ранг.

Value Table
weighted_criteria
[[criteria1, weight1], [criteria2, weight2],...]
(Дополнительный)

Несколько критериев с весами, используемыми для ранжирования результатов интерполяции. Введите критерий и вес для каждой строки. Результаты интерполяции будут ранжированы независимо по каждому из критериев, и для окончательного определения рангов результатов интерполяции будет использоваться средневзвешенное значение рангов.

  • ACCURACY - результаты будут ранжироваться по наименьшей среднеквадратичной ошибке.
  • BIAS - результаты будут ранжироваться по ближайшей к нулю средней ошибке.
  • WORST_CASE - результаты будут ранжироваться по наименьшей максимальной абсолютной ошибке.
  • STANDARD_ERROR - результаты будут ранжироваться, начиная от ближайшей к единице среднеквадратичной нормированной ошибки.
  • PRECISION - результаты будут ранжироваться по наименьшей средней стандартной ошибке.

Value Table
exclusion_criteria
[[criteria1, value1], [criteria2, value2],...]
(Дополнительный)

Критерий и связанные значения, которые будут использоваться для исключения результатов интерполяции из сравнения. Исключенные результаты не получат рангов и получат значение No в поле Included выходной таблицы перекрестной проверки.

  • MAX_RMSE - результаты будут исключены, если среднеквадратичная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет точность прогнозирования.
  • MAX_WORST_CASE - результаты будут исключены, если максимальная абсолютная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет наименьшую худшую ошибку.
  • MAX_STD_RMSE - результаты будут исключены, если среднеквадратичная нормированная ошибка превысит заданное значение. Значение должно быть больше или равно 1. Эта опция измеряет точность стандартной ошибки.
  • MIN_STD_RMSE - результаты будут исключены, если среднеквадратичная нормированная ошибка не превышает заданное значение. Значение должно быть между 0 и 1. Эта опция измеряет точность стандартной ошибки.
  • MAX_MEAN_ERROR - результаты будут исключены, если средняя ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет смещение.
  • MIN_MEAN_ERROR - результаты будут исключены, если средняя ошибка не превысит заданное значение. Значение не должно быть положительным. Эта опция измеряет смещение.
  • MAX_ASE - результаты будут исключены, если средняя стандартная ошибка превысит заданное значение. Значение не может быть отрицательным. Эта опция измеряет точность.
  • MIN_PERC_ERROR - результаты будут исключены, если результат интерполяции не так точен, как базовая непространственная модель, прогнозирующая глобальное среднее значение во всех точках на карте. Эта относительная точность измеряется путем сравнения значения среднеквадратичной ошибки со среднеквадратическим отклонением значений интерполируемых точек. Среднеквадратичная ошибка должна быть, как минимум, на указанный процент меньше среднеквадратического отклонения, чтобы быть включенной в сравнение. Например, значение 10 означает, что среднеквадратичная ошибка должна быть как минимум на 10 процентов меньше среднеквадратического отклонения, чтобы ее можно было включить в сравнение и ранжирование. Значение должно быть в диапазоне от 0 до 100. Эта опция измеряет точность прогнозирования.

Value Table

Пример кода

ExploratoryInterpolation, пример 1 (окно Python)

Скрипт Python, демонстрирующий использование функции ExploratoryInterpolation.

# Interpolate points using Simple Kriging, Universal Kriging, and EBK
# Rank results by highest prediction accuracy
# Exclude results with error reductions under 25%

inPoints = "myPoints"
inField = "myField"
outTable = "outCVtable"
outGALayer = "Result With Highest Rank"
interpMethods = ["SIMPLE_KRIGING", "UNIVERSAL_KRIGING", "EBK"]
compMethod = "SINGLE"
criterion = "ACCURACY"
exclCrit = [["MIN_PERC_ERROR", 25]]
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, criterion, None, None, exclCrit)
ExploratoryInterpolation, пример 2 (автономный скрипт)

Скрипт Python, демонстрирующий использование функции ExploratoryInterpolation.

# Interpolate points and a field using various interpolation methods
# Rank results by highest weighted average rank
# Rank same results by hierarchical sorting

# Import system modules
import arcpy

# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")

# Allow overwriting output
arcpy.env.overwriteOutput = True

### Set shared parameters
# Set input and output locations
directory = "C:/data/"
ingdb = directory + "data.gdb/"
outgdb = directory + "out.gdb/"
arcpy.env.workspace = directory
# Input points
inPoints = ingdb + "myPoints"
# Input field
inField = "myField"
# List of interpolation methods
interpMethods = ["SIMPLE_KRIGING", "UNIVERSAL_KRIGING", "EBK"]
# Exclude results with error reductions under 25%
exclCrit = [["MIN_PERC_ERROR", 25]]
# Output geostatistical layer with highest rank
outGALayer = "Result With Highest Rank"

### Set weighted average rank parameters
# Output table of ranks and cross validation results
outTable = directory + "outWeightedAverageTable"
# Use weighted average rank
compMethod = "AVERAGE_RANK"
# Use all criteria with highest weight to prediction accuracy
weightedCrit = [
            ["ACCURACY", 3],
            ["BIAS", 1],
            ["WORST_CASE", 1],
            ["STANDARD_ERROR", 1],
            ["PRECISION", 1]
               ]

# Compare using weighted average rank
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, None, None, weightedCrit, exclCrit)



### Set hierarchical sorting parameters
# Output table of ranks and cross validation results
outTable = directory + "outHierSortTable"
# Use hierarchical sorting with tolerances
compMethod = "SORTING"
# Compare using highest prediction accuracy with a 10% tolerance
# Break ties by lowest bias
hierCrit = [
            ["ACCURACY", "PERCENT", 10],
            ["BIAS", "PERCENT", None]
           ]

# Compare using hierarchical sorting with tolerances
arcpy.ga.ExploratoryInterpolation(inPoints, inField, outTable, outGALayer,
         interpMethods, compMethod, None, hierCrit, None, exclCrit)

Информация о лицензиях

  • Basic: Обязательно Geostatistical Analyst
  • Standard: Обязательно Geostatistical Analyst
  • Advanced: Обязательно Geostatistical Analyst

Связанные разделы