Какие существуют модели крингинга?

Доступно с лицензией Geostatistical Analyst.

Методы кригинга основаны на математических и статистических моделях. Добавление статистической модели, включающей вероятность, отличает методы кригинга от детерминированных методов, описанных в разделе Детерминированные методы для пространственной интерполяции. При кригинге вы связываете некоторую вероятность со своими прогнозами; то есть значения не могут быть полностью предсказуемы с помощью статистической модели. Рассмотрим пример с выборкой измеренных значений содержания азота в поле. Очевидно, что даже при большой выборке вы не сможете предсказать точное содержание азота в каком-либо месте, где не проводилось измерений. Поэтому вы не только пытаетесь это предсказать, но и оцениваете ошибку прогноза.

Методы кригинга основаны на понятии автокорреляции. Корреляция обычно рассматривается как тенденция к взаимосвязи двух типов переменных. Например, фондовый рынок имеет тенденцию к позитивным изменениям при снижении процентных ставок, поэтому говорят, что они коррелируют отрицательно. Однако фондовый рынок положительно автокоррелирован, что означает, что он имеет корреляцию внутри себя. На фондовом рынке два значения, как правило, будут более схожими, если между ними будет разница всего в один день, а не в один год. Это связано с основным принципом географии — объекты, расположенные ближе друг к другу, как правило, более похожи, чем те, что находятся дальше друг от друга. Скорость, с которой ослабевает корреляция, может быть выражена как функция расстояния.

Автокорреляция - это функция расстояния. Это определяющая черта геостатистики. В классической статистике наблюдения считаются независимыми, то есть между ними нет корреляции. В геостатистике информация о пространственном местоположении позволяет вычислять расстояния между наблюдениями и моделировать автокорреляцию как функцию расстояния.

Также обратите внимание, что, как правило, фондовый рынок растет со временем, что называется трендом. Для геостатистических данных используются те же термины, и они выражены в следующей простой математической формуле:

Z(s) = µ(s) + ε(s),

где Z(s) - представляющая интерес переменная, разложенная на детерминированный тренд µ(s) и случайную, автокоррелированную форму ошибок ε(s). Символ s указывает местоположение; представьте, что он содержит пространственные координаты x (долгота) и y (широта). Вариации этой формулы лежат в основе всех различных типов кригинга. Начнем справа и будем двигаться влево.

Каким бы сложным ни был тренд в модели, µ(s) все равно не даст идеального прогноза. В этом случае делаются некоторые предположения относительно ошибки ε(s), а именно, вы ожидаете, что они будут равны 0 (в среднем) и что автокорреляция между ε(s) и ε(s + h) зависит не от фактического местоположения s, а только от смещения h между ими двумя. Это необходимо для обеспечения репликации, чтобы вы могли оценить автокорреляционную функцию. Например, на следующем рисунке предполагается, что случайные ошибки в парах местоположений, соединенных стрелками, имеют одинаковую автокорреляцию:

Стрелки автокорреляции

Далее изучим тренд. Это может быть простая константа, то есть µ(s) = m для всех местоположений s, и если µ неизвестно, то это модель, на которой основан ординарный кригинг. Он также может быть составлен из линейной функции самих пространственных координат, например:

µ(s) = ß0 + ß1x + ß2y + ß3x2 + ß4y2 + ß5xy,

где это поверхность полиномного тренда второго порядка и простая линейная регрессия по пространственным координатам x и y. Изменяющиеся тренды, в которых коэффициенты регрессии неизвестны, формируют модели для универсального кригинга. Всякий раз, когда тренд полностью известен (то есть известны все параметры и ковариации), независимо от того, постоянен он или нет, он формирует модель для простого кригинга.

Теперь взгляните на левую часть разложения, Z(s) = µ(s) + ε(s). Вы можете выполнять преобразования над Z(s). Например, вы можете изменить его на индикаторную переменную, где она равно 0, если Z(s) ниже некоторого значения (например, 0,12 ppm для концентрации озона), или 1, если она выше некоторого значения. Возможно, вам захочется спрогнозировать вероятность того, что Z(s) превысит пороговое значение, и прогнозы, основанные на этой модели, формируют индикаторный кригинг. Вы можете выполнить общие неопределенные преобразования Z(s) и назвать их fi(Z(si)) для i-й переменной. Вы можете формировать показатели функций переменных; например, если вы хотите предсказать местоположение s0, вы формируете предиктор дизъюнктивного кригинга g(Z(s0)), используя данные fi(Z(si)).

Наконец, рассмотрим случай, когда у вас есть более одного типа переменной, и вы формируете модели Zj(s) = µj(s) + εj(s) для j-го типа переменной. Здесь вы можете рассмотреть другой тренд для каждой переменной, и помимо автокорреляции для ошибок εj(s), у вас также есть взаимная корреляция между ошибками εj(s) и εk(s) для двух типов переменных. Например, вы можете рассмотреть взаимную корреляцию между двумя переменными, такими как концентрация озона и твердые частицы, и их необязательно измерять в одних и тех же местах. Модели, основанные на более чем одной представляющей интерес переменной, составляют основу кокригинга. Вы можете сформировать индикаторную переменную Z(s), и если вы спрогнозируете ее, используя исходные нетрансформированные данные Z(s) в модели кокригинга, вы получите вероятностный кригинг. Если вас интересует более одной переменной, вы можете рассмотреть обычный кокригинг, универсальный кокригинг, простой кокригинг, индикаторный кокригинг, вероятностный кокригинг и дизъюнктивный кокригинг как многомерные расширения различных типов кригинга, описанных ранее.