各種クリギング モデルの概要

Geostatistical Analyst のライセンスで利用可能。

クリギングは数学的モデルと統計学的モデルに依存します。 クリギングは、確率を含む統計学的モデルが加わるという点で、空間内挿の決定論的方法で説明している決定論的方法とは区別されます。 クリギングでは、推定には確率が対応付けられます。つまり、統計学的モデルから値を完全に推定することはできません。 農地に含まれる窒素の測定値のサンプルを例にとって考えます。 当然のことながら、大きなサンプルであっても、未測定位置における窒素の正確な値を推定することはできません。 このため、値を推定するだけでなく、推定の誤差の評価も行います。

クリギングは自己相関という概念に依存しています。 相関は、一般に、2 つのタイプの変数が互いに関連する傾向と考えられます。 たとえば、金利が低下すると株式市場にプラスの変化をもたらすため、両者には負の相関関係があると言えます。 ただし、株式市場には正の自己相関、つまり内部相関があります。 株式市場において、2 つの値は、1 年前の値と比較したものより 1 日前の値と比較した方が類似性が高い傾向にあります。 これは、互いに近接しているもののほうが離れた位置にあるものより類似性が高いという地理の基本原則と同義です。 相関が減衰する速度を距離の関数として表すことができます。

自己相関は距離の関数です。 これは地球統計学を決定づける特徴です。 従来の統計学では、測定値は独立しているものと見なされ、測定値の間に相関はありませんでした。 地球統計学では、空間的位置に関する情報を利用して、測定値間の距離を計算し、自己相関を距離の関数としてモデル化することができます。

また、一般に、株式市場が上昇している状態をトレンドと呼びます。 地球統計学的データにも同じ用語があり、これは次のような簡単な数式によって表されます。

Z(s) = µ(s) + ε(s)

ここで、関心変数 Z(s) は決定論的トレンド µ(s) と自己相関ランダム誤差 ε(s) に分解されます。 記号 s は位置を表し、空間的 x (経度) 座標と y (緯度) 座標から成ります。 この式に基づいた変動はすべてのタイプのクリギングの基礎となります。 先に右辺について見た後で、左辺について考えます。

モデルのトレンドがどれだけ複雑であろうと、µ(s) だけでは完全な推定にはなりません。 この場合、誤差項 ε(s) についていくつかの仮定を行います。つまり、誤差項は (平均で) 0 であり、ε(s) と ε(s + h) の間の自己相関は実際の位置 s ではなくこの 2 つの間の変位 h のみに依存するとします。 これは再現性を満たして自己相関関数を推定するために必要です。 たとえば、以下の図で

自己相関矢印

矢印で結ばれている位置のペアにおけるランダム誤差は同じ自己相関を持つと仮定されます。

次に、トレンドを調べます。 すべての位置 s で単純な定数となり (µ(s) = m)、µ が未知である場合、これは通常クリギングで使用されるモデルになります。 これは、以下のような空間的座標自体の線形関数として表すこともできます。

µ(s) = ß0 + ß1x + ß2y + ß3x2 + ß4y2 + ß5xy

これは 2 次多項式トレンド サーフェスであり、空間的な x,y 座標に対する線形回帰にすぎません。 トレンドが変化し、回帰係数が未知の位置があるとした場合、普遍クリギングのモデルが作成されます。 トレンドが定数かどうかにかかわらず完全に既知である (つまり、すべてのパラメーターと共変量が既知である) とした場合、単純クリギングのモデルが作成されます。

次に、分解式 Z(s) = µ(s) + ε(s) の左辺について見ていきましょう。 Z(s) に対して変換を実行できます。 たとえば、Z(s) が何らかの値 (たとえば、オゾン濃度 0.12 ppm など) より小さい場合には 0 となり、何らかの値より大きい場合には 1 となる指標変数にこれを変更できます。 Z(s) が閾値を超える確率を推定する場合、指標クリギングのモデルに基づいて推定を行います。 Z(s) の何らかの一般変換を行い、これを i 番目の変数の fi(Z(si)) と呼ぶことができます。 変数の関数の推定式を作成することができ、たとえば、位置 s0 で推定する場合、データ fi(Z(si)) を使用して分離クリギング式 g(Z(s0)) を作成します。

最後に、複数の変数がある場合について考え、j 番目の変数タイプのモデル Zj(s) = µj(s) + εj(s) を作成します。 ここでは、各変数について異なるトレンドを考慮することができ、誤差 εj(s) の自己相関に加え、2 つの変数タイプの誤差 εj(s) と εk(s) の間の相互相関もあります。 たとえば、オゾン濃度と粒子状物質などの 2 つの変数間の相互相関を考慮することができ、これらの変数が同じ位置で測定されている必要はありません。 複数の関心変数に基づくモデルがコクリギングの基礎となります。 指標変数 Z(s) を作成し、コクリギング モデルで元の未変換データ Z(s) を使用てこれを推定した場合、確率クリギングを得ます。 複数の関心変数がある場合、通常コクリギング、普遍コクリギング、単純コクリギング、指標コクリギング、確率コクリギング、分離コクリギングは上記で説明した各種クリギングの多変量拡張と考えることができます。