EBK 回帰予測とは

Geostatistical Analyst のライセンスで利用可能。

はじめに

EBK 回帰予測は、内挿するデータの値に影響することがわかっている説明変数ラスターとともに経験ベイズ クリギング (EBK) を使用する地球統計学的内挿方法です。 この手法ではクリギングと回帰分析が組み合わせて使用されるため、回帰分析またはクリギングを単独で使用するよりも推定の確度が高くなります。

経験ベイズ クリギングの詳細

回帰分析の基本の詳細

回帰クリギング モデルの基本

その名のとおり、回帰クリギング モデルは最小二乗回帰と単純クリギングのハイブリッドです。 これらの回帰モデルとクリギング モデルは、平均値と誤差項の推定を分離することによって従属変数を予測します。

従属変数 = (平均) + (誤差)

最小二乗法 (OLS) では、平均値が説明変数の加重合計としてモデル化され (回帰式)、誤差項はランダムな無相関ノイズであると見なされます。 単純クリギングでは、セミバリオグラム/共分散モデルを使用して誤差項がモデル化され、平均値は一定の値であると見なされます。 その意味で、OLS は平均値に重きを置いた解析を行い、クリギングは誤差項に重きを置いた解析を行います。 これに対し、回帰クリギング モデルは平均値についての回帰モデルの推定と誤差項についてのセミバリオグラム/共分散モデルの推定を同時に行います。 両方の成分を同時に計算するため、回帰クリギング モデルの方が回帰モデルまたはクリギング モデルを単独で使用するよりも推定確度が高くなります。 実際には、OLS 回帰と単純クリギングは回帰クリギングの特殊なケースです。

説明変数ラスターとして使用する変数を選択する際には十分な注意が必要です。 各説明変数が従属変数の値に影響を与えることがわかっている必要があります。 最小二乗法の説明変数を選択するときと同じ方法で説明変数を選択することをお勧めします。 ただし、説明変数が相関しているかどうかをチェックする必要はありません。 これについては、次のセクションで詳しく説明します。

主成分分析

回帰クリギング モデルを構築する前に、説明変数ラスターが主成分に変換され、これらの主成分が回帰モデルの説明変数として使用されます。 主成分は説明変数の線形結合 (加重和) であり、各主成分が他のすべての主成分と無相関になるように計算されます。 これらは相互に無相関であるため、主成分を使用して回帰モデルの多重共線性 (相互に相関する説明変数) の問題を解くことができます。

各主成分は全体の変動性に対する説明変数の割合を表します。 多くの場合、すべての説明変数に含まれている情報の多くを数個の主成分だけで表すことができます。 有用でない主成分を破棄することで、確度を大幅に下げることなくモデルの計算が安定し効率的になります。 [分散の最小累積割合] パラメーターを使用して、主成分が表す変動の大きさを制御することができます。

説明変数がラスターでなければならない理由

このツールでは、すべての説明変数をラスターとして入力する必要があり、回帰クリギング モデルは各入力ポイントに相当する説明変数ラスターの値を抽出することによって構築されます。 なぜ説明変数は従属変数が格納されている同じポイント フィーチャクラスのフィールドであってはならないのか不思議に思うかもしれません。 新しい位置で推定を行うためには、説明変数をその新しい位置で測定して回帰クリギング モデルから推定を計算する必要があります。 説明変数が入力従属変数フィーチャのフィールドであった場合、その入力ポイントの位置でしか推定を行うことができません。 実際に内挿 (新しい位置での値を推定) するためには、説明変数は内挿位置で測定されていなければなりません。 各推定位置に説明変数を指定するには、説明変数をラスターとして保存するのが最も自然なやり方です。

説明変数がラスター形式ではなく入力従属変数フィーチャのフィールドとして保存されている場合、いずれかの内挿方法を使用して各説明変数をラスターに変換する必要があります。 ただし、EBK 回帰予測は説明変数が (内挿された推定値ではなく) 測定値であることを前提としているため、説明変数の内挿時に生じた誤差は以降の計算で適切に考慮されません。 実際には、これは推定が偏る可能性と標準誤差が過小評価される可能性があることを意味しています。

ローカル モデルの作成と評価

EBK 回帰予測をその他の回帰クリギング モデルと比較した場合の最大の利点の 1 つは、モデルがローカルに計算されるということです。 これにより、モデルはエリアごとに変化して局所的影響が考慮されるようになります。 たとえば、説明変数と従属変数の関係は地域によって変化することがあり、EBK 回帰予測ではこのような地域的な変化を正確にモデル化することができます。

EBK 回帰予測では、モデル化を行う前に入力データを一定のサイズのサブセットに分割することで、このような局所的影響が考慮されます。 各ローカル サブセット内のポイントの数は [各ローカル モデルの最大ポイント数] パラメーターによって制御します。 これらのローカル サブセットそれぞれについて回帰クリギング モデルが別個に計算され、これらのローカル モデルをすべて組み合わせることで最終推定マップが生成されます。 あるいは、[サブセット ポリゴン フィーチャ] パラメーターを使用してローカル サブセットを定義することもできます。 このパラメーターでポリゴン フィーチャを指定した場合、各ポリゴン フィーチャによってサブセットが 1 つ定義され、1 つのポリゴン フィーチャに含まれているすべてのポイントが 1 つのサブセットとして処理されます。 この場合、各ポリゴンには 20 ~ 1,000 個のポイントが含まれている必要があります。

[出力診断フィーチャクラス] パラメーターを使用して、これらのローカル モデルそれぞれについてモデル診断を生成することができます。 このパラメーターを使用すると、各ローカル モデルに寄与するすべてのポイントが含まれるポリゴンから成るポリゴン フィーチャクラスが作成されます。 たとえば、5 つのサブセットがある場合、5 つのポリゴンが作成され、各ポリゴンは各サブセットの領域を示します。 ポリゴン フィーチャクラスには、ローカル モデルがサブセットにどの程度良好に適合しているかについての診断情報を示す各種フィールドも含まれています。 サブセット ポリゴン フィーチャを指定した場合、出力診断フィーチャクラスはサブセット ポリゴンと同じジオメトリを持ちます。

変換とセミバリオグラム モデル

EBK 回帰予測ではさまざまな変換とセミバリオグラム モデルを使用できます。

次の変換オプションを利用できます。

  • なし - 従属変数に変換は適用されません。
  • 経験 - ノンパラメトリック カーネル混合が従属変数に適用されます。 このオプションは従属変数が正規分布していない場合に推奨されます。
  • 対数経験 - 経験的変換が適用される前に対数変換が従属変数に適用されます。 このオプションを使用するとすべての推定値がゼロより大きくなるため、このオプションは従属変数が負にならない場合 (降雨量測定など) に推奨されます。

次のセミバリオグラム モデルを使用できます。

  • 指数 - このセミバリオグラム モデルは、誤差項の空間的自己相関が他のオプションと比べて比較的急速に減少すると仮定します。 これがデフォルトです。
  • ナゲット - このセミバリオグラム モデルは、誤差項が空間的に独立していると仮定します。 このオプションを使用することは最小二乗回帰を使用することに相当するため、このオプションが実際の内挿に使用されることはめったにありません。 その代わりに、これは回帰クリギングを使用したときに最小二乗回帰と比べてどの程度改善されるかを確認するときの基準として使用できます。
  • Whittle - このセミバリオグラム モデルは、誤差項の空間的自己相関が他のオプションと比べて比較的ゆっくりと減少すると仮定します。
  • K-ベッセル - このセミバリオグラム モデルでは、誤差項の空間的自己相関の減少速度を速くすることも、遅くすることも、またはその間にすることもできます。 これは柔軟なので、ほとんどの場合に最も正確な推定値が得られますが、追加のパラメーターの推定を必要とするため計算時間が長くなります。 どのセミバリオグラムを使用すべきかわからない場合、最も確度の高い結果を得るには待ち時間が長くてもかまわなければ、このオプションが推奨されます。

参考文献

  • Chilès, J-P., and P. Delfiner (1999). Chapter 4 of Geostatistics: Modeling Spatial Uncertainty. New York: John Wiley & Sons, Inc.
  • Krivoruchko K. (2012). "Empirical Bayesian Kriging," ArcUser Fall 2012.
  • Krivoruchko K. (2012). "Modeling Contamination Using Empirical Bayesian Kriging," ArcUser Fall 2012.
  • Krivoruchko K. and Gribov A. (2014). "Pragmatic Bayesian kriging for non-stationary and moderately non-Gaussian data," Mathematics of Planet Earth. Proceedings of the 15th Annual Conference of the International Association for Mathematical Geosciences, Springer 2014, pp. 61-64.
  • Krivoruchko K. and Gribov A. (2019). "Evaluation of empirical Bayesian kriging," Spatial Statistics Volume 32. https://doi.org/10.1016/j.spasta.2019.100368.
  • Pilz, J., and G. Spöck (2007). "Why Do We Need and How Should We Implement Bayesian Kriging Methods," Stochastic Environmental Research and Risk Assessment 22 (5):621–632.

関連トピック