Geostatistical Analyst のライセンスで利用可能。
内挿モデルはいずれも推定方法であり、最終目的は、測定位置と測定位置の間にあるすべての位置における推定値のサーフェスを生成することにあります。 一般的に、推定の精度と信頼性も把握する必要があるため、Geostatistical Analyst では、推定にはばらつきがつきものであるということを念頭に置きながら推定サーフェスを解釈するのに役立つ、さまざまな出力サーフェス タイプが用意されています。 以降の各セクションでそれぞれの出力サーフェス タイプについて説明し、一番下の表に各内挿方法で使用可能なサーフェス タイプを一覧しています。
すべての出力マップでは、正しい内挿方法と正しい内挿パラメーターを選択していることを前提としています。 実際には、データが内挿方法の仮定を満たしていない場合や間違ったパラメーターが指定されている場合、これらのサーフェスはデータの真値を正確に表していないことがあります。
推定サーフェス
(指標クリギングと確率クリギングを除く) すべての内挿法で推定サーフェスの作成が可能であり、これはすべての内挿方法のデフォルトの出力です。 このサーフェスには、測定位置と測定位置の間にあるすべての位置におけるデータの推定値が表示されます。
推定標準誤差サーフェス
推定標準誤差サーフェスは、各位置における推定値の標準誤差のマップです。 標準誤差は各位置における推定値の標準偏差であり、標準誤差が大きいほど、推定値の精度は低くなります。 標準誤差は、各推定位置における真値を含む可能性がある区間を作成するときに一般に使用されます。
68-95-99.7 則
データが多変量正規分布に従う場合、簡単な経験則に従って各推定位置における真値の信頼区間を作成できます。 この規則によれば、真値の 68% (約 2/3) が推定値を中心とした標準誤差の 1 倍の範囲内に収まり、95% が標準誤差の 2 倍の範囲内に収まり、99.7% が標準誤差の 3 倍の範囲内に収まります。 たとえば、ある位置の推定値が 100 で、標準誤差が 5 の場合、真値が 95 ~ 105 の範囲にあることを 68% 確信できます。 同様に、真値が 90 ~ 110 の範囲にあることを 95% 確信でき、真値が 85 ~ 115 の範囲にあることがほぼ確実になります (99.7% の信頼性)。 他のパーセントで信頼区間を作成する場合、統計の教科書やインターネット上で公開されている Z テーブルの臨界値を参考にしてください。
データが多変量正規分布に従っていることを確認することは非常に困難であり、実際には、一変量正規性のみを確認することが一般的です。 一変量正規性の調査にはヒストグラム チャートを使用できます。
チェビシェフの不等式
データが 68-95-99.7 則の仮定を満たしていない場合や、データがこの仮定を満たしているか確信を持てない場合、チェビシェフの不等式に基づいてさらに保守的な信頼区間を作成することができます。 この不等式によれば、有限の平均値と分散を持つ分布では、真値の少なくとも (1-1/k2)·100% が推定値を中心とした標準誤差の k 倍の範囲内に収まります (ここで、k>1)。 k=2 に設定した場合、真値の少なくとも 75% が推定値を中心とした標準誤差の 2 倍の範囲内に収まります。 同様に、k=3 に設定した場合、真値の少なくとも 88.9% が推定値を中心とした標準誤差の 3 倍の範囲内に収まります。 k を別の値に設定することで、別のパーセントでの区間を作成することができます。
標準誤差の解釈方法
標準誤差の値は入力データの値と範囲を念頭に解釈する必要があります。 たとえば、入力データのすべての値が 10,000 ~ 12,000 の範囲にある場合、標準誤差の値 100 は、入力データの値とその範囲に比べてかなり小さいため、推定の精度が高いことを示しています。 これに対し、データの値が 50 ~ 200 の範囲にある場合、標準誤差が同じ 100 であっても、推定値のばらつきが入力データの値およびその範囲と同程度であるため、精度が低いことを示しています。
確率サーフェス
確率マップは一般に、汚染に関する国の基準など、対象となる臨界値が存在する場合に使用されます。 この臨界値は閾値と呼ばれ、この出力マップには閾値を超える確率が表示されます。 このマップは、この臨界閾値を超える確率が最も高いエリアや最も低いエリアを調べるのに役立ちます。
分位サーフェス
分位マップには、各位置における推定値の分布の指定の分位値が表示されます。 分位マップは一般に、最悪のシナリオと最良のシナリオに向けて準備する際に使用されます。 たとえば、推定値のマップを作成する代わりに、推定値の 95 番目の分位値から成るマップを作成できます。 この場合、真値の 5% だけが分位サーフェスの値を超えます。 同様に、第 10 分位マップを作成した場合、真値の 10% だけが分位サーフェスの値より小さくなります。
指標変数の標準誤差サーフェス
指標変数は値 0 と 1 だけをとるバイナリ変数です。 指標クリギング、確率クリギング、分離クリギングは閾値に基づいて入力データを 0 または 1 に再分類することで確率マップを計算します。閾値より小さい値は 0 に再分類され、閾値より大きい値は 1 に再分類されます。 推定マップに指標変数が内挿された後、指標変数の期待値が計算され、この期待値は指標変数が 1 と等しくなる (つまり、閾値を超える) 確率として解釈することができます。 したがって、指標変数の標準誤差出力マップは指標変数の期待値の標準誤差のサーフェスとなります。つまり、これは閾値を超える確率の標準誤差です。
指標変数は正規分布にならないので、指標変数に 68-95-99.7 ルールを使用することはできません。 閾値を超える確率の信頼区間を作成するには、チェビシェフの不等式を使用できます。
条件数サーフェス
条件数サーフェスはローカル多項式内挿のオプションの出力であり、各推定位置における推定値の安定性を判断するときに使用します。 条件数を文字通りに解釈するのは困難ですが、条件数が大きいほど、推定は不安定になります。 この場合、安定性とは、入力データや内挿パラメーターのわずかな変化によって推定値が変化する量を意味します。 ローカル多項式内挿における条件数の経験則として、1 次多項式では条件数が 10 を超えてはなりません。 2 次多項式では条件数が 100 を超えてはならず、3 次多項式では条件数が 1,000 を超えてはなりません。 4 次以上の多項式は一般に推奨されません。
各内挿方法で使用可能な出力サーフェスのタイプ
以下の表の シンボルは、各内挿方法でそのタイプの出力サーフェスが使用可能であることを示しています。
内挿方法 | 推定 | 推定標準誤差 | 分位マップ | 確率マップ | 指標変数の標準誤差 | 条件数 |
---|---|---|---|---|---|---|
通常クリギング | 1 | 1 | ||||
普遍クリギング | 1 | 1 | ||||
単純クリギング | 1 | 1 | ||||
指標クリギング | ||||||
確率クリギング | ||||||
分離クリギング | 2 | 2 | 2 | 2 | ||
EBK 回帰予測 | 5 | 5 | 5 | |||
経験ベイズ クリギング | 1 | 1 | ||||
経験ベイズ クリギング 3D | 1 | 1 | ||||
エリア内挿 | ||||||
バリアを使用した拡散内挿 | ||||||
グローバル多項式内挿 | ||||||
IDW | ||||||
バリアを使用したカーネル内挿 | 3 | |||||
ローカル多項式内挿 | 4 | 4 | ||||
放射基底関数 |
1 多変量正規分布の仮定が必要です。
2 ペアワイズ二変量正規性の仮定が必要です。
3 多項式の次数が 1 に設定されている必要があります。
4 空間条件数の閾値を使用する必要があります。
5 [地球統計レイヤー → ラスター (GA Layer to Rasters)] を使用して出力を作成する必要があります。