Geostatistical Analyst の基本用語

Geostatistical Analyst のライセンスで利用可能。

以下の用語と概念は、地球統計学および Geostatistical Analyst で繰り返し出現するものです。

用語説明

交差検証

内挿モデルの確度を評価するときの手法。 Geostatistical Analyst では、交差検証は 1 つのポイントを除外した後、残りのすべてのポイントを使用して、除外された位置の値を推定します。 この後、ポイントをデータセットに再び追加してから、別のポイントを除外します。 データセット内のすべてのサンプルについてこれを行うことで、モデルの性能を評価する際に比較可能な推定値と既知の値のペアが作成されます。 結果は通常、平均二乗誤差と二乗平均平方根誤差として集計されます。

決定論的方法

Geostatistical Analyst における決定論的方法とは、類似性の範囲 (逆距離加重など) または滑らかさの度合い (放射基底関数など) に基づいて、測定されたポイントからサーフェスを作成する方法です。 この手法では推定の不確実性 (誤差) の尺度は提供されません。

地球統計レイヤー

Geostatistical Analyst ツールボックス内の多くのジオプロセシング ツールによって生成された結果は、地球統計レイヤーと呼ばれるサーフェスに保存されます。 地球統計レイヤーを使用して、結果のマップを作成したり、内挿法のパラメーター値を確認および変更したり、別のタイプの地球統計レイヤー (推定誤差マップなど) を作成したり、結果をラスターまたはベクター (コンター、塗りつぶしコンターとポイント) 形式にエクスポートしたりすることができます。

地球統計学的方法

Geostatistical Analyst における地球統計学的内挿方法は、自己相関 (計測点相互の統計的関係) を含む統計的モデルに基づいています。 これらの手法では、推定サーフェスや、それらの推定に関連する不確実性 (誤差) の尺度を生成できます。

内挿

既知のサンプル位置で取得された測定値を使用して、サンプルが未収集の位置について値を予測 (推定) するプロセス。 Geostatistical Analyst では複数の内挿法が提供されており、基礎となる仮定、データ要件、各種出力 (推定値とその誤差 (不確実性) など) を生成する能力は内挿法によってそれぞれ異なります。

カーネル

Geostatistical Analyst で提供されている内挿法のいくつかで使用される加重関数。 通常は、推定対象の位置に近いサンプル値には大きい加重が割り当てられ、推定対象の位置から遠いサンプル値には小さい加重が割り当てられます。

クリギング

空間的自己相関のセミバリオグラム モデルを使用して (分位マップと確率マップ、または地球統計学的シミュレーションから) 分析範囲内の各位置の推定値、推定に関連する誤差、および生じ得る値の分布に関するその他の情報を生成する一連の内挿法です。

検索近傍

ほとんどの内挿法では、データのローカル サブセットを使用して推定が行われます。 移動するウィンドウをイメージしてください。ウィンドウ内のデータのみを使用してそのウィンドウの中心での推定が行われます。 これを行うのは、サンプル内の推定を行う必要がある位置から遠く離れた位置には余分な情報があり、分析範囲全体の推定値を生成するために必要な計算時間を短縮するためです。 近傍の選択 (近接するサンプルの数およびウィンドウ内でのその空間的配置) は推定サーフェスに影響するため、慎重に選択する必要があります。

セミバリオグラム

さまざまな距離によって隔てられているサンプル間の差 (分散) を説明する関数。 通常、セミバリオグラムは小さな差では小さな分散、大きな分離距離では大きな分散を示し、データが空間的に自己相関していることを示します。 サンプル データから推定されるセミバリオグラムは経験的セミバリオグラムです。 これは一連のポイントとしてグラフに表されます。 これらのポイントに合わせて適合された関数がセミバリオグラム モデルと呼ばれます。 セミバリオグラム モデルはクリギング (分析範囲内の各位置の推定値、推定に関連する誤差、および生じ得る値の分布に関する情報を生成可能な強力な内挿法) の主要な構成要素です。

シミュレーション

地球統計学におけるシミュレーションとは、(1 つのサーフェスを生成するクリギングとは異なり) 可能性のある多数のバージョンの推定サーフェスを生成することによってクリギングを拡張する手法を指します。 一連の推定サーフェスから提供される豊富な情報を用いて、特定の位置における推定値の不確実性や、対象地域内の一連の推定値あるいは 2 つ目のモデル (物理、経済など) への入力として使用可能な一連の推定値の不確実性を説明することができます。

空間的自己相関

自然現象は空間的自己相関を示すことがよくあります。つまり、互いに近接した位置で取得されたサンプル値は遠く離れた位置で取得されたサンプルよりも類似性が高くなります。 内挿方法には、空間的自己相関の明示的なモデルを必要とするもの (クリギングなど)、空間的自己相関の度合いには推定値を使用し、これを測定する手段は提供しないもの (逆距離加重など)、データセットで空間的自己相関という概念を必要としないものがあります。 空間的自己相関が存在する場合、(観測間の独立性に依存する) 従来の統計的方法を信頼性をもって使用することはできません。

変換

データ変換は、データの分布形状を変化させたり分散を安定化したりするためにデータに関数 (対数、ボックス-コックス、アークサイン、正規スコア) を適用しときに実行されます。

検証

交差検証とよく似ていますが、モデルの構築と評価に同じデータセットが使用される代わりに、2 つのデータセットが使用され、1 つはモデルの構築に、もう 1 つは性能の独立テストとして使用されます。 データセットが 1 つだけ使用可能な場合、サブセット フィーチャ ツールを使用して、データセットをトレーニング サブセットとテスト サブセットにランダムに分割することができます。

Geostatistical Analyst の基本用語