正規スコア変換

Geostatistical Analyst のライセンスで利用可能。

一部の内挿とシミュレーション方法では入力データが正規分布している必要があります (このような方法の一覧については、「データの分布の調査」をご参照ください)。 正規スコア変換 (NST) は、標準正規分布に非常に近くなるようにデータセットを変換するよう設計されています。 このために、データセット内の値が小さいものから順にランク付けされ、そのランクが正規分布から生成されたランクと対応付けられます。 変換のステップとしては、データセットが並べ替えられてランク付けされ、データセット内の各値のランクに対応するランクが標準正規分布から検出され、そのランクに関連付けられている正規分布の値によって変換後のデータセットが構成されます。 ランク付けにはデータセットの頻度分布または累積分布を使用できます。

正規スコア変換の適用される前と適用された後のヒストグラムと累積分布の例を以下に示します。

正規スコア変換の適用前と適用後のヒストグラム
正規スコア変換の適用前と適用後のヒストグラム

正規スコア変換の適用前と適用後の累積分布
正規スコア変換の適用前と適用後の累積分布

近似法

Geostatistical Analyst には、直接近似法、線形近似法、ガウス カーネル近似法、乗法的スキュー近似法の 4 つの近似法があります。 直接近似法では実際の累積分布が使用され、線形近似法では累積分布の各ステップ間の直線が適合され、ガウス カーネル近似法では累積正規分布成分の線形結合を適合させることによって累積分布が近似されます。 乗法的スキュー近似法では、基本分布 (スチューデントの T 分布、対数正規分布、ガンマ分布、経験分布、対数経験分布) を適合させ、これをベータ分布の線形結合を適合させることによって (逆確率積分変換を使用して) スキューイングすることによって、累積分布が近似されます。 対数正規分布、ガンマ分布、対数経験分布は正のデータにのみ使用することができ、推定値は正であることが保証されます。 適合されたモデルの品質を判断するための赤池情報量基準 (AIC) が提供されています。

変換後のスケールで推定が行われ、推定値は元のスケールに自動的に変換されます。 仮定および近似の滑らかさに応じて近似法を選択します。 直接近似法は滑らかさが最も低く、仮定の数が最小となり、線形近似法は中間です。 ガウス カーネル近似法と乗法的スキュー近似法では滑らかな逆変換になりますが、これらはデータ分布を既知の分布の有限組み合わせによって近似できることを前提としています。

関連トピック


このトピックの内容
  1. 近似法