交差検証 (Cross Validation) (Geostatistical Analyst)

Geostatistical Analyst のライセンスで利用可能。

サマリー

1 つのデータ位置を削除し、残りの位置のデータを使用して関連データを推定します。 このツールの主な使用法は、推定値と観測値を比較して、一部のモデル パラメーターに関する有用な情報を得ることです。

交差検証と検証の実行の詳細

使用法

  • Python でこのツールを使用する場合、result オブジェクトには、フィーチャクラスと CrossValidationResult の両方が含まれ、次のプロパティがあります。

    • 個数 - 使用されたサンプルの総数。
    • 平均誤差 - 計測値と推定値の差の平均値。
      平均誤差
    • RMS 誤差 - モデルによる計測値の推定がどれだけ近似しているかを示します。 この誤差が小さいほど、モデルが優れています。
      RMS 誤差
    • 推定標準誤差 - 推定標準誤差の平均値。
      推定標準誤差
    • 平均標準誤差 - 標準された誤差の平均値。 この値は 0 に近い必要があります。
      平均標準誤差
    • 標準 RMS 誤差 - 推定標準誤差が有効であれば、この値は 1 に近い必要があります。 標準 RMS 誤差が 1 よりも大きい場合、推定値のばらつきを過小評価しています。ることになります。 標準 RMS 誤差が 1 よりも小さい場合、推定値のばらつきを過大評価しています。
      標準 RMS 誤差
    • 90% 区間内の割合 - 90 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、90 に近い必要があります。
    • 95% 区間内の割合 - 95 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、95 に近い必要があります。
    • 平均 CRPS - すべてのポイントの連続的ランク付け確率スコア (CRPS) の平均値。 CRPS は、各観測データ値に対する推定累積分布関数からの偏差を計測する診断です。 この値は可能な限り小さくする必要があります。 この診断は、単一ポイントの推定ではなく、完全な分布とデータを比較するため、他の交差検証診断よりも優れている点がいくつもあります。 この統計情報の計算にはシミュレーションが含まれるため、単純な式で記述することはできません。

    [IDW][グローバル多項式の内挿法 (Global Polynomial Interpolation)][放射基底関数 (Radial Basis Functions)][バリアを使用したディフュージョン内挿 (Diffusion Interpolation With Barriers)]、および [バリアを使用したカーネル内挿 (Kernel Interpolation With Barriers)] では、平均誤差と RMS 誤差の結果のみを使用できます。

    [経験ベイズ クリギング (Empirical Bayesian Kriging)] モデルと [EBK 回帰予測 (EBK Regression Prediction)] モデルでは、90% 区間内の割合、95% 区間内の割合、および平均 CRPS のみを使用できます。

  • オプションの出力フィーチャクラスのフィールドについては、[地球統計レイヤー → ポイント (GA Layer To Points)] ツールをご参照ください。

パラメーター

ラベル説明データ タイプ
入力地球統計レイヤー

解析する地球統計レイヤー。

Geostatistical Layer
出力ポイント フィーチャクラス
(オプション)

地球統計レイヤーの各位置における交差検証の統計情報を格納します。

Feature Class

派生した出力

ラベル説明データ タイプ
個数

使用されたサンプルの総数。

Long
平均誤差

平均誤差 - 計測値と推定値の差の平均値。

Double
RMS

RMS 誤差 - モデルによる計測値の推定がどれだけ近似しているかを示します。

Double
平均標準

推定標準誤差 - 推定標準誤差の平均値。

Double
標準化平均

平均標準誤差 - 標準化された誤差の平均値。

Double
標準 RMS

標準 RMS 誤差 - 推定標準誤差が有効であれば、この値は 1 に近い必要があります。

Double
90% 区間内の割合

90% 区間内の割合 - 90 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、90 に近い必要があります。

Double
95% 区間内の割合

95% 区間内の割合 - 95 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、95 に近い必要があります。

Double
Average CRPS

平均 CRPS - すべてのポイントの連続的ランク付け確率スコア (CRPS) の平均値。 CRPS は、各観測データ値に対する推定累積分布関数からの偏差を計測する診断です。 この値は可能な限り小さくする必要があります。 この診断は、単一ポイントの推定ではなく、完全な分布とデータを比較するため、他の交差検証診断よりも優れている点がいくつもあります。 この統計情報の計算にはシミュレーションが含まれるため、単純な式で記述することはできません。

Double

arcpy.ga.CrossValidation(in_geostat_layer, {out_point_feature_class})
名前説明データ タイプ
in_geostat_layer

解析する地球統計レイヤー。

Geostatistical Layer
out_point_feature_class
(オプション)

地球統計レイヤーの各位置における交差検証の統計情報を格納します。

Feature Class

派生した出力

名前説明データ タイプ
count

使用されたサンプルの総数。

Long
mean_error

平均誤差 - 計測値と推定値の差の平均値。

Double
root_mean_square

RMS 誤差 - モデルによる計測値の推定がどれだけ近似しているかを示します。

Double
average_standard

推定標準誤差 - 推定標準誤差の平均値。

Double
mean_standardized

平均標準誤差 - 標準化された誤差の平均値。

Double
root_mean_square_standardized

標準 RMS 誤差 - 推定標準誤差が有効であれば、この値は 1 に近い必要があります。

Double
percent_in_90_interval

90% 区間内の割合 - 90 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、90 に近い必要があります。

Double
percent_in_95_interval

95% 区間内の割合 - 95 パーセントの交差検証信頼区間に含まれるポイントの割合。 この値は、95 に近い必要があります。

Double
average_crps

平均 CRPS - すべてのポイントの連続的ランク付け確率スコア (CRPS) の平均値。 CRPS は、各観測データ値に対する推定累積分布関数からの偏差を計測する診断です。 この値は可能な限り小さくする必要があります。 この診断は、単一ポイントの推定ではなく、完全な分布とデータを比較するため、他の交差検証診断よりも優れている点がいくつもあります。 この統計情報の計算にはシミュレーションが含まれるため、単純な式で記述することはできません。

Double

コードのサンプル

CrossValidation の例 1 (Python ウィンドウ)

入力地球統計レイヤーに対して交差検証を実行します。

import arcpy
arcpy.env.workspace = "C:/gapyexamples/data"
cvResult = arcpy.CrossValidation_ga("C:/gapyexamples/data/kriging.lyr")
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))
CrossValidation の例 2 (スタンドアロン スクリプト)

入力地球統計レイヤーに対して交差検証を実行します。

# Name: CrossValidation_Example_02.py
# Description: Perform cross validation on an input geostatistical layer.
# Requirements: Geostatistical Analyst Extension

# Import system modules
import arcpy

# Set environment settings
arcpy.env.workspace = "C:/gapyexamples/data"

# Set local variables
inLayer = "C:/gapyexamples/data/kriging.lyr"

# Execute CrossValidation
cvResult = arcpy.CrossValidation_ga(inLayer)
print("Root Mean Square error = " + str(cvResult.rootMeanSquare))

ライセンス情報

  • Basic: 次のものが必要 Geostatistical Analyst
  • Standard: 次のものが必要 Geostatistical Analyst
  • Advanced: 次のものが必要 Geostatistical Analyst

関連トピック