ラベル | 説明 | データ タイプ |
入力地球統計レイヤー | 内挿結果を表す地球統計レイヤー。 各レイヤーを比較およびランク付けします。 | Geostatistical Layer |
出力交差検証テーブル | 各内挿結果の交差検証の統計情報とランクを含む出力テーブル。 RANK フィールドに、内挿結果の最終的なランクが格納されます。 | Table |
最高ランクの出力地球統計レイヤー (オプション) | 最高ランクの内挿結果の出力地球統計レイヤー。 この内挿結果では、出力交差検証テーブルの RANK フィールドの値が 1 になります。 最高ランクの内挿結果に同じ順位が存在する場合や、除外基準によりすべての結果が除外されている場合は、値を指定してもレイヤーは作成されません。 この場合、ツールから警告メッセージが返されます。 | Geostatistical Layer |
比較方法 (オプション) | 内挿結果の比較とランク付けに使用する方法を指定します。
| String |
基準 (オプション) | 内挿結果のランク付けに使用する基準を指定します。
| String |
基準階層 (オプション) | 許容値による階層的並べ替えに使用される基準の階層。 複数の基準を優先度順 (重要な基準から順に) 指定します。 内挿結果は最初の基準でランク付けされ、順位が同じ場合は 2 つ目の基準で順位付けされます。 2 つ目の基準で順位が同じ場合は 3 つ目の基準で順位付けされ、以降も同様です。 交差検証の統計情報は連続値であり、一般的に順位が完全に同じになることはないため、許容値を使用して基準内で同じ順位として扱います。 各行で、1 列目に基準、2 列目に許容値タイプ (パーセントまたは絶対値) 、3 列目に許容値を指定します。 許容値を指定しない場合、許容値は使用されません。これは、最終行に非常に有効で、最高ランクの内挿結果で同じ順位が発生しないようにすることができます。 各行 (階層レベル) で、次の基準を使用できます。
たとえば、1 行目に許容値を 5% に設定した [RMS 誤差 (精度)] 値、2 行目に許容値を設定しない [平均誤差 (バイアス)] 値を指定することができます。 この場合、最初に RMS 誤差の小さい順 (推定精度の高い順) に内挿結果がランク付けされ、RMS 誤差値が最も正確な結果の 5% 以内に含まれる内挿結果はすべて、推定精度で同じ順位と見なされます。 順位が同じ結果のうち、平均誤差が最もゼロに近い (バイアスが小さい) 結果に最高ランクが付けられます。 | Value Table |
加重基準 (オプション) | 内挿結果のランク付けに使用する、加重を含む複数の基準。 各行で、基準と加重を指定します。 内挿結果は各基準で独立してランク付けされ、ランクの加重平均を使用して内挿結果の最終的なランクが決定されます。
| Value Table |
除外基準 (オプション) | 内挿結果を比較対象から除外するために使用される基準および関連付けられた値。 除外された結果はランク付けされず、出力交差検証テーブルの Included フィールドの値は No になります。
| Value Table |
Geostatistical Analyst のライセンスで利用可能。
サマリー
交差検証の統計情報に基づくカスタマイズ可能な基準を使用して、Geostatistical レイヤーを比較およびランク付けします。
内挿結果は、単一の基準 (例: 推定精度の高い順、バイアスの小さい順)、複数の基準の加重平均ランク、または複数基準の階層的ソート (各基準で同じ順位になった場合は、階層内の次の基準によって順位付けされる方法) に基づいてランク付けすることができます。 除外基準を使用して、最低限の品質基準を満たさない内挿結果を比較対象から除外することもできます。 各内挿結果の交差検証の統計情報とランクを集約したテーブルが出力されます。 必要に応じて、最高ランクの内挿結果の地球統計レイヤーを出力し、今後のワークフローで使用することができます。
図
使用法
交差検証は、leave-one-out (1 つ抜き) 法で内挿結果を評価します。 この方法では、データセット内の各ポイントを順次削除し、残りのすべてのポイントを使用して、除外されたポイントの値を推定します。 その後、交差検証の推定値と隠れたポイントの真値を比較し、その差が交差検証誤差になります (誤差は正または負の値になります)。 交差検証を行う理由は、内挿結果が隠れたポイントの値を推定するのに有効であれば、内挿の目的である新しい位置の未知の値を推定するのにも有効であるためです。 このツールで使用されるすべての基準は、交差検証結果の統計サマリーに基づいています。
交差検証の統計サマリーを使用して内挿結果を評価する方法は、複数の内挿結果を比較する際に便利かつ効果的ですが、データの専門知識および結果の対話的な調査に取って代わるものではありません。 チャートおよび個々の交差検証誤差を確認することで、統計サマリーではわからない結果のパターンが明らかになることがよくあります。 たとえば、交差検証誤差には、あるエリアは過小評価され、他のエリアは過大評価された空間パターンが存在することが多く、このようなパターンは統計サマリーでは表現されていない場合があります。
[比較方法] パラメーターには、内挿結果の交差検証の統計情報を比較する 3 つのオプションがあります。 各オプションにはメリットとデメリットがあります。
- [単一の基準] - 単一の基準を使用して、結果の比較とランク付けを行います。 推定精度の高い順、バイアスの小さい順、ワーストケース誤差の小さい順、標準誤差精度の高い順、または精度の高い順にランク付けできます。 基準は [基準] パラメーターで指定します。
- メリット - このオプションは、安定性と一貫性があることがわかっている内挿結果を比較する際のシンプルで一般的な方法です。 すべての結果が非常に類似している場合に、その中から選択する際にも便利です。
- デメリット - 基準によって、内挿結果が適切な場合とそうでない場合があります (例: 推定精度は高いがバイアスも大きい)。 この場合、単一の基準でランク付けすると、不安定な結果や誤解を招く結果に高いランクが割り当てられます。 単一の基準でランク付けする場合は、[除外基準] パラメーターのさまざまなオプションを使用して、結果を比較する前に、不安定な結果や誤解を招く結果を確実に削除することをお勧めします。
- [許容値を使用した階層的並べ替え] - 階層的並べ替えを使用して、結果の比較とランク付けを行います。 [基準階層] パラメーターで、複数の基準を優先度順 (優先度の高い基準から順に) 指定します。 内挿結果は最初の基準でランク付けされ、順位が同じ場合は 2 つ目の基準で順位付けされます。 2 つ目の基準で順位が同じ場合は 3 つ目の基準で順位付けされ、以降も同様です。 この処理は、カスタム並べ替えや、スプレッドシート ソフトウェアの階層的並べ替え (A で並べ替え、次に B で並べ替え、次に C で並べ替え、以降も同様) をモデルにしています。 ただし、交差検証の統計情報は連続値であり、一般的に順位が完全に同じになることはないため、許容値 (パーセントまたは絶対値) を指定して、各基準で同じ順位として扱うことができます。
- メリット - このオプションは複数の基準を使用し、交差検証の統計情報の相対的差異を考慮します。 たとえば、ある内挿結果が最も優先度の高い基準で他の内挿結果よりはるかに優れている場合、その内挿結果は、階層内の後続の基準に関係なく最高ランクとして扱われます。
- デメリット - 階層的並べ替えの有効性は、指定する許容値によって異なります。 許容値が小さすぎる場合、結果の順位が同じにならないため、一部の基準は使用されなくなります。 許容値が大きすぎる場合、多くの結果が互いの許容値の範囲内に含まれるため、ランク付けの際に同じ順位の結果が多く発生します。
- [加重平均ランク] - 複数の基準の加重平均ランクを使用して、結果の比較とランク付けを行います。 複数の基準および関連付けられた加重は [加重基準] パラメーターで指定します。 内挿結果は各基準で独立してランク付けされ、ランクの加重平均を使用して最終的なランクが決定されます。 加重が大きい基準は、最終的なランクに与える影響が大きいため、加重を使用して特定の基準が他の基準よりも優先されることを示すことができます。
- メリット - このオプションは複数の基準を使用し、特定の基準を他の基準よりも優先することができ、常にすべての基準を使用して比較します。
- デメリット - 交差検証の統計情報の値における相対的差異は無視されます。 たとえば、すべての RMS 誤差値が互いに非常に小さな許容値の範囲内に含まれている (すべての結果がほぼ同等の推定精度であることを示している) 場合でも、(N 個の内挿結果に対して) 推定精度によって 1 ~ N のランク付けが行われます。 一方、平均誤差の値が結果同士で大きく異なる (結果のバイアスに大きな差異があることを示している) 場合でも、バイアスの基準によって 1 ~ N のランク付けが行われます。 加重平均は基準のランクのみを使用するため、ランク付けにおいて交差検証の統計情報の相対的差異は無視されます。
- [単一の基準] - 単一の基準を使用して、結果の比較とランク付けを行います。 推定精度の高い順、バイアスの小さい順、ワーストケース誤差の小さい順、標準誤差精度の高い順、または精度の高い順にランク付けできます。 基準は [基準] パラメーターで指定します。
交差検証の統計情報、内挿結果の説明、ランクを集約したテーブルが出力され、プレゼンテーションやレポートに含めることができます。 交差検証の統計情報は、1 つ以上の内挿結果に適用される場合のみテーブルに含まれます。 たとえば、逆距離加重法と放射基底関数のみを使用する場合、これらの方法では標準誤差が計算されないため、出力テーブルに平均標準誤差値のフィールドが含まれません。 ある統計情報が一部の内挿結果には適用され、その他の内挿結果には適用されない場合、その統計情報が適用されない結果に対する値は NULL となります。 また、[経験ベイズ クリギング (Empirical Bayesian Kriging)] ツール、[EBK 回帰予測 (EBK Regression Prediction)] ツール、[経験ベイズ クリギング 3D (Empirical Bayesian Kriging 3D)] ツールを使用していずれかの入力地球統計レイヤーが作成された場合、複数の交差検証の統計情報がテーブルに含まれます。これらは情報提供のために含まれ、他のすべての内挿方法では NULL 値になります。 加重平均ランクを使用する場合、指定したすべての基準のランクとその加重平均もテーブルに含まれます。
必要に応じて、[最高ランクの出力地球統計レイヤー] パラメーターを使用すると、最高ランクの入力地球統計レイヤーのコピーを作成することができます。 これは、ModelBuilder および Python のスクリプトで、最適な内挿結果を後続のツールに自動的に反映するのに役立ちます。
ツールの実行時は、ジオプロセシング メッセージと進行状況バー メッセージに、計算中の内挿結果が表示されます。 すべての結果が計算および比較された後、ランクがジオプロセシング メッセージとして出力されます。 ランクは出力交差検証テーブルでも確認できます。
[探索的内挿 (Exploratory Interpolation)] ツールでは、このツールと同じ交差検証の比較が実行されますが、入力ポイントとフィールドからさまざまな内挿結果を自動的に生成してから比較およびランク付けします。
使用できる基準、基準を計測する交差検証の統計情報、および各内挿結果にスコアを割り当てる際に使用される式を次の表に示します (スコアが小さいほど優れています)。 各内挿結果のスコアを並べ替えることで、基準のランクが決定されます。
注意:
3 つの基準に対して、スコアは交差検証の統計情報と等しくなります。
条件 交差検証の統計 スコアの式 推定精度の高い順
RMS 誤差
結果は、RMS 誤差の小さい順にランク付けされます。
Score = RootMeanSquareError
バイアスの小さい順
平均誤差
結果は、平均誤差がゼロに近い順にランク付けされます。
Score = AbsoluteValue( MeanError )
ワーストケース誤差の小さい順
最大絶対誤差
結果は、最大絶対誤差の小さい順にランク付けされます。
Score = MaximumAbsoluteError
標準誤差精度の高い順
標準 RMS 誤差
結果は、標準 RMS 誤差が 1 に近い順にランク付けされます。
Score = AbsoluteValue( RMSStdError - 1 )
精度の高い順
平均標準誤差
結果は、平均標準誤差の小さい順にランク付けされます。
Score = AverageStandardError
基準で同じ順位が存在する場合、同じ順位のすべての結果に、共有されている最高のランクに等しいランクが付けられます (ランクが高いほど、ランクの数値は小さくなります)。 たとえば、RMS 誤差値 (12、14、14、15、16、16、18) には、推定精度基準によってランク (1、2、2、4、5、5、7) が付けられます。 同じ値が存在するため、ランク 3 と 6 はスキップされています。
比較では、さまざまな段階で同じ順位が発生することがあります。 同じ順位は階層的並べ替えを使用している場合に多く発生します。これは、許容値の範囲内にあるすべての結果が互いに同じ順位と見なされ、許容値の範囲外にあるすべての結果も互いに同じ順位と見なされるためです。 また、加重平均ランクでも同じ順位がよく発生します。これは、内挿結果がさまざまな基準で異なるランクが付けられている場合に、ランクの加重平均が等しくなることがあるためです。 まれに、単一の基準の比較でも同じ順位が発生することがあります (例: すべてのポイントが定数値の場合)。 単一の基準で同じ順位が存在する場合、その基準が加重平均に使用されていると、加重平均ランクにも影響します。
階層的並べ替えでは、交差検証の統計情報ではなく、基準のスコアに対する許容値を指定します。 通常、スコアが統計情報と等しい基準 (推定精度の高い順、ワーストケース誤差の小さい順、精度の高い順) では、適切な許容値が明確です。 たとえば、内挿結果の最小 RMS 誤差値が 200 の場合、10% の許容値には、RMS 誤差値が 220 (200 + (10/100) x 200 = 220) 以下のすべての結果が含まれます。 同様に、絶対許容値が 15 の場合、RMS 誤差値が 215 (200 + 15 = 215) 以下のすべての結果が含まれます。
ただし、スコアが統計情報の値と等しくない基準 (バイアスの小さい順、標準誤差精度の高い順) では、適切な許容値が明確ではありません。 平均誤差の統計情報では、バイアスは平均誤差の絶対値によって評価されます。 このため、たとえば、平均誤差値 -4 と 6 は絶対値で 50% 異なるため、相対的差異は 50% (ABS(-4) + (50/100) x ABS(-4) = ABS(6)) です。 同様に、絶対差は 2 (ABS(-4) + 2 = ABS(6)) です。
標準 RMS 誤差の統計情報では、標準誤差精度は、標準 RMS 誤差の値と目標値 (1) との絶対差で評価されます。 このため、たとえば、標準 RMS 誤差値 0.2 と 2.4 の相対的差異は 75% です。 これは、値 0.2 と 2.4 を比較すると、後者は前者に比べて目的値 (1) に対して値が 1.75 倍 (75% 多く) 離れているためです (絶対差はそれぞれ 0.8 と 1.4) (ABS(0.2 - 1) + (75/100) x ABS(0.2 - 1) = ABS(2.4 - 1))。 同様に、絶対差は 0.6 (ABS(0.2 - 1) + 0.6 = ABS(2.4 - 1)) です。
さまざまな基準で、すべての入力地球統計レイヤーが標準誤差出力タイプをサポートしている必要があります。 標準誤差を許容しない地球統計レイヤーが存在する場合、複数のパラメーターのさまざまなオプションが使用できなくなります。 使用できなくなるのは、標準誤差正確度、精度、標準化 RMS 誤差の統計情報、または平均標準誤差の統計情報に関連したオプションです。 [地球統計レイヤー] コンテキスト タブの [描画] グループにある [表示タイプ] メニューには、地球統計レイヤーでサポートされている出力タイプが表示されます。
[除外基準] パラメーターの [誤差低減の最小割合] オプションは、内挿されるポイントの値や範囲がわからない場合 (自動化された環境など) に特に有効です。 このオプションを使用すると、マップ上のすべての位置でグローバル平均値を推定するベースライン非空間モデルよりも十分に正確でない内挿結果が除外されます。 この相対精度は、内挿されるポイントの値の標準偏差と RMS 誤差値を比較して計測され、RMS 誤差が標準偏差よりも指定されたパーセント以上小さくないと、比較対象に含まれません。 たとえば、値に 10 を指定すると、RMS 誤差が標準偏差よりも 10% 以上小さくないと、比較およびランク付けの対象に含まれません。
分野によって、内挿結果で許容される誤差低減の基準は異なります。 物理科学で高密度にサンプリングされた計測値を使用する場合、誤差を 90% 以上低減することがよくあります。 一方、社会科学では、多くの場合、10 ~ 20% の誤差低減が研究者にとって重要な意味を持ちます。
有意義で公平な比較を実行するため、各入力地球統計レイヤーを作成する際は、同じポイントおよびフィールドを使用することをお勧めします。 いずれかのレイヤーが同じデータ ソースを共有していない場合、ツールは警告メッセージを返します。
パラメーター
arcpy.ga.CompareGeostatisticalLayers(in_geostat_layers, out_cv_table, {out_geostat_layer}, {comparison_method}, {criterion}, {criteria_hierarchy}, {weighted_criteria}, {exclusion_criteria})
名前 | 説明 | データ タイプ |
in_geostat_layers [in_geostat_layer1,in_geostat_layer2,...] | 内挿結果を表す地球統計レイヤー。 各レイヤーを比較およびランク付けします。 | Geostatistical Layer |
out_cv_table | 各内挿結果の交差検証の統計情報とランクを含む出力テーブル。 RANK フィールドに、内挿結果の最終的なランクが格納されます。 | Table |
out_geostat_layer (オプション) | 最高ランクの内挿結果の出力地球統計レイヤー。 この内挿結果では、出力交差検証テーブルの RANK フィールドの値が 1 になります。 最高ランクの内挿結果に同じ順位が存在する場合や、除外基準によりすべての結果が除外されている場合は、値を指定してもレイヤーは作成されません。 この場合、ツールから警告メッセージが返されます。 | Geostatistical Layer |
comparison_method (オプション) | 内挿結果の比較とランク付けに使用する方法を指定します。
| String |
criterion (オプション) | 内挿結果のランク付けに使用する基準を指定します。
| String |
criteria_hierarchy [[criteria1, tol_type1, tol_val1], [criteria2, tol_type2, tol_val2],...] (オプション) | 許容値による階層的並べ替えに使用される基準の階層。 複数の基準を優先度順 (重要な基準から順に) 指定します。 内挿結果は最初の基準でランク付けされ、順位が同じ場合は 2 つ目の基準で順位付けされます。 2 つ目の基準で順位が同じ場合は 3 つ目の基準で順位付けされ、以降も同様です。 交差検証の統計情報は連続値であり、一般的に順位が完全に同じになることはないため、許容値を使用して基準内で同じ順位として扱います。 各行で、1 列目に基準、2 列目に許容値タイプ (パーセントまたは絶対値) 、3 列目に許容値を指定します。 許容値を指定しない場合、許容値は使用されません。これは、最終行に非常に有効で、最高ランクの内挿結果で同じ順位が発生しないようにすることができます。 各行 (階層レベル) で、次の基準を使用できます。
たとえば、1 行目に許容値を 5% に設定した ACCURACY 値、2 行目に許容値を設定しない BIAS 値を指定することができます。 この場合、最初に RMS 誤差の小さい順 (推定精度の高い順) に内挿結果がランク付けされ、RMS 誤差値が最も正確な結果の 5% 以内に含まれる内挿結果はすべて、推定精度で同じ順位と見なされます。 順位が同じ結果のうち、平均誤差が最もゼロに近い (バイアスが小さい) 結果に最高ランクが付けられます。 | Value Table |
weighted_criteria [[criteria1, weight1], [criteria2, weight2],...] (オプション) | 内挿結果のランク付けに使用する、加重を含む複数の基準。 各行で、基準と加重を指定します。 内挿結果は各基準で独立してランク付けされ、ランクの加重平均を使用して内挿結果の最終的なランクが決定されます。
| Value Table |
exclusion_criteria [[criteria1, value1], [criteria2, value2],...] (オプション) | 内挿結果を比較対象から除外するために使用される基準および関連付けられた値。 除外された結果はランク付けされず、出力交差検証テーブルの Included フィールドの値は No になります。
| Value Table |
コードのサンプル
次の Python スクリプトは、CompareGeostatisticalLayers 関数の使用方法を示しています。
# Compare Simple kriging, EBK, and Kernel Interpolation results
# Rank results by highest prediction accuracy
# Exclude results with error reductions under 25%
myGALayers = ["Simple Kriging", "EBK", "Kernel Interpolation"]
outTable = "outCVtable"
outGALayer = "Result With Highest Rank"
compMethod = "SINGLE"
criterion = "ACCURACY"
exclCrit = [["MIN_PERC_ERROR", 25]]
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
compMethod, criterion, None, None, exclCrit)
次の Python スクリプトは、CompareGeostatisticalLayers 関数の使用方法を示しています。
# Compare various interpolation results
# Rank results by highest weighted average rank
# Rank same results by hierarchical sorting
# Import system modules
import arcpy
# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")
# Allow overwriting output
arcpy.env.overwriteOutput = True
### Set shared parameters
# Set input and output locations
directory = "C:/data/"
outgdb = directory + "out.gdb/"
arcpy.env.workspace = directory
# Three interpolation results to compare
myGALayers = ["EBK", "Universal Kriging", "Kernel Interpolation"]
# Exclude results with error reductions under 25%
exclCrit = [["MIN_PERC_ERROR", 25]]
# Output geostatistical layer with highest rank
outGALayer = "Result With Highest Rank"
### Set weighted average rank parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outWeightedAverageTable"
# Use weighted average rank
compMethod = "AVERAGE_RANK"
# Use all criteria with highest weight to prediction accuracy
weightedCrit = [
["ACCURACY", 3],
["BIAS", 1],
["WORST_CASE", 1],
["STANDARD_ERROR", 1],
["PRECISION", 1]
]
# Compare using weighted average rank
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
compMethod, None, None, weightedCrit, exclCrit)
### Set hierarchical sorting parameters
# Output table of ranks and cross validation results
outTable = outgdb + "outHierSortTable"
# Use hierarchical sorting with tolerances
compMethod = "SORTING"
# Compare using highest prediction accuracy with a 10% tolerance
# Break ties by lowest bias
hierCrit = [
["ACCURACY", "PERCENT", 10],
["BIAS", "PERCENT", None]
]
# Compare using hierarchical sorting with tolerances
arcpy.ga.CompareGeostatisticalLayers(myGALayers, outTable, outGALayer,
compMethod, None, hierCrit, None, exclCrit)
ライセンス情報
- Basic: 次のものが必要 Geostatistical Analyst
- Standard: 次のものが必要 Geostatistical Analyst
- Advanced: 次のものが必要 Geostatistical Analyst