空間コンポーネントの説明変数を作成 (Create Spatial Component Explanatory Variables) (空間統計)

サマリー

1 つ以上の数値フィールドの空間パターンを最もよく表し、予測モデルや回帰モデルで有用な説明変数としての役割を担う、空間コンポーネント フィールドを作成します。

入力フィールドは、予測モデルに使用される説明変数と従属変数です。 (元の説明変数に加えて) 結果の空間コンポーネント フィールド (Moran の固有ベクトルと呼ぶ) を説明変数として使用すると、他の変数の空間パターンが考慮されることにより、モデルの予測能力が向上することがよくあります。

Moran の固有ベクトルの詳細

空間コンポーネントの説明変数を作成ツールの図

使用法

  • このツールでは、入力フィールドの値を最も正確に予測する空間コンポーネントが作成されます。 各コンポーネントは空間パターンを表し、入力フィールドのパターンと最もよく似たパターンを持つコンポーネントが選択されます。 たとえば、あるフィールドには東西の広範なトレンドが存在するが、その中にはいくつかの低値と高値のクラスターが含まれている場合、東西のトレンドを表すコンポーネントとクラスターを表すコンポーネントの 2 つのコンポーネントを結合することによってパターンを表すことができます。 説明変数と従属変数の空間パターンとよく似た説明変数を含めることによって、[一般化線形回帰分析 (Generalized Linear Regression)][フォレストベースのブーストされた分類と回帰分析 (Forest-based and Boosted Classification and Regression)] などの予測ツールや回帰ツールで空間効果が考慮されます。 空間効果を考慮することで、通常は、これらの非空間予測モデルの予測精度が上がり、空間バイアス (残差の空間パターンなど) が低下します。 特定のエリアがモデルによって体系的に過少または過大に予測されないようにするためにこれが重要となります。 また、空間効果によって生じるノイズを除外しながら説明変数と従属変数の間の直接的な関係が予測されるため、説明変数の係数をさらに容易に解釈することができます。

  • このツールは予測モデルで使用可能な説明変数を作成することを目的としていますが、この目的には、予測モデルの残差フィールドまたは標準化残差フィールドから空間的自己相関を除去する [フィールドから空間的自己相関分析をフィルター (Filter Spatial Autocorrelation From Field)] ツールを使用することもできます。 残差自己相関を効果的にフィルターする空間コンポーネントは有用な説明変数であることが多く、通常は、より少ない数のコンポーネントを説明変数として使用してもこのツールで同等のモデル改善が得られます。 両方のツールを試してみて、元の予測モデルで両方のツールの結果 (それぞれの空間コンポーネントなど) を比較することをおすすめします (調整済み決定係数または AIC 値を比較するなど)。

  • 空間コンポーネントは出力フィーチャクラスにフィールドとして返され、このツールをアクティブ マップで実行した場合、1 つ目の空間コンポーネントに基づいて出力フィーチャ レイヤーが描画されます。 入力フィールドも出力フィーチャクラスに含まれるため、予測ツールで元の説明変数と空間コンポーネント説明変数を使用して従属変数を予測することができ、入力フィーチャクラスと出力フィーチャクラスをマージする必要はありません。

  • ジオプロセシング メッセージには、入力フィールドの空間的フィルターに使用された一連の空間コンポーネントをリストした次の 2 つのテーブルが含まれています。

    • 近傍検索履歴 - 検定された 28 個の空間加重マトリックス (SWM) それぞれについて、SWM の詳細 (近接フィーチャの数と加重スキームなど)、すべてのコンポーネントを使用する場合の p 値と調整済み決定係数の値、選択したコンポーネントのみを使用する場合の調整済み決定係数の値、選択されたコンポーネントの数が表示されます。 選択したコンポーネントを使用して調整された最も大きい決定係数の値を含む SWM がコンポーネントの作成に使用され、太字とアスタリスクによって示されます。
    • 空間コンポーネント検索履歴 - 選択した SWM について、各コンポーネントの ID 値 (たとえば、ID 4 は 4 番目の空間コンポーネントを意味します)、コンポーネントの Moran's I 値と p 値、コンポーネント (これまでに選択したすべてのコンポーネントを含む) の調整済み決定係数の値が表示されます。 入力フィールドを最も効果的に予測した (決定係数の値が最も大きい) コンポーネントから順に行が並べ替えられます。

  • このツールは入力フィーチャの SWM を選択し ([入力空間加重マトリックス ファイル] パラメーターで指定されている場合を除く)、次の手順に従ってコンポーネント説明変数を選択します。

    1. 28 個の候補の SWM それぞれについて、すべての空間コンポーネントを説明変数として使用して入力フィールドを予測することによって、SWM の統計的有意性が検定されます。 有意性検定ではすべての入力フィールドからの決定係数を組み合わせたものが使用され、検定された SWM の数を考慮して p 値に対するシダック補正が実行されます。 統計的に有意でない SWM は候補リストから削除されます。
    2. 残りの候補の SWM それぞれについて、空間コンポーネントが順番に説明変数として追加されます。この処理は、次のコンポーネントが統計的に有意でないか (p 値が 0.05 より大きい)、そのコンポーネント (およびこれまでに選択したすべてのコンポーネント) の調整済み決定係数の値が、SWM のすべてのコンポーネントを使用した場合の調整済み決定係数の値を超えるまで続けられます。 入力フィールドの予測に使用した場合に統計的有意性が最も高い (p 値が最も小さい) ものを見つけることによって、個々の新しいコンポーネントが選択されます。
    3. 結果の調整済み決定係数の値が最も大きい SWM ファイルが最終 SWM として選択され、選択された空間コンポーネントの関連セットが出力フィーチャクラスにフィールドとして返されます。

    この手順を FWD (前進) 選択法と呼び、以下の参考文献で詳しく説明されています。

    • Blanchet, F. Guillaume, Pierre Legendre, and Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.

パラメーター

ラベル説明データ タイプ
入力フィーチャ

予測モデルに使用される説明変数と従属変数のフィールドが含まれている入力フィーチャ。

Feature Layer
入力フィールド

予測モデルに使用される説明変数と従属変数の入力フィールド。

Field
出力フィーチャ

予測モデルで追加の説明変数として使用可能な空間コンポーネントのフィールドが格納される出力フィーチャ。

Feature Class
入力フィーチャからすべてのフィールドをアペンド
(オプション)

入力フィーチャのすべてのフィールドを出力フィーチャクラスにコピーするかどうかを指定します。

  • オン - 入力フィーチャのすべてのフィールドを出力フィーチャクラスにコピーします。 これがデフォルトです。
  • オフ - 入力フィールドのみを出力フィーチャクラスにコピーします。
Boolean
入力空間加重マトリックス ファイル
(オプション)

入力 SWM ファイル (.swm)。 値を指定した場合、そのファイルを使用して入力フィーチャの近接フィーチャと加重が定義されます。 値を指定しなかった場合、28 個の異なる近傍が検定され、説明変数として最も効果的なコンポーネントを作成するものが使用されます。

File
出力空間加重マトリックス ファイル
(オプション)

このツールによって選択される近接フィーチャと加重の出力 SWM ファイル (.swm)。 入力 .swm ファイルを指定した場合、このパラメーターは適用されません。

File
一意の ID フィールド
(オプション)

出力 .swm ファイルの一意の ID フィールド。 このフィールドは整数フィールドであり、入力フィーチャごとに一意の値を持つ必要があります。

Field

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field})
名前説明データ タイプ
in_features

予測モデルに使用される説明変数と従属変数のフィールドが含まれている入力フィーチャ。

Feature Layer
input_fields
[input_fields,...]

予測モデルに使用される説明変数と従属変数の入力フィールド。

Field
out_features

予測モデルで追加の説明変数として使用可能な空間コンポーネントのフィールドが格納される出力フィーチャ。

Feature Class
append_all_fields
(オプション)

入力フィーチャのすべてのフィールドを出力フィーチャクラスにコピーするかどうかを指定します。

  • ALL入力フィーチャのすべてのフィールドを出力フィーチャクラスにコピーします。 これがデフォルトです。
  • NO_FIELDS入力フィールドのみを出力フィーチャクラスにコピーします。
Boolean
in_swm
(オプション)

入力 SWM ファイル (.swm)。 値を指定した場合、そのファイルを使用して入力フィーチャの近接フィーチャと加重が定義されます。 値を指定しなかった場合、28 個の異なる近傍が検定され、説明変数として最も効果的なコンポーネントを作成するものが使用されます。

File
out_swm
(オプション)

このツールによって選択される近接フィーチャと加重の出力 SWM ファイル (.swm)。 入力 .swm ファイルを指定した場合、このパラメーターは適用されません。

File
id_field
(オプション)

出力 .swm ファイルの一意の ID フィールド。 このフィールドは整数フィールドであり、入力フィーチャごとに一意の値を持つ必要があります。

Field

コードのサンプル

CreateSpatialComponentExplanatoryVariables の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、CreateSpatialComponentExplanatoryVariables 関数の使用方法を示しています。

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)
CreateSpatialComponentExplanatoryVariables の例 2 (スタンドアロン スクリプト)

次のスタンドアロン スクリプトで、CreateSpatialComponentExplanatoryVariables 関数を使用する方法を示します。

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

ライセンス情報

  • Basic: Yes
  • Standard: Yes
  • Advanced: Yes

関連トピック