2 変数空間的関連性 (Bivariate Spatial Association (Lee'sL)) (空間統計)

サマリー

Lee's L 統計を使用して 2 つの連続型変数の間の空間的関連性を計算します。

Lee's L 統計は、変数間の相関度と共パターン (空間クラスタリングの類似度) の両方を特徴付けます。 この値の範囲は -1 ~ 1 であり、概念上は相関係数とよく似ていますが、2 つの変数の空間的自己相関を考慮するために調整されています。 Lee's L の値が 1 に近い場合、これらの変数には強い正の相関関係があり、各変数は強い空間的自己相関を持ちます (変数の高値と低値それぞれが密集する傾向にあります)。 Lee's L の値が -1 に近い場合、これらの変数には強い負の相関関係があり、各変数は強い正の空間的自己相関を持ちます。 この値が 0 に近い場合、これらの変数には相関関係がないか、空間的自己相関がないか、その両方となります。

Lee's L 統計を各入力フィーチャに分割できます。これは Lee's L ローカル統計と呼ばれ、フィーチャとその近接フィーチャのローカルな空間的関連性を示します。 これを使用して、Lee's L グローバル統計よりも空間的関連性が高いエリアや低いエリアを求めることができます。 各フィーチャの近接フィーチャの値に基づいて、ローカル統計を 7 つのカテゴリのいずれかに分類することもできます。 順列を使用して、グローバル統計とローカル統計の両方の統計的有意性が検定されます。

2 変数空間的関連性 (Lee's L) の仕組みの詳細

2 変数空間的関連性 (Lee's L) ツールの図
上の行の 2 つの変数間には正の空間的関連性があり、下の行の 2 つの変数間には負の空間的関連性があります。

使用法

  • この 2 つの解析変数は連続していなければならず (バイナリやカテゴリではない)、これらの変数は線形関係を持ちます。 関係が線形でない場合、[フィールドの変換 (Transform Field)] ツールを使用して解析変数に変換を適用して関係を線形化してから、変換後の値を使用してツールを再度実行します。

  • このツールから返されるさまざまな出力を使用して、2 つの解析変数間の空間的関連性を調べることができます。 ジオプロセシング メッセージには Lee's L 統計と p 値が表示され、出力フィーチャクラスには Lee's L ローカル統計、p 値、統計的有意性の結果を示すフィールドが含まれています。 アクティブなマップで実行した場合、ローカルな空間的関連性のカテゴリ Not SignificantHigh-HighLow-LowHigh-LowLow-High に基づいて出力フィーチャ レイヤーが描画されます。 たとえば、Lee's L ローカル統計に少なくとも 90% の統計的有意性があり、1 つ目の解析変数が平均値より高く、2 つ目の変数が平均値より低い場合、カテゴリは High-Low になります。

    ツール出力の詳細

  • グローバル空間的関連性とローカル空間的関連性の統計的有意性を検定するための p 値は順列を使用して計算されます。

  • 少なくとも 50 個の入力フィーチャを使用し、各フィーチャに少なくとも 8 つの近接フィーチャを含めます。

  • 各フィーチャの近傍には常にそのフィーチャが含まれます。 空間加重ファイルを使用して近接フィーチャを定義した場合、空間加重ファイルでフィーチャ自体への加重が定義されていない場合でも、フィーチャ自体への加重として加重 1 が定義されます。 各近傍の加重は合計が 1 になるように行で標準化されます。

  • 乱数ジェネレーター環境を使用して順列と p 値を再現できます。 シード値が指定されていない場合、ランダム性が原因でグローバル p 値とローカル p 値が変化することがあります。 ただし、並列処理ファクター環境が 1 より大きい値に設定されている場合 (デフォルト)、乱数ジェネレーターのシード値が固定であっても順列は一貫しません。

  • 2 つの解析変数の順序を逆にしても Lee's L グローバル/ローカル統計は変化しませんが、p 値は順列のランダム性が原因で変化することがあります。 カテゴリ High-LowLow-High も反転します。

パラメーター

ラベル説明データ タイプ
入力フィーチャ

2 つの解析変数のフィールドが含まれている入力フィーチャ。

Feature Layer
解析フィールド 1

1 つ目の解析変数のフィールド。 このフィールドの値は数値でなければなりません。

Field
解析フィールド 2

2 つ目の解析変数のフィールド。 このフィールドの値は数値でなければなりません。

Field
出力フィーチャ

Lee's L ローカル統計、空間的関連性のカテゴリ、p 値、各フィーチャの近接フィーチャの加重平均が含まれている出力フィーチャ。

Feature Class
近傍タイプ
(オプション)

各フィーチャの近接フィーチャを特定する方法を指定します。 そのフィーチャは近傍に必ず含まれ、近傍のすべての加重が合計 1 になるように正規化されます。

  • 固定距離バンド指定された各フィーチャの臨界距離内にあるフィーチャが近接フィーチャとして含められます。 これは、ポイント フィーチャに対するデフォルトの設定です。
  • K 近傍最も近い K 個のフィーチャが近接フィーチャとして含められます。
  • 隣接エッジのみエッジを共有するポリゴン フィーチャが近接フィーチャとして含められます。
  • 隣接エッジ コーナーエッジまたはコーナーを共有するポリゴン フィーチャが近接フィーチャとして含められます。 ポリゴン フィーチャに対するデフォルトです。
  • ドロネー三角形分割ドロネー三角形分割 (ティーセン ポリゴン) でエッジまたはコーナーを共有するポイントが近接フィーチャとして含められます。
  • 空間加重をファイルから取得近接フィーチャと加重は空間加重ファイルによって定義されます。
String
距離バンド
(オプション)

フォーカル フィーチャの近接フィーチャの特定に使用される距離バンド。 値が指定されていない場合、各フィーチャの近傍に他の近接フィーチャが少なくとも 1 つ存在する最短の距離になります。 ポリゴンの場合、重心間の距離を使用して近接フィーチャが特定されます。

Linear Unit
近傍数
(オプション)

近接フィーチャとして含まれる、各フィーチャの近接フィーチャの数。 この値にフィーチャ自体は含まれません。 たとえば、6 を指定した場合、フィーチャとそのフィーチャに最も近い 6 つの近接フィーチャ (合計 7 つのフィーチャ) が使用されます。 デフォルトは 8 です。 2 以上の値を指定する必要があります。

Long
加重マトリックス ファイル
(オプション)

近接フィーチャおよびフィーチャ間の加重を定義する空間加重マトリックス ファイルのパスとファイル名。

File
ローカル加重方式
(オプション)

空間的関連性を計算する際に近接フィーチャに適用される加重方式を指定します。

  • 加重なし近接フィーチャは加重されません。 これがデフォルトです。
  • バイスクエア近接フィーチャは Bisquare (四次) カーネルを使用して加重されます。
String
カーネル バンド幅
(オプション)

Bisquare カーネルのバンド幅。 バンド幅は、加重が距離に伴って減少する速度を定義します。 バンド幅が大きいほど、フィーチャから離れた距離にある近接フィーチャに比較的大きな加重が加わります。 K 近傍法の近傍の場合、デフォルト値 (空) では、フォーカル フィーチャの (k+1) 番目の近接フィーチャまでの距離と等しい適応バンド幅が使用されます。 固定距離バンド近傍の場合、デフォルト (空) では距離バンドと同じ値が使用されます。

Linear Unit
順列の数
(オプション)

グローバル p 値とローカル p 値を計算する場合に基準分布の作成に使用される順列の数を指定します。 すべての p 値は、両側仮説検定を使用して計算されます。

  • 99分析で 99 の順列が使用されます。 順列の数が 99 の場合、とりうる最小の p 値は 0.02 であり、その他すべての p 値はこの値の倍数になります。
  • 199解析は 199 の順列を使用します。 順列の数が 199 の場合、とりうる最小の p 値は 0.01 であり、その他すべての p 値はこの値の倍数になります。
  • 499分析で 499 の順列が使用されます。 順列の数が 499 の場合、とりうる最小の p 値は 0.004 であり、その他すべての p 値はこの値の倍数になります。
  • 999分析で 999 の順列が使用されます。 順列の数が 999 の場合、とりうる最小の p 値は 0.002 であり、その他すべての p 値はこの値の倍数になります。 90% の信頼度の検定ではこのオプションが推奨されます。 これがデフォルトです。
  • 4999解析では 4,999 の順列が使用されます。 順列の数が 4,999 の場合、とりうる最小の p 値は 0.0004 であり、その他すべての p 値はこの値の倍数になります。 95% の信頼度の検定ではこのオプションが推奨されます。
  • 9999分析で 9,999 の順列が使用されます。 順列の数が 9,999 の場合、とりうる最小の p 値は 0.0002 であり、その他すべての p 値はこの値の倍数になります。 99% の信頼度の検定ではこのオプションが推奨されます。
Long

派生した出力

ラベル説明データ タイプ
Lee's L

解析変数の Lee's L 統計。

Double
p 値

Lee's L 統計の p 値。

Double
ピアソン相関

解析変数間のピアソン相関。

Double

arcpy.stats.BivariateSpatialAssociation(in_features, analysis_field1, analysis_field2, out_features, {neighborhood_type}, {distance_band}, {num_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, {num_permutations})
名前説明データ タイプ
in_features

2 つの解析変数のフィールドが含まれている入力フィーチャ。

Feature Layer
analysis_field1

1 つ目の解析変数のフィールド。 このフィールドの値は数値でなければなりません。

Field
analysis_field2

2 つ目の解析変数のフィールド。 このフィールドの値は数値でなければなりません。

Field
out_features

Lee's L ローカル統計、空間的関連性のカテゴリ、p 値、各フィーチャの近接フィーチャの加重平均が含まれている出力フィーチャ。

Feature Class
neighborhood_type
(オプション)

各フィーチャの近接フィーチャを特定する方法を指定します。 そのフィーチャは近傍に必ず含まれ、近傍のすべての加重が合計 1 になるように正規化されます。

  • DISTANCE_BAND指定された各フィーチャの臨界距離内にあるフィーチャが近接フィーチャとして含められます。 これは、ポイント フィーチャに対するデフォルトの設定です。
  • K_NEAREST_NEIGHBORS最も近い K 個のフィーチャが近接フィーチャとして含められます。
  • CONTIGUITY_EDGES_ONLYエッジを共有するポリゴン フィーチャが近接フィーチャとして含められます。
  • CONTIGUITY_EDGES_CORNERSエッジまたはコーナーを共有するポリゴン フィーチャが近接フィーチャとして含められます。 ポリゴン フィーチャに対するデフォルトです。
  • DELAUNAY_TRIANGULATIONドロネー三角形分割 (ティーセン ポリゴン) でエッジまたはコーナーを共有するポイントが近接フィーチャとして含められます。
  • GET_SPATIAL_WEIGHTS_FROM_FILE近接フィーチャと加重は空間加重ファイルによって定義されます。
String
distance_band
(オプション)

フォーカル フィーチャの近接フィーチャの特定に使用される距離バンド。 値が指定されていない場合、各フィーチャの近傍に他の近接フィーチャが少なくとも 1 つ存在する最短の距離になります。 ポリゴンの場合、重心間の距離を使用して近接フィーチャが特定されます。

Linear Unit
num_neighbors
(オプション)

近接フィーチャとして含まれる、各フィーチャの近接フィーチャの数。 この値にフィーチャ自体は含まれません。 たとえば、6 を指定した場合、フィーチャとそのフィーチャに最も近い 6 つの近接フィーチャ (合計 7 つのフィーチャ) が使用されます。 デフォルトは 8 です。 2 以上の値を指定する必要があります。

Long
weights_matrix_file
(オプション)

近接フィーチャおよびフィーチャ間の加重を定義する空間加重マトリックス ファイルのパスとファイル名。

File
local_weighting_scheme
(オプション)

空間的関連性を計算する際に近接フィーチャに適用される加重方式を指定します。

  • UNWEIGHTED近接フィーチャは加重されません。 これがデフォルトです。
  • BISQUARE近接フィーチャは Bisquare (四次) カーネルを使用して加重されます。
String
kernel_bandwidth
(オプション)

Bisquare カーネルのバンド幅。 バンド幅は、加重が距離に伴って減少する速度を定義します。 バンド幅が大きいほど、フィーチャから離れた距離にある近接フィーチャに比較的大きな加重が加わります。 K 近傍法の近傍の場合、デフォルト値 (空) では、フォーカル フィーチャの (k+1) 番目の近接フィーチャまでの距離と等しい適応バンド幅が使用されます。 固定距離バンド近傍の場合、デフォルト (空) では距離バンドと同じ値が使用されます。

Linear Unit
num_permutations
(オプション)

グローバル p 値とローカル p 値を計算する場合に基準分布の作成に使用される順列の数を指定します。 すべての p 値は、両側仮説検定を使用して計算されます。

  • 99分析で 99 の順列が使用されます。 順列の数が 99 の場合、とりうる最小の p 値は 0.02 であり、その他すべての p 値はこの値の倍数になります。
  • 199解析は 199 の順列を使用します。 順列の数が 199 の場合、とりうる最小の p 値は 0.01 であり、その他すべての p 値はこの値の倍数になります。
  • 499分析で 499 の順列が使用されます。 順列の数が 499 の場合、とりうる最小の p 値は 0.004 であり、その他すべての p 値はこの値の倍数になります。
  • 999分析で 999 の順列が使用されます。 順列の数が 999 の場合、とりうる最小の p 値は 0.002 であり、その他すべての p 値はこの値の倍数になります。 90% の信頼度の検定ではこのオプションが推奨されます。 これがデフォルトです。
  • 4999解析では 4,999 の順列が使用されます。 順列の数が 4,999 の場合、とりうる最小の p 値は 0.0004 であり、その他すべての p 値はこの値の倍数になります。 95% の信頼度の検定ではこのオプションが推奨されます。
  • 9999分析で 9,999 の順列が使用されます。 順列の数が 9,999 の場合、とりうる最小の p 値は 0.0002 であり、その他すべての p 値はこの値の倍数になります。 99% の信頼度の検定ではこのオプションが推奨されます。
Long

派生した出力

名前説明データ タイプ
lee_l

解析変数の Lee's L 統計。

Double
p_value

Lee's L 統計の p 値。

Double
corr

解析変数間のピアソン相関。

Double

コードのサンプル

BivariateSpatialAssociation の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、BivariateSpatialAssociation 関数の使用方法を示しています。

# Calculate the Lee's L statistic using eight nearest neighbors
# and adaptive bandwidth.
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    distance_band=None,
    num_neighbors=8,
    weights_matrix_file=None,
    local_weighting_scheme="BISQUARE",
    kernel_bandwidth=None,
    num_permutations=9999
)
BivariateSpatialAssociation の例 2 (スタンドアロン スクリプト)

次のスタンドアロン スクリプトで、BivariateSpatialAssociation 関数を使用する方法を示します。

# Calculate the Lee's L statistic for two analysis fields.  

import arcpy 

# Set the current workspace
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool

arcpy.stats.BivariateSpatialAssociation(
    in_features=r"myFeatureClass",
    analysis_field1="myAnalysisField1",
    analysis_field2="myAnalysisField2",
    out_features=r"myOutputFeatureClass",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    num_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None,
    num_permutations=9999
)

# Print the messages. The messages include the Lee's L statistic, p-value, 
# Pearson correlations, and spatial smoothing scalars.

print(arcpy.GetMessages())

ライセンス情報

  • Basic: Yes
  • Standard: Yes
  • Advanced: Yes

関連トピック