空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I)) の詳細

[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールは、同時にフィーチャの位置とフィーチャの値の両方に基づいて空間的自己相関を評価します。 このツールは、フィーチャの集合と関連付けられた属性に対して、明示的なパターンがクラスタリングするか、分散するか、不規則かを評価します。 このツールは、Moran's I インデックスの値および Z スコアと p 値の両方を計算して、このインデックスの有意性を評価します。 p 値は、検定統計量によって制限される、既知の分布曲線の下にある面積の近似値です。

演算

Global Moran's I の算出に使用される計算

Global Moran's I のその他の計算を表示

Global Moran's I 統計の背後にある計算を上に示します。 このツールは、評価対象の属性の平均値と分散を計算します。 その後、各フィーチャの値について、平均値を減算して、平均からの偏差が求められます。 すべての近接フィーチャ (指定した距離バンド内にあるフィーチャなど) の偏差の値が掛け合わされてクロス積が求められます。 Global Moran's I 統計の分子には、これらのクロス積の総和が含まれています。 フィーチャ A と B が近接フィーチャであり、すべてのフィーチャの値の平均値が 10 であるとします。 考えられるクロス積の結果の範囲は次のようになります。

フィーチャの値偏差クロス積

A=50

B=40

40

30

1200

A=8

B=6

-2

-4

8

A=20

B=2

10

-8

-80

近接フィーチャの値がどちらも平均より大きいかどちらも平均より小さい場合、クロス積は正になります。 一方の値が平均より小さくもう一方が平均より大きい場合、クロス積は負になります。 いずれの場合にも、平均からの偏差が大きくなるほど、クロス積の結果は大きくなります。 データセット内の値が空間的に密集する (高値は他の高値の近くに密集し、低値は他の低値の近くに密集する) 傾向にある場合、Moran's インデックスは正になります。 高値が他の高値と反発し、低値に近寄る傾向にある場合、このインデックスは負になります。 正のクロス積の値と負のクロス積の値が釣り合っている場合、このインデックスはほぼゼロになります。 インデックスの値が -1.0 ~ +1.0 の範囲になるように、分子が分散によって正規化されます (例外については、以下の「参考情報」のセクションをご参照ください)。

このツールは、インデックスの値を計算した後、期待されるインデックスの値を計算します。 この後、期待されるインデックスの値と観測されたインデックスの値が比較されます。 このツールは、データセット内のフィーチャの数およびデータ値全体の分散を入力としてとり、この差が統計的に有意かどうかを示す Z スコアと p 値を計算します。 インデックスの値を直接解釈することはできず、帰無仮説との関係でのみ解釈することができます。

解釈

このツールは推測統計であり、分析結果は必ず帰無仮説との関係でのみ解釈されます。 Global Moran's I 統計に関して、帰無仮説では、分析対象の属性は分析範囲内のフィーチャ間にランダムに分布し、観測される値のパターンを促進する空間プロセスは偶然であると仮定します。 分析対象の属性の値をいくつか選び、フィーチャの上に投げ捨てると、それぞれの値は勝手にどこかに落ちます。 この (値を選んで投げ捨てる) プロセスは、ランダム空間プロセスの例です。

このツールから返された p 値が統計的に有意である場合、帰無仮説を棄却することができます。 結果の解釈をまとめたものを次の表に示します。

p 値が統計的に有意ではない。

帰無仮説を棄却できません。 フィーチャの値の空間分布はランダム空間プロセスの結果である可能性が十分にあります。 フィーチャの値の観測された空間パターンは、空間完全ランダム性 (CSR) の非常に多数のバージョンの 1 つにすぎない可能性があります。

p 値が統計的に有意であり、Z スコアが正の値である。

帰無仮説を棄却できます。 データセット内の高値や低値の空間分布は、根底にある空間プロセスがランダムである場合に期待されるよりも空間的に密集しています。

p 値が統計的に有意であり、Z スコアが負の値である。

帰無仮説を棄却できます。 データセット内の高値と低値の空間分布は、根底にある空間プロセスがランダムである場合に期待されるよりも空間的に分散しています。 分散した空間パターンは、多くの場合、何らかの種類の競争プロセスを反映しています。高値を持つフィーチャが高値を持つ他のフィーチャと反発し、同様に、低値を持つフィーチャが低値を持つ他のフィーチャと反発します。

注意:

[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールと [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールの帰無仮説はどちらも空間完全ランダム性です。 ただし、[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールの Z スコアの解釈は異なります。

出力

[空間的自己相関分析 (Spatial Autocorrelation)] ツールは、Moran's I インデックス、期待されるインデックス、分散、Z スコア、p 値の 5 つの値を返します。 このツールはこれらの値をジオプロセシング メッセージとして提供し、モデルまたはスクリプトで使用するために派生出力値として返します。 オプションとして、このツールは結果の概要図を持つ .html ファイルとしてレポートを作成します。 レポートへのパスは、ツールのパラメーターを要約するメッセージに含まれています。 このパスをクリックして、レポート ファイルを開きます。

ベスト プラクティス

このツールを使用する際には、以下の点に注意する必要があります。

  • [入力フィーチャクラス] パラメーターの値に少なくとも 30 個のフィーチャが含まれている必要があります。 フィーチャ数が 30 個未満の場合、結果は信頼できません。

  • [空間リレーションシップのコンセプト] パラメーターに指定されている値が適切であることを確認します。

    空間リレーションシップのコンセプトの選択のベスト プラクティスの詳細

  • [距離バンドまたは距離の閾値] パラメーターに指定されている値が適切であることを確認します。 以下の条件を満たす必要があります。
    • すべてのフィーチャが少なくとも 1 つ近接フィーチャを持つ必要があります。
    • すべてのフィーチャを近接フィーチャとするフィーチャが存在してはいけません。
    • [入力フィールド] パラメーターの値が偏っている場合、各フィーチャに約 8 個の近接フィーチャが必要です。
  • 入力ポリゴン フィーチャの場合、ほぼ必ず標準化が必要になります。

参考情報

[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの結果は統計的に有意なホット スポットを示しています。 このツールの結果が統計的に有意でないことがあります。 [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールからのグローバル統計では、データの全体的なパターンと傾向が評価されています。 これらは、空間パターンが分析範囲全体にわたって一貫している場合に最も効果的です。 ローカル統計 ([ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールなど) では、各フィーチャが近隣のフィーチャとの関係で評価され、ローカルな状況がグローバルの状況と比較されます。 次の例について考えます。 一連の値の平均を計算する際には、グローバル統計も計算します。 すべての値が 20 に近い場合は、平均値も 20 に近くなり、その結果はデータセット全体を非常に適切に表したサマリーとなります。 しかし、値の半分が 1 に近く、値のもう半分が 100 に近い場合、平均はおおよそ 50 になります。 ほぼ 50 に近いデータ値は存在しないため、平均値はデータセット全体を適切に表したサマリーとはいえません。 データ値のヒストグラムを作成した場合、双峰分布になります。 同様に、[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールなどのグローバル空間統計は、評価対象の空間プロセスが分析範囲全体にわたって一貫している場合に最も効果的です。 この場合、結果は空間パターン全体を適切に表したサマリーになります。 詳細については、『The Analysis of Spatial Association by Use of Distance Statistics』およびこれらが表す SIDS の分析をご参照ください。

このツールの結果は [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールの結果と異なります。 この 2 つのツールは、別の空間パターンを評価するものです。 詳細については、「高/低クラスター分析 (High/Low Clustering (Getis-Ord General G)) の結果の解釈」をご参照ください。

Z スコアまたは p 値の結果を異なる分析範囲間で比較することはできません。 ただし、分析範囲が固定され (すべての分析がカリフォルニアの郡の分析であるなど)、[入力フィールド] パラメーターの値が比較可能で (たとえば、すべての分析に何らかのタイプの人口数が含まれる)、ツールのパラメーターが同じである場合、統計的に有意な Z スコアを比較して、空間的クラスタリングや空間的分散の強度を把握したり、時間の経過とともに変化する傾向をよく理解することができます。 [距離バンドまたは距離の閾値] パラメーターの値を何度か増やして解析を実行することで、空間的クラスタリングを促進するプロセスが最も顕著である距離や縮尺を確認できます。

一般に、Global Moran's インデックスの範囲は -1.0 ~ 1.0 となります。これは、加重が行で標準化されている場合に常に当てはまります。 加重を行で標準化していない場合、インデックスの値が -1.0 ~ 1.0 の範囲から外れることがあり、これはパラメーターの設定に問題があることを示しています。 最も一般的な問題としては、次のものが挙げられます。

  • [入力フィールド] パラメーター値が大きく偏っており (これを確認するにはデータ値のヒストグラムを作成)、[空間リレーションシップのコンセプト] または [距離バンド] パラメーターの値の設定により、一部のフィーチャには近接フィーチャがほとんど存在しない。 Global Moran's I 統計は漸近正規性を持ちます。つまり、データが偏っている場合、各フィーチャには少なくとも 8 つの近接フィーチャが必要です。 [距離バンドまたは距離の閾値] パラメーターで計算されるデフォルト値は、各フィーチャが少なくとも 1 つの近傍フィーチャを持つことを保証しますが、[入力フィールド] パラメーターの値が大きく偏っている場合は特に、これでは十分でないことがあります。
  • [空間リレーションシップのコンセプト] パラメーターの [逆距離] オプションが使用され、逆距離が非常に小さい。
  • [標準化] パラメーターが [行] オプションに設定されている必要があるが、設定されていない。 データが集約された場合には必ず、集約スキームが分析対象のフィールドに直接関連している場合を除き、[行] オプションを指定します。

応用例

ツールの応用例を次に示します。

  • 空間的自己相関が最も強い距離を見つけることによって、各種空間解析手法の適切な近傍距離を特定します。
  • 時間とともに変化する民族的または人種的な分離傾向 (分離が増大しているか減少しているか) を評価します。
  • 考え、疾病、トレンドの空間および時間による拡散を集計します (考え、疾病、トレンドが独立しているか、集中しているか、普及し、さらに拡散しているか)。

参考資料

このツールの詳細については、以下の文献およびジャーナル記事をご参照ください。

Getis, Arthur, and J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, no. 3. 1992.

Goodchild, Michael F. Spatial Autocorrelation. Catmog 47, Geo Books. 1986.

Griffith, Daniel. Spatial Autocorrelation: A Primer. Resource Publications in Geography, Association of American Geographers. 1987.

The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.