[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールは、フィーチャの位置とフィーチャの値の両方に基づいて、空間的自己相関分析を計測します。フィーチャの集合と関連付けられた属性に対して、明示的なパターンがクラスタリングするか、分散するか、不規則かを評価します。このツールは、Moran's I インデックス値、および、Z スコアと p 値の両方を計算して、インデックスの有意性を評価します。p 値とは、テスト統計の制限のもとで、既知の分布曲線における面積を数学的に近似した値です。
演算
Global Moran's I 統計の土台となる計算式を上に示します。このツールは、評価対象の属性の平均値と分散を計算します。そして、各フィーチャ値について、平均値を引いて平均からの偏差を算出します。すべての近傍フィーチャ (たとえば指定した距離バンド内にあるフィーチャ) の偏差値を掛け合わせて、クロス積を算出します。Global Moran's I 統計の分子には、このクロス積の合計を含むことに注意してください。フィーチャ A とフィーチャ B が近傍であり、すべてのフィーチャ値の平均が 10 であるとします。
フィーチャの値 | 偏差 | クロス積 | |||
A=50 | B=40 | 40 | 30 | 1200 | |
A= 8 | B=6 | -2 | -4 | 8 | |
A=20 | B=2 | 10 | -8 | -80 |
近傍フィーチャの値が、どちらも平均値より大きいか、またはどちらも平均値より小さい場合、クロス積は正の値になります。近傍フィーチャの片方の値が平均値より小さく、もう片方が平均値より大きい場合、クロス積は負の値になります。いずれの場合でも、平均値からの偏差が大きくなればなるほど、クロス算結果は大きくなります。データセット内の値が空間クラスターを形成する (高い値が他の高い値の近くに集まり、低い値が他の低い値の近くに集まる) 場合、Moran インデックスは正の値になります。高い値が他の高い値とは反発して、低い値の近くに集まる傾向がある場合、Moran インデックスは負の値になります。正のクロス積値が負のクロス積値とバランスがとれている場合、Moran インデックスはゼロに近くなります。分子は分散によって正規化されるため、インデックスの値は -1.0 ~ +1.0 の範囲になります (例外については、後述の「FAQ」のセクションをご参照ください)。
[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールは、インデックス値を計算した後、期待インデックス値を計算します。期待されるインデックスの値は、観測されたインデックスの値と比較されます。データセット内のフィーチャ数と、データ値全体の分散から、この差異が統計的に有意かどうかを示す Z スコアと p 値が計算されます。インデックス値を直接解釈することはできません。インデックス値は帰無仮説の文脈内でのみ解釈できます。
解釈
[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールは、推定的統計解析を実行します。つまり、解析結果は常に帰無仮説の文脈内で解釈されます。Global Moran's I 統計の場合、解析対象の属性は分析範囲のフィーチャ間でランダムに分布している、という帰無仮説が立てられます。言い換えれば、観測された値のパターン化を推進する空間プロセスの可能性はランダムであるということです。解析している属性の値を適当に選択して、適当にフィーチャに設定したとしましょう。この処理 (値の選択と設定) がランダムな空間プロセスの一例です。
このツールによって返された p 値が統計的に有意である場合、帰無仮説を否定できます。次の表に結果の解釈の仕方をまとめています。
p 値が統計的に有意ではない。 | 帰無仮説を否定できません。フィーチャ値の空間分布がランダムな空間プロセスの結果である可能性が高いです。観測されたフィーチャ値の空間パターンは、完全空間ランダム性 (CSR) の非常に多数ある可能なバージョンの 1 つといえます。 |
p 値が統計的に有意であり、Z スコアが正の値である。 | 帰無仮説を否定することができます。データセット内の高い値または低い値の空間分布が、空間プロセスがランダムである場合に期待されるものよりも空間的にクラスタリングしています。 |
p 値が統計的に有意であり、Z スコアが負の値である。 | 帰無仮説を否定することができます。データセット内の高い値または低い値の空間分布が、空間プロセスがランダムである場合に期待されるものよりも空間的に分散しています。分散した空間パターンは、多くの場合、なんらかの種類の競争プロセスを反映しています。高い値を持つフィーチャが他の高い値を持つフィーチャと反発し、同様に、低い値を持つフィーチャが他の低い値を持つフィーチャと反発します。 |
メモ:
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールと [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの帰無仮説はどちらも、完全空間ランダム性 (CSR) です。しかし、高/低クラスター分析での Z スコアの解釈は異なります。
出力
[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールは値を 5 つ返します。Moran I インデックス、期待されるインデックス、分散、Z スコア、p 値です。これらの値は、ツールの実行中に [ジオプロセシング] ウィンドウの下部にメッセージとして書き込まれ、モデルまたはスクリプトでの潜在的な用途のために、出力値として渡されます。このメッセージにアクセスするには、[ジオプロセシング] ウィンドウでプログレス バーの上にカーソルを置くか、ポップアップ ボタンをクリックするか、メッセージ セクションを展開します。ジオプロセシング履歴を介して、以前に実行したツールのメッセージにアクセスすることもできます。オプションとして、このツールは結果の概要図を持つ HTML レポート ファイルを作成します。レポートへのパスは、ツールの実行パラメーターを要約するメッセージに含まれています。このパスをクリックすると、レポート ファイルが開きます。
ベスト プラクティスのガイドライン
- 入力フィーチャクラスは少なくとも 30 個のフィーチャを含んでいますか?フィーチャ数が 30 個未満の場合、結果は信頼できません。
- [空間リレーションシップのコンセプト] の選択は適切ですか?「空間リレーションシップのコンセプトの選択」をご参照ください。
- [距離バンドまたは距離の閾値] の値は適切ですか?「固定距離の選択」をご参照ください。
- すべてのフィーチャが少なくとも 1 つ近接フィーチャを持つ必要があります。
- すべてのフィーチャを近接フィーチャとするフィーチャが存在してはいけません。
- とくに入力フィールドの値に歪みがある場合は、フィーチャはそれぞれ約 8 個の近接フィーチャを持つようにします。
- 行を標準化する必要がありますか?ポリゴン フィーチャの場合、ほぼ必ず行の標準化が必要になります。「標準化」をご参照ください。
FAQ
Q: [ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの結果は統計的に有意なホット スポットを示しています。[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの結果はなぜ同じように統計的に有意ではないのですか?
A: [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールのようなグローバル統計では、データのパターン全体と傾向を評価します。グローバル統計は、分析範囲全体で空間パターンにばらつきがないときに最も有効です。ローカル統計 ([ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールなど) では、近傍フィーチャのコンテキスト内にある各フィーチャにアクセスして、ローカルな状況をグローバルな状況と比較します。ここで、1 つの例を検証します。1 組の値の平均値を計算するとき、これはグローバル統計値の計算でもあります。すべての値が 20 に近い場合、平均値も 20 に近くなり、その結果はデータセット全体を非常によく表すまとめとなります。一方、値の半数が 1 付近であり、残りの半数が 100 付近である場合の平均値は 50 付近になります。50 付近のデータ値が存在しない可能性があるため、平均値はデータセット全体を適切に表したサマリーとはいえません。このデータ値のヒストグラムを作成すれば、分布に山が 2 つあることがわかります。同様に、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールも含むグローバル空間統計は、計測する空間プロセスが分析範囲全体でばらつきがないときに最も有効です。その場合、結果は空間パターン全体をよく表すまとめになります。詳細については、以下に示した Getis and Ord (1992) と、その SIDS 分析をご参照ください。
Q: [高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] の結果が [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] の結果と異なるのはなぜですか?
A: 計測する空間パターンが違います。詳細についてはここをクリックしてください。
Q:このツールの Z スコアまたは p 値を別の分析範囲の解析結果と比べることはできますか。
A:別の分析範囲と結果を比べることはできません。ただし、分析範囲を固定し (たとえば、カリフォルニア州の全郡の解析など)、入力フィールドが同等で (たとえば、すべての解析がある種の人口数を対象としている場合)、ツール パラメーターが同じ (たとえば、[距離バンドまたは距離の閾値] が 5,000 メートルの固定距離で、行を標準化している場合) であれば、統計的に有意な Z スコアを比較して、クラスタリングまたは分散の強さを感じ取ったり、時間的な傾向を把握できる可能性はあります。また、[距離バンドまたは距離の閾値] の値を徐々に増やして解析し、空間クラスタリングを推進するプロセスが最も顕著な距離または縮尺を確認することもできます。
Q: Moran インデックスが 1.0 より大きかったり、-1.0 より小さかったりするのはなぜですか?
A: 一般に、Global Moran インデックスの範囲は -1.0 ~ 1.0 です。これは、ウェイトが行で標準化されているときは常に当てはまります。ウェイトを行で標準化しないと、インデックス値が -1.0 ~ 1.0 の範囲外になることがあり、これはパラメーター設定に問題があることを示しています。最も一般的な問題は次のとおりです。
- 入力フィールドの値の歪みが激しく (データ値のヒストグラムを作成して確認します)、[空間リレーションシップのコンセプト] または[距離バンドまたは距離の閾値] が、一部のフィーチャの近傍フィーチャが非常に少なくなるような設定になっています。Global Moran's I 統計は、漸近的正規です。そのため、歪んだデータの場合、各フィーチャが少なくとも 8 個の近傍フィーチャを持つ必要があります。[距離バンドまたは距離の閾値] パラメーター用に計算されたデフォルト値は、すべてのフィーチャが少なくとも 1 つ近傍フィーチャを持つことを保証します。しかし、特に入力フィールドの値の歪みが大きい場合、これでは十分ではありません。
- [空間リレーションシップのコンセプト] として逆距離が使用されていて、逆距離が非常に小さくなっています。
- [行の標準化] が選択されていませんが、選択する必要があります。データを集約するときは、集約方式が直接フィールドに関係している場合でない限り、必ず [行の標準化] を選択する必要があります。
適用例
- 空間的自己相関が最も強い距離を発見して、さまざまな空間解析方法に適切な近傍距離の特定に役立てます。
- 民族的または人種的分離の、ある期間にわたるおおまかな傾向を計測します。分離は増えているのでしょうか、減っているのでしょうか。
- 考え方、病気、流行の空間的および時間的拡散をまとめます。考え方、病気、流行は孤立したまま一箇所に集まっているのでしょうか、それとも、広まって拡散しているのでしょうか。
参考資料
以下の書籍と雑誌記事に、このツールに関する詳細情報が記載されています。
Getis, Arthur および J. K. Ord『The Analysis of Spatial Association by Use of Distance Statistics』Geographical Analysis 24、no. 3、1992 年
Goodchild, Michael F., Spatial Autocorrelation.Catmog 47, Geo Books, 1986 1986.
Griffith, Daniel 著、『Spatial Autocorrelation: A Primer』 (Resource Publications in Geography、Association of American Geographers、1987)
Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年