ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*)) の詳細

[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールは、データセットの各フィーチャの Getis-Ord Gi* (発音はジー-アイ-スター) 統計を計算します。 結果として生成される Z スコアと p 値は、高い値または低い値のフィーチャが空間的にどの場所でクラスタリングされるかを示します。 このツールでは、各フィーチャが隣接フィーチャのコンテキスト内で評価されます。 高い値を持つフィーチャは興味深いフィーチャではあっても、統計的に有意なホット スポットではない可能性もあります。 統計的に有意なホット スポットである場合は、高い値を持つフィーチャが、同じように高い値を持つ別のフィーチャに囲まれています。 あるフィーチャとその近傍を対象とする特定エリアの合計値が、すべてのフィーチャの合計値と比例的に比較されます。 実際の特定エリアの合計値と期待された合計値が、偶然には発生しないほど大きく異なっていれば、Z スコアは統計的に有意ということになります。 FDR 補正が適用されると、多重検定および空間依存性を説明できるように、統計的な有意性が調整されます。

演算

Getis-Ord Gi* 統計の計算を次の図に示します。

Gi* 統計の数式

解釈

データセットの各フィーチャに対して返される Gi* 統計値は Z スコアです。 統計的に有意な正の Z スコアの場合、Z スコアが大きくなるほど、高い値のクラスタリングの強度が高くなります (ホット スポット)。 統計的に有意な負の Z スコアの場合、Z スコアが小さくなるほど、低い値のクラスタリングの強度が高くなります (コールド スポット)。 統計的有意性の判定および多重検定や空間依存性の補正の詳細については、「Z スコアとは、 p 値とは」をご参照ください。

出力

このツールは、各入力フィーチャクラスの Z スコア、p 値、および信頼度ビン (Gi_Bin) を含む出力フィーチャクラスを作成します。

ツールが完了すると、作成された出力フィーチャクラスがマップに追加され、Gi_Bin フィールドにデフォルトのレンダリングが適用されます。

ホット スポット分析の考慮事項

ホット スポット分析を行う場合、以下を検討してください。

  • ツールは、高い値または低い値 (犯罪件数、事故の深刻度、スポーツ用品の購入額など) のどちらが空間的にクラスタリングされるかを評価します。 このような値を含むフィールドが分析フィールドです。 ただし、ポイント インシデント データでは、インシデントに関係する特定の値の空間クラスタリングを分析することよりも、インシデントの強度を評価することに関心が向く場合があります。 その場合は、分析を実行する前に、次の手順によりインシデント データを集約します。
    • 分析範囲にポリゴン フィーチャがある場合は、[空間結合 (Spatial Join)] ツールを使用して、各ポリゴンのイベント数を集計します。 その結果である各ポリゴンのイベント数を含むフィールドが、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの [入力フィールド] パラメーター値になります。
    • [フィッシュネットの作成 (Create Fishnet)] ツールまたは [テッセレーションの生成 (Generate Tessellation)] ツールを使用して、ポイント フィーチャ上にポリゴン グリッドを構築します。 次に、[空間結合 (Spatial Join)] ツールを使用して、各グリッド ポリゴン内のイベント数を集計します。 分析範囲外のグリッド ポリゴンは削除します。 また、分析範囲内のグリッド ポリゴンの多くでイベント数がゼロの場合は、適切であればポリゴンのグリッド サイズを大きくします。または、イベント数がゼロのグリッド ポリゴンを削除しておきます。
    • 一致または近接したポイントがいくつかある場合は、[インテグレート (Integrate)] ツールと [イベントの集計 (Collect Events)] ツールを使用して、指定した距離内にあるフィーチャをスナップしてまとめ、イベント数とスナップされたポイント数を示すカウント属性が関連付けられ、それぞれ独自の位置にポイントを含む新しいフィーチャクラスを作成します。 得られた ICOUNT フィールドを、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの [入力フィールド] パラメーター値として使用します。
      注意:

      同じ位置にあるポイントが冗長なレコードである可能性がある場合は、[同一値を持つレコードの検出 (Find Identical)] ツールを使用し、重複を見つけて削除します。

    上記のツールを使用してインシデント データを集約する例を、次の図に示します。
    インシデント データの集約の例
    インシデント データの集約方法を示します。
  • [ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの [空間リレーションシップのコンセプト] パラメーター値の推奨値 (デフォルト値) は [固定距離バンド] です。 [時空間ウィンドウ][無関心領域][K 最近隣内挿法][ドロネー三角形分割法] オプションでもかまいません。 分析距離の値を決めるベスト プラクティスと戦略については、「空間リレーションシップのコンセプトの選択におけるベスト プラクティス」と「固定距離バンドの値を選択するためのベスト プラクティス」をご参照ください。 時空間ホット スポット分析については、「時空間クラスター分析」をご参照ください。

  • 入力フィールドによって、問うことのできる疑問の種類が決まります。 インシデントが多数起きている場所を確認すること、または特定の属性の高い値と低い値が空間的にどの場所でクラスターを形成しているかを確認することに最も関心がある場合、生の値または生のインシデント件数に対して、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールを実行します。 この種の分析は、資源配分の問題に特に役立ちます。 これとは別に (または追加として)、他の変数に比べて想定外に高い値を持つエリアを見つけたい場合もあります。 たとえば、抵当流れを分析する場合は、住宅が多い場所では抵当流れも多いと予想されます (つまり、抵当流れの件数は、ある程度は住宅数の関数であると予想されます)。 抵当流れの件数を住宅数で割って、この比率に対して [ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールを実行した場合、「抵当流れの件数が多いのはどこか」という疑問ではなくなります。 代わりに、「住宅数に対して、抵当流れの件数が予想外に多いのはどこか」という疑問を持っていることになります。 分析を実行する前に比率を作成することで、特定の予想される関係 (たとえば、犯罪数は人口の関数、抵当流れの件数は住宅数の関数) を制御して、予想外のホット スポットとコールド スポットを特定できます。

ベスト プラクティス

次に、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*)) ツール] の使用に関するベスト プラクティスを示します。

  • [入力フィーチャクラス] パラメーターの値は少なくとも 30 個のフィーチャを含んでいる必要があります。 フィーチャ数が 30 個未満の場合、結果は信頼できません。
  • 適切な [空間リレーションシップのコンセプト] パラメーターの値を指定します。 このツールでは、[固定距離バンド] オプションが推奨されています。 時空間ホット スポット分析については、「空間リレーションシップのコンセプトの選択におけるベスト プラクティス」をご参照ください。
  • 適切な [距離バンドまたは距離の閾値] パラメーターの値を指定します。 詳細については、「距離バンドまたは距離の閾値」をご参照ください。
    • すべてのフィーチャが少なくとも 1 つ近接フィーチャを持つ必要があります。
    • すべてのフィーチャを近接フィーチャとするフィーチャが存在してはいけません。
    • 特に、[入力フィールド] パラメーターの値が偏っている場合は、各フィーチャがおよそ 8 つの近隣フィーチャを持つようにします。 [近接フィーチャへの距離を計算 (Calculate Distance Band from Neighbor Count)] ツールを使用すると、各フィーチャに 8 つの近接フィーチャがある場合の平均距離を求めることができます。

適用例

たとえば、犯罪分析、疫学、投票行動分析、経済地理学、小売分析、交通事故分析、人口統計学などで応用できます。 次のような質問に答えることができます。

  • 感染症が集中して発生している場所はどこか?
  • すべての住宅火災の中で台所火災の数が予想よりも多い場所はどこか?
  • 避難場所はどこに設置すべきか?
  • いつ、どこで強さがピークになっているのか?
  • リソースを割り当てる必要があるのは、どの場所およびどの期間か?

参考資料

空間統計に関する詳細については、次のリソースをご参照ください。

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.

Getis, A. and J.K. Ord. 1992."The Analysis of Spatial Association by Use of Distance Statistics" in Geographical Analysis 24(3).

Ord, J.K. and A. Getis. 1995. "Local Spatial Autocorrelation Statistics: Distributional Issues and an Application" in Geographical Analysis 27(4).

空間統計リソースのページには、ショート ビデオ、チュートリアル、Web セミナー、記事、およびその他いろいろな資料が用意されており、空間統計を取り扱う際に役立ちます。

Scott, L. and N. Warmerdam. Extend Crime Analysis with ArcGIS Spatial Statistics Tools in ArcUser Online, April–June 2005.