ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*)) (空間統計)

概要

1 組のウェイト付きフィーチャに対して、Getis-Ord Gi* 統計値を使用して、統計的に有意なホット スポットとコールド スポットを特定します。

ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*)) ツールの詳細

ホット スポット分析の図

使用法

  • このツールは、統計的に有意な高い値および低い値の空間クラスター (ホット スポットとコールド スポット) を特定します。また、[入力フィーチャクラス] の各フィーチャの Z スコア、p 値、および信頼度ビンのフィールド (Gi_Bin) を含む [出力フィーチャクラス] を作成します。

  • Z スコアと p 値は、フィーチャごとに帰無仮説を棄却すべきかどうかを判断する統計的有意性の尺度です。実際には、観察された高い値または低い値の空間クラスタリングが、ランダム分布で同じ値に期待されるものより顕著かどうかを示します。Z スコアおよび p 値のフィールドは、どのタイプの FDR (False Discovery Rate) 補正も反映しません。

  • Gi_Bin フィールドは、FDR 補正が適用されているかどうかにかかわらず、統計的に有意なホット スポットとコールド スポットを特定します。+/-3 ビンのフィーチャは、統計的な有意性を 99 % の信頼度で反映し、+/-2 ビンのフィーチャは 95 % の信頼度、+/-1 ビンのフィーチャは 90 % の信頼度で統計的な有意性を反映します。ビン 0 のフィーチャのクラスターは統計的に有意ではありません。FDR 補正を適用しない場合、統計的な有意性は、p 値および Z スコア フィールドを使用します。オプションの [FDR (False Discovery Rate) 補正の適用] パラメーターのチェックボックスをオンにすると、信頼度を決定する重要な p 値を小さくして、多重検定および空間依存性で説明されるようにします。

  • フィーチャの Z スコアが高く p 値が小さいことは、高い値の空間クラスタリングを示します。Z スコアが負の低い値で p 値が小さいことは、低い値の空間クラスタリングを示します。Z スコアが高く (または低く) なるほど、クラスタリングの程度は高くなります。Z スコアがゼロに近いことは、明白な空間クラスタリングがないことを示します。

  • Z スコアは、無作為化帰無仮説計算に基づいています。スコアの詳細については、「Z スコアと p 値とは」をご参照ください。

  • [入力フィーチャクラス] が投影されていない場合 (つまり、座標が、度、分、および秒で与えられた場合)、または出力座標系地理座標系に設定された場合、弦の測定値を使用して距離が計算されます。弦距離の測定値が使用されるのは、少なくとも互いに約 30° の範囲内のポイントに対して、すばやく算出され、実際の測地距離に非常に近い推定値が得られるという理由からです。弦距離は、扁平回転楕円体に基づいています。地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。弦距離は、メートル単位でレポートされます。

    注意:

    分析範囲が 30°を越えて広がる場合、必ずデータを投影してください。30°を超える場合、弦距離は測地距離の良好な推定値にはなりません。

  • 弦距離を解析で使用するときに、[距離バンドまたは距離の閾値] パラメーターを指定する場合、メートル単位で指定する必要があります。

  • ライン フィーチャとポリゴン フィーチャの場合は、距離の計算にフィーチャの重心が使用されます。マルチポイント、ポリライン、または複数のパートを持つポリゴンの場合は、すべてのフィーチャ パートの加重平均中心を使用して重心が計算されます。加重は、ポイント フィーチャの場合は 1、ライン フィーチャの場合は長さ、ポリゴン フィーチャの場合は面積です。

  • 入力フィールドにはさまざまな値を含めなくてはなりません。この統計計算では、分析する変数に変異が存在する必要があります。たとえば、入力値がすべて 1 の場合、解は存在しません。このツールを使用してインシデント データの空間パターンを分析する場合は、インシデント データの集約または [最適化ホット スポット分析 (Optimized Hot Spot Analysis)] ツールの使用を検討してください。

    メモ:

    インシデント データは、イベント (犯罪、交通事故など) またはオブジェクト (樹木、店舗など) を表すポイントです。これらのポイントでは、各ポイントに関連付けられて測定される属性ではなく、インシデント データの有無に焦点が当てられます。

  • [最適化ホット スポット分析 (Optimized Hot Spot Analysis)] ツールはデータを照会して、ホット スポットの結果を最適化するパラメーター設定を自動的に選択します。このツールは、インシデント データを集約し、適切な規模の分析を選択して、多重検定および空間依存性の結果を調整します。選択したパラメーター オプションは、メッセージとして作成されるので、これを利用すると、このツールを使用するときのパラメーターの調整に役立ちます。このツールを使用してパラメーター設定を柔軟かつ完全に制御できます。

  • [空間リレーションシップのコンセプト] パラメーターの選択には、解析対象のフィーチャ間の固有のリレーションシップが反映されている必要があります。フィーチャの空間相互作用をより現実的にモデリングできればできるほど、結果はより正確になります。推奨事項については「空間リレーションシップのコンセプトの選択: ベスト プラクティス」で説明しています。次のようなヒントもあります。

    • 固定距離バンド

      これがデフォルト値になります。[距離バンドまたは距離の閾値] は、各フィーチャが少なくとも 1 つ近傍フィーチャを持つことを保証します。これは重要なことですが、多くの場合このデフォルトは解析に使用する最も適切な距離ではありません。分析で適切な尺度 (距離バンド) を選択する詳細については、「固定距離バンドの値の選択」で説明しています。

    • [逆距離] または [距離の逆二乗]

      [距離バンドまたは距離の閾値] パラメーターにゼロを入力すると、すべてのフィーチャが他のすべてのフィーチャの近隣フィーチャと見なされます。このパラメーターを空白のままにしておくと、デフォルトの距離が適用されます。

      距離のウェイトが 1 未満の場合は、反転したときに不安定になります。そのため、距離の 1 単位未満に分割されたフィーチャのウェイトは、1 に設定されます。

      逆距離系のオプション ([逆距離][距離の逆二乗]、および [無関心領域]) の場合、一致する 2 つのポイントは、ゼロ除算を避けるためにウェイトが 1 になります。これによりフィーチャが分析から除外されないことが保証されます。

  • 時空間リレーションシップなど、[空間リレーションシップのコンセプト] パラメーターの追加オプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用したときに利用できます。これらの追加オプションを利用するには、解析を実行する前に空間ウェイト マトリックス ファイルを作成します。[空間リレーションシップのコンセプト] パラメーターでは、[空間ウェイトをファイルから取得] を選択し、[ウェイト マトリックス ファイル] パラメーターでは、作成した空間ウェイト ファイルへのパスを指定します。

  • 時空間クラスター分析については、「時空間分析」のドキュメントをご参照ください。

  • マップ レイヤーを使用して、入力フィーチャクラスを指定できます。解析対象として指定したレイヤーの中で何らかのフィーチャが選択されている場合、選択されているフィーチャだけが解析の対象となります。

  • ウェイト マトリックス ファイルに「.swm」拡張子を付けると、このツールは [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] または [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して生成された空間ウェイト マトリックス ファイルを想定します。それ以外の場合、ツールは ASCII 形式の空間ウェイト マトリックス ファイルを想定します。場合によっては、使用する空間ウェイト マトリックス ファイルのタイプに応じて振舞いが変わります。

    • ASCII 形式の空間ウェイト マトリックス ファイル:
      • ウェイトはそのまま使用されます。フィーチャ対フィーチャのリレーションシップがない場合は、ゼロとして扱われます。
      • [セルフ ポテンシャル フィールド] パラメーター値を指定するか、セルフ ポテンシャル ウェイトを明示的に含めない限り、セルフ ポテンシャルのデフォルトのウェイトはゼロです。
      • 非対称のリレーションシップが適用され、フィーチャは、自身は近傍を持たない隣接フィーチャを持つことができます。つまり、隣接フィーチャは元のフィーチャのローカル平均の計算に含められますが、その隣接フィーチャはグローバル平均の計算には含められません。
      • ウェイトについて行の標準化を行うと、選択セットの解析で正しい結果は得られません。選択セットで解析を実行する必要があるときは、ASCII データをテーブルに読み込み、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールで [変換テーブル] オプションを使用して、ASCII 空間ウェイト ファイルを *.swm ファイルに変換します。
    • SWM 形式の空間ウェイト マトリックス ファイル:
      • ウェイトについて行の標準化を行うと、ウェイトは選択セットに対して再標準化されます。そうでない場合、ウェイトは、そのまま使用されます。
      • [セルフ ポテンシャル フィールド] パラメーター値を指定しない限り、セルフ ポテンシャルのデフォルトのウェイトは 1 です。

  • ASCII 形式の空間ウェイト マトリックス ファイルで解析を実行すると、多くのメモリが消費されます。5,000 を超えるフィーチャの解析で、ASCII 形式の空間ウェイト マトリックス ファイルを SWM 形式ファイルに変換する場合を考えます。まず、ASCII ウェイトを Excel などに読み込んで表形式にします。次に、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを、[空間リレーションシップのコンセプト] パラメーターに [変換テーブル] を使用して、実行します。出力は、SWM 形式の空間ウェイト マトリックス ファイルになります。

  • このツールの出力フィーチャクラスは自動的にコンテンツ ウィンドウに追加され、Gi_Bin フィールドにはデフォルトのレンダリングが適用されます。ホットからコールドへのレンダリングは、<ArcGIS Pro>\Resources\ArcToolBox\Templates\Layers にあるレイヤー ファイルによって定義されます。必要に応じて、レイヤー シンボルを再適用すれば、デフォルトのレンダリングを再適用できます。

  • このツールの出力には、[入力フィールド] の値をチャート化するヒストグラムが含まれます。このヒストグラムには、[コンテンツ] ウィンドウの [出力フィーチャクラス] でアクセスできます。

  • このツールのパラメーターの詳細については、「空間関係のモデリング」のヘルプ トピックをご参照ください。

  • 注意:

    シェープファイルを使用するときは、NULL 値を格納できないため、注意が必要です。シェープファイル以外の入力からシェープファイルを作成するツールまたはその他の方法では、NULL 値がゼロとして格納または解釈される場合があります。場合によっては、NULL 値はシェープファイルに非常に大きな負の値として格納されます。この場合、予期せぬ結果に至ることがあります。詳細については、「ジオプロセシングでのシェープファイル出力の注意事項」をご参照ください。

    レガシー:

    [行を標準化] はこのツールに影響を与えません。[ホット スポット分析 (Getis-Ord Gi* 統計値)] の結果は行を標準化のありなしに関係なく同じです。したがって、このパラメーターは無効であり、下位互換性を維持するためのツール パラメーターとしてのみ残されています。

  • Python スクリプトでこのツールを使用すると、実行されたツールから返される結果のオブジェクトの出力は次のようになります。

    位置詳細データ タイプ

    0

    出力フィーチャクラス

    フィーチャ クラス

    1

    結果のフィールド名 (GiZScore)

    フィールド

    2

    確率フィールド名 (GiPValue)

    フィールド

    3

    ソース ID のフィールド名 (SOURCE_ID)

    フィールド

構文

arcpy.stats.HotSpots(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Self_Potential_Field}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction}, {number_of_neighbors})
パラメーター説明データ タイプ
Input_Feature_Class

ホット スポット分析が実行されるフィーチャクラス。

Feature Layer
Input_Field

評価する数値フィールド (被害者の数、犯罪率、テストのスコアなど)。

Field
Output_Feature_Class

Z スコアと p 値の結果を受け取る出力フィーチャクラス。

Feature Class
Conceptualization_of_Spatial_Relationships

フィーチャ間の空間リレーションシップをどのよう定義するかを指定します。

  • INVERSE_DISTANCE遠くにあるフィーチャよりも、近くのフィーチャの方が、ターゲット フィーチャの計算に大きく影響します。
  • INVERSE_DISTANCE_SQUAREDINVERSE_DISTANCE と同じですが、傾斜が急なため、影響度がより急速に低下する点と、ターゲット フィーチャに最も近いフィーチャだけがそのフィーチャの計算に大きな影響を与える点が異なります。
  • FIXED_DISTANCE_BAND各フィーチャは、隣接フィーチャのコンテキスト内で解析されます。指定した臨界距離 (Distance_Band_or_Threshold) 内の隣接フィーチャは、ウェイト 1 を受け取り、ターゲット フィーチャの計算に影響を与えます。臨界距離の外にある隣接フィーチャは、ウェイト 0 を受け取り、ターゲット フィーチャの計算に影響を与えません。
  • ZONE_OF_INDIFFERENCEターゲット フィーチャの指定した臨界距離 (Distance_Band_or_Threshold) 内のフィーチャは、ウェイト 1 を受け取り、ターゲット フィーチャの計算に影響を与えます。臨界距離を超えると、ウェイト (および隣接フィーチャがターゲット フィーチャの計算に与える影響) は距離に伴って減少します。
  • K_NEAREST_NEIGHBORS最も近い K 個のフィーチャが分析に含められます。K は指定した数値パラメーターです。
  • CONTIGUITY_EDGES_ONLY境界またはオーバーラップを共有する隣接ポリゴンだけが、ターゲットのポリゴン フィーチャの計算に影響を与えます。
  • CONTIGUITY_EDGES_CORNERS境界、ノード、またはオーバーラップを共有するポリゴン フィーチャはターゲットのポリゴン フィーチャの計算に影響を与えます。
  • GET_SPATIAL_WEIGHTS_FROM_FILE空間リレーションシップは、指定した空間ウェイト ファイルによって定義されます。空間ウェイト ファイルへのパスは、Weights_Matrix_File パラメーターに指定します。
String
Distance_Method

各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。

  • EUCLIDEAN_DISTANCE2 つのポイント間の直線距離 (最短距離)。
  • MANHATTAN_DISTANCE直角の軸 (街区) に沿って計測した 2 つのポイント間の距離。X 座標と Y 座標の間の (絶対) 距離を合計して計算します。
String
Standardization

行の標準化はこのツールに影響を与えません。[ホット スポット分析 (Getis-Ord Gi* 統計値)] の結果は、行の標準化のありなしに関係なく同じです。このパラメーターは無効であり、下位互換性を維持するためのツール パラメーターとしてのみ残されています。

  • NONE空間ウェイトの標準化は適用されません。
  • ROW空間ウェイトの標準化は適用されません。
String
Distance_Band_or_Threshold_Distance
(オプション)

逆距離オプションおよび固定距離オプションの場合、ここで閾値を指定します。ターゲット フィーチャに対して指定したカットオフの外側のフィーチャは、そのフィーチャの解析では除外されます。ただし、ZONE_OF_INDIFFERENCE オプションの場合、ここで指定した閾値内にあるフィーチャの影響は等しく考慮され、閾値外にあるフィーチャの影響は距離に伴って減少します。入力する距離値は、出力座標系の値に一致している必要があります。

空間リレーションシップの逆距離のコンセプトの場合、値 0 は閾値の距離が適用されないことを示します。このパラメーターを空白のままにすると、デフォルトの閾値が計算され、適用されます。デフォルト値はユークリッド距離であり、すべてのフィーチャに 1 つ以上の隣接フィーチャがあることが保証されます。

このパラメーターは、ポリゴン隣接 (CONTIGUITY_EDGES_ONLY または CONTIGUITY_EDGES_CORNERS) または GET_SPATIAL_WEIGHTS_FROM_FILE の空間コンセプトを選択した場合、効果がありません。

Double
Self_Potential_Field
(オプション)

セルフ ポテンシャル (フィーチャとそれ自身の間の距離またはウェイト) を表すフィールド。

Field
Weights_Matrix_File
(オプション)

フィーチャ間の空間リレーションシップ、および潜在的に時系列のリレーションシップを定義するウェイトが含まれたファイルへのパス。

File
Apply_False_Discovery_Rate__FDR__Correction
(オプション)
  • APPLY_FDR統計的な有意性は、FDR 補正を使用します。
  • NO_FDR統計的な優位性は、FDR 補正を使用せず、p 値および Z スコアのフィールドを使用します。これがデフォルトです。
Boolean
number_of_neighbors
(オプション)

解析に含める近傍の数を指定する整数。

Long

派生した出力

名前説明データ タイプ
Results_Field

結果のフィールド名 (GiZScore)。

フィールド
Probability_Field

確率フィールド名 (GiPValue)。

フィールド
Source_ID

ソース ID のフィールド名 (SOURCE_ID)。

フィールド

コードのサンプル

HotSpots (ホット スポット分析) の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、HotSpotAnalysisツールの使用方法を示しています。

import arcpy
arcpy.env.workspace = "C:/data"
arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
                     "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", 
                     "NONE", "#", "#", "euclidean6Neighs.swm", "NO_FDR")
HotSpots (ホット スポット分析) の例 2 (スタンドアロン スクリプト)

次のスタンドアロン Python スクリプトは、HotSpotAnalysis ツールの使用方法を示しています。

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace
    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)
    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6,
                        "NO_STANDARDIZATION") 
    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp", 
                     "GET_SPATIAL_WEIGHTS_FROM_FILE",
                     "EUCLIDEAN_DISTANCE", "NONE",
                     "#", "#", "euclidean6Neighs.swm","NO_FDR")
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

環境

出力座標系

フィーチャ ジオメトリが分析の前に出力データの座標系に投影されます。したがって、[距離バンドまたは距離の閾値] パラメーターに入力された値は、出力データの座標系で指定されている値と一致する必要があります。数学的演算はすべて、出力データの座標系の空間参照に基づいて行われます。出力データの座標系が度、分、および秒に基づく場合、測地距離はメートル単位の弦の距離を使用して推定されます。

ライセンス情報

  • Basic: はい
  • Standard: はい
  • Advanced: はい

関連トピック