概要
Getis-Ord General G 統計を使用して、高い値または低い値のクラスタリングの程度を計測します。
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールの詳細
図
使用法
[高/低クラスター分析 (High/Low Clustering)] ツールは、観測 General G、期待 General G、Z スコア、および p 値という 4 つの値を返します。これらの値は、ツールの実行中に [ジオプロセシング] ウィンドウの下部にメッセージとして書き込まれ、モデルまたはスクリプトでの潜在的な用途のために、出力値として渡されます。このメッセージにアクセスするには、[ジオプロセシング] ウィンドウで進行状況バーにカーソルを合わせるか、ポップアップ ボタンをクリックするか、メッセージ セクションを展開します。ジオプロセシング履歴を介して、以前に実行したツールのメッセージにアクセスすることもできます。必要に応じて、このツールを使用して、結果の概要図を持つ HTML レポート ファイルを作成できます。レポートへのパスは、ツールの実行パラメーターを要約するメッセージに含まれています。このパスをクリックして、レポート ファイルを開きます。
[入力フィールド] にはさまざまな非負の値が含まれます。[入力フィールド] に負の値が含まれている場合は、エラー メッセージが表示されます。さらに、この統計計算では、分析する変数に変異が存在する必要があります。たとえば、入力値がすべて 1 の場合、解は存在しません。このツールを使用してインシデント データの空間パターンを分析する場合は、インシデント データの集約を検討してください。[最適化ホット スポット分析 (Optimized Hot Spot Analysis)] ツールを使用して、インシデント データの空間パターンを分析することもできます。
メモ:
インシデント データは、イベント (犯罪、交通事故など) またはオブジェクト (樹木、店舗など) を表すポイントです。これらのポイントでは、各ポイントに関連付けられて測定される属性ではなく、インシデント データの有無に焦点が当てられます。
- Z スコアと p 値は、帰無仮説を棄却すべきかどうかを判断するための統計的な有意性を示す尺度です。このツールの場合、帰無仮説は、フィーチャに関連付けられた値はランダムに分布しているというものです。
Z スコアは、無作為化帰無仮説計算に基づいています。スコアの詳細については、「Z スコアと 「p 値とは」をご参照ください。
Z スコアが高く (または低く) なるほど、クラスタリングの強度は強くなります。Z スコアがゼロに近いことは、分析範囲に明白なクラスタリングがないことを示します。正の Z スコアは高い値のクラスタリングを示します。負の Z スコアは低い値のクラスタリングを示します。
[入力フィーチャクラス] が投影されていない場合 (つまり、座標が、度、分、および秒で与えられた場合)、または出力座標系が地理座標系に設定された場合、弦の測定値を使用して距離が計算されます。弦距離の測定値が使用されるのは、少なくとも互いに約 30° の範囲内のポイントに対して、すばやく算出され、実際の測地距離に非常に近い推定値が得られるという理由からです。弦距離は、短回転楕円体に基づいています。地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。弦距離は、メートル単位でレポートされます。
注意:
分析範囲が 30°を越えて広がる場合、必ずデータを投影してください。30°を超える場合、弦距離は測地距離の良好な推定値にはなりません。
弦距離を解析で使用するときに、[距離バンドまたは距離の閾値] パラメーターを指定する場合、メートル単位で指定する必要があります。
ライン フィーチャとポリゴン フィーチャの場合は、距離の計算にフィーチャの重心が使用されます。マルチポイント、ポリライン、または複数のパートを持つポリゴンの場合は、すべてのフィーチャ パートの加重平均中心を使用して重心が計算されます。加重は、ポイント フィーチャの場合は 1、ライン フィーチャの場合は長さ、ポリゴン フィーチャの場合は面積です。
[空間リレーションシップのコンセプト] パラメーターの選択には、解析対象のフィーチャ間の固有のリレーションシップが反映されている必要があります。フィーチャの空間相互作用をより現実的にモデリングできればできるほど、結果はより正確になります。推奨事項については「空間リレーションシップのコンセプトの選択: ベスト プラクティス」で説明しています。次のようなヒントもあります。
- 固定距離バンド
[距離バンドまたは距離の閾値] パラメーターは、各フィーチャが少なくとも 1 つ近傍フィーチャを持つことを保証します。これは重要なことですが、多くの場合、計算されたデフォルトは解析に使用する最も適切な距離ではありません。分析で適切な尺度 (距離バンド) を選択する詳細については、「固定距離バンドの値の選択」で説明しています。
- [逆距離] または [距離の逆二乗]
[距離バンドまたは距離の閾値] パラメーターにゼロを入力すると、すべてのフィーチャが他のすべてのフィーチャの近隣フィーチャと見なされます。このパラメーターを空白のままにしておくと、デフォルトの距離が適用されます。
距離のウェイトが 1 未満の場合は、反転したときに不安定になります。そのため、距離の 1 単位未満に分割されたフィーチャのウェイトは、1 に設定されます。
逆距離系のオプション ([逆距離]、[距離の逆二乗]、および [無関心領域]) の場合、一致する 2 つのポイントは、ゼロ除算を避けるためにウェイトが 1 になります。これによりフィーチャが分析から除外されないことが保証されます。
- 固定距離バンド
3 次元リレーションシップや時空間リレーションシップなど、[空間リレーションシップのコンセプト] パラメーターの追加オプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールで使用できます。これらの追加オプションを利用するには、解析を実行する前に空間ウェイト マトリックス ファイルを作成します。[空間リレーションシップのコンセプト] パラメーターでは、[空間ウェイトをファイルから取得] を選択し、[ウェイト マトリックス ファイル] パラメーターでは、作成した空間ウェイト ファイルへのパスを指定します。
マップ レイヤーを使用して、入力フィーチャクラスを指定できます。解析対象として指定したレイヤーの中で何らかのフィーチャが選択されている場合、選択されているフィーチャだけが解析の対象となります。
ウェイト マトリックス ファイルに .swm 拡張子を付けると、このツールは [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して作成された空間ウェイト マトリックス ファイルであると想定します。それ以外の場合、このツールは ASCII 形式の空間ウェイト マトリックス ファイルであると想定します。場合によっては、使用する空間ウェイト マトリックス ファイルのタイプに応じて振舞いが変わります。
- ASCII 形式の空間ウェイト マトリックス ファイル:
- ウェイトはそのまま使用されます。フィーチャ対フィーチャのリレーションシップがない場合は、ゼロとして扱われます。
- ウェイトについて行の標準化を行うと、選択セットの解析で正しい結果は得られません。選択セットで解析を実行する必要があるときは、ASCII データをテーブルに読み込み、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールで [変換テーブル] オプションを使用して、ASCII 空間ウェイト ファイルを SWM ファイルに変換します。
- SWM 形式の空間ウェイト マトリックス ファイル:
- ウェイトについて行の標準化を行うと、ウェイトは選択セットに対して再標準化されます。そうでない場合、ウェイトは、そのまま使用されます。
- ASCII 形式の空間ウェイト マトリックス ファイル:
ASCII 形式の空間ウェイト マトリックス ファイルで解析を実行すると、多くのメモリが消費されます。5,000 を超えるフィーチャの解析で、ASCII 形式の空間ウェイト マトリックス ファイルを SWM 形式ファイルに変換する場合を考えます。まず、ASCII ウェイトを Excel などに読み込んで表形式にします。次に、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを、[空間リレーションシップのコンセプト] パラメーターに [変換テーブル] を使用して、実行します。出力は、SWM 形式の空間ウェイト マトリックス ファイルになります。
このツールのパラメーターの詳細については、「空間関係のモデリング」のヘルプ トピックをご参照ください。
注意:
シェープファイルを使用するときは、NULL 値を格納できないため、注意が必要です。シェープファイル以外の入力からシェープファイルを作成するツールまたはその他の方法では、NULL 値がゼロとして格納または解釈される場合があります。場合によっては、NULL 値はシェープファイルに非常に大きな負の値として格納されます。この場合、予期せぬ結果に至ることがあります。詳細については、「ジオプロセシングでのシェープファイル出力の注意事項」をご参照ください。
構文
arcpy.stats.HighLowClustering(Input_Feature_Class, Input_Field, {Generate_Report}, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {number_of_neighbors})
パラメーター | 説明 | データ タイプ |
Input_Feature_Class | 一般 G 統計値が計算されるフィーチャクラスです。 | Feature Layer |
Input_Field | 評価する数値フィールド。 | Field |
Generate_Report (オプション) |
| Boolean |
Conceptualization_of_Spatial_Relationships | フィーチャ間の空間リレーションシップをどのよう定義するかを指定します。
| String |
Distance_Method | 各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。
| String |
Standardization | 空間ウェイトの標準化を適用するかどうかを指定します。行の標準化が推奨されるのは、サンプリングの設計や指定された集約方式によってフィーチャの分布が偏る可能性があるときです。
| String |
Distance_Band_or_Threshold_Distance (オプション) | 逆距離オプションおよび固定距離オプションの場合、ここで閾値を指定します。ターゲット フィーチャに対して指定したカットオフの外側のフィーチャは、そのフィーチャの解析では除外されます。ただし、ZONE_OF_INDIFFERENCE オプションの場合、ここで指定した閾値内にあるフィーチャの影響は等しく考慮され、閾値外にあるフィーチャの影響は距離に伴って減少します。入力する距離値は、出力座標系の値に一致している必要があります。 空間リレーションシップの逆距離のコンセプトの場合、値 0 は閾値の距離が適用されないことを示します。このパラメーターを空白のままにすると、デフォルトの閾値が計算され、適用されます。このデフォルト値はユークリッド距離であり、すべてのフィーチャに 1 つ以上の隣接フィーチャがあることが保証されます。 このパラメーターは、ポリゴン隣接 (CONTIGUITY_EDGES_ONLY または CONTIGUITY_EDGES_CORNERS) または GET_SPATIAL_WEIGHTS_FROM_FILE の空間コンセプトを選択した場合、効果がありません。 | Double |
Weights_Matrix_File (オプション) | フィーチャ間の空間リレーションシップ、および潜在的に時系列のリレーションシップを定義するウェイトが含まれたファイルへのパス。 | File |
number_of_neighbors (オプション) | 解析に含める近傍の数を指定する整数。 | Long |
コードのサンプル
次の Python ウィンドウ スクリプトは、HighLowClusteringツールの使用方法を示しています。
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT", "false", "GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE", "NONE", "#", "euclidean6Neighs.swm")
次のスタンドアロン Python スクリプトは、HighLowClustering ツールの使用方法を示しています。
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the High/Low Clustering (Getis-Ord General G) tool
# Import system modules
import arcpy
# Set property to overwrite existing outputs
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "!FID!", "PYTHON")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Cluster Analysis of 911 Calls
# Process: High/Low Clustering (Getis-Ord General G)
hs = arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT",
"false",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "euclidean6Neighs.swm")
except arcpy.ExecuteError:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
環境
- 出力座標系
フィーチャ ジオメトリは分析に先立って出力座標系に投影されます。すべての数学的演算は、出力座標系の空間参照に基づいて実行されます。[出力データの座標系] が度、分、および秒に基づく場合、測地距離は弦距離を使用して推定されます。
ライセンス情報
- Basic: はい
- Standard: はい
- Advanced: はい