グループ分析 (Grouping Analysis) (空間統計)

サマリー

フィーチャ属性およびオプションの空間的/時系列的制限に基づいてフィーチャをグループ化します。

レガシー:

このツールは非推奨のツールです。 このツールのアルゴリズムを強化し、分析法に新しい機能を追加しました。 新しいフィーチャや分析法を使いやすくするため、このツールに代わる 2 つのツールを新たに提供されています。 [空間的に制限された多変量クラスター分析 (Spatially Constrained Multivariate Clustering)] ツールを使えば、空間的に近接したグループを作成できます。 [多変量クラスター分析 (Multivariate Clustering)] ツールは、空間的制限がないグループの作成に使います。

Grouping Analysis diagram

使用法

    レガシー:

    ArcGIS Pro 2.1 では、この [グループ分析 (Grouping Analysis)] ツールのアルゴリズムを強化し、分析法に新しい機能を追加しました。 新しいフィーチャや分析法を使いやすくするため、[グループ分析 (Grouping Analysis)] ツールに代わる、2 つのツールを新たに開発しました。 [空間的に制限された多変量クラスター分析 (Spatially Constrained Multivariate Clustering)] ツールを使えば、空間的に近接したグループを作成できます。 [多変量クラスター分析 (Multivariate Clustering)] ツールは、空間的制限がないグループの作成に使います。

  • このツールは、分析で使用されるフィールドに加え、新しい整数フィールド SS_GROUP も使用して出力フィーチャクラスを生成します。 デフォルトでは SS_GROUP フィールドに基づいてレンダリングされ、各フィーチャがどのグループに属するかが見てわかります。 たとえば、グループ数を 3 に設定した場合、各レコードの SS_GROUP フィールドの値は 1、2、3 のいずれかになります。 [空間的制限] パラメーターで [空間的制限なし] を選択すると、出力フィーチャクラスに SS_SEED という新規のバイナリ フィールドが挿入されます。 SS_SEED フィールドには、グループを開始する始点として使用されたフィーチャが示されます。 SS_SEED フィールドのゼロ以外の値の数は、[グループ数] パラメーターに入力した値と一致します。

  • このツールでは、オプションとして、[出力レポート ファイル] パラメーターのパスを指定すると、PDF レポート ファイルを作成できます。 このレポートには、特定されたグループの特性を理解するために役立つさまざまなテーブルやグラフが含まれます。 PDF レポートへのパスは、ツールの実行パラメーターを要約するメッセージに含まれています。 このパスをクリックすると、レポート ファイルが開きます。 このメッセージにアクセスするには、[ジオプロセシング] ウィンドウでプログレス バーの上にカーソルを置くか、ポップアップ ボタンをクリックするか、メッセージ セクションを展開します。 ジオプロセシング履歴を介して、以前に実行した [グループ分析 (Grouping Analysis)] のメッセージにアクセスすることもできます。

    注意:

    レポート ファイルの作成には、かなりの処理時間がかかる場合があります。 したがって、[グループ分析 (Grouping Analysis)] では、グループのメンバーシップを示す [出力フィーチャクラス] が作成されますが、15 を超えるグループまたは変数を指定した場合、PDF レポート ファイルは作成されません。

  • [入力フィーチャクラス] が投影されていない場合 (つまり、座標が、度、分、および秒で与えられた場合)、または出力座標系が地理座標系に設定された場合、弦の測定値を使用して距離が計算されます。 弦距離の測定値が使用されるのは、少なくとも互いに約 30° の範囲内のポイントに対して、すばやく算出され、実際の測地距離に非常に近い推定値が得られるという理由からです。 弦距離は、扁平回転楕円体に基づいています。 地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。 弦距離は、メートル単位でレポートされます。

    注意:

    分析範囲が 30°を越えて広がる場合、必ずデータを投影してください。 30°を超える場合、弦距離は測地距離の良好な推定値にはなりません。

  • [一意の ID フィールド] を使用して、[出力フィーチャクラス] のレコードを元の入力フィーチャクラスのレコードにリンクします。 [一意の ID フィールド] には、各フィーチャに一意の値を指定する必要があるため、このフィールドは通常、フィーチャクラスで維持される永続的なフィールドでなければなりません。 データセットに [一意の ID フィールド] がない場合は、フィーチャクラス テーブルに新しい整数フィールドを追加して、フィールド値が FID/OID フィールドと等しくなるように計算されるように設定することで、簡単に作成できます。 [一意の ID フィールド] パラメーターに FID/OID フィールドを直接使用することはできません。

  • [分析フィールド] は数値である必要があり、多様な値を含んでいる必要があります。 変化のないフィールド (つまり、どのレコードも値が同じ) は解析から排除されますが、[出力フィーチャクラス] には含まれます。 [グループ分析 (Grouping Analysis)] ツールでは、カテゴリ フィールドがダミー変数 (あるカテゴリに属するすべてのフィーチャは値 1、それ以外のすべてのフィーチャはゼロ) として表される場合にカテゴリ フィールドを使用できます。

  • [グループ分析 (Grouping Analysis)] ツールによるグループ構築では、空間的または時間的制限を課すことも、課さないことも可能です。 一部のアプリケーションでは、作成したグループに隣接または近接要件を適用したくない場合があります。 そのような場合は、[空間的制限] パラメーターを [空間的制限なし] に設定します。

  • 一部の分析では、グループを空間的に隣接させたい場合があります。 隣接オプションは、ポリゴン フィーチャクラスに対して有効化され、グループの別のメンバーとエッジを共有している場合 ([隣接エッジのみ])、あるいはエッジまたは頂点を共有している場合 ([隣接エッジ コーナー]) にのみフィーチャが同じグループに属することができることを指定します。

  • [ドローネ三角形分割法] オプションおよび [K 最近隣内挿] オプションは、すべてのグループ メンバーが近隣であることを確保したい場合にポイント フィーチャまたはポリゴン フィーチャに対して有効です。 これらのオプションにより、他の少なくとも 1 つのフィーチャが Natural Neighbor (ドローネ三角形分割) または K 最近隣内挿である場合にのみフィーチャがグループに含まれることを指定します。 K は考慮する近傍数であり、[近傍数] パラメーターを使用して指定します。

  • 空間的制限と時間的制限の両方を使用してグループを作成するには、まず [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用してフィーチャ間の空間的および時間的リレーションシップを定義する空間ウェイト マトリックス ファイル (*.swm) を作成します。 次に、[空間的制限] パラメーターを [空間ウェイトをファイルから取得] に設定し、[空間ウェイト マトリックス ファイル] パラメーターを作成した SWM ファイルに設定して、[グループ分析 (Grouping Analysis)] を実行します。

  • フィーチャの Z 値を考慮する三次元グループを作成するには、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを、[Z 値を使用] パラメーターをオンにして使用し、まずフィーチャ間の 3D リレーションシップを定義する空間ウェイト マトリックス ファイル (*.swm) を作成します。 次に、[空間的制限] パラメーターを [空間ウェイトをファイルから取得] に設定し、[空間ウェイト マトリックス ファイル] パラメーターを作成した SWM ファイルに設定して、[グループ分析 (Grouping Analysis)] を実行します。

  • [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して、まず SWM ファイルを作成し、次に [空間ウェイト マトリックス ファイル] パラメーターにそのファイルのパスを指定することで、固定距離など、その他の [空間的制限] を適用することができます。

    注意:

    空間ウェイト マトリックス ファイル (SWM) ファイルを作成して空間的制限を定義できますが、実際にはウェイトは適用されません。 SWM はどのフィーチャが隣接であるか、近接であるかを定義します。 空間的制限を適用することにより、同じグループのメンバーとなることができるかできないかを決定します。 たとえば、[隣接エッジのみ] を選択すると、単一のグループ内のすべてのフィーチャはグループ内の別のフィーチャと共通する少なくとも 1 つのエッジを持ちます。 これにより、結果のグループは空間的隣接を維持します。

  • 空間的制限を定義すると、コンパクト、隣接、または近接グループが確保されます。 [分析フィールド] のリストに空間的変数を含めることにより、これらのグループ属性も利用しやすくなります。 空間的変数の例には、高速道路の入り口ランプまでの距離、求職先へのアクセス性、買い物への近さ、接続の手段、さらに座標系 (X, Y) があります。 時刻、曜日、または時間的距離を表す変数を含めることにより、グループ メンバー間の時間的緊密性を高めることができます。

  • フィーチャ群に明瞭な空間的パターンが見られるときは (空間的に明瞭に分離している 3 つのクラスターなど)、空間的に制限されたグループ化アルゴリズムは複雑になる可能性があります。 このため、グループ化アルゴリズムでは、まず明瞭に分離されているグループがあるかどうかを判定します。 指定した [グループ数] よりも分離グループの数の方が大きい場合、ツールは解を得ることができず、失敗し、該当するエラー メッセージが表示されます。 指定した [グループ数] と分離グループの数がまったく同じである場合、下の (A) に示すように、フィーチャの空間的構成のみをよりどころとしてグループ化がなされます。 分離グループの数よりも指定した [グループ数] が大きい場合、すでに判明している分離グループがグループ化の出発点となります。 たとえば、3 つの接続されていないグループがあり、指定した [グループ数]4 である場合、下の (B) に示すように 3 つのグループのいずれかを分割して 4 番目のグループが作成されます。

    切断されたグループ

  • 場合によっては、[グループ分析 (Grouping Analysis)] ツールは適用される空間的制限を満たすことができず、その結果、どのグループにも属さないフィーチャが出てきます (そのフィーチャの SS_GROUP 値は -9999 になり、内容のないレンダリングになります)。 これは近傍のないフィーチャがある場合に発生します。 これを回避するには、すべてのフィーチャが近傍を持つようになる [K 最近隣内挿法] を使用します。 [近傍数] パラメーターを増やすと、接続されていないグループの問題の解決に役立ちます。

  • 可能な限り多くの [分析フィールド] を含めたい傾向がありますが、このツールは単一の変数およびビルドで開始することにより最適に機能します。 分析フィールドの数が少ないほうが、結果の解析が容易になります。 また、フィールドの数が少ないと、どの変数が最適な区別を実行するか判断しやすくなります。

  • [空間的制限] パラメーターで [空間的制限なし] を選択した場合、[初期化方法] には、[シード ロケーションの検索][フィールドからシードを取得]、および [ランダム シードを使用] という 3 つのオプションを選択できます。 シードは、個々のグループを開始するときに使用されるフィーチャです。 たとえば、[グループ数] パラメーターに [3] を入力した場合、分析は 3 つのシード フィーチャで開始されます。 デフォルトのオプション、[シード ロケーションの検索] では、最初のシードはランダムに選択され、データ空間内で互いに遠く離れているフィーチャを表すシードが選択されていきます。 データ空間内で互いに異なる領域を補足する初期シードを選択すると、パフォーマンスが向上します。 それぞれのグループで表現したい個別の特性が、特定のフィーチャによって反映されている場合があります。 このようなケースでは、これらの個別のフィーチャを特定するシード フィールドを作成します。 作成するシード フィールドには、初期シード フィーチャ以外ではすべてゼロを指定する必要があり、初期シード フィーチャには値 [1] を指定する必要があります。次に、[初期化方法] パラメーターに [フィールドからシードを取得] を選択します。 ある種の感度分析を実行して、同じグループ内で常に見つかるフィーチャを確認したい場合は、[初期化方法] パラメーターに [ランダム シードを使用] オプションを選択します。 このオプションでは、すべてのシード フィーチャがランダムに選択されます。

    注意:

    ランダム シードを使用する場合は、乱数ジェネレーター環境設定で乱数ジェネレーターの実行を開始できるシードを選択することもできます。 ただし、このツールでは常に、乱数ジェネレーターとしてメルセンヌ ツイスターが使用されます。

  • [初期化フィールド] の値が [1] の場合、それはシードとして解釈されます。 シード フィーチャが [グループ数] よりも多い場合、シード フィーチャは [初期化フィールド] で識別されているシード フィーチャからランダムに選択されます。 シード フィーチャが [グループ数] で指定されている数よりも少ない場合は、[初期化フィールド] で識別されているシード フィーチャから (データ空間内で) 遠くなるように追加のシード フィーチャが選択されます。

  • データに最適な [グループ数] がわかっている場合があります。 わからない場合は、グループ数をいろいろと変えて試行し、グループの差別化に最適な数を見出す必要があります。 [グループの最適数の評価] パラメーターをオンにすると、2 から 15 までのグループ数でグループ化ソリューションについて疑似 F 統計が計算されます。 [グループ数] を決めるのに頼れる基準が他にない場合は、疑似 F 統計値が最大になる値を、グループ数として採用してください。 F 統計値が最大となるソリューションでは、同じグループに属するフィーチャ同士の相似性、違うグループに属するフィーチャ同士の相違性が両方とも最大になります。 オプションの [出力レポート ファイル] を指定すると、その PDF レポートには、グループ数が 2 〜 15 のソリューションの F 統計値を表すグラフが表示されます。

  • 分割された追加のグループが恣意的な結果となった場合、指定した [グループ数] に関係なく、ツールは停止します。 たとえば、データに 3 つの空間的にクラスタリングされたポリゴンと 1 つの分析フィールドが含まれているとします。 クラスター内のすべてのフィーチャに同じ分析フィールド値がある場合、いずれかのクラスターは、3 つのグループが作成された後に恣意的に分割されていることになります。 このような場合に 3 つ以上のグループを指定していても、ツールは 3 つのグループのみを作成します。 グループ内の少なくとも 1 つの分析フィールドの値に、ある程度のばらつきがある場合、分割によるグループの作成は継続します。

    グループはこれ以上作成されない
    分析フィールドの値にばらつきがない場合、グループは分割されません。

  • 分析に空間的または空間的時間的制限を含めると、疑似 F 統計を比較できます ([入力フィーチャ][分析フィールド] が変わらない限り)。 したがって、F 統計値を使用すると、最適な [グループ数] を算出できるだけでなく、最も効果的な [空間的制限] オプション、[距離計算の方法]、および [近傍数] の選択も容易になります。

  • [空間的制限] パラメーターに [空間的制限なし] を選択し、[初期化方法][シード ロケーションの検索] または [ランダム シードを使用] を選択したときにフィーチャをグループ化するために使用される K 平均アルゴリズムは、ヒューリスティクスを組み込み、(同じデータを使用し、同じツール パラメーターを使用しても) ツールを使用するたびに異なる結果を返す可能性があります。 これは、グループの出発点とする初期シード フィーチャを見つける過程にランダムな要素があるためです。

  • 空間的制限を適用するとランダムな要素はなくなります。このため、単一の疑似 F 統計をグループ 2 からグループ 15 について計算でき、算出された最大 F 統計値を使用して、分析に最適な [グループ数] を決定できます。 ただし、[空間的制限なし] オプションはヒューリスティック ソリューションであるため、グループの最適な数を決定するにはさらに込み入った作業が必要になります。 初期シード フィーチャが異なるため、F 統計はツールを実行するたびに異なる可能性があります。 ただし、データに個別パターンが存在するときは、個々の実行によって得られるソリューションの一貫性が高くなります。 このため、[空間的制限なし] オプションを選択したときに最適なグループ数を決定しやすいように、ツールは 2、3、4 から 15 グループまで 10 回のグループ化分析を行います。 次に、これら 10 個のソリューションの分布に関する情報が報告され (最小値、最大値、平均値、および中央値)、分析に最適なグループ数の決定に役立てられます。

  • [グループ分析 (Grouping Analysis)] ツールは、カスタム モデルやスクリプトで使用できる 3 つの派生した出力値を返します。 これらは、[グループ数] の疑似 F 統計 (Output_FStat)、グループ数 2 から 15 までの最大の疑似 F 統計 (Max_FStat)、最大の疑似 F 統計値に関連付けられたグループ数 (Max_FStat_Group) です。 [グループの最適数の評価] を選択しないと、派生したすべての出力変数が None に設定されます。

  • 一連のフィーチャに割り当てられるグループ番号は実行するたびに変わる可能性があります。 たとえば、所得の変数に基づいてフィーチャを 2 つのグループに分けるとします。 初回の分析では、高所得フィーチャ群が「グループ 2」、低所得フィーチャ群が「グループ 1」とラベル付けされ、2 回目の分析では、高所得フィーチャ群が「グループ 1」とラベル付けされます。[空間的制限なし] を指定すると、解析を実行するごとに、中所得フィーチャ群の一部が高所得グループと低所得グループの間を行ったり来たりする可能性があります。

  • 作ろうと思えば大量のグループを作れますが、ほとんどのシナリオでは、フィーチャを分けるのに必要なグループはほんの 2、3 個です。 大量のグループがあるとグラフやマップの解釈が困難になるため、[グループ数] パラメーターに [15] を超える値を入力したり、15 を超える [分析フィールド] を選択すると、レポートは作成されません。 ただし、このグループの最大数の制限を増やすことができます。

    詳細:

    [グループ分析 (Grouping Analysis)] ツールの Python ソース コードを使用できるため、必要に応じて、15 変数/15 グループのレポート制限を無効にすることができます。 この上限は、Partition.py スクリプト ファイルと空間統計ツールボックス内のツールの整合チェック コードの両方にある 2 つの変数によって設定されます。

    maxNumGroups = 15
    maxNumVars = 15

  • [出力レポート ファイル] の詳細については、「グループ分析 (Grouping Analysis) の詳細」をご参照ください。

パラメーター

ラベル説明データ タイプ
入力フィーチャ

グループを作成するフィーチャクラスまたはフィーチャ レイヤー。

Feature Layer
一意の ID フィールド

入力フィーチャクラスのすべてのフィーチャで値が異なる整数フィールドです。個別値フィールドがない場合は、整数フィールドをフィーチャクラス テーブルに追加し、FID/OBJECTID フィールドに等しいフィールド値を計算することによって、作成できます。

Field
出力フィーチャクラス

新規に作成された出力フィーチャクラス。すべてのフィーチャ、指定した分析フィールド、および各フィーチャが属しているグループを示すフィールドが含まれています。

Feature Class
グループ数

作成するグループの数。 15 グループを超えると、[出力レポート] パラメーターは無効になります。

Long
分析フィールド

グループを別のグループと区別するために使用するフィールドのリスト。 15 フィールドを超えると、[出力レポート] パラメーターは無効になります。

Field
空間的制限

作成したグループをフィーチャ間の空間リレーションシップによって制限するかどうかとその方法を指定します。

  • 隣接エッジのみグループには隣接ポリゴン フィーチャが入ります。 エッジを共有するポリゴンのみが同じグループに属することができます。
  • 隣接エッジ コーナーグループには隣接ポリゴン フィーチャが入ります。 エッジまたは頂点を共有するポリゴンのみが同じグループに属することができます。
  • ドロネー三角形分割同じグループ内のフィーチャは、グループ内の別のフィーチャと共通の少なくとも 1 つの Natural Neighbor を持ちます。 Natural Neighbor リレーションシップはドローネ三角形分割に基づきます。 概念的に、ドローネ三角形分割はフィーチャの重心から三角形の重複しないメッシュを作成します。 各フィーチャは 1 個の三角形ノードです。エッジを共有しているノード同士は、互いに近傍と見なされます。
  • K 近傍同じグループ内のフィーチャは互いに近くにあります。各フィーチャはグループ内の他の少なくとも 1 つのフィーチャの近傍になります。 近傍リレーションシップは、[近傍数] パラメーターに整数値 K を指定した最近隣の K フィーチャに基づきます。
  • 空間ウェイトをファイルから取得空間リレーションシップおよびオプションの時系列リレーションシップは、空間ウェイト ファイル (*.swm) により定義されます。 [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して、空間ウェイト マトリックス ファイルを作成します。
  • 空間制限なしフィーチャはデータの空間近接性のみを使用してグループ化されます。 フィーチャは、同じグループに属するために空間的または時間的に互いに近くにある必要はありません。
String
距離計算の方法
(オプション)

各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。

  • ユークリッド2 つのポイント間の直線距離 (最短距離)。
  • マンハッタン直角の軸 (街区) に沿って計測した 2 つのポイント間の距離。X 座標と Y 座標の間の (絶対) 距離を合計して計算します。
String
近傍数
(オプション)

このパラメーターは、[空間的制限] パラメーターが [K 最近隣内挿] であるか、いずれかの隣接方法 ([隣接エッジのみ] または[隣接エッジ コーナー]) である場合に有効になります。 デフォルトの近傍数は 8 です。[K 近傍]2 より小さい数を指定することはできません。 この値は、グループを作成するときに考慮される最近隣候補の正確な数を反映します。 そのグループ内の他のいずれかのフィーチャが K 最近隣でない限り、フィーチャはグループに含まれません。 [隣接エッジのみ] および [隣接エッジ コーナー] のデフォルトは、0 です。 隣接方法の場合、考慮される近隣候補の正確な数を反映します。 指定された [近傍数] よりも少ない数のフィーチャに対して追加される近傍フィーチャは、フィーチャの中心点との近接度に基づきます。

Long
ウェイト マトリックス ファイル
(オプション)

フィーチャ間の空間リレーションシップを指定する空間ウェイトが含まれたファイルへのパス。

File
初期化方法
(オプション)

選択した [空間的制限] パラメーターが [空間制限なし] である場合は、初期シードを取得する方法を指定します。 シードはグループを成長させるために使用されます。 たとえば、グループ数を 3 と指定すると、分析は 3 つのシードで開始されます。

  • シード ロケーションを選択シード フィーチャはパフォーマンスを最適化するために選択されます。
  • シードをフィールドから取得初期化フィールドのゼロ以外の値は、グループを開始する始点として使用されます。
  • ランダム シードを使用初期シード フィーチャはランダムに選択されます。
String
初期化フィールド
(オプション)

シード フィーチャを識別する数値フィールド。 このフィールドが 1 であるフィーチャがグループの出発点として使用されます。

Field
出力レポート ファイル
(オプション)

グループの特性を要約して作成される PDF レポート ファイルの絶対パス。 このレポートは、各グループの特性を理解するときに役立つ複数のグラフを含んでいます。 レポート ファイルの作成には、かなりの処理時間がかかる場合があります。

File
グループの最適数の評価
(オプション)

ツールでグループの最適な数 (2 〜 15) を評価するかどうかを指定します。

  • オン - 2 〜 15 のグループ数を評価します。
  • オフ - グループ数の評価を行いません。 これがデフォルトです。
Boolean

派生した出力

ラベル説明データ タイプ
F 統計

出力疑似 F 統計値。

Double
最大 F 統計グループ

最大疑似 F 統計値に関連付けられたグループの数。

Long
最大 F 統計

グループ 2 ~ 15 の最大疑似 F 統計。

Double

arcpy.stats.GroupingAnalysis(Input_Features, Unique_ID_Field, Output_Feature_Class, Number_of_Groups, Analysis_Fields, Spatial_Constraints, {Distance_Method}, {Number_of_Neighbors}, {Weights_Matrix_File}, {Initialization_Method}, {Initialization_Field}, {Output_Report_File}, {Evaluate_Optimal_Number_of_Groups})
名前説明データ タイプ
Input_Features

グループを作成するフィーチャクラスまたはフィーチャ レイヤー。

Feature Layer
Unique_ID_Field

入力フィーチャクラスのすべてのフィーチャで値が異なる整数フィールドです。個別値フィールドがない場合は、整数フィールドをフィーチャクラス テーブルに追加し、FID/OBJECTID フィールドに等しいフィールド値を計算することによって、作成できます。

Field
Output_Feature_Class

新規に作成された出力フィーチャクラス。すべてのフィーチャ、指定した分析フィールド、および各フィーチャが属しているグループを示すフィールドが含まれています。

Feature Class
Number_of_Groups

作成するグループの数。 15 グループを超えると、[出力レポート] パラメーターは無効になります。

Long
Analysis_Fields
[analysis_field,...]

グループを別のグループと区別するために使用するフィールドのリスト。 15 フィールドを超えると、[出力レポート] パラメーターは無効になります。

Field
Spatial_Constraints

作成したグループをフィーチャ間の空間リレーションシップによって制限するかどうかとその方法を指定します。

  • CONTIGUITY_EDGES_ONLYグループには隣接ポリゴン フィーチャが入ります。 エッジを共有するポリゴンのみが同じグループに属することができます。
  • CONTIGUITY_EDGES_CORNERSグループには隣接ポリゴン フィーチャが入ります。 エッジまたは頂点を共有するポリゴンのみが同じグループに属することができます。
  • DELAUNAY_TRIANGULATION同じグループ内のフィーチャは、グループ内の別のフィーチャと共通の少なくとも 1 つの Natural Neighbor を持ちます。 Natural Neighbor リレーションシップはドローネ三角形分割に基づきます。 概念的に、ドローネ三角形分割はフィーチャの重心から三角形の重複しないメッシュを作成します。 各フィーチャは 1 個の三角形ノードです。エッジを共有しているノード同士は、互いに近傍と見なされます。
  • K_NEAREST_NEIGHBORS同じグループ内のフィーチャは互いに近くにあります。各フィーチャはグループ内の他の少なくとも 1 つのフィーチャの近傍になります。 近傍リレーションシップは、Number_of_Neighbors パラメーターに整数値 K を指定した最近隣の K フィーチャに基づきます。
  • GET_SPATIAL_WEIGHTS_FROM_FILE空間リレーションシップおよびオプションの時系列リレーションシップは、空間ウェイト ファイル (*.swm) により定義されます。 [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して、空間ウェイト マトリックス ファイルを作成します。
  • NO_SPATIAL_CONSTRAINTフィーチャはデータの空間近接性のみを使用してグループ化されます。 フィーチャは、同じグループに属するために空間的または時間的に互いに近くにある必要はありません。
String
Distance_Method
(オプション)

各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。

  • EUCLIDEAN2 つのポイント間の直線距離 (最短距離)。
  • MANHATTAN直角の軸 (街区) に沿って計測した 2 つのポイント間の距離。X 座標と Y 座標の間の (絶対) 距離を合計して計算します。
String
Number_of_Neighbors
(オプション)

このパラメーターは、Spatial_Constraints パラメーターが K_NEAREST_NEIGHBORS であるか、いずれかの隣接方法 (CONTIGUITY_EDGES_ONLY または CONTIGUITY_EDGES_CORNERS) である場合に指定できます。 デフォルトの近傍数は 8 です。K_NEAREST_NEIGHBORS2 より小さい数を指定することはできません。 この値は、グループを作成するときに考慮される最近隣候補の正確な数を反映します。 そのグループ内の他のいずれかのフィーチャが K 最近隣でない限り、フィーチャはグループに含まれません。 CONTIGUITY_EDGES_ONLY および CONTIGUITY_EDGES_CORNERS のデフォルトは、0 です。 隣接方法の場合、考慮される近隣候補の正確な数を反映します。 指定された Number_of_Neighbors よりも少ない数のフィーチャに対して追加される近傍フィーチャは、フィーチャの中心点との近接度に基づきます。

Long
Weights_Matrix_File
(オプション)

フィーチャ間の空間リレーションシップを指定する空間ウェイトが含まれたファイルへのパス。

File
Initialization_Method
(オプション)

選択した Spatial_Constraint パラメーターが NO_SPATIAL_CONSTRAINT である場合は、初期シードを取得する方法を指定します。 シードはグループを成長させるために使用されます。 たとえば、グループ数を 3 と指定すると、分析は 3 つのシードで開始されます。

  • FIND_SEED_LOCATIONSシード フィーチャはパフォーマンスを最適化するために選択されます。
  • GET_SEEDS_FROM_FIELD初期化フィールドのゼロ以外の値は、グループを開始する始点として使用されます。
  • USE_RANDOM_SEEDS初期シード フィーチャはランダムに選択されます。
String
Initialization_Field
(オプション)

シード フィーチャを識別する数値フィールド。 このフィールドが 1 であるフィーチャがグループの出発点として使用されます。

Field
Output_Report_File
(オプション)

グループの特性を要約して作成される PDF レポート ファイルの絶対パス。 このレポートは、各グループの特性を理解するときに役立つ複数のグラフを含んでいます。 レポート ファイルの作成には、かなりの処理時間がかかる場合があります。

File
Evaluate_Optimal_Number_of_Groups
(オプション)
  • EVALUATE2 〜 15 のグループ数を評価します。
  • DO_NOT_EVALUATEグループ数の評価を行いません。 これがデフォルトです。
Boolean

派生した出力

名前説明データ タイプ
Output_FStat

出力疑似 F 統計値。

Double
Max_FStat_Group

最大疑似 F 統計値に関連付けられたグループの数。

Long
Max_FStat

グループ 2 ~ 15 の最大疑似 F 統計。

Double

コードのサンプル

GroupingAnalysis の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、GroupingAnalysis 関数の使用方法を示しています。

import arcpy
arcpy.env.workspace = r"C:\GA"
arcpy.stats.GroupingAnalysis("Dist_Vandalism.shp", "TARGET_FID", "outGSF.shp", 
                             "4", "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",
                             "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", "", 
                             "FIND_SEED_LOCATIONS", "", "outGSF.pdf", 
                             "DO_NOT_EVALUATE")
GroupingAnalysis の例 2 (スタンドアロン スクリプト)

次のスタンドアロン Python スクリプトは、GroupingAnalysis 関数の使用方法を示しています。


# Grouping Analysis of Vandalism data in a metropolitan area
# using the Grouping Analysis Tool

# Import system modules
import arcpy
import os

# Set geoprocessor object property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

try:
    # Set the current workspace (to avoid having to specify the full path to
    # the feature classes each time)
    arcpy.env.workspace = r"C:\GA"

    # Join the 911 Call Point feature class to the Block Group Polygon feature 
    # class
    # Process: Spatial Join
    fieldMappings = arcpy.FieldMappings()
    fieldMappings.addTable("ReportingDistricts.shp")
    fieldMappings.addTable("Vandalism2006.shp")

    sj = arcpy.SpatialJoin_analysis("ReportingDistricts.shp", 
                                    "Vandalism2006.shp", "Dist_Vand.shp", 
                                    "JOIN_ONE_TO_ONE", "KEEP_ALL", 
                                    fieldMappings, "COMPLETELY_CONTAINS")
    
    # Use Grouping Analysis tool to create groups based on different variables 
    # or analysis fields
    # Process: Group Similar Features  
    ga = arcpy.stats.GroupingAnalysis("Dist_Vand.shp", "TARGET_FID", 
                                      "outGSF.shp", "4", 
                                      "Join_Count;TOTPOP_CY;VACANT_CY;UNEMP_CY",
                                      "NO_SPATIAL_CONSRAINT", "EUCLIDEAN", "", 
                                      "", "FIND_SEED_LOCATIONS", "",
                                      "outGSF.pdf", "DO_NOT_EVALUATE")

    # Use Summary Statistic tool to get the Mean of variables used to group
    # Process: Summary Statistics
    SumStat = arcpy.Statistics_analysis("outGSF.shp", "outSS", 
                                        [["Join_Count", "MEAN"], 
                                         ["VACANT_CY", "MEAN"], 
                                         ["TOTPOP_CY", "MEAN"], 
                                         ["UNEMP_CY", "MEAN"]], 
                                        "GSF_GROUP")

except:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

環境

特殊なケース

出力座標系

フィーチャ ジオメトリは分析に先立って出力座標系に投影されます。すべての数学的演算は、出力座標系の空間参照に基づいて実行されます。[出力データの座標系] が度、分、および秒に基づく場合、測地距離は弦距離を使用して推定されます。

乱数ジェネレーター

使用される乱数ジェネレーターのタイプは常にメルセンヌ ツイスターです。

ライセンス情報

  • Basic: Yes
  • Standard: Yes
  • Advanced: Yes