[ポイント集約のビン サイズを評価 (Evaluate Bin Sizes for Point Aggregation)] ツールを使用することで、テッセレーション配置の正方形または六角形のビンにポイント数を集約する際の、適切なビン サイズを選択することができます。 このツールでは、他のさまざまなビン サイズを評価して、代わりに他のビン サイズを使用した場合に集計とパターンの結果がどのように変化するかを調べることもできます。

緊急通報、サービス停止、動物の目撃を集約するなど、ポイントをビンに集約して集計することは、GIS の一般的なワークフローです。 これは、多数のポイントの塊をわかりやすく示したり、個々のポイントの位置をぼかすことでプライバシーを保護したりするときにも使用されます。 しかしながら、多くの用途があるにもかかわらず、これらのビンの大きさに関する指針はほとんどありません。 実際には、ビン サイズは都合に合わせて (切りのよい数を使用するなど) 選択したり、結果の見た目が最もよくなるビン サイズにすることがよくあります。 しかし、どのスケールを選択するかによって、何を検出できるかと、それをどのように解釈するかが変わるため (可変単位地区問題の一例)、正当で再現性のある決定を行うことが重要です。 結果のポイント数がビン サイズにどの程度左右されるか (使用するビンのサイズが変わるとパターンや結論が変わるか) を明らかにすることも重要です。
基本的に、ビンへのポイント データの集約に適切なビン サイズを決定することはスケールの問題です。 小さすぎるビンはほとんど空で数に一貫性がなくなり、大きすぎるビンは重要な局所的パターンがぼかされたり隠されたりします。 適切なビン サイズとは、多種多様なポイント数を生成するのに十分に大きく (空の多数のビンと多数のポイントが入る少数のビンとはならない)、ポイントの局所的パターンが (集約によって取り除かれることなく) 結果のビンに残る程度に小さいサイズです。
適切なビン サイズを決定するため、内部の均一性とポイント数の多様性という 2 つの基準を使用して、さまざまな候補のビン サイズを評価します。 内部の均一性という評価基準では、各ビン内のポイントが空間的にランダムになる傾向があるかどうかを評価し、ほとんどの場合、より小さいビン サイズが好まれます。 これに対し、ポイント数の多様性という評価基準では、結果のビンがどれだけ均等に分布しているかを評価し、ほとんどの場合、より大きいビン サイズが好まれます。

この 2 つの評価基準 (どちらも値は 0 ~ 1 の間) を掛け合わせることでビン サイズごとに 1 つの評価スコアが生成され、評価スコアが最も高いビン サイズがこのツールによって推奨されます。 評価スコアの曲線から、このツールによって推奨されたビン サイズと比べて他のビン サイズではどの程度違うかを確認することができます。

評価スコアとその計算方法の詳細については、以下の「ビン サイズ評価の詳細」セクションをご参照ください。
適切な集約境界の定義
集約対象のポイントを提供するだけでなく、[集約境界] パラメーターを使用して、ポイントが集約されてビンが作成されるエリアも定義する必要があります。 集約境界 (分析範囲または対象地域とも呼ぶ) として、ポイントが発生して記録されうるエリアを定義する必要があります。 たとえば、ある市における緊急通報を集約する場合、緊急通報は市内のどこかから発信され、市外からの通報はデータセットに含まれないため、その市の境界線を集約境界として使用します。 ビンを作成してから集約境界でクリップしたくなりがちですが、むしろ境界の方が評価スコアと推奨ビン サイズに大きな影響を与えます。 不適切な集約境界を選択すると、推奨ビン サイズが非現実的に大きくなるか小さくなるため、どの境界が自分のデータに最も適しているか検討することを強くおすすめします。
このツールでは、あるエリアでたまたまインシデントが発生しなかったからポイントがないのか (特定の週に市のセクションで強盗事件が発生しなかった場合など)、あるいはそのエリアでポイントを観測することが不可能であるからなのか (クジラを陸上で目撃するなど) を区別できる必要があるため、ポイントが発生しうる場所と発生しえない場所を定義する境界を指定することが重要です。 このツールはビンの結果のポイント数の多様性を評価するため、数 0 は他の数と同程度に重要であり、ポイントなしのビンの比率が高くなるビン サイズは回避されます。 実際には、これは、集約境界が大きすぎる (ポイントが記録されないエリアが多数含まれている) 場合、ギャップを埋めて空のビンの数を減らすために推奨ビン サイズが非現実的に大きくなることを意味します。 これに対し、分析範囲が小さすぎる場合、このツールではポイントなしのビンの数を増やすため、より小さいビン サイズが推奨されます。
ポイントに適した集約境界がわかっている場合 (市の境界線など)、[カスタム ポリゴン] オプションを選択し、[カスタム ポリゴン] パラメーターで境界を指定します。 対話型フィーチャ入力を使用して、集約境界を対話形式で描画することもできます。
適切な集約境界が不明である場合、[凹包]、[凸包]、または [エンベロープ] オプションを使用して、境界を自動的に作成できます (詳細については [ジオメトリーの最小範囲 → ポリゴン (Minimum Bounding Geometry)] を参照)。 自動的に作成された境界を使用する場合、その境界がポイントを十分に表しているかどうかを必ず目で確認する必要があります。 境界が適切でない場合は、別のオプションを使用するか、ポイントをより適切に表す境界を対話形式で描画します。
以下の図は、同じデータで [集約境界] パラメーターのすべてのオプションを使用したときの結果のビン サイズを示しています。 カスタム オプションでは、ポイントが収集された実際の境界が使用されています。 その他のデータセット (特に空間的外れ値を含むもの) では、結果のビン サイズとパターンの違いがさらに極端になることがあります。

ツールの出力
このツールでは 3 つの出力が作成され、これらは同じグループ レイヤーに格納されます。 1 つ目の出力は、推奨ビン サイズを使用した集約ビンのポリゴン フィーチャクラスです。 このレイヤーは各ビン内のポイント数によってシンボル表示されます。
2 つ目の出力は、このツールで使用された集約境界のポリゴン フィーチャクラスです。 この出力は、境界の形状を把握するため、凹包オプションと凸包オプションで最も役立ちます。 3 つ目の出力は、このツールでテストされたすべてのビン サイズの評価スコアが格納されているテーブルです。 このテーブルには、ビン サイズの調査に使用可能な 2 つのチャートが付属しています。
ビン サイズ間の評価スコアのチャート
[ビン サイズ間の評価スコア] チャートには、テストされたすべてのビン サイズの評価スコアが表示されます。 チャート内の青色のポイントは、そのビン サイズの未処理の評価スコアであり、スプラインによってスムージングされます (青色の曲線)。 青色の曲線の最も大きい値が推奨ビン サイズであり、オレンジ色の縦線で示されています。 推奨ビン サイズの周囲には薄いオレンジ色の信頼領域も表示されており、この範囲内にあるビン サイズは推奨ビン サイズと比べて評価スコアがそれほど低くないため、この範囲内の値を選択すれば (切りのよい数値を選択するなど) 評価スコアが大きく下がることはありません。

このチャートの下部には、推奨ビン サイズと、各ビンの関連エリアが表示されています。 正方形のビンの場合、ビン サイズは各正方形の幅または高さであり、六角形の場合、ビン サイズは各六角形の高さ (あるフラットなエッジから反対側のフラットなエッジまでの距離) です。
注意:
テストされる最も小さいビン サイズ (x 軸の最小値) は、各入力ポイントでビンの数が 20 になるサイズであり (つまり、ビンが小さくてその 95% 以上のビンにはポイントが含まれない)、最も大きいビン サイズ (x 軸の最大値) は、x または y の範囲のいずれか大きい方の 25% です。 このツールでは、最小値から最大値までの範囲で均等に増分された 100 種類のビン サイズがテストされます。
ビン サイズ間の内部の均一性とポイント数の多様性のチャート
[ビン サイズ間の内部の均一性とポイント数の多様性] チャートには、評価スコアを生成する際に組み合わせて使用された 2 つの基準が表示されます。 テストされたビン サイズごとに、緑色の曲線は内部均一性のスコアを示し、紫色の曲線はポイント数の多様性のスコアを示しています。 通常、緑色の曲線は下降し、紫色の曲線は上昇します。 推奨ビン サイズと信頼区間も背景情報として表示されます。 推奨ビン サイズでは、通常、どちらの基準も妥当なスコアになり、これは、対立する基準の間でうまくバランスがとれていることを示しています。 各基準の詳細については、以下の「ビン サイズ評価の詳細」セクションをご参照ください。

ジオプロセシング メッセージ
このツールのメッセージには、[結果サマリー] セクションと [集約サマリー] セクションがあります。 結果のサマリーには、推奨ビン サイズと関連するビン エリアが表示されます。 六角形の場合、各六角形の辺の長さも表示されます。 集約サマリーには、ポイント数、ビン数、平均ポイント数、集約境界の面積など、結果のビンとポイント数のさまざまなサマリー統計が表示されます。
ベスト プラクティスおよび制限
このツールを使用する際のベスト プラクティスと制限を次に示します:
このツールは、ポイントの集約に適したビン サイズが 1 つ存在することを前提としています。 ただし、多くの場合、集約境界全体にわたってポイントを適切に表す 1 つのビン サイズが存在するわけではありません。 たとえば、人口密度が低い農村部と人口密度が高い都市部がある大きな郡では、郡全体で緊急通報を集約するのは困難な場合があります。 都市部を表すのに十分に小さいビンは農村部ではほぼ空になるのに対し、農村部に十分な大きさのビンでは都心はほんの数個のビンに集約されてしまいます。 この問題の一般的な兆候として、推奨ビン サイズの周囲の信頼区間が非常に広くなり、これは使用するビン サイズについての高い不確実性を示しています。 解決策の 1 つとしては、ポイントを複数のデータセットに分割し、異なるビン サイズを使用してこれらを別々に集約します。
- このツールは、単純なカートグラフィック スムージングを行うためではなく、結果のポイント数を使用して、ある種の分析 (ホット スポット分析やローカル外れ値分析など) を実行する場合に最も適しています。 このツールは表示を改善するために多数のポイントの塊をスムージングすることにも使用されますが、このツールの主な目的は、ポイントの空間構造が最も維持される集約ビンを作成し、分析の助けとなるポイント数を生成することにあります。
- 多数の一致ポイントがある (同じ座標に複数のポイントがある) 場合、非現実的なビン サイズになることがあります。 このツールは、入力ポイントのいずれかが一致している場合、警告を返します。
ビン サイズ評価の詳細
大まかに言うと、このツールでは、内部の均一性とポイント数の多様性という 2 つの評価基準を使用して、一定範囲のビン サイズを評価します。 評価基準ごとに各ビン サイズに 0 ~ 1 のスコアが与えられ、これらの値を掛け合わせて、両方の基準のバランスがとれた最終的な評価スコアが生成されます。 内部の均一性という評価基準では、通常は、より小さいビン サイズが好まれるのに対し、ポイント数の多様性という評価基準では、通常は、より大きなビン サイズが好まれるため、評価スコアが最も高いビン サイズとは、対立する基準の間で最も折り合いがつく、中間にあるビン サイズのことになります。 以下の各セクションでは、この 2 つの基準についてさらに詳しく説明します。
内部の均一性
内部の均一性という評価基準では、ポイントが結果のビン内に均一に分布しているかどうかが評価されます。 たとえば、以下の図において、左側のビン内のポイントは 1 つのコーナーに密集していますが、右側のビンではポイントがランダムかつ均一に分散しているため、右側のビンの方が内部の均一性は高くなっています。

内部の均一性は、重要な局所的パターンが隠れてしまうビン サイズを選択しないようにするために重要です。 ビン内のポイントが強いクラスターまたはパターンを形成している場合、単なる数としてこれらを集約すると判断を誤る可能性があります。 この評価基準では、各ビン内のポイントがランダムに配置されている (そのビンが内部のポイントの偏りない代表的なサマリーであることを示す) かどうかチェックされます。 多数のビンが構造化パターンを示している場合、これは、ビン サイズが大きすぎて、ビン内の重要なパターンが隠されていることの現れです。
この評価基準はビンごとに空間完全ランダム性をテストすることによって計算され、その値は、p 値が 0.05 より大きい (つまり、クラスターとして検出されなかった) ビンの比率です。 空のセルは空間的にランダムかクラスターか分類できないため、ポイントがないビンはこの比率に含まれません。
空間完全ランダム性のテストでは、各ビンがいくつかの小さいビンに分割されます。 正方形の場合、ビンは 25 個の小さい正方形に分割され、六角形の場合、ビンは 24 個の三角形に分割されます。 正方形または三角形内のポイント数の均一性が、カイ二乗適合度検定を使用してテストされます。
ポイント数の多様性
ポイント数の多様性の評価基準では、ビン全体におけるポイント数の多様性が定量化されて、数の値が多様になるビン サイズが好まれ、空のビンの比率が高くなって少数のビンに多数のポイントが入るビン サイズは回避されます。 概念上、これによって情報は豊かなものとなり、集約によってポイント数に意味のあるバリエーションと多様性が与えられるべきであるという考えを反映しています。ポイント数に対して分析 (ホット スポット分析など) を実行しようとする場合には特にこのことが望まれます。 実際には、ビンが大きくなるほど、数がより多様で均等に分布する傾向があるため、この評価基準ではビン サイズが大きくなる傾向があります。
たとえば、以下の図では、下側のビンの方が上側のビンよりもポイント数が多様で均等に分布しているため、下側のビンの方がポイント数の多様性のスコアは高くなります。 一般に、ポイント数の分布が一様 (フラットな) 分布に近くなるほど、このスコアは高くなります。

この評価基準は正規化シャノン エントロピー メジャーを使用して計算されます。 ビン サイズごとに、ビン数の分布が 5 つの等間隔に分割され、この分布のエントロピーが計算されます。 このエントロピーが一様分布のエントロピーによって除算され、0 ~ 1 の間のスコアが計算されます。
注意:
内部の均一性のスコアとポイント数の多様性のスコアは、ビン サイズごとに完全なテッセレーションを構築するのではなく、集約境界内のランダムな正方形または六角形をシュミレートすることによって生成されます。 これにより、処理速度は向上しますが、このツールを再度実行すると結果は若干異なります。 ただし、乱数ジェネレーター環境を使用することで、再現可能な結果を得ることができます。 平均で集約境界の 75% がシミュレーションでカバーされるように、各ビン サイズでシミュレートされるポリゴンの数が計算されます。
ブートストラップ信頼区間
チャートに示されている推奨ビン サイズの周囲のオレンジ色の信頼区間はブートストラップを使用して構築されています。 このプロセスでは、評価スコアが復元抽出によってランダムにリサンプリングされ、リサンプリングされた評価スコアのセットごとにスプラインが推定されます。 リサンプリングのたびに、元の推奨ビン サイズの評価スコアが記録され、5 パーセンタイルが計算されます。 評価スコアがこの値を上回るビン サイズはすべて信頼区間に含まれます。 このようなビン サイズは、評価スコアが、このツールによって推奨されたビン サイズの評価スコアを大きく下回ることがないと解釈することができます。
H3 六角形
このツールでは、H3 六角形には集約できません。 ただし、六角形に集約する場合、関連する H3 解像度を [ビン サイズ間の評価スコア] チャートにガイドとして表示できます。 デフォルトでは、ガイドは無効になっていますが、[チャート プロパティ] ウィンドウの [ガイド] タブで有効にすることができます。

ガイド (灰色の破線の縦線) を有効にした場合、テストされたビン サイズの範囲内にある H3 解像度の評価スコアを確認し、自分のデータに最適なものを選択することができます。 たとえば、以下の図では、H3 解像度 4 は評価スコアが最も高く、推奨ビン サイズに最も近く、信頼区間内にあります。

参考文献
このツールの実装には以下の参考文献が用いられています。
- Ramos, Rafael G. 2025. "Finding an Adequate Areal Unit to Map Crime: A Spatial Data Perspective." New Research in Crime Modeling and Mapping Using Geospatial Technologies (pp. 27-44). Cham: Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-81580-5_2.