ジオデータベースのインデックス

インデックスは、クエリーのパフォーマンスの向上、特にデータ取得操作の高速化に重要な役割を果たします。 次の表は、属性インデックス、フルテキスト インデックス、空間インデックスを比較したものです。

インデックス タイプ説明優先フィールドのデータ タイプ使用例メリットデメリット

属性インデックス

属性インデックスは、属性値に基づいてレコードをすばやく検索することで、データの取得を高速化するデータ構造です。

属性フィールドの一般的なデータ タイプには次のようなものがあります。

  • 数値タイプ (整数、浮動小数点)
  • テキスト (文字列)
  • 日付

属性インデックスを使用すると、データセット全体のスキャンを行わずにレコードを高速に取得できるため、データ解析におけるクエリーの最適化とフィルタリングの強化に役立ちます。 たとえば、世界の地震データをフィルターして、過去 5 年間のマグニチュード 6 以上の地震のみを表示できます。

属性インデックスによって、特に大規模なデータセットにおいて、クエリーのパフォーマンスとデータの取得速度が大幅に向上します。

属性インデックスには追加のストレージ領域が必要であり、基になるデータに大幅な変更が加えられるたびにインデックスを更新する必要があるため、データの変更が遅くなる可能性があります。

フルテキスト インデックス

フルテキスト インデックスは、個々の単語やフレーズのインデックスを作成することで、自然言語のテキスト データ内での効率的な検索を実現する特殊なインデックスです。

一般的なテキストベースの属性フィールドのデータ タイプには次のようなものがあります。

  • 文字列
  • テキスト
  • CLOB
  • CHAR
  • VARCHAR
  • VARCHAR2

フルテキスト インデックスは、テキストを検索可能なトークンに分解して、すばやく効率的な検索を可能にします。 これは、犯罪レポートでキーワード (住居侵入、暴行など) を解析して、法執行機関がトレンドとホットスポットを特定するのに役立てるなどのタスクに特に役立ちます。

フルテキスト インデックスによって、検索の速度と精度が向上し、フレーズ検索などの複雑なクエリーがサポートされます。

フルテキスト インデックスには特定のデータベース構成が必要であり、ストレージのニーズが増大する可能性があり、データの変更に応じて保守するために追加の処理時間が必要になる場合があります。

空間インデックス

ArcGIS Pro では、空間インデックスは、道路地図のロケーター グリッドに似た、フィーチャクラス内のフィーチャの範囲全体を覆うグリッドベースのシステムです。これにより、フィーチャの識別、選択、画面移動、拡大などの空間クエリーのパフォーマンスが向上します。

一般的な空間データ タイプには次のようなものがあります。

  • ポイント
  • ライン
  • ポリゴン

空間インデックスによって、空間クエリーのパフォーマンスが向上します。 たとえば、都市の公園の場所が数千ある場合、空間インデックスを使用すると、特定エリアにある公園の検索や、四角形の描画による公園選択、マップ上での公園への素早い画面移動と拡大などのタスクを高速化できます。

空間インデックスは自動的に作成および保守されます。これにより、クエリーのパフォーマンスが向上し、手動によるインデックス管理の必要性がなくなることでユーザーの時間を節約できます。

空間インデックスはストレージ領域をさらに消費し、大規模なデータセットではそれがかなり大きくなる可能性があります。

属性フルテキスト空間の各インデックスの詳細

関連トピック