LocateXT のライセンスで利用可能。
ArcGIS LocateXT エクステンションでは、[位置の抽出] ウィンドウを使用して、構造化されていないデータを検索して空間位置を取得し、それらの位置を表すポイント フィーチャを生成できます。
構造化されてないデータとは、Web ページ、レポート、電子メール、ソーシャル メディア コンテンツなどの任意のテキストまたはドキュメントのことです。Microsoft Office ドキュメント (Word、PowerPoint、Excel)、Adobe PDF ドキュメント、テキスト ファイルなどはすべて処理可能です。[位置の抽出] ウィンドウでは、多数のフォルダーやファイルを一度に処理したり、ディスク全体をスキャンしたりすることができます。電子メールや Web ページからこのウィンドウ上にテキストをドラッグして解析することもできます。
出力フィーチャクラスの属性テーブルには、各ポイントの空間位置が見つかったファイルも記録されています。位置のコンテキストを提供するため、空間位置の前後のテキストが元のドキュメントから抽出されて各属性に格納されます。位置に関連付けられている日付とキーワードも抽出できます。[位置の抽出] ウィンドウでは住所を表すテキストは空間位置として自動的には認識されないので、ロケーターを使用してその位置を表すポイントを生成することはできません。
[位置の抽出] ウィンドウにある機能は、[ドキュメントから位置を抽出 (Extract Locations from Document)] および [テキストから位置を抽出 (Extract Locations from Text)] ジオプロセシング ツールにもあります。
自由形式のテキストの例
アラスカ州の地震に関する新しい記事を確認し、記事に記載されているそれぞれの位置をマップ上に表示する場合は、以下の入力テキストのサンプルをコピーして、ウィンドウに直接貼り付けることができます。
入力テキスト
アラスカ州では、平均すると 1 日あたり 100 回地震が発生しています。この地域の地質構造は、太平洋プレートと北米プレートの相互作用に支配されています。この相互作用は、記録に残っている史上最大の 3 つの地震の主な要因になっています。リヒター スケールで 9.2 を計測した最大の地震は、1964 年 3 月 28 日にプリンス ウィリアム湾 (60.91°N, 147.34°W) で発生しました。8.7 を計測した 2 番目に大きいアラスカ州の地震は、1965 年 2 月 4 日にラット諸島周辺 (51.25°N, 178.72°E) で発生しました。8.6 を計測した 3 番目に大きい地震は、1957 年 3 月 9 日にアンドリアノフ諸島周辺 (51.50°N, 175.63°W) で発生しました。
出力フィーチャ
入力テキストから 3 つの地震の位置が抽出されるとただちに、出力フィーチャクラスが [コンテンツ] ウィンドウに表示され、アクティブなマップに各ポイントが表示されます。
デフォルトでは、入力テキストの中に含まれる比較的最近の日付も抽出され、出力フィーチャクラスの属性テーブルに記録されます。しかし、上記の入力テキストの日付は、デフォルトの日付範囲外になります。
メモ:
国際空間座標形式や国際日付形式の一部は、入力テキストに含まれると、デフォルトで認識されません。たとえば、空間座標で使用される方角の略称が英語以外の言語に翻訳される場合や、日付が ISO 形式ではなく、英語以外の言語で記載される場合などです。英語の代わりに、あるいは英語に加えて、他の言語でも座標や日付を正しく認識できるよう、設定をカスタマイズできます。
半構造化されたテキストの例
空間座標を認識するだけでなく、場所と空間座標を関連付けるカスタム位置を定義できます。たとえば、ドキュメントのどこかでポートランドという単語が見つかった場合、ポートランド市内の位置を表すポイントをその単語に関連付けることができます。同様に、空港名コードが見つかった場合、その空港の位置を表すポイントをそのコードに関連付けることができます。
一部のドキュメントには一定量の構造が含まれています。旅行フォーム専用のフォルダーがある場合、そこから情報を抽出し、出力フィーチャクラスの属性テーブル内のカスタム属性に格納できます。たとえば、以下の入力テキストが含まれているドキュメントでは、Name:、Address:、Purpose of travel: の各ラベルの後ろのテキストを抽出するカスタム属性を定義できます。後から、ArcGIS Pro で使用可能なその他のツールを使用してこれらの属性を処理できます。
入力テキスト
Name: Doe, Jane
Address: 380 New York St, Redlands, CA, 92373
Date: 2019-03-14
Destination: PDX
Purpose of travel: Meet with the team at the Esri R&D Center at 309 SW 6th Ave #600, Portland, OR, 97204.
出力フィーチャ
入力テキストからポートランド市内のカスタム位置が抽出されるとただちに、出力フィーチャクラスが [コンテンツ] ウィンドウに表示され、アクティブなマップに各ポイントが表示されます。フィーチャをクリックして、ドキュメントから抽出された情報を調べます。この例では、日付が抽出されて属性テーブルに格納されています。さらに、カスタム属性を使用して、ラベルの末尾から行の末尾までのテキストを抽出し、旅行者の名前と住所や旅行の理由を表すフィールドにそのコンテンツが格納されています。その他のカスタム属性を使用して、ドキュメント内に存在するキーワードが特定されて別のフィールドに格納されています。
出力フィーチャクラスの属性テーブル内の [住所] フィールドのコンテンツは他のツールを使用してジオコーディングできます。これは自動的にはジオコーディングされません。同様に、旅行の目的について述べている自由形式のテキスト内の住所は住所として自動的には識別されず、ジオコーディングされません。
メモ:
X 座標と Y 座標がテーブルの別個の列に格納されている、カンマ区切りテキスト ファイルなどの構造化されたテキスト データがある場合、[XY テーブル → ポイント (XY Table To Point)] ツールを使用して、これらの位置を表すポイント フィーチャを作成します。