AI モデルを使用したテキストの処理 (Process Text Using AI Model) (GeoAI)

サマリー

テキスト変換、エンティティ認識、テキスト分類、テキスト生成、翻訳、要約などのさまざまな用途に対応するため、フィーチャクラスまたはテーブル内のテキスト フィールドや、フォルダーのテキスト ファイルなどのさまざまなソースのテキストを処理します。 このツールは、カスタム サードパーティ モデルや、[テキスト分類モデルのトレーニング (Train Text Classification Model)][テキスト変換モデルのトレーニング (Train Text Transformation Model)][エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールを使用してトレーニングされたディープ ラーニング モデルを使用できます。

使用法

  • このツールを使用するには、ディープ ラーニング フレームワークがインストールされている必要があります。 ArcGIS Pro のディープ ラーニング フレームワークを使用するようにコンピューターを設定するには、「ArcGIS 用のディープ ラーニング フレームワークのインストール」をご参照ください。

  • このツールは、モデル情報を含んでいるモデル定義ファイルを必要とします。 モデルは [テキスト分類モデルのトレーニング (Train Text Classification Model)][テキスト変換モデルのトレーニング (Train Text Transformation Model)][エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールを使用してトレーニングできます。 [入力モデル定義ファイル] パラメーター値には、Esri モデル定義 JSON ファイル (.emd) またはディープ ラーニング モデル パッケージ (.dlpk) を指定することができます。 モデル ファイルはローカルに格納、または ArcGIS Living Atlas of the World 上でホストできます。

  • このツールは、モデル拡張機能を使用して作成されたサードパーティの言語モデルの使用をサポートしています。 この機能により、ArcGIS Pro でサポートされているツールによってトレーニングされていないカスタム ディープ ラーニング モデルを使用して、エンティティ抽出、テキスト分類、テキスト要約、テキスト翻訳などのタスクが可能になります。 カスタム ディープ ラーニング モデル ファイルの作成の詳細については、「ArcGIS でのサードパーティの言語モデルの使用」をご参照ください。

  • このツールは、CPU または GPU 上で実行できます。ただし、ディープ ラーニングは計算負荷が高いので、GPU を使用することをおすすめします。 GPU を使用してこのツールを実行するには、プロセッサ タイプ環境を GPU に設定します。 複数の GPU がある場合は、代わりに GPU ID 環境を指定します。

  • このツールは、ディープ ラーニング フレームワークや GPU 仕様をインストールすることなく、リモートでホストされているサードパーティの言語モデルの実行をサポートします。これらはリモートで管理されます。

  • このツールの実行要件および発生する可能性のある問題の詳細については、「ディープ ラーニングに関するよくある質問」をご参照ください。

パラメーター

ラベル説明データ タイプ
入力レイヤーまたはテーブル

入力は次のいずれかになります。

  • 入力フィールドが含まれている、ポイント/ライン/ポリゴン入力フィーチャクラスまたはテーブル。 入力の各行は 1 つのレコードを表します。
  • テキスト ファイルを含むフォルダー。
Feature Layer; Table View; Table; Folder
データ フィールド

下流の自然言語処理 (NLP) タスクに使用される入力フィーチャクラスまたはテーブルのフィールドの名前。

Field
入力モデル定義ファイル

NLP タスクで使用されるトレーニング済みのモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd)、またはローカルに格納あるいは ArcGIS Living Atlas (.dlpk_remote) でホストされたディープ ラーニング モデル パッケージ (.dlpk) を指定することができます。

.dlpk ファイルには、サードパーティの言語モデルを指定することもできます。

注意:

サードパーティの言語モデル .dlpk ファイルには有害なコードが含まれる可能性があります。 ソースを信頼できる場合のみこれらのモデルを使用してください。

File
出力レイヤーまたは出力テーブル

NLP タスクからの出力が格納されるフィーチャクラスまたはテーブル。

Feature Class; Table; Feature Layer
モデル引数
(オプション)

推測の実行中にモデルによって使用される追加の引数。 これには、サードパーティ モデルでサポートされる引数や、[テキスト分類モデルのトレーニング (Train Text Classification Model)][テキスト変換モデルのトレーニング (Train Text Transformation Model)][エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでサポートされるその他のパラメーターも含まれます。

注意:

サードパーティの言語モデルを使用している場合、モデル引数は、.dlpk ファイルで指定されたパラメーターに従って更新されます。 モデル引数の定義の詳細については、「ArcGIS でのサードパーティの言語モデルの使用」の getParameterInfo セクションをご参照ください。

Value Table
ロケーション ゾーン
(オプション)

その住所が存在すると予想される地理的な領域またはゾーン。 指定されたテキストが、モデルによって抽出された住所にアペンドされます。

ロケーターは、ロケーション ゾーン情報を使用して、住所が存在する地域または地理的な領域を特定し、より適切な結果を生成します。

注意:

このパラメーターは、定義済みの住所エンティティを持つ [エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでトレーニングされたモデルでのみサポートされています。

String
入力ロケーター
(オプション)

入力テキスト ドキュメント内の住所をジオコーディングするために使用されるロケーター。 ジオコーディングが正常に行われ、出力フィーチャクラスに格納された各住所にポイントが生成されます。

注意:

このパラメーターは、定義済みの住所エンティティを持つ [エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでトレーニングされたモデルでのみサポートされています。

Address Locator

派生した出力

ラベル説明データ タイプ
更新されたテーブル

入力データから生成された結果が含まれている出力フィーチャ レイヤー。

Feature Layer; Table

arcpy.geoai.ProcessTextUsingAIModel(in_layer, data_fields, in_model_definition_file, out_layer, {model_arguments}, {location_zone}, {in_locator})
名前説明データ タイプ
in_layer

入力は次のいずれかになります。

  • 入力フィールドが含まれている、ポイント/ライン/ポリゴン入力フィーチャクラスまたはテーブル。 入力の各行は 1 つのレコードを表します。
  • テキスト ファイルを含むフォルダー。
Feature Layer; Table View; Table; Folder
data_fields
[data_fields,...]

下流の自然言語処理 (NLP) タスクに使用される入力フィーチャクラスまたはテーブルのフィールドの名前。

Field
in_model_definition_file

NLP タスクで使用されるトレーニング済みのモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd)、またはローカルに格納あるいは ArcGIS Living Atlas (.dlpk_remote) でホストされたディープ ラーニング モデル パッケージ (.dlpk) を指定することができます。

.dlpk ファイルには、サードパーティの言語モデルを指定することもできます。

注意:

サードパーティの言語モデル .dlpk ファイルには有害なコードが含まれる可能性があります。 ソースを信頼できる場合のみこれらのモデルを使用してください。

File
out_layer

NLP タスクからの出力が格納されるフィーチャクラスまたはテーブル。

Feature Class; Table; Feature Layer
model_arguments
[model_arguments,...]
(オプション)

推測の実行中にモデルによって使用される追加の引数。 これには、サードパーティ モデルでサポートされる引数や、[テキスト分類モデルのトレーニング (Train Text Classification Model)][テキスト変換モデルのトレーニング (Train Text Transformation Model)][エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでサポートされるその他のパラメーターも含まれます。

注意:

サードパーティの言語モデルを使用している場合、モデル引数は、.dlpk ファイルで指定されたパラメーターに従って更新されます。 モデル引数の定義の詳細については、「ArcGIS でのサードパーティの言語モデルの使用」の getParameterInfo セクションをご参照ください。

Value Table
location_zone
(オプション)

その住所が存在すると予想される地理的な領域またはゾーン。 指定されたテキストが、モデルによって抽出された住所にアペンドされます。

ロケーターは、ロケーション ゾーン情報を使用して、住所が存在する地域または地理的な領域を特定し、より適切な結果を生成します。

注意:

このパラメーターは、定義済みの住所エンティティを持つ [エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでトレーニングされたモデルでのみサポートされています。

String
in_locator
(オプション)

入力テキスト ドキュメント内の住所をジオコーディングするために使用されるロケーター。 ジオコーディングが正常に行われ、出力フィーチャクラスに格納された各住所にポイントが生成されます。

注意:

このパラメーターは、定義済みの住所エンティティを持つ [エンティティ認識モデルのトレーニング (Train Entity Recognition Model)] ツールでトレーニングされたモデルでのみサポートされています。

Address Locator

派生した出力

名前説明データ タイプ
updated_table

入力データから生成された結果が含まれている出力フィーチャ レイヤー。

Feature Layer; Table

コードのサンプル

ProcessTextUsingAIModel (スタンドアロン スクリプト)

次の例は、ProcessTextUsingAIModel 関数を使用する方法を示しています。

# Name: ProcessText.py
# Description: ArcGIS geoprocessing tool that enables a broad range of advanced
# text processing tasks, with customizable outputs to meet various NLP needs.
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy

arcpy.env.workspace = "C:/processtextexamples/data"

# Set local variables
in_table = "ProcessTextData"
pretrained_model_path_emd = "c:\\processtextdata\\ProcessTextUsingLLMs.emd"

# Run Process Text Using AI Model
arcpy.geoai.ProcessTextUsingAIModel(
    in_layer, data_fields, in_model_definition_file, out_layer, model_arguments,
    location_zone, in_locator)

ライセンス情報

  • Basic: No
  • Standard: No
  • Advanced: Yes

関連トピック