ディープラーニングを使用したテキスト分類 (Classify Text Using Deep Learning) (GeoAI)—ArcGIS Pro

サマリー

トレーニング済みのテキスト分類モデルをフィーチャクラスまたはテーブルのテキストフィールドで実行し、信頼値を含む各クラスとともに割り当てられたクラスラベルまたはカテゴリラベルを使用して各レコードを更新します。

使用法

このツールを使用するには、ディープラーニングフレームワークがインストールされている必要があります。 ArcGIS Pro のディープラーニングフレームワークを使用するようにコンピューターを設定するには、「ArcGIS 用のディープラーニングフレームワークのインストール」をご参照ください。
このツールは、トレーニング済みのモデル情報を含んでいるモデル定義ファイルを必要とします。モデルは、[テキスト分類モデルのトレーニング (Train Text Classification Model)] ツールを使用してトレーニングできます。 [入力モデル定義ファイル] パラメーター値には、Esri モデル定義 JSON ファイル (.emd) またはディープラーニングモデルパッケージ (.dlpk) を指定することができます。モデルファイルはローカルに格納、または ArcGIS Living Atlas 上でホストできます。
このツールは、CPU または GPU 上で実行できます。ただし、ディープラーニングは計算負荷が高いので、GPU を使用することをお勧めします。 GPU を使用してこのツールを実行するには、プロセッサタイプ環境を GPU に設定します。複数の GPU がある場合は、代わりに GPU ID 環境を指定します。
このツールの実行要件および発生する可能性のある問題の詳細については、「ディープラーニングに関するよくあるご質問 (FAQ)」をご参照ください。

パラメーター

ラベル	説明	データタイプ
入力テーブル	分類またはラベル付与するテキストを含む、入力ポイント、ライン、ポリゴンフィーチャクラスまたはテーブル。	Feature Layer; Table View
テキストフィールド	分類するテキストを含む、入力フィーチャクラスまたはテーブルのテキストフィールド。	Field
入力モデル定義ファイル	分類に使用されるトレーニング済みモデル。モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd)、またはローカルに格納あるいは ArcGIS Living Atlas (.dlpk_remote) でホストされたディープラーニングモデルパッケージ (.dlpk) を指定することができます。	File
クラスラベルフィールド (オプション)	モデルによって割り当てられたクラスまたはカテゴリラベルを含むフィールドの名前。デフォルトのフィールド名は ClassLabel です。	String
モデル引数 (オプション)	モデルの出力の調整に使用される、sequence_length や confidence_threshold などの追加の引数。引数の名前は、ツールによって入力されます。注意: モデル引数 confidence_threshold は複数ラベルのテキスト分類にのみ適用されます。	Value Table
すべての予測で説明を表示 (オプション)	SHAP 説明を生成するかどうかを指定します。説明の生成にかかる時間は、入力の長さによって異なります。オン - SHAP 説明は出力テーブルの行ごとに生成されます。オフ - SHAP 説明は生成されません。これがデフォルトです。	Boolean
バッチサイズ (オプション)	1 回に処理されるトレーニングサンプルの数。デフォルト値は 4 です。バッチサイズを大きくすると、ツールのパフォーマンスが向上しますが、バッチサイズが増加するにつれて、使用されるメモリ量が増加します。メモリ不足エラーが発生した場合は、より小さなバッチサイズを使用してください。	Double

派生した出力

ラベル	説明	データタイプ
更新されたテーブル	各クラスの信頼値とともに入力データから生成された分類およびラベル付与済みテキストを含む、出力ポイント、ライン、ポリゴンフィーチャクラスまたはテーブル。	Table View; Feature Layer

arcpy.geoai.ClassifyTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {class_label_field}, {model_arguments}, {explain}, {batch_size})

名前	説明	データタイプ
in_table	分類またはラベル付与するテキストを含む、入力ポイント、ライン、ポリゴンフィーチャクラスまたはテーブル。	Feature Layer; Table View
text_field	分類するテキストを含む、入力フィーチャクラスまたはテーブルのテキストフィールド。	Field
in_model_definition_file	分類に使用されるトレーニング済みモデル。モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd)、またはローカルに格納あるいは ArcGIS Living Atlas (.dlpk_remote) でホストされたディープラーニングモデルパッケージ (.dlpk) を指定することができます。	File
class_label_field (オプション)	モデルによって割り当てられたクラスまたはカテゴリラベルを含むフィールドの名前。デフォルトのフィールド名は ClassLabel です。	String
model_arguments [model_arguments,...] (オプション)	モデルの出力の調整に使用される、sequence_length や confidence_threshold などの追加の引数。引数の名前は、ツールによって入力されます。注意: モデル引数 confidence_threshold は複数ラベルのテキスト分類にのみ適用されます。	Value Table
explain (オプション)	ENABLE_SHAP—SHAP 説明は出力テーブルの行ごとに生成されます。 DISABLE_SHAP—SHAP 説明は生成されません。これがデフォルトです。	Boolean
batch_size (オプション)	1 回に処理されるトレーニングサンプルの数。デフォルト値は 4 です。バッチサイズを大きくすると、ツールのパフォーマンスが向上しますが、バッチサイズが増加するにつれて、使用されるメモリ量が増加します。メモリ不足エラーが発生した場合は、より小さなバッチサイズを使用してください。	Double

派生した出力

名前	説明	データタイプ
updated_table	各クラスの信頼値とともに入力データから生成された分類およびラベル付与済みテキストを含む、出力ポイント、ライン、ポリゴンフィーチャクラスまたはテーブル。	Table View; Feature Layer

コードのサンプル

ClassifyTextUsingDeepLearning (Python ウィンドウ)

次の Python ウィンドウスクリプトは、ClassifyTextUsingDeepLearning 関数の使用方法を示しています。

# Name: ClassifyText.py
# Description: Classify text into multiple classes
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = "TextClassifierData"
pretrained_model_path_emd = "c:\\classifydata\\TextClassifier.emd"

# Run Classify Text Using Deep Learning
arcpy.geoai.ClassifyTextUsingDeepLearning(in_table, "Address", pretrained_model_path_emd)

環境

プロセッサタイプ, GPU ID

ライセンス情報

Basic: No
Standard: No
Advanced: Yes

サマリー

使用法

パラメーター

注意:

派生した出力

注意:

派生した出力

コードのサンプル

環境

ライセンス情報

関連トピック

このトピックの内容