Entitäten mit Deep Learning extrahieren (GeoAI)

Zusammenfassung

Damit wird ein trainiertes Modell zur Erkennung benannter Entitäten für Textdateien in einem Ordner zum Extrahieren von Entitäten und Positionen (wie Adressen, Namen von Orten oder Personen, Datumsangaben und Geldwerte) in eine Tabelle ausgeführt. Wenn die extrahierten Entitäten eine Adresse enthalten, wird diese vom Werkzeug mithilfe des angegebenen Locators geokodiert und eine Feature-Class als Ausgabe erzeugt.

Weitere Informationen zur Funktionsweise der Entitätenerkennung

Verwendung

  • Für dieses Werkzeug müssen Deep-Learning-Frameworks installiert sein. Informationen zum Einrichten des Computers für Deep-Learning-Frameworks in ArcGIS Pro finden Sie unter Installieren von Deep-Learning-Frameworks for ArcGIS.

  • Dieses Werkzeug erfordert eine Modelldefinitionsdatei, die Informationen zum trainierten Modell enthält. Das Modell kann mit dem Werkzeug Textklassifizierungsmodell trainieren trainiert werden. Als Parameterwert für die Eingabe-Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein Deep-Learning-Modellpaket (.dlpk) verwendet werden. Die Modelldateien müssen lokal gespeichert werden.

  • Dieses Werkzeug kann in einer CPU oder einem Grafikprozessor ausgeführt werden. Deep Learning ist jedoch rechenintensiv, sodass ein Grafikprozessor empfohlen wird. Wenn Sie dieses Werkzeug mit dem Grafikprozessor ausführen möchten, legen Sie die Umgebungsvariable Prozessortyp auf "GPU" fest. Wenn Sie mehrere Grafikprozessoren haben, geben Sie stattdessen die Umgebung "GPU-ID" an.

  • Weitere Informationen zu den Voraussetzungen für die Ausführung dieses Werkzeugs und eventuell dabei auftretenden Problemen finden Sie unter Häufig gestellte Fragen zu Deep Learning.

Parameter

BeschriftungErläuterungDatentyp
Eingabeordner

Der Ordner mit den Textdateien, aus denen benannte Entitäten extrahiert werden sollen.

Folder
Ausgabetabelle

Die Ausgabe-Feature-Class oder Ausgabetabelle, die die extrahierten Entitäten enthält. Wenn ein Locator angegeben wird und mit dem Modell Adressen extrahiert werden, wird die Feature-Class durch Geokodierung der extrahierten Adressen erzeugt.

Feature Class; Table
Eingabe-Modelldefinitionsdatei

Das trainierte Modell, das für die Klassifizierung verwendet werden soll. Als Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein lokal gespeichertes Deep-Learning-Modellpaket (.dlpk) verwendet werden.

File
Modellargumente
(optional)

Zusätzliche Argumente wie beispielsweise ein Konfidenzschwellenwert, die zum Anpassen der Empfindlichkeit des Modells verwendet werden.

Die Namen der Argumente werden vom Werkzeug gefüllt.

Value Table
Batch-Größe
(optional)

Die Anzahl der Trainingsgebiete, die gleichzeitig verarbeitet werden sollen. Der Standardwert ist 4.

Durch größere Batches kann die Leistung des Werkzeugs erhöht werden. Aber größere Batches belegen mehr Arbeitsspeicher. Wird die Fehlermeldung "Nicht genügend Arbeitsspeicher" angezeigt, verwenden Sie kleinere Batches.

Double
Region oder Zone zur Verortung
(optional)

Die geographische Region oder Zone, in der sich die Adressen vermutlich befinden. Der angegebene Text wird an die Adresse angehängt, die vom Modell extrahiert wurde.

Vom Locator werden die Informationen der Verortungszone verwendet, um die Region oder den geographischen Bereich zu identifizieren, in der bzw. in dem sich die Adresse vermutlich befindet, und um bessere Ergebnisse zu erzielen.

String
Eingabe-Locator
(optional)

Der Locator, der verwendet wird, um Adressen in Eingabetextdokumenten zu geokodieren. Für jede erfolgreich geokodierte Adresse wird ein Punkt erzeugt und in der Ausgabe-Feature-Class gespeichert.

Address Locator

arcpy.geoai.ExtractEntitiesUsingDeepLearning(in_folder, out_table, in_model_definition_file, {model_arguments}, {batch_size}, {location_zone}, {in_locator})
NameErläuterungDatentyp
in_folder

Der Ordner mit den Textdateien, aus denen benannte Entitäten extrahiert werden sollen.

Folder
out_table

Die Ausgabe-Feature-Class oder Ausgabetabelle, die die extrahierten Entitäten enthält. Wenn ein Locator angegeben wird und mit dem Modell Adressen extrahiert werden, wird die Feature-Class durch Geokodierung der extrahierten Adressen erzeugt.

Feature Class; Table
in_model_definition_file

Das trainierte Modell, das für die Klassifizierung verwendet werden soll. Als Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein lokal gespeichertes Deep-Learning-Modellpaket (.dlpk) verwendet werden.

File
model_arguments
[model_arguments,...]
(optional)

Zusätzliche Argumente wie beispielsweise ein Konfidenzschwellenwert, die zum Anpassen der Empfindlichkeit des Modells verwendet werden.

Die Namen der Argumente werden vom Werkzeug gefüllt.

Value Table
batch_size
(optional)

Die Anzahl der Trainingsgebiete, die gleichzeitig verarbeitet werden sollen. Der Standardwert ist 4.

Durch größere Batches kann die Leistung des Werkzeugs erhöht werden. Aber größere Batches belegen mehr Arbeitsspeicher. Wird die Fehlermeldung "Nicht genügend Arbeitsspeicher" angezeigt, verwenden Sie kleinere Batches.

Double
location_zone
(optional)

Die geographische Region oder Zone, in der sich die Adressen vermutlich befinden. Der angegebene Text wird an die Adresse angehängt, die vom Modell extrahiert wurde.

Vom Locator werden die Informationen der Verortungszone verwendet, um die Region oder den geographischen Bereich zu identifizieren, in der bzw. in dem sich die Adresse vermutlich befindet, und um bessere Ergebnisse zu erzielen.

String
in_locator
(optional)

Der Locator, der verwendet wird, um Adressen in Eingabetextdokumenten zu geokodieren. Für jede erfolgreich geokodierte Adresse wird ein Punkt erzeugt und in der Ausgabe-Feature-Class gespeichert.

Address Locator

Codebeispiel

ExtractEntitiesUsingDeepLearning (Python-Fenster)

Das folgende Skript für das Python-Fenster veranschaulicht, wie Sie die Funktion ExtractEntitiesUsingDeepLearning verwenden.

# Name: ExtractEntities.py
# Description: Extract useful entities like "Address", "Date" from text.  
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"
dbpath = "C:/textanalysisexamples/Text_analysis_tools.gdb"

# Set local variables
in_folder = 'test_data'
out_table = os.path.join(dbpath, "ExtractedEntities")

pretrained_model_path_emd = "c:\\extractentities\\EntityRecognizer.emd"

# Run Extract Entities Using Deep Learning
arcpy.geoai.ExtractEntitiesUsingDeepLearning(in_folder, out_table, pretrained_model_path_emd)

Umgebungen

Lizenzinformationen

  • Basic: Nein
  • Standard: Nein
  • Advanced: Ja

Verwandte Themen