Positionen aus Dokument extrahieren (Conversion)

Mit der LocateXT-Lizenz verfügbar.

Zusammenfassung

Analysiert Dokumente mit nicht oder nur grob strukturiertem Text (z. B. E-Mail-Nachrichten, Reiseformulare usw.) und extrahiert Positionen in eine Point-Feature-Class.

Die Eingabe-Dokumente werden von dem Werkzeug wie folgt analysiert und verarbeitet:

  • Im Inhalt der Dokumente angegebene räumliche Koordinaten werden erkannt und als Punkte erstellt, die diese Positionen darstellen. Die folgenden Koordinatenformate werden erkannt: Dezimalgrad, Grad Dezimalminuten, Grad Minuten Sekunden, Universal Transverse Mercator und Military Grid Reference System.
  • Im Inhalt des Dokuments angegebene und in einer benutzerdefinierten Datei mit Ortsangaben definierte Ortsnamen werden erkannt und als Punkte erstellt, die diese Positionen darstellen. In einer benutzerdefinierten Positionsdatei wird ein Ortsname mit einer räumlichen Koordinate für diese Position verknüpft.
  • Relevante Informationen im Text werden erkannt, aus einem Dokument extrahiert und in Feldern in der Attributtabelle der Ausgabe-Feature-Class aufgezeichnet.

Dieses Werkzeug unterstützt alle Microsoft Office-Dokumente (Word, PowerPoint und Excel), Adobe PDF-Dokumente, Text mit Markups wie XML- und HTML-Dokumente und Nur-Text-Dateien wie Textdateien (.txt).

Verwendung

  • Die standardmäßigen Parameterwerte sind für die optimale Identifizierung von Koordinaten und Datumsangaben konzipiert. Die Standardwerte können für jeden Parameter geändert werden. Je weniger Parameter geändert werden, desto schneller wird das Werkzeug ausgeführt.

  • Alle Koordinatenformate sind standardmäßig aktiv. Wenn Sie nur benutzerdefinierte Orte und keine räumlichen Koordinaten extrahieren möchten, können Sie die Parameter für das Koordinatenformat deaktivieren.

  • Wenn ein Adobe PDF-Dokument als Eingabe zur Verfügung gestellt wird und eine räumliche Koordinate in einem aktivierten Format enthält, aber die Ausgabe-Feature-Class kein Feature enthält, das die räumliche Koordinate darstellt, kann Ihr Computer PDF-Dokumente aufgrund einer fehlenden Komponente möglicherweise nicht verarbeiten.

    Weitere Informationen zum Scannen von Dateien

  • Wenn Sie eine benutzerdefinierte Ortsdatei verwenden, um Ortsnamen zu extrahieren, sollten Sie am besten weniger Ortsnamen in der Datei angeben. Wenn Sie beispielsweise eine Feature-Class, die alle Orte der Welt repräsentiert, in eine benutzerdefinierte Ortsdatei konvertieren, kann der Prozess viel Zeit in Anspruch nehmen, wenn nach Orten gesucht wird, die höchstwahrscheinlich nicht vorhanden sind oder in Gebieten der Welt liegen, die Sie für Ihre Analyse nicht interessieren.

    Weitere Informationen über benutzerdefinierte Ortsdateien

  • Wenn die Ortsnamen, an denen Sie interessiert sind, falsch geschrieben werden können oder bekannte Variationen aufweisen, erhalten Sie in der Regel bessere Ergebnisse, wenn Sie in der benutzerdefinierten Ortsdatei diese häufigen Schreibfehler und alternativen Ortsnamen gleich mit angeben, anstatt den Fuzzy-Abgleich zu verwenden. Wenn der Fuzzy-Abgleich aktiviert wurde, wird ein Ort ausgegeben, wenn 70 % der Zeichen in einem Ortsnamen mit der Eingabe übereinstimmen. Dadurch können mehr falsch positive Ergebnisse entstehen, als wenn Sie bekannte Variationen und Fehlschreibungen gleich mit angeben.

    Ein nützlicher Workflow für den Fuzzy-Abgleich ist, das Werkzeug zuerst mit deaktiviertem Fuzzy-Abgleich auszuführen. Führen Sie das Werkzeug danach erneut mit aktiviertem Fuzzy-Abgleich aus, und prüfen Sie die Ergebnisse. So können Schreibvariationen identifiziert werden, die der benutzerdefinierten Ortsdatei hinzugefügt werden können.

    Weitere Informationen zum Fuzzy-Abgleich

Parameter

BeschriftungErläuterungDatentyp
Eingabedatei

Die Eingabedatei, in der nach Positionen (Koordinaten oder benutzerdefinierte Positionen), Datumsangaben und benutzerdefinierten Attributen gesucht wird, oder ein Ordner, in dem in allen Dateien im Ordner nach Positionen gesucht wird.

File
Ausgabe-Feature-Class

Die Feature-Class mit Punkt-Features, die die gefundenen Orte darstellt.

Feature Class
Eingabevorlage
(optional)

Die Vorlagendatei (*.lxttmpl), die die Einstellung für die einzelnen Werkzeugparameter festlegt. Wenn eine Vorlagendatei angegeben wird, werden alle für andere Parameter angegebenen Werte ignoriert, mit Ausnahme derjenigen, die den zu verarbeitenden Eingabeinhalt und die Ausgabe-Feature-Class bestimmen.

Einige Einstellungen, die im Bereich Positionen extrahieren verfügbar sind, stehen diesem Werkzeug nur zur Verfügung, wenn die Einstellungen in einer Vorlagendatei gespeichert sind und die Vorlagendatei in diesem Parameter referenziert wird. Dies sind die folgenden Einstellungen:

  • Räumliche Koordinaten im XY-Format: Ermöglicht die Erkennung von zwei aufeinanderfolgenden Zahlen wie 630084 4833438 oder 981075.652ftUS 607151.272ftUS als Koordinaten, wenn sie für ein mit den Eingabedokumenten verknüpftes planares Koordinatensystem gültig sind. Sie können festlegen, ob Zahlen mit und ohne Einheiten oder nur Zahlen mit Maßeinheiten als Koordinaten erkannt werden sollen.
  • Benutzerdefinierte Datums- und Uhrzeitformate: Ermöglicht es Ihnen, die Erkennung von Text als räumliche Koordinate oder Datum anzupassen, insbesondere wenn er in einer anderen Sprache als Englisch geschrieben ist oder ein Format verwendet, das in den USA nicht üblich ist. So kann z. B. eine räumliche Koordinate, die als 30 20 10 N x 060 50 40 W geschrieben wird, mit einer Anpassung erkannt werden, die besagt, dass das Zeichen x ein gültiger Text zwischen dem Breitengrad und dem Längengrad ist. Koordinaten und Datumsangaben wie 60.91°N, 147.34°O und 17 juillet, 2018 können erkannt werden, wenn spezifische Anpassungen an die Sprache der Dokumente, in diesem Fall Französisch, vorgenommen werden. Wenn außerdem zweistellige Jahreszahlen verwendet werden, können Sie den Zeitraum in Jahren festlegen, mit dem sie abgeglichen werden sollen.
  • Einstellungen für mehrdeutige Daten: Daten wie z. B. 10/12/2019 sind mehrdeutig, weil sie entweder als 12. Oktober 2019 oder als 10. Dezember 2019 interpretiert werden können. Einige Länder verwenden standardmäßig das Datumsformat M/T/JJ, andere Länder verwenden das Format T/M/JJ. Sie können festlegen, wie diese mehrdeutigen Datumsangaben standardmäßig interpretiert werden sollen, entweder als M/T/JJ oder als T/M/JJ.
  • Länge der Felder in der Ausgabe-Feature-Class: Sie können die Länge der Felder, die den Text um die räumlichen Koordinaten herum enthalten, die aus einem Dokument extrahiert werden, mit den Parametern Prätext-Feldlänge (pre_text_length in Python) und Posttext-Feldlänge (post_text_length in Python) festlegen. Im Bereich Positionen extrahieren können Sie die Länge mehrerer zusätzlicher Felder in der Attributtabelle festlegen, einschließlich der Felder mit den aus dem Dokument extrahierten Datumsangaben, dem ursprünglichen Text, der in Datumsangaben umgewandelt wurde, dem Dateinamen, aus dem die Informationen extrahiert wurden, usw.

File
Breiten- und Längengrad
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 33.8N 77.035W und W77N38.88909.

  • Aktiviert: Das Werkzeug sucht nach Dezimalgrad-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
X Y mit Gradsymbolen
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben mit Gradsymbolen formatiert sind (seltene Fehlalarme). Beispiele: 38.8° -77.035° und -077d+38.88909d.

  • Aktiviert: Das Werkzeug sucht nach Dezimalgrad-Koordinaten, die als XY-Angaben mit Gradsymbolen formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als XY-Angaben mit Gradsymbolen formatiert sind.
Boolean
X Y ohne Gradsymbole
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Beispiele: 38.8 -77.035 und -077.0, +38.88909.

  • Aktiviert: Das Werkzeug sucht nach Dezimalgrad-Koordinaten, die als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als XY-Angaben ohne Symbole formatiert sind.
Boolean
Breiten- und Längengrad
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 3853.3N 7702.100W und W7702N3853.3458.

  • Aktiviert: Das Werkzeug sucht nach "Grad Dezimalminuten"-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach "Grad Dezimalminuten"-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
X Y mit Minutensymbolen
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als XY-Angaben mit Minutensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 3853' -7702.1' und -07702m+3853.3458m.

  • Aktiviert: Das Werkzeug sucht nach "Grad Dezimalminuten"-Koordinaten, die als XY-Angaben mit Minutensymbolen formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach "Grad Dezimalminuten"-Koordinaten, die als XY-Angaben mit Minutensymbolen formatiert sind.
Boolean
Breiten- und Längengrad
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 385320.7N 770206.000W und W770206N385320.76.

  • Aktiviert: Das Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
X Y mit Sekundensymbolen
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Sekundensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 385320" -770206.0" und -0770206.0s+385320.76s.

  • Aktiviert: Das Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Sekundensymbolen formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Sekundensymbolen formatiert sind.
Boolean
X Y mit Trennzeichen
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Trennzeichen formatiert sind (moderat auftretende Fehlalarme). Beispiele: 38:53:20 -77:2:6.0 und -077/02/06/+38/53/20.76.

  • Aktiviert: Das Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Trennzeichen formatiert sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Trennzeichen formatiert sind.
Boolean
Universelle transversale Mercator-Projektion
(optional)

Gibt an, ob nach UTM-Koordinaten (Universelle transversale Mercator-Projektion) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S 323503 4306438 und 18 north 323503.25 4306438.39.

  • Aktiviert: Das Werkzeug sucht nach UTM-Koordinaten. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach UTM-Koordinaten.
Boolean
UPS Nordpolar
(optional)

Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y 2722399 2000000 und north 2722399 2000000.

  • Aktiviert: Das Werkzeug sucht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich.
Boolean
UPS Südpolar
(optional)

Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: A 2000000 3168892 und south 2000000 3168892.

  • Aktiviert: Das Werkzeug sucht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich.
Boolean
Military Grid Reference System
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S UJ 13503 06438 und 18SUJ0306.

  • Aktiviert: Das Werkzeug sucht nach MGRS-Koordinaten. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach MGRS-Koordinaten.
Boolean
Nordpolar
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y TG 56814 69009 und YTG5669.

  • Aktiviert: Das Werkzeug sucht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich.
Boolean
Südpolar
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Südpolarbereich gesucht werden soll (moderat auftretende Fehlalarme). Beispiele: A TN 56814 30991 und ATN5630.

  • Aktiviert: Das Werkzeug sucht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich.
Boolean
Komma als Dezimalzeichen verwenden
(optional)

Gibt an, ob ein Komma (,) als Dezimaltrennzeichen erkannt werden soll. Standardmäßig werden Inhalte auf räumliche Koordinaten überprüft (erkennbar durch einen Punkt (.) oder ein Multiplikationszeichen (·) als Dezimaltrennzeichen), z. B. Lat 01° 10·80’ N Long 103° 28·60’ E. Wenn Sie mit Inhalten arbeiten, in denen räumliche Koordinaten durch Zahlen definiert sind, die ein Komma (,) als Dezimaltrennzeichen verwenden, z. B. 52° 8′ 32,14″ N; 5° 24′ 56,09″ E, legen Sie diesen Parameter entsprechend fest, sodass ein Komma als Dezimaltrennzeichen erkannt wird. Dieser Parameter wird nicht automatisch auf Grundlage der regionalen Einstellung des Betriebssystems Ihres Computers eingestellt.

  • Aktiviert: Gibt an, ob ein Komma als Dezimaltrennzeichen erkannt werden soll.
  • Deaktiviert: Ein Punkt oder ein Multiplikationszeichen soll als Dezimaltrennzeichen erkannt werden. Dies ist die Standardeinstellung.
Boolean
Interpretation als Längengrad, Breitengrad
(optional)

Gibt an, ob XY-Koordinaten als Längen- und Breitengrad interpretiert werden sollen. Wenn Ziffern wie XY-Koordinaten wirken, beide Ziffern kleiner als 90 sind und nicht durch Symbole oder Notationen angegeben wird, welche Ziffer den Längengrad darstellt, können die Ergebnisse mehrdeutig sein. Interpretieren Sie die Ziffern in der Koordinatenreihenfolge Längengrad, Breitengrad (d. h. XY) und nicht Breitengrad, Längengrad (d. h. YX).

  • Aktiviert: XY-Koordinaten werden als Längengrad-Breitengrad interpretiert.
  • Deaktiviert: XY-Koordinaten werden als Breitengrad-Längengrad interpretiert. Dies ist die Standardeinstellung.
Boolean
Eingabe-Koordinatensystem
(optional)

Das Koordinatensystem, das verwendet wird, um die in der Eingabe definierten räumlichen Koordinaten zu interpretieren. GCS WGS 84 ist der Standard.

Spatial Reference
Benutzerdefinierte Eingabepositionen
(optional)

Die benutzerdefinierte Ortsdatei (.lxtgaz), die beim Scannen des Eingabeinhalts verwendet wird. Für jedes Vorkommen eines Ortsnamens in der benutzerdefinierten Ortsdatei wird ein Punkt erstellt, und zwar bis zu den Grenzen, die durch andere Werkzeugparameter festgelegt sind.

File
Fuzzy-Abgleich verwenden
(optional)

Gibt an, ob beim Vergleich des Eingabeinhalts mit den in der benutzerdefinierten Ortsdatei angegebenen Ortsnamen ein Fuzzy-Abgleich stattfinden soll.

  • Aktiviert: Ein Fuzzy-Abgleich wird bei der Suche in der benutzerdefinierten Ortsdatei verwendet.
  • Deaktiviert: Ein exakter Abgleich wird bei der Suche in der benutzerdefinierten Ortsdatei verwendet. Dies ist die Standardeinstellung.
Boolean
Maximale Anzahl an extrahierten Features
(optional)

Maximale Anzahl an Features, die extrahiert werden können. Das Werkzeug durchsucht den eingegebenen Inhalt nicht mehr nach Orten, wenn die maximale Anzahl erreicht ist. Wenn der Service als Geoverarbeitungsservice ausgeführt wird, können für den Service und für den Server unterschiedliche Limits für die Anzahl der zulässigen Features gelten.

Long
Die angegebene Anzahl an ersten Features ignorieren
(optional)

Die Anzahl der Features, die erkannt und ignoriert werden, bevor alle anderen Features extrahiert werden. Dieser Parameter kann verwendet werden, um die Suche auf einen bestimmten Teil der Daten zu konzentrieren.

Long
Verwendeter Monatsname
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen der Monatsname vorkommt (seltene Fehlalarme). 12 May 2003 und January 15, 1997 sind Beispiele.

  • Aktiviert: Das Werkzeug sucht nach Datumsangaben, in denen der Monatsname vorkommt. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Datumsangaben, in denen der Monatsname vorkommt.
Boolean
M/T/J und T/M/J
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). 5/12/03 und 1-15-1997 sind Beispiele.

  • Aktiviert: Das Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format M/T/J oder T/M/J vorkommen.
Boolean
JJJJMMTT
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). 20030512 und 19970115 sind Beispiele.

  • Aktiviert: Das Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format JJJJMMTT vorkommen.
Boolean
JJMMTT
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). 030512 und 970115 sind Beispiele.

  • Aktiviert: Das Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format JJMMTT vorkommen.
Boolean
YYJJJ
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). 03132 und 97015 sind Beispiele.

  • Aktiviert: Das Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen.
Boolean
Maximale Anzahl an extrahierten Datumsangaben
(optional)

Die maximale Anzahl an zu extrahierenden Datumsangaben.

Long
Die angegebene Anzahl an ersten Datumsangaben ignorieren
(optional)

Die Anzahl an Datumsangaben, die erkannt und ignoriert werden, bevor alle anderen Datumsangaben extrahiert werden.

Long
Frühestes Datum des zulässigen Datumsbereichs
(optional)

Das früheste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem späteren entsprechen, werden extrahiert.

Date
Letztes Datum des zulässigen Datumsbereichs
(optional)

Das späteste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem früheren entsprechen, werden extrahiert.

Date
Benutzerdefinierte Eingabeattribute
(optional)

Die benutzerdefinierte Ortsdatei (.lxtca), die zum Scannen des Eingabeinhalts verwendet wird. Für alle in der Datei definierten benutzerdefinierten Attribute werden Felder in der Attributtabelle der Ausgabe-Feature-Class erstellt. Wenn der Eingabeinhalt gescannt wird, wird geprüft, ob er Text enthält, der mit in der Datei angegebenen benutzerdefinierten Attributen verknüpft ist. Wenn eine Übereinstimmung gefunden wird, wird der entsprechende Text aus dem Eingabeinhalt extrahiert und im entsprechenden Feld gespeichert.

File
Eingabedatei: Link-Text
(optional)

Der Dateipfad, der als Dateiname in den Ausgabedaten verwendet wird, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben wird, wird der Pfad der Eingabedatei verwendet, bei dem es sich um einen nicht erreichbaren Ordner auf einem Server handeln kann. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist.

String
Eingabedatei: Datum und Uhrzeit
(optional)

Das UTC-Datum und die UTC-Uhrzeit, zu der die Datei geändert wurde, wird als "Geändert"-Attribut in den Ausgabedaten verwendet, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben ist, wird die aktuelle "Geändert"-Zeit der Eingabedatei verwendet. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist.

Date
Prätext-Feldlänge
(optional)

Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die vor dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Pre-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Pre-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten.

Long
Posttext-Feldlänge
(optional)

Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die nach dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Post-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Post-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten.

Long
Koordinatenformat
(optional)

Gibt das Koordinatenformat an, das zum Speichern der Koordinatenposition verwendet werden soll. Eine Standarddarstellung der räumlichen Koordinate, die das Punkt-Feature definiert, wird in einem Feld der Attributtabelle gespeichert.

  • DD – DezimalgradDie Koordinatenposition wird im Dezimalgrad-Format festgehalten. Dies ist die Standardeinstellung.
  • DM – Grad DezimalminutenDie Koordinatenposition wird im "Grad Dezimalminuten"-Format festgehalten.
  • DMS – Grad Minuten SekundenDie Koordinatenposition wird im "Grad Minuten Sekunden-"Format festgehalten.
  • UTM – Universal Transverse MercatorDie Koordinatenposition wird im Format der universellen transversalen Mercator-Projektion festgehalten.
  • MGRS – Military Grid Reference SystemDie Koordinatenposition wird im Format des Military Grid Reference System festgehalten.
String
Wortumbrüche sind erforderlich
(optional)

Gibt an, ob mit Wortumbrüchen nach Text gesucht werden soll. Ein Wortumbruch bedeutet, dass Wörter (Text) durch Leerzeichen oder Satzzeichen begrenzt sind, wie dies in europäischen Sprachen der Fall ist.

Diese Einstellung kann je nach Sprache des Textes zu häufigen oder seltenen Fehlalarmen führen. Wenn "Wortumbrüche sind erforderlich" nicht aktiv ist, würde z. B. der englische Text Bernard mit San Bernardino übereinstimmen, was wahrscheinlich als falsch positives Ergebnis angesehen werden würde. Wenn der Text jedoch in einer Sprache geschrieben wurde, die keine Wortumbrüche verwendet, finden Sie keine Wörter, sofern "Wortumbrüche sind erforderlich" aktiv ist. Beispielsweise wird mit dem Text Ich flog nach Tokio auf Japanisch (私は東京に飛んで) nur das Wort Tokio gefunden (東京), wenn "Wortumbrüche sind erforderlich" nicht aktiv ist.

  • Aktiviert: Das Werkzeug sucht nach Wörtern, die durch Leerzeichen oder Satzzeichen begrenzt sind. Dies ist die Standardeinstellung.
  • Deaktiviert: Das Werkzeug sucht nicht nach Wörtern, die durch Leerzeichen oder Satzzeichen begrenzt sind.
Boolean

arcpy.conversion.ExtractLocationsDocument(in_file, out_feature_class, {in_template}, {coord_dd_latlon}, {coord_dd_xydeg}, {coord_dd_xyplain}, {coord_dm_latlon}, {coord_dm_xymin}, {coord_dms_latlon}, {coord_dms_xysec}, {coord_dms_xysep}, {coord_utm}, {coord_ups_north}, {coord_ups_south}, {coord_mgrs}, {coord_mgrs_northpolar}, {coord_mgrs_southpolar}, {comma_decimal}, {coord_use_lonlat}, {in_coor_system}, {in_custom_locations}, {fuzzy_match}, {max_features_extracted}, {ignore_first_features}, {date_monthname}, {date_m_d_y}, {date_yyyymmdd}, {date_yymmdd}, {date_yyjjj}, {max_dates_extracted}, {ignore_first_dates}, {date_range_begin}, {date_range_end}, {in_custom_attributes}, {file_link}, {file_mod_datetime}, {pre_text_length}, {post_text_length}, {std_coord_fmt}, {req_word_breaks})
NameErläuterungDatentyp
in_file

Die Eingabedatei, in der nach Positionen (Koordinaten oder benutzerdefinierte Positionen), Datumsangaben und benutzerdefinierten Attributen gesucht wird, oder ein Ordner, in dem in allen Dateien im Ordner nach Positionen gesucht wird.

File
out_feature_class

Die Feature-Class mit Punkt-Features, die die gefundenen Orte darstellt.

Feature Class
in_template
(optional)

Die Vorlagendatei (*.lxttmpl), die die Einstellung für die einzelnen Werkzeugparameter festlegt. Wenn eine Vorlagendatei angegeben wird, werden alle für andere Parameter angegebenen Werte ignoriert, mit Ausnahme derjenigen, die den zu verarbeitenden Eingabeinhalt und die Ausgabe-Feature-Class bestimmen.

Einige Einstellungen, die im Bereich Positionen extrahieren verfügbar sind, stehen diesem Werkzeug nur zur Verfügung, wenn die Einstellungen in einer Vorlagendatei gespeichert sind und die Vorlagendatei in diesem Parameter referenziert wird. Dies sind die folgenden Einstellungen:

  • Räumliche Koordinaten im XY-Format: Ermöglicht die Erkennung von zwei aufeinanderfolgenden Zahlen wie 630084 4833438 oder 981075.652ftUS 607151.272ftUS als Koordinaten, wenn sie für ein mit den Eingabedokumenten verknüpftes planares Koordinatensystem gültig sind. Sie können festlegen, ob Zahlen mit und ohne Einheiten oder nur Zahlen mit Maßeinheiten als Koordinaten erkannt werden sollen.
  • Benutzerdefinierte Datums- und Uhrzeitformate: Ermöglicht es Ihnen, die Erkennung von Text als räumliche Koordinate oder Datum anzupassen, insbesondere wenn er in einer anderen Sprache als Englisch geschrieben ist oder ein Format verwendet, das in den USA nicht üblich ist. So kann z. B. eine räumliche Koordinate, die als 30 20 10 N x 060 50 40 W geschrieben wird, mit einer Anpassung erkannt werden, die besagt, dass das Zeichen x ein gültiger Text zwischen dem Breitengrad und dem Längengrad ist. Koordinaten und Datumsangaben wie 60.91°N, 147.34°O und 17 juillet, 2018 können erkannt werden, wenn spezifische Anpassungen an die Sprache der Dokumente, in diesem Fall Französisch, vorgenommen werden. Wenn außerdem zweistellige Jahreszahlen verwendet werden, können Sie den Zeitraum in Jahren festlegen, mit dem sie abgeglichen werden sollen.
  • Einstellungen für mehrdeutige Daten: Daten wie z. B. 10/12/2019 sind mehrdeutig, weil sie entweder als 12. Oktober 2019 oder als 10. Dezember 2019 interpretiert werden können. Einige Länder verwenden standardmäßig das Datumsformat M/T/JJ, andere Länder verwenden das Format T/M/JJ. Sie können festlegen, wie diese mehrdeutigen Datumsangaben standardmäßig interpretiert werden sollen, entweder als M/T/JJ oder als T/M/JJ.
  • Länge der Felder in der Ausgabe-Feature-Class: Sie können die Länge der Felder, die den Text um die räumlichen Koordinaten herum enthalten, die aus einem Dokument extrahiert werden, mit den Parametern Prätext-Feldlänge (pre_text_length in Python) und Posttext-Feldlänge (post_text_length in Python) festlegen. Im Bereich Positionen extrahieren können Sie die Länge mehrerer zusätzlicher Felder in der Attributtabelle festlegen, einschließlich der Felder mit den aus dem Dokument extrahierten Datumsangaben, dem ursprünglichen Text, der in Datumsangaben umgewandelt wurde, dem Dateinamen, aus dem die Informationen extrahiert wurden, usw.

File
coord_dd_latlon
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 33.8N 77.035W und W77N38.88909.

  • FIND_DD_LATLONDas Werkzeug sucht nach Dezimalgrad-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DD_LATLONDas Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
coord_dd_xydeg
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben mit Gradsymbolen formatiert sind (seltene Fehlalarme). Beispiele: 38.8° -77.035° und -077d+38.88909d.

  • FIND_DD_XYDEGDas Werkzeug sucht nach Dezimalgrad-Koordinaten, die als XY-Angaben mit Gradsymbolen formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DD_XYDEGDas Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als XY-Angaben mit Gradsymbolen formatiert sind.
Boolean
coord_dd_xyplain
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Beispiele: 38.8 -77.035 und -077.0, +38.88909.

  • FIND_DD_XYPLAINDas Werkzeug sucht nach Dezimalgrad-Koordinaten, die als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • DONT_FIND_DD_XYPLAINDas Werkzeug sucht nicht nach Dezimalgrad-Koordinaten, die als XY-Angaben ohne Symbole formatiert sind.
Boolean
coord_dm_latlon
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 3853.3N 7702.100W und W7702N3853.3458.

  • FIND_DM_LATLONDas Werkzeug sucht nach "Grad Dezimalminuten"-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DM_LATLONDas Werkzeug sucht nicht nach "Grad Dezimalminuten"-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
coord_dm_xymin
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als XY-Angaben mit Minutensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 3853' -7702.1' und -07702m+3853.3458m.

  • FIND_DM_XYMINDas Werkzeug sucht nach "Grad Dezimalminuten"-Koordinaten, die als XY-Angaben mit Minutensymbolen formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DM_XYMINDas Werkzeug sucht nicht nach "Grad Dezimalminuten"-Koordinaten, die als XY-Angaben mit Minutensymbolen formatiert sind.
Boolean
coord_dms_latlon
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 385320.7N 770206.000W und W770206N385320.76.

  • FIND_DMS_LATLONDas Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als Breiten- und Längengrad formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DMS_LATLONDas Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als Breiten- und Längengrad formatiert sind.
Boolean
coord_dms_xysec
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Sekundensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 385320" -770206.0" und -0770206.0s+385320.76s.

  • FIND_DMS_XYSECDas Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Sekundensymbolen formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DMS_XYSECDas Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Sekundensymbolen formatiert sind.
Boolean
coord_dms_xysep
(optional)

Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Trennzeichen formatiert sind (moderat auftretende Fehlalarme). Beispiele: 8:53:20 -77:2:6.0 und -077/02/06/+38/53/20.76.

  • FIND_DMS_XYSEPDas Werkzeug sucht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Trennzeichen formatiert sind. Dies ist die Standardeinstellung.
  • DONT_FIND_DMS_XYSEPDas Werkzeug sucht nicht nach "Grad, Minuten, Sekunden"-Koordinaten, die als XY-Angaben mit Trennzeichen formatiert sind.
Boolean
coord_utm
(optional)

Gibt an, ob nach UTM-Koordinaten (Universelle transversale Mercator-Projektion) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S 323503 4306438 und 18 north 323503.25 4306438.39.

  • FIND_UTM_MAINWORLDDas Werkzeug sucht nach UTM-Koordinaten. Dies ist die Standardeinstellung.
  • DONT_FIND_UTM_MAINWORLDDas Werkzeug sucht nicht nach UTM-Koordinaten.
Boolean
coord_ups_north
(optional)

Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y 2722399 2000000 und north 2722399 2000000.

  • FIND_UTM_NORTHPOLARDas Werkzeug sucht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich. Dies ist die Standardeinstellung.
  • DONT_FIND_UTM_NORTHPOLARDas Werkzeug sucht nicht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich.
Boolean
coord_ups_south
(optional)

Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: A 2000000 3168892 und south 2000000 3168892.

  • FIND_UTM_SOUTHPOLARDas Werkzeug sucht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich. Dies ist die Standardeinstellung.
  • DONT_FIND_UTM_SOUTHPOLARDas Werkzeug sucht nicht nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich.
Boolean
coord_mgrs
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S UJ 13503 06438 und 18SUJ0306.

  • FIND_MGRS_MAINWORLDDas Werkzeug sucht nach MGRS-Koordinaten. Dies ist die Standardeinstellung.
  • DONT_FIND_MGRS_MAINWORLDDas Werkzeug sucht nicht nach MGRS-Koordinaten.
Boolean
coord_mgrs_northpolar
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y TG 56814 69009 und YTG5669.

  • FIND_MGRS_NORTHPOLARDas Werkzeug sucht nach MGRS-Koordinaten im Nordpolarbereich. Dies ist die Standardeinstellung.
  • DONT_FIND_MGRS_NORTHPOLARDas Werkzeug sucht nicht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich.
Boolean
coord_mgrs_southpolar
(optional)

Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Südpolarbereich gesucht werden soll (moderat auftretende Fehlalarme). Beispiele: A TN 56814 30991 und ATN5630.

  • FIND_MGRS_SOUTHPOLARDas Werkzeug sucht nach MGRS-Koordinaten im Südpolarbereich. Dies ist die Standardeinstellung.
  • DONT_FIND_MGRS_SOUTHPOLARDas Werkzeug sucht nicht nach MGRS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich.
Boolean
comma_decimal
(optional)

Gibt an, ob ein Komma (,) als Dezimaltrennzeichen erkannt werden soll. Standardmäßig werden Inhalte auf räumliche Koordinaten überprüft (erkennbar durch einen Punkt (.) oder ein Multiplikationszeichen (·) als Dezimaltrennzeichen), z. B. Lat 01° 10·80’ N Long 103° 28·60’ E. Wenn Sie mit Inhalten arbeiten, in denen räumliche Koordinaten durch Zahlen definiert sind, die ein Komma (,) als Dezimaltrennzeichen verwenden, z. B. 52° 8′ 32,14″ N; 5° 24′ 56,09″ E, legen Sie diesen Parameter entsprechend fest, sodass ein Komma als Dezimaltrennzeichen erkannt wird. Dieser Parameter wird nicht automatisch auf Grundlage der regionalen Einstellung des Betriebssystems Ihres Computers eingestellt.

  • USE_COMMA_DECIMAL_MARKEin Komma wird als Dezimaltrennzeichen erkannt.
  • USE_DOT_DECIMAL_MARKEin Punkt oder ein Multiplikationszeichen soll als Dezimaltrennzeichen erkannt werden. Dies ist die Standardeinstellung.
Boolean
coord_use_lonlat
(optional)

Wenn Ziffern wie XY-Koordinaten wirken, beide Ziffern kleiner als 90 sind und nicht durch Symbole oder Notationen angegeben wird, welche Ziffer den Längengrad darstellt, können die Ergebnisse mehrdeutig sein. Interpretieren Sie die Ziffern in der Koordinatenreihenfolge Längengrad, Breitengrad (d. h. XY) und nicht Breitengrad, Längengrad (d. h. YX).

  • PREFER_LONLATXY-Koordinaten werden als Längengrad-Breitengrad interpretiert.
  • PREFER_LATLONXY-Koordinaten werden als Breitengrad-Längengrad interpretiert. Dies ist die Standardeinstellung.
Boolean
in_coor_system
(optional)

Das Koordinatensystem, das verwendet wird, um die in der Eingabe definierten räumlichen Koordinaten zu interpretieren. GCS WGS 84 ist der Standard.

Spatial Reference
in_custom_locations
(optional)

Die benutzerdefinierte Ortsdatei (.lxtgaz), die beim Scannen des Eingabeinhalts verwendet wird. Für jedes Vorkommen eines Ortsnamens in der benutzerdefinierten Ortsdatei wird ein Punkt erstellt, und zwar bis zu den Grenzen, die durch andere Werkzeugparameter festgelegt sind.

File
fuzzy_match
(optional)

Gibt an, ob ein Fuzzy-Abgleich bei der Suche in der benutzerdefinierten Ortsdatei verwendet werden soll.

  • USE_FUZZYEin Fuzzy-Abgleich wird bei der Suche in der benutzerdefinierten Ortsdatei verwendet.
  • DONT_USE_FUZZYEin exakter Abgleich wird bei der Suche in der benutzerdefinierten Ortsdatei verwendet. Dies ist die Standardeinstellung.
Boolean
max_features_extracted
(optional)

Maximale Anzahl an Features, die extrahiert werden können. Das Werkzeug durchsucht den eingegebenen Inhalt nicht mehr nach Orten, wenn die maximale Anzahl erreicht ist. Wenn der Service als Geoverarbeitungsservice ausgeführt wird, können für den Service und für den Server unterschiedliche Limits für die Anzahl der zulässigen Features gelten.

Long
ignore_first_features
(optional)

Die Anzahl der Features, die erkannt und ignoriert werden, bevor alle anderen Features extrahiert werden. Dieser Parameter kann verwendet werden, um die Suche auf einen bestimmten Teil der Daten zu konzentrieren.

Long
date_monthname
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen der Monatsname vorkommt (seltene Fehlalarme). 12 May 2003 und January 15, 1997 sind Beispiele.

  • FIND_DATE_MONTHNAMEDas Werkzeug sucht nach Datumsangaben, in denen der Monatsname vorkommt. Dies ist die Standardeinstellung.
  • DONT_FIND_DATE_MONTHNAMEDas Werkzeug sucht nicht nach Datumsangaben, in denen der Monatsname vorkommt.
Boolean
date_m_d_y
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). 5/12/03 und 1-15-1997 sind Beispiele.

  • FIND_DATE_M_D_YDas Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). Dies ist die Standardeinstellung.
  • DONT_FIND_DATE_M_D_YDas Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format M/T/J oder T/M/J vorkommen.
Boolean
date_yyyymmdd
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). 20030512 und 19970115 sind Beispiele.

  • FIND_DATE_YYYYMMDDDas Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). Dies ist die Standardeinstellung.
  • DONT_FIND_DATE_YYYYMMDDDas Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format JJJJMMTT vorkommen.
Boolean
date_yymmdd
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). 030512 und 970115 sind Beispiele.

  • FIND_DATE_YYMMDDDas Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • DONT_FIND_DATE_YYMMDDDas Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format JJMMTT vorkommen.
Boolean
date_yyjjj
(optional)

Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). 03132 und 97015 sind Beispiele.

  • FIND_DATE_YYJJJDas Werkzeug sucht nach Datumsangaben, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). Dies ist die Standardeinstellung.
  • DONT_FIND_DATE_YYJJJDas Werkzeug sucht nicht nach Datumsangaben, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen.
Boolean
max_dates_extracted
(optional)

Die maximale Anzahl an zu extrahierenden Datumsangaben.

Long
ignore_first_dates
(optional)

Die Anzahl an Datumsangaben, die erkannt und ignoriert werden, bevor alle anderen Datumsangaben extrahiert werden.

Long
date_range_begin
(optional)

Das früheste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem späteren entsprechen, werden extrahiert.

Date
date_range_end
(optional)

Das späteste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem früheren entsprechen, werden extrahiert.

Date
in_custom_attributes
(optional)

Die benutzerdefinierte Ortsdatei (.lxtca), die zum Scannen des Eingabeinhalts verwendet wird. Für alle in der Datei definierten benutzerdefinierten Attribute werden Felder in der Attributtabelle der Ausgabe-Feature-Class erstellt. Wenn der Eingabeinhalt gescannt wird, wird geprüft, ob er Text enthält, der mit in der Datei angegebenen benutzerdefinierten Attributen verknüpft ist. Wenn eine Übereinstimmung gefunden wird, wird der entsprechende Text aus dem Eingabeinhalt extrahiert und im entsprechenden Feld gespeichert.

File
file_link
(optional)

Der Dateipfad, der als Dateiname in den Ausgabedaten verwendet wird, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben wird, wird der Pfad der Eingabedatei verwendet, bei dem es sich um einen nicht erreichbaren Ordner auf einem Server handeln kann. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist.

String
file_mod_datetime
(optional)

Das UTC-Datum und die UTC-Uhrzeit, zu der die Datei geändert wurde, wird als "Geändert"-Attribut in den Ausgabedaten verwendet, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben ist, wird die aktuelle "Geändert"-Zeit der Eingabedatei verwendet. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist.

Date
pre_text_length
(optional)

Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die vor dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Pre-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Pre-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten.

Long
post_text_length
(optional)

Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die nach dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Post-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Post-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten.

Long
std_coord_fmt
(optional)

Gibt das Koordinatenformat an, das zum Speichern der Koordinatenposition verwendet werden soll. Eine Standarddarstellung der räumlichen Koordinate, die das Punkt-Feature definiert, wird in einem Feld der Attributtabelle gespeichert.

  • STD_COORD_FMT_DDDie Koordinatenposition wird im Dezimalgrad-Format festgehalten. Dies ist die Standardeinstellung.
  • STD_COORD_FMT_DMDie Koordinatenposition wird im "Grad Dezimalminuten"-Format festgehalten.
  • STD_COORD_FMT_DMSDie Koordinatenposition wird im "Grad Minuten Sekunden-"Format festgehalten.
  • STD_COORD_FMT_UTMDie Koordinatenposition wird im Format der universellen transversalen Mercator-Projektion festgehalten.
  • STD_COORD_FMT_MGRSDie Koordinatenposition wird im Format des Military Grid Reference System festgehalten.
String
req_word_breaks
(optional)

Gibt an, ob mit Wortumbrüchen nach Text gesucht werden soll. Ein Wortumbruch bedeutet, dass Wörter (Text) durch Leerzeichen oder Satzzeichen begrenzt sind, wie dies in europäischen Sprachen der Fall ist.

Diese Einstellung kann je nach Sprache des Textes zu häufigen oder seltenen Fehlalarmen führen. Wenn "Wortumbrüche sind erforderlich" nicht aktiv ist, würde z. B. der englische Text Bernard mit San Bernardino übereinstimmen, was wahrscheinlich als falsch positives Ergebnis angesehen werden würde. Wenn der Text jedoch in einer Sprache geschrieben wurde, die keine Wortumbrüche verwendet, finden Sie keine Wörter, sofern "Wortumbrüche sind erforderlich" aktiv ist. Beispielsweise wird mit dem Text Ich flog nach Tokio auf Japanisch (私は東京に飛んで) nur das Wort Tokio gefunden (東京), wenn "Wortumbrüche sind erforderlich" nicht aktiv ist.

  • REQ_WORD_BREAKSDas Werkzeug sucht nach Wörtern, die durch Leerzeichen oder Satzzeichen begrenzt sind. Dies ist die Standardeinstellung.
  • DONT_REQ_WORD_BREAKSDas Werkzeug sucht nicht nach Wörtern, die durch Leerzeichen oder Satzzeichen begrenzt sind.
Boolean

Codebeispiel

ExtractLocationsFromDocument – Beispiel (Python-Fenster)

Das folgende Skript für das Python-Fenster veranschaulicht, wie die Funktion ExtractLocationsFromDocument im unmittelbaren Modus verwendet wird.

import arcpy
arcpy.env.workspace = "c:/data"
arcpy.conversion.ExtractLocationsFromDocument("wells.docx", "water.gdb/wells")

Lizenzinformationen

  • Basic: Erfordert LocateXT
  • Standard: Erfordert LocateXT
  • Advanced: Erfordert LocateXT

Verwandte Themen