Beschriftung | Erläuterung | Datentyp |
Eingabedatei | Die Eingabedatei, in der nach Positionen (Koordinaten oder benutzerdefinierte Positionen), Datumsangaben und benutzerdefinierten Attributen gesucht wird, oder ein Ordner, in dem in allen Dateien im Ordner nach Positionen gesucht wird. | File |
Ausgabe-Feature-Class | Die Feature-Class mit Punkt-Features, die die gefundenen Orte darstellt. | Feature Class |
Eingabevorlage (optional) | Die Vorlagendatei (*.lxttmpl), die die Einstellung für die einzelnen Werkzeugparameter festlegt. Wenn eine Vorlagendatei angegeben wird, werden alle für andere Parameter angegebenen Werte ignoriert, mit Ausnahme derjenigen, die den zu verarbeitenden Eingabeinhalt und die Ausgabe-Feature-Class bestimmen. Einige Einstellungen, die im Bereich Positionen extrahieren verfügbar sind, stehen diesem Werkzeug nur zur Verfügung, wenn die Einstellungen in einer Vorlagendatei gespeichert sind und die Vorlagendatei in diesem Parameter referenziert wird. Dies sind die folgenden Einstellungen:
| File |
Breiten- und Längengrad (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 33.8N 77.035W und W77N38.88909.
| Boolean |
X Y mit Gradsymbolen (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben mit Gradsymbolen formatiert sind (seltene Fehlalarme). Beispiele: 38.8° -77.035° und -077d+38.88909d.
| Boolean |
X Y ohne Gradsymbole (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Beispiele: 38.8 -77.035 und -077.0, +38.88909.
| Boolean |
Breiten- und Längengrad (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 3853.3N 7702.100W und W7702N3853.3458.
| Boolean |
X Y mit Minutensymbolen (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als XY-Angaben mit Minutensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 3853' -7702.1' und -07702m+3853.3458m.
| Boolean |
Breiten- und Längengrad (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 385320.7N 770206.000W und W770206N385320.76.
| Boolean |
X Y mit Sekundensymbolen (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Sekundensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 385320" -770206.0" und -0770206.0s+385320.76s.
| Boolean |
X Y mit Trennzeichen (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Trennzeichen formatiert sind (moderat auftretende Fehlalarme). Beispiele: 38:53:20 -77:2:6.0 und -077/02/06/+38/53/20.76.
| Boolean |
Universelle transversale Mercator-Projektion (optional) | Gibt an, ob nach UTM-Koordinaten (Universelle transversale Mercator-Projektion) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S 323503 4306438 und 18 north 323503.25 4306438.39.
| Boolean |
UPS Nordpolar (optional) | Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y 2722399 2000000 und north 2722399 2000000.
| Boolean |
UPS Südpolar (optional) | Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: A 2000000 3168892 und south 2000000 3168892.
| Boolean |
Military Grid Reference System (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S UJ 13503 06438 und 18SUJ0306.
| Boolean |
Nordpolar (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y TG 56814 69009 und YTG5669.
| Boolean |
Südpolar (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Südpolarbereich gesucht werden soll (moderat auftretende Fehlalarme). Beispiele: A TN 56814 30991 und ATN5630.
| Boolean |
Komma als Dezimalzeichen verwenden (optional) | Gibt an, ob ein Komma (,) als Dezimaltrennzeichen erkannt werden soll. Standardmäßig werden Inhalte auf räumliche Koordinaten überprüft (erkennbar durch einen Punkt (.) oder ein Multiplikationszeichen (·) als Dezimaltrennzeichen), z. B. Lat 01° 10·80’ N Long 103° 28·60’ E. Wenn Sie mit Inhalten arbeiten, in denen räumliche Koordinaten durch Zahlen definiert sind, die ein Komma (,) als Dezimaltrennzeichen verwenden, z. B. 52° 8′ 32,14″ N; 5° 24′ 56,09″ E, legen Sie diesen Parameter entsprechend fest, sodass ein Komma als Dezimaltrennzeichen erkannt wird. Dieser Parameter wird nicht automatisch auf Grundlage der regionalen Einstellung des Betriebssystems Ihres Computers eingestellt.
| Boolean |
Interpretation als Längengrad, Breitengrad (optional) | Gibt an, ob XY-Koordinaten als Längen- und Breitengrad interpretiert werden sollen. Wenn Ziffern wie XY-Koordinaten wirken, beide Ziffern kleiner als 90 sind und nicht durch Symbole oder Notationen angegeben wird, welche Ziffer den Längengrad darstellt, können die Ergebnisse mehrdeutig sein. Interpretieren Sie die Ziffern in der Koordinatenreihenfolge Längengrad, Breitengrad (d. h. XY) und nicht Breitengrad, Längengrad (d. h. YX).
| Boolean |
Eingabe-Koordinatensystem (optional) | Das Koordinatensystem, das verwendet wird, um die in der Eingabe definierten räumlichen Koordinaten zu interpretieren. GCS WGS 84 ist der Standard. | Spatial Reference |
Benutzerdefinierte Eingabepositionen (optional) | Die benutzerdefinierte Ortsdatei (.lxtgaz), die beim Scannen des Eingabeinhalts verwendet wird. Für jedes Vorkommen eines Ortsnamens in der benutzerdefinierten Ortsdatei wird ein Punkt erstellt, und zwar bis zu den Grenzen, die durch andere Werkzeugparameter festgelegt sind. | File |
Fuzzy-Abgleich verwenden (optional) | Gibt an, ob beim Vergleich des Eingabeinhalts mit den in der benutzerdefinierten Ortsdatei angegebenen Ortsnamen ein Fuzzy-Abgleich stattfinden soll.
| Boolean |
Maximale Anzahl an extrahierten Features (optional) | Maximale Anzahl an Features, die extrahiert werden können. Das Werkzeug durchsucht den eingegebenen Inhalt nicht mehr nach Orten, wenn die maximale Anzahl erreicht ist. Wenn der Service als Geoverarbeitungsservice ausgeführt wird, können für den Service und für den Server unterschiedliche Limits für die Anzahl der zulässigen Features gelten. | Long |
Die angegebene Anzahl an ersten Features ignorieren (optional) | Die Anzahl der Features, die erkannt und ignoriert werden, bevor alle anderen Features extrahiert werden. Dieser Parameter kann verwendet werden, um die Suche auf einen bestimmten Teil der Daten zu konzentrieren. | Long |
Verwendeter Monatsname (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen der Monatsname vorkommt (seltene Fehlalarme). 12 May 2003 und January 15, 1997 sind Beispiele.
| Boolean |
M/T/J und T/M/J (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). 5/12/03 und 1-15-1997 sind Beispiele.
| Boolean |
JJJJMMTT (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). 20030512 und 19970115 sind Beispiele.
| Boolean |
JJMMTT (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). 030512 und 970115 sind Beispiele.
| Boolean |
YYJJJ (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). 03132 und 97015 sind Beispiele.
| Boolean |
Maximale Anzahl an extrahierten Datumsangaben (optional) | Die maximale Anzahl an zu extrahierenden Datumsangaben. | Long |
Die angegebene Anzahl an ersten Datumsangaben ignorieren (optional) | Die Anzahl an Datumsangaben, die erkannt und ignoriert werden, bevor alle anderen Datumsangaben extrahiert werden. | Long |
Frühestes Datum des zulässigen Datumsbereichs (optional) | Das früheste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem späteren entsprechen, werden extrahiert. | Date |
Letztes Datum des zulässigen Datumsbereichs (optional) | Das späteste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem früheren entsprechen, werden extrahiert. | Date |
Benutzerdefinierte Eingabeattribute (optional) | Die benutzerdefinierte Ortsdatei (.lxtca), die zum Scannen des Eingabeinhalts verwendet wird. Für alle in der Datei definierten benutzerdefinierten Attribute werden Felder in der Attributtabelle der Ausgabe-Feature-Class erstellt. Wenn der Eingabeinhalt gescannt wird, wird geprüft, ob er Text enthält, der mit in der Datei angegebenen benutzerdefinierten Attributen verknüpft ist. Wenn eine Übereinstimmung gefunden wird, wird der entsprechende Text aus dem Eingabeinhalt extrahiert und im entsprechenden Feld gespeichert. | File |
Eingabedatei: Link-Text (optional) | Der Dateipfad, der als Dateiname in den Ausgabedaten verwendet wird, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben wird, wird der Pfad der Eingabedatei verwendet, bei dem es sich um einen nicht erreichbaren Ordner auf einem Server handeln kann. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist. | String |
Eingabedatei: Datum und Uhrzeit (optional) | Das UTC-Datum und die UTC-Uhrzeit, zu der die Datei geändert wurde, wird als "Geändert"-Attribut in den Ausgabedaten verwendet, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben ist, wird die aktuelle "Geändert"-Zeit der Eingabedatei verwendet. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist. | Date |
Prätext-Feldlänge (optional) | Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die vor dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Pre-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Pre-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten. | Long |
Posttext-Feldlänge (optional) | Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die nach dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Post-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Post-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten. | Long |
Koordinatenformat (optional) | Gibt das Koordinatenformat an, das zum Speichern der Koordinatenposition verwendet werden soll. Eine Standarddarstellung der räumlichen Koordinate, die das Punkt-Feature definiert, wird in einem Feld der Attributtabelle gespeichert.
| String |
Wortumbrüche sind erforderlich (optional) | Gibt an, ob mit Wortumbrüchen nach Text gesucht werden soll. Ein Wortumbruch bedeutet, dass Wörter (Text) durch Leerzeichen oder Satzzeichen begrenzt sind, wie dies in europäischen Sprachen der Fall ist. Diese Einstellung kann je nach Sprache des Textes zu häufigen oder seltenen Fehlalarmen führen. Wenn "Wortumbrüche sind erforderlich" nicht aktiv ist, würde z. B. der englische Text Bernard mit San Bernardino übereinstimmen, was wahrscheinlich als falsch positives Ergebnis angesehen werden würde. Wenn der Text jedoch in einer Sprache geschrieben wurde, die keine Wortumbrüche verwendet, finden Sie keine Wörter, sofern "Wortumbrüche sind erforderlich" aktiv ist. Beispielsweise wird mit dem Text Ich flog nach Tokio auf Japanisch (私は東京に飛んで) nur das Wort Tokio gefunden (東京), wenn "Wortumbrüche sind erforderlich" nicht aktiv ist.
| Boolean |
Mit der LocateXT-Lizenz verfügbar.
Zusammenfassung
Analysiert Dokumente mit nicht oder nur grob strukturiertem Text (z. B. E-Mail-Nachrichten, Reiseformulare usw.) und extrahiert Positionen in eine Point-Feature-Class.
Die Eingabe-Dokumente werden von dem Werkzeug wie folgt analysiert und verarbeitet:
- Im Inhalt der Dokumente angegebene räumliche Koordinaten werden erkannt und als Punkte erstellt, die diese Positionen darstellen. Die folgenden Koordinatenformate werden erkannt: Dezimalgrad, Grad Dezimalminuten, Grad Minuten Sekunden, Universal Transverse Mercator und Military Grid Reference System.
- Im Inhalt des Dokuments angegebene und in einer benutzerdefinierten Datei mit Ortsangaben definierte Ortsnamen werden erkannt und als Punkte erstellt, die diese Positionen darstellen. In einer benutzerdefinierten Positionsdatei wird ein Ortsname mit einer räumlichen Koordinate für diese Position verknüpft.
- Relevante Informationen im Text werden erkannt, aus einem Dokument extrahiert und in Feldern in der Attributtabelle der Ausgabe-Feature-Class aufgezeichnet.
Dieses Werkzeug unterstützt alle Microsoft Office-Dokumente (Word, PowerPoint und Excel), Adobe PDF-Dokumente, Text mit Markups wie XML- und HTML-Dokumente und Nur-Text-Dateien wie Textdateien (.txt).
Verwendung
Die standardmäßigen Parameterwerte sind für die optimale Identifizierung von Koordinaten und Datumsangaben konzipiert. Die Standardwerte können für jeden Parameter geändert werden. Je weniger Parameter geändert werden, desto schneller wird das Werkzeug ausgeführt.
Alle Koordinatenformate sind standardmäßig aktiv. Wenn Sie nur benutzerdefinierte Orte und keine räumlichen Koordinaten extrahieren möchten, können Sie die Parameter für das Koordinatenformat deaktivieren.
Wenn ein Adobe PDF-Dokument als Eingabe zur Verfügung gestellt wird und eine räumliche Koordinate in einem aktivierten Format enthält, aber die Ausgabe-Feature-Class kein Feature enthält, das die räumliche Koordinate darstellt, kann Ihr Computer PDF-Dokumente aufgrund einer fehlenden Komponente möglicherweise nicht verarbeiten.
Wenn Sie eine benutzerdefinierte Ortsdatei verwenden, um Ortsnamen zu extrahieren, sollten Sie am besten weniger Ortsnamen in der Datei angeben. Wenn Sie beispielsweise eine Feature-Class, die alle Orte der Welt repräsentiert, in eine benutzerdefinierte Ortsdatei konvertieren, kann der Prozess viel Zeit in Anspruch nehmen, wenn nach Orten gesucht wird, die höchstwahrscheinlich nicht vorhanden sind oder in Gebieten der Welt liegen, die Sie für Ihre Analyse nicht interessieren.
Wenn die Ortsnamen, an denen Sie interessiert sind, falsch geschrieben werden können oder bekannte Variationen aufweisen, erhalten Sie in der Regel bessere Ergebnisse, wenn Sie in der benutzerdefinierten Ortsdatei diese häufigen Schreibfehler und alternativen Ortsnamen gleich mit angeben, anstatt den Fuzzy-Abgleich zu verwenden. Wenn der Fuzzy-Abgleich aktiviert wurde, wird ein Ort ausgegeben, wenn 70 % der Zeichen in einem Ortsnamen mit der Eingabe übereinstimmen. Dadurch können mehr falsch positive Ergebnisse entstehen, als wenn Sie bekannte Variationen und Fehlschreibungen gleich mit angeben.
Ein nützlicher Workflow für den Fuzzy-Abgleich ist, das Werkzeug zuerst mit deaktiviertem Fuzzy-Abgleich auszuführen. Führen Sie das Werkzeug danach erneut mit aktiviertem Fuzzy-Abgleich aus, und prüfen Sie die Ergebnisse. So können Schreibvariationen identifiziert werden, die der benutzerdefinierten Ortsdatei hinzugefügt werden können.
Parameter
arcpy.conversion.ExtractLocationsDocument(in_file, out_feature_class, {in_template}, {coord_dd_latlon}, {coord_dd_xydeg}, {coord_dd_xyplain}, {coord_dm_latlon}, {coord_dm_xymin}, {coord_dms_latlon}, {coord_dms_xysec}, {coord_dms_xysep}, {coord_utm}, {coord_ups_north}, {coord_ups_south}, {coord_mgrs}, {coord_mgrs_northpolar}, {coord_mgrs_southpolar}, {comma_decimal}, {coord_use_lonlat}, {in_coor_system}, {in_custom_locations}, {fuzzy_match}, {max_features_extracted}, {ignore_first_features}, {date_monthname}, {date_m_d_y}, {date_yyyymmdd}, {date_yymmdd}, {date_yyjjj}, {max_dates_extracted}, {ignore_first_dates}, {date_range_begin}, {date_range_end}, {in_custom_attributes}, {file_link}, {file_mod_datetime}, {pre_text_length}, {post_text_length}, {std_coord_fmt}, {req_word_breaks})
Name | Erläuterung | Datentyp |
in_file | Die Eingabedatei, in der nach Positionen (Koordinaten oder benutzerdefinierte Positionen), Datumsangaben und benutzerdefinierten Attributen gesucht wird, oder ein Ordner, in dem in allen Dateien im Ordner nach Positionen gesucht wird. | File |
out_feature_class | Die Feature-Class mit Punkt-Features, die die gefundenen Orte darstellt. | Feature Class |
in_template (optional) | Die Vorlagendatei (*.lxttmpl), die die Einstellung für die einzelnen Werkzeugparameter festlegt. Wenn eine Vorlagendatei angegeben wird, werden alle für andere Parameter angegebenen Werte ignoriert, mit Ausnahme derjenigen, die den zu verarbeitenden Eingabeinhalt und die Ausgabe-Feature-Class bestimmen. Einige Einstellungen, die im Bereich Positionen extrahieren verfügbar sind, stehen diesem Werkzeug nur zur Verfügung, wenn die Einstellungen in einer Vorlagendatei gespeichert sind und die Vorlagendatei in diesem Parameter referenziert wird. Dies sind die folgenden Einstellungen:
| File |
coord_dd_latlon (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 33.8N 77.035W und W77N38.88909.
| Boolean |
coord_dd_xydeg (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben mit Gradsymbolen formatiert sind (seltene Fehlalarme). Beispiele: 38.8° -77.035° und -077d+38.88909d.
| Boolean |
coord_dd_xyplain (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als Dezimalgrad gespeichert und als XY-Angaben ohne Symbole formatiert sind (häufige Fehlalarme). Beispiele: 38.8 -77.035 und -077.0, +38.88909.
| Boolean |
coord_dm_latlon (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 3853.3N 7702.100W und W7702N3853.3458.
| Boolean |
coord_dm_xymin (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad Dezimalminuten" gespeichert und als XY-Angaben mit Minutensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 3853' -7702.1' und -07702m+3853.3458m.
| Boolean |
coord_dms_latlon (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als Breiten- und Längengrad formatiert sind (seltene Fehlalarme). Beispiele: 385320.7N 770206.000W und W770206N385320.76.
| Boolean |
coord_dms_xysec (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Sekundensymbolen formatiert sind (seltene Fehlalarme). Beispiele: 385320" -770206.0" und -0770206.0s+385320.76s.
| Boolean |
coord_dms_xysep (optional) | Gibt an, ob nach Koordinaten gesucht werden soll, die als "Grad, Minuten, Sekunden" gespeichert und als XY-Angaben mit Trennzeichen formatiert sind (moderat auftretende Fehlalarme). Beispiele: 8:53:20 -77:2:6.0 und -077/02/06/+38/53/20.76.
| Boolean |
coord_utm (optional) | Gibt an, ob nach UTM-Koordinaten (Universelle transversale Mercator-Projektion) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S 323503 4306438 und 18 north 323503.25 4306438.39.
| Boolean |
coord_ups_north (optional) | Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y 2722399 2000000 und north 2722399 2000000.
| Boolean |
coord_ups_south (optional) | Gibt an, ob nach UPS-Koordinaten (Universelle polar-stereographische Projektion) im Südpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: A 2000000 3168892 und south 2000000 3168892.
| Boolean |
coord_mgrs (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) gesucht werden soll (seltene Fehlalarme). Beispiele: 18S UJ 13503 06438 und 18SUJ0306.
| Boolean |
coord_mgrs_northpolar (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Nordpolarbereich gesucht werden soll (seltene Fehlalarme). Beispiele: Y TG 56814 69009 und YTG5669.
| Boolean |
coord_mgrs_southpolar (optional) | Gibt an, ob nach MGRS-Koordinaten (Military Grid Reference Systems) im Südpolarbereich gesucht werden soll (moderat auftretende Fehlalarme). Beispiele: A TN 56814 30991 und ATN5630.
| Boolean |
comma_decimal (optional) | Gibt an, ob ein Komma (,) als Dezimaltrennzeichen erkannt werden soll. Standardmäßig werden Inhalte auf räumliche Koordinaten überprüft (erkennbar durch einen Punkt (.) oder ein Multiplikationszeichen (·) als Dezimaltrennzeichen), z. B. Lat 01° 10·80’ N Long 103° 28·60’ E. Wenn Sie mit Inhalten arbeiten, in denen räumliche Koordinaten durch Zahlen definiert sind, die ein Komma (,) als Dezimaltrennzeichen verwenden, z. B. 52° 8′ 32,14″ N; 5° 24′ 56,09″ E, legen Sie diesen Parameter entsprechend fest, sodass ein Komma als Dezimaltrennzeichen erkannt wird. Dieser Parameter wird nicht automatisch auf Grundlage der regionalen Einstellung des Betriebssystems Ihres Computers eingestellt.
| Boolean |
coord_use_lonlat (optional) | Wenn Ziffern wie XY-Koordinaten wirken, beide Ziffern kleiner als 90 sind und nicht durch Symbole oder Notationen angegeben wird, welche Ziffer den Längengrad darstellt, können die Ergebnisse mehrdeutig sein. Interpretieren Sie die Ziffern in der Koordinatenreihenfolge Längengrad, Breitengrad (d. h. XY) und nicht Breitengrad, Längengrad (d. h. YX).
| Boolean |
in_coor_system (optional) | Das Koordinatensystem, das verwendet wird, um die in der Eingabe definierten räumlichen Koordinaten zu interpretieren. GCS WGS 84 ist der Standard. | Spatial Reference |
in_custom_locations (optional) | Die benutzerdefinierte Ortsdatei (.lxtgaz), die beim Scannen des Eingabeinhalts verwendet wird. Für jedes Vorkommen eines Ortsnamens in der benutzerdefinierten Ortsdatei wird ein Punkt erstellt, und zwar bis zu den Grenzen, die durch andere Werkzeugparameter festgelegt sind. | File |
fuzzy_match (optional) | Gibt an, ob ein Fuzzy-Abgleich bei der Suche in der benutzerdefinierten Ortsdatei verwendet werden soll.
| Boolean |
max_features_extracted (optional) | Maximale Anzahl an Features, die extrahiert werden können. Das Werkzeug durchsucht den eingegebenen Inhalt nicht mehr nach Orten, wenn die maximale Anzahl erreicht ist. Wenn der Service als Geoverarbeitungsservice ausgeführt wird, können für den Service und für den Server unterschiedliche Limits für die Anzahl der zulässigen Features gelten. | Long |
ignore_first_features (optional) | Die Anzahl der Features, die erkannt und ignoriert werden, bevor alle anderen Features extrahiert werden. Dieser Parameter kann verwendet werden, um die Suche auf einen bestimmten Teil der Daten zu konzentrieren. | Long |
date_monthname (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen der Monatsname vorkommt (seltene Fehlalarme). 12 May 2003 und January 15, 1997 sind Beispiele.
| Boolean |
date_m_d_y (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format M/T/J oder T/M/J vorkommen (moderat auftretende Fehlalarme). 5/12/03 und 1-15-1997 sind Beispiele.
| Boolean |
date_yyyymmdd (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJJJMMTT vorkommen (moderat auftretende Fehlalarme). 20030512 und 19970115 sind Beispiele.
| Boolean |
date_yymmdd (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format JJMMTT vorkommen (häufige Fehlalarme). 030512 und 970115 sind Beispiele.
| Boolean |
date_yyjjj (optional) | Gibt an, ob nach Datumsangaben gesucht werden soll, in denen Zahlen im Format YYJJJ oder YYYYJJJ vorkommen (häufige Fehlalarme). 03132 und 97015 sind Beispiele.
| Boolean |
max_dates_extracted (optional) | Die maximale Anzahl an zu extrahierenden Datumsangaben. | Long |
ignore_first_dates (optional) | Die Anzahl an Datumsangaben, die erkannt und ignoriert werden, bevor alle anderen Datumsangaben extrahiert werden. | Long |
date_range_begin (optional) | Das früheste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem späteren entsprechen, werden extrahiert. | Date |
date_range_end (optional) | Das späteste Datum für die Extraktion. Erkannte Datumsangaben, die diesem Wert oder einem früheren entsprechen, werden extrahiert. | Date |
in_custom_attributes (optional) | Die benutzerdefinierte Ortsdatei (.lxtca), die zum Scannen des Eingabeinhalts verwendet wird. Für alle in der Datei definierten benutzerdefinierten Attribute werden Felder in der Attributtabelle der Ausgabe-Feature-Class erstellt. Wenn der Eingabeinhalt gescannt wird, wird geprüft, ob er Text enthält, der mit in der Datei angegebenen benutzerdefinierten Attributen verknüpft ist. Wenn eine Übereinstimmung gefunden wird, wird der entsprechende Text aus dem Eingabeinhalt extrahiert und im entsprechenden Feld gespeichert. | File |
file_link (optional) | Der Dateipfad, der als Dateiname in den Ausgabedaten verwendet wird, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben wird, wird der Pfad der Eingabedatei verwendet, bei dem es sich um einen nicht erreichbaren Ordner auf einem Server handeln kann. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist. | String |
file_mod_datetime (optional) | Das UTC-Datum und die UTC-Uhrzeit, zu der die Datei geändert wurde, wird als "Geändert"-Attribut in den Ausgabedaten verwendet, wenn der Parameter Eingabedatei (in_file in Python) an den Server übertragen wird. Wenn dieser Parameter nicht angegeben ist, wird die aktuelle "Geändert"-Zeit der Eingabedatei verwendet. Dieser Parameter hat keine Auswirkung, wenn die Eingabedatei nicht angegeben ist. | Date |
pre_text_length (optional) | Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die vor dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Pre-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Pre-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten. | Long |
post_text_length (optional) | Inhalt wird aus dem Eingabedokument extrahiert, um einen Kontext für den gefundenen Ort zu liefern. Dieser Parameter legt die maximale Anzahl der Zeichen fest, die nach dem Text, der den Ort definiert, extrahiert werden. Der extrahierte Text wird im Feld Post-Text in der Attributtabelle der Ausgabe-Feature-Class gespeichert. Der Standard ist 254. Der Datentyp des Feldes Post-Text hat ebenfalls diese Länge. Die Länge eines Textfeldes in einem Shapefile ist auf 254 Zeichen begrenzt. Wenn die Ausgabe ein Shapefile ist, wird eine größere Anzahl von Zeichen auf 254 abgeschnitten. | Long |
std_coord_fmt (optional) | Gibt das Koordinatenformat an, das zum Speichern der Koordinatenposition verwendet werden soll. Eine Standarddarstellung der räumlichen Koordinate, die das Punkt-Feature definiert, wird in einem Feld der Attributtabelle gespeichert.
| String |
req_word_breaks (optional) | Gibt an, ob mit Wortumbrüchen nach Text gesucht werden soll. Ein Wortumbruch bedeutet, dass Wörter (Text) durch Leerzeichen oder Satzzeichen begrenzt sind, wie dies in europäischen Sprachen der Fall ist. Diese Einstellung kann je nach Sprache des Textes zu häufigen oder seltenen Fehlalarmen führen. Wenn "Wortumbrüche sind erforderlich" nicht aktiv ist, würde z. B. der englische Text Bernard mit San Bernardino übereinstimmen, was wahrscheinlich als falsch positives Ergebnis angesehen werden würde. Wenn der Text jedoch in einer Sprache geschrieben wurde, die keine Wortumbrüche verwendet, finden Sie keine Wörter, sofern "Wortumbrüche sind erforderlich" aktiv ist. Beispielsweise wird mit dem Text Ich flog nach Tokio auf Japanisch (私は東京に飛んで) nur das Wort Tokio gefunden (東京), wenn "Wortumbrüche sind erforderlich" nicht aktiv ist.
| Boolean |
Codebeispiel
Das folgende Skript für das Python-Fenster veranschaulicht, wie die Funktion ExtractLocationsFromDocument im unmittelbaren Modus verwendet wird.
import arcpy
arcpy.env.workspace = "c:/data"
arcpy.conversion.ExtractLocationsFromDocument("wells.docx", "water.gdb/wells")
Lizenzinformationen
- Basic: Erfordert LocateXT
- Standard: Erfordert LocateXT
- Advanced: Erfordert LocateXT