Zusammenfassung
Aktualisiert die Eigenschaften eines Big-Data-Verbindungs-Datasets (BDC). Mit diesem Werkzeug werden die Einstellungen für Feld, Geometrie, Zeit und Datei für ein angegebenes BDC-Dataset geändert.
Verwendung
Für dieses Werkzeug ist eine Big-Data-Verbindung (BDC) erforderlich. Um eine BDC zu erstellen, verwenden Sie das Werkzeug Big-Data-Verbindung erstellen.
Verwenden Sie dieses Werkzeug, um Schema, Geometrie oder Zeit eines BDC-Datasets zu ändern, damit Sie es in Analysen oder Visualisierungen beispielsweise in den folgenden Szenarien nutzen können:
- Ihr CSV-Dataset wurde nur mit Feldern vom Typ Zeichenfolge registriert, und Sie möchten die Felder als numerisch festlegen, um sie in Analysen zu verwenden.
- Ihr BDC-Dataset weist Attributwerte für zwei getrennte Standorte auf, z. B. Ein- und Ausstiegsorte von Taxis, und Sie möchten die Geometrie ändern, um sie in Analysen zu verwenden.
- Für Ihren Workflow muss die Zeit im Eingabe-Layer festgelegt sein.
- Sie möchten ein BDC-Dataset für einen Kollegen freigeben, für den nur eine Teilmenge der Features relevant ist, also fügen Sie einen Definitionsabfrageausdruck hinzu, und blenden einige nicht verwendete Felder aus.
Sie können die folgenden Eigenschaften ändern:
- Definitionsabfrage: Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.
- Felder: Feldname, Feldtyp und Sichtbarkeit.
- Geometrie: Die Darstellung der Geometrie. Sie sind für Shapefiles nicht editierbar.
- Zeit: Die Darstellung der Zeit.
- Datei: Die zum Lesen des Datasets verwendeten Dateieigenschaften.
Geben Sie mit dem Parameter Big-Data-Verbindungs-Dataset das BDC-Dataset mit den Eigenschaften an, die Sie ändern möchten. Sie können zum Dataset navigieren oder es mit einem Pfad wie c:\<path>\MyBDC.bdc\<dataset_name> angeben, Beispiel: c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.
Definieren Sie mit dem Parameter Ausdruck einen Ausdruck, um die in der Analyse verwendeten Features zu beschränken. Das Hinzufügen eines Filters zu einem BDC-Dataset ist mit dem Anwenden einer Definitionsabfrage auf ein Dataset in der Karte vergleichbar: Sie geben einen SQL-Ausdruck an, um relevante Features zu filtern.
Sie können den Feldtyp für durch Trennzeichen getrennte Dateien aktualisieren. Für andere Datenquellen (wie Shapefiles, ORC- oder Parquet-Dateien) können Sie den Feldtyp nicht aktualisieren.
Sie können die Geometrie für durch Trennzeichen getrennte, ORC- und Parquet-Dateien ändern. Sie können die Geometrie nicht für ein Dataset mit einem Shapefile als Quelle ändern.
In der folgenden Tabelle ist dargestellt, wie Zeitformate für die Parameter Startzeit und Endzeit angegeben werden, wenn Sie ein BDC-Dataset bearbeiten. Das Beispiel zeigt, wie der 2. Januar 2016, um 21:45:02,05 Uhr dargestellt wird.
Zeitformate in Big-Data-Verbindungen
Symbol Bedeutung Beispiel yy
Das Jahr – durch zwei Ziffern dargestellt.
16
yyyy
Das Jahr – durch vier Ziffern dargestellt.
2016
MM
Der Monat – als numerischer Wert dargestellt.
01 oder 1
MMM
Der Monat – durch drei Buchstaben dargestellt.
Jan
MMMM
Der Monat – vollständig ausgeschrieben.
January
dd
Der Tag.
02 oder 2
HH
Die Stunde – wobei das 24-Stunden-Format mit Werten von 0 bis 23 verwendet wird.
21
hh
Die Stunde – wobei das 12-Stunden-Format mit Werten von 1 bis 12 verwendet wird.
9
mm
Die Minute – Werte liegen zwischen 0 und 59.
45
ss
Die Sekunde – Werte liegen zwischen 0 und 59.
02
SSS
Die Millisekunde – Werte liegen zwischen 0 und 999.
50
a
Der AM/PM-Marker.
PM
epoch_millis
Die Zeit in Millisekunden von der Unixzeit.
1509581781000
epoch_seconds
Die Zeit in Sekunden von der Unixzeit.
1509747601
Z
Der Zeitzonenversatz, ausgedrückt in Stunden.
-0100 oder -01:00
ZZZ
Der Zeitzonenversatz, ausgedrückt in Zeitzonen-IDs.
America/Los_Angeles
''
Verwenden Sie einzelne Anführungszeichen, um Text hinzuzufügen, der keinen in dieser Tabelle angegebenen Wert darstellt.
'T'
Die folgende Tabelle zeigt anhand von Beispielen, wie dasselbe Datum – 2. Januar 2016, 21:45:02,05 Uhr – in verschiedenen Formaten dargestellt wird:
Beispiele für Zeitformate
Sie können die Zeitzone wie folgt angeben:Eingabedatum Datumsformat 01/02/2016 9:45:02PM
MM/dd/yyyy hh:mm:ssa
Jan02-16 21:45:02
MMMdd-yy HH:mm:ss
Januar 02 2016 9:45:02.050PM
MMMM dd yyyy hh:mm:ss.SSSa
01/02/2017T9:45:14:05-0000
MM/TT/JJJJ hh:mm:ssa
- Der vollständige Namen der Zeitzone: Pacific Standard Time
- Mit dem Zeitzonenversatz, ausgedrückt in Stunden: -0100 oder -01:00
- Mit der UTC- oder GMT-Abkürzung
Sie können die folgenden Eigenschaften einer durch Trennzeichen getrennten Datei ändern:
- Feldtrennzeichen: Das Trennzeichen für jedes Feld. Gebräuchliche Trennzeichen sind , und ;.
- Datensatzabschlusszeichen: Das Abschlusszeichen für jede Datenzeile. Gebräuchliche Abschlusszeichen sind \n und \t.
- Anführungszeichen: Das verwendete Anführungszeichen im Quellen-Dataset.
- Hat Kopfzeile: Der Wert "True" oder "False" zur Angabe, ob das Quellen-Dataset Überschriften aufweist. Wenn eine Kopfzeile im Dataset enthalten ist, werden die Überschriften für die Feldnamen verwendet.
- Codierung: Der vom Quellen-Dataset verwendete Codierungstyp. Die Standardeinstellung ist "UTF-8".
Das Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren aktualisiert die Eigenschaften eines einzelnen Datasets. Mit den folgenden Werkzeugen können Sie die BDC ändern:
- Dataset aus Big-Data-Verbindung kopieren: Kopiert ein Dataset aus einer BDC in eine Feature-Class.
- Dataset aus Big-Data-Verbindung duplizieren: Erstellt eine Sicht eines vorhandenen BDC-Datasets.
- Big-Data-Verbindung aktualisieren: Prüft auf neue Datasets und fügt sie der BDC hinzu.
- Dataset aus Big-Data-Verbindung entfernen: Entfernt ein Dataset aus der BDC.
- Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren: Ändert die Eigenschaften eines einzelnen BDC-Datasets.
- Vorschau von Dataset aus Big-Data-Verbindung anzeigen: Zeigt eine Vorschau der ersten zehn Features im Dataset an, um zu überprüfen, ob sie richtig registriert wurden.
- Dataset beschreiben: Ermöglicht eine Überprüfung, ob das Dataset wie erwartet dargestellt wird.
Sie können optional die BDC-Datei manuell bearbeiten. In den folgenden Situationen sollten Sie die .bdc-Datei immer manuell ändern:
- Die X-, Y- oder Z-Position wird von einem oder mehreren Feldern dargestellt.
- Sie möchten den Quellenpfad aktualisieren.
Erfahren Sie mehr über die Formatierung von Big-Data-Verbindungsdateien.
Dieses Geoverarbeitungswerkzeug wird unterstützt durch Spark. Weitere Informationen über Big-Daten-Verbindungen und deren Verwendung finden Sie unter Big-Data-Verbindungen.
Syntax
arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
Parameter | Erklärung | Datentyp |
bdc_dataset | Das zu aktualisierende BDC-Dataset. Die Bearbeitungsoptionen hängen von den Quelldaten ab (Shapefile, durch Trennzeichen getrennte Datei, ORC- oder Parquet-Datei). | Table View |
expression (optional) | Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden. | SQL Expression |
field_properties [field_properties,...] (optional) | Gibt die zu ändernden Feldnamen und -eigenschaften an.
Gibt an, ob Felder sichtbar oder ausgeblendet sind.
| Value Table |
geometry_type (optional) | Gibt den Geometrietyp an, der für die räumliche Darstellung des Datasets verwendet wird. Die Geometrie kann für Datasets mit einem Shapefile als Quelle nicht geändert werden.
| String |
spatial_reference (optional) | Der WKID-Wert oder die WKT-Zeichenfolge für den Raumbezug des Datasets. Die Standardeinstellung ist WKID 4326 (WGS84). Der Raumbezug kann für Daten mit einem Shapefile als Quelle nicht geändert werden. | String |
geometry_format_type (optional) | Gibt an, wie die Geometrie formatiert wird. Die Geometrie kann für Daten mit einem Shapefile als Quelle nicht geändert werden.
| String |
geometry_field (optional) | Ein einzelnes Feld zur Darstellung der Geometrie. Dieses Feld wird verwendet, wenn das Geometrieformat WKT, WKB, GeoJSON oder EsriJSON ist. | String |
x_field (optional) | Das Feld zur Darstellung der X-Position. Wenn mehr als ein Feld die X-Position darstellt, ändern Sie die .bdc-Datei manuell. | String |
y_field (optional) | Das Feld zur Darstellung der Y-Position. Wenn mehr als ein Feld die Y-Position darstellt, ändern Sie die .bdc-Datei manuell. | String |
z_field (optional) | Das Feld zur Darstellung der Z-Position. Wenn mehr als ein Feld die Z-Position darstellt, ändern Sie die .bdc-Datei manuell. | String |
time_type (optional) | Gibt den Zeittyp an, mit dem das Dataset zeitlich dargestellt wird.
| String |
time_zone (optional) | Die Zeitzone des Datasets. | String |
start_time_format [start_time_format,...] (optional) | Die Felder, mit denen die Startzeit und die Zeitformatierung definiert werden. | Value Table |
end_time_format [end_time_format,...] (optional) | Die Felder, mit denen die Endzeit und die Zeitformatierung definiert werden. | Value Table |
file_extension (optional) | Die Dateierweiterung des Quellen-Datasets. Der Parameterwert kann nicht geändert werden. | String |
field_delimiter (optional) | Das im Quellen-Dataset verwendete Feldtrennzeichen. | String |
record_terminator (optional) | Das im Quellen-Dataset verwendete Datensatzabschlusszeichen. | String |
quote_character (optional) | Das im Quellen-Dataset verwendete Anführungszeichen. | String |
has_header_row (optional) | Gibt an, ob das Quellen-Dataset eine Kopfzeile aufweist.
| Boolean |
encoding (optional) | Der Typ der für das Quellen-Dataset verwendeten Codierung. Standardmäßig wird UTF-8 verwendet. | String |
Abgeleitete Ausgabe
Name | Erklärung | Datentyp |
updated_bdc | Die aktualisierte BDC-Datei mit den bearbeiteten Eigenschaften, die auf das angegebene Dataset angewendet wird. | Datei |
Codebeispiel
Das folgende Python-Skript veranschaulicht, wie die Funktion UpdateBDCDatasetProperties verwendet wird.
# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator,
file_quotechar, has_header_row, file_encoding)
Umgebungen
Lizenzinformationen
- Basic: Nein
- Standard: Nein
- Advanced: Ja