Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren (GeoAnalytics Desktop)

Zusammenfassung

Aktualisiert die Eigenschaften eines Big-Data-Verbindungs-Datasets (BDC). Mit diesem Werkzeug werden die Einstellungen für Feld, Geometrie, Zeit und Datei für ein angegebenes BDC-Dataset geändert.

Verwendung

  • Für dieses Werkzeug ist eine Big-Data-Verbindung (BDC) erforderlich. Um eine BDC zu erstellen, verwenden Sie das Werkzeug Big-Data-Verbindung erstellen.

  • Verwenden Sie dieses Werkzeug, um Schema, Geometrie oder Zeit eines BDC-Datasets zu ändern, damit Sie es in Analysen oder Visualisierungen beispielsweise in den folgenden Szenarien nutzen können:

    • Ihr CSV-Dataset wurde nur mit Feldern vom Typ Zeichenfolge registriert, und Sie möchten die Felder als numerisch festlegen, um sie in Analysen zu verwenden.
    • Ihr BDC-Dataset weist Attributwerte für zwei getrennte Standorte auf, z. B. Ein- und Ausstiegsorte von Taxis, und Sie möchten die Geometrie ändern, um sie in Analysen zu verwenden.
    • Für Ihren Workflow muss die Zeit im Eingabe-Layer festgelegt sein.
    • Sie möchten ein BDC-Dataset für einen Kollegen freigeben, für den nur eine Teilmenge der Features relevant ist, also fügen Sie einen Definitionsabfrageausdruck hinzu, und blenden einige nicht verwendete Felder aus.

  • Sie können die folgenden Eigenschaften ändern:

    • Definitionsabfrage: Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.
    • Felder: Feldname, Feldtyp und Sichtbarkeit.
    • Geometrie: Die Darstellung der Geometrie. Sie sind für Shapefiles nicht editierbar.
    • Zeit: Die Darstellung der Zeit.
    • Datei: Die zum Lesen des Datasets verwendeten Dateieigenschaften.

  • Geben Sie mit dem Parameter Big-Data-Verbindungs-Dataset das BDC-Dataset mit den Eigenschaften an, die Sie ändern möchten. Sie können zum Dataset navigieren oder es mit einem Pfad wie c:\<path>\MyBDC.bdc\<dataset_name> angeben, Beispiel: c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.

  • Definieren Sie mit dem Parameter Ausdruck einen Ausdruck, um die in der Analyse verwendeten Features zu beschränken. Das Hinzufügen eines Filters zu einem BDC-Dataset ist mit dem Anwenden einer Definitionsabfrage auf ein Dataset in der Karte vergleichbar: Sie geben einen SQL-Ausdruck an, um relevante Features zu filtern.

  • Sie können den Feldtyp für durch Trennzeichen getrennte Dateien aktualisieren. Für andere Datenquellen (wie Shapefiles, ORC- oder Parquet-Dateien) können Sie den Feldtyp nicht aktualisieren.

  • Sie können die Geometrie für durch Trennzeichen getrennte, ORC- und Parquet-Dateien ändern. Sie können die Geometrie nicht für ein Dataset mit einem Shapefile als Quelle ändern.

  • In der folgenden Tabelle ist dargestellt, wie Zeitformate für die Parameter Startzeit und Endzeit angegeben werden, wenn Sie ein BDC-Dataset bearbeiten. Das Beispiel zeigt, wie der 2. Januar 2016, um 21:45:02,05 Uhr dargestellt wird.

    Zeitformate in Big-Data-Verbindungen

    SymbolBedeutungBeispiel

    yy

    Das Jahr – durch zwei Ziffern dargestellt.

    16

    yyyy

    Das Jahr – durch vier Ziffern dargestellt.

    2016

    MM

    Der Monat – als numerischer Wert dargestellt.

    01 oder 1

    MMM

    Der Monat – durch drei Buchstaben dargestellt.

    Jan

    MMMM

    Der Monat – vollständig ausgeschrieben.

    January

    dd

    Der Tag.

    02 oder 2

    HH

    Die Stunde – wobei das 24-Stunden-Format mit Werten von 0 bis 23 verwendet wird.

    21

    hh

    Die Stunde – wobei das 12-Stunden-Format mit Werten von 1 bis 12 verwendet wird.

    9

    mm

    Die Minute – Werte liegen zwischen 0 und 59.

    45

    ss

    Die Sekunde – Werte liegen zwischen 0 und 59.

    02

    SSS

    Die Millisekunde – Werte liegen zwischen 0 und 999.

    50

    a

    Der AM/PM-Marker.

    PM

    epoch_millis

    Die Zeit in Millisekunden von der Unixzeit.

    1509581781000

    epoch_seconds

    Die Zeit in Sekunden von der Unixzeit.

    1509747601

    Z

    Der Zeitzonenversatz, ausgedrückt in Stunden.

    -0100 oder -01:00

    ZZZ

    Der Zeitzonenversatz, ausgedrückt in Zeitzonen-IDs.

    America/Los_Angeles

    ''

    Verwenden Sie einzelne Anführungszeichen, um Text hinzuzufügen, der keinen in dieser Tabelle angegebenen Wert darstellt.

    'T'

    Die folgende Tabelle zeigt anhand von Beispielen, wie dasselbe Datum – 2. Januar 2016, 21:45:02,05 Uhr – in verschiedenen Formaten dargestellt wird:

    Beispiele für Zeitformate

    EingabedatumDatumsformat

    01/02/2016 9:45:02PM

    MM/dd/yyyy hh:mm:ssa

    Jan02-16 21:45:02

    MMMdd-yy HH:mm:ss

    Januar 02 2016 9:45:02.050PM

    MMMM dd yyyy hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/TT/JJJJ hh:mm:ssa

    Sie können die Zeitzone wie folgt angeben:
    • Der vollständige Namen der Zeitzone: Pacific Standard Time
    • Mit dem Zeitzonenversatz, ausgedrückt in Stunden: -0100 oder -01:00
    • Mit der UTC- oder GMT-Abkürzung
  • Sie können die folgenden Eigenschaften einer durch Trennzeichen getrennten Datei ändern:

    • Feldtrennzeichen: Das Trennzeichen für jedes Feld. Gebräuchliche Trennzeichen sind , und ;.
    • Datensatzabschlusszeichen: Das Abschlusszeichen für jede Datenzeile. Gebräuchliche Abschlusszeichen sind \n und \t.
    • Anführungszeichen: Das verwendete Anführungszeichen im Quellen-Dataset.
    • Hat Kopfzeile: Der Wert "True" oder "False" zur Angabe, ob das Quellen-Dataset Überschriften aufweist. Wenn eine Kopfzeile im Dataset enthalten ist, werden die Überschriften für die Feldnamen verwendet.
    • Codierung: Der vom Quellen-Dataset verwendete Codierungstyp. Die Standardeinstellung ist "UTF-8".

  • Das Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren aktualisiert die Eigenschaften eines einzelnen Datasets. Mit den folgenden Werkzeugen können Sie die BDC ändern:

  • Sie können optional die BDC-Datei manuell bearbeiten. In den folgenden Situationen sollten Sie die .bdc-Datei immer manuell ändern:

    • Die X-, Y- oder Z-Position wird von einem oder mehreren Feldern dargestellt.
    • Sie möchten den Quellenpfad aktualisieren.

    Erfahren Sie mehr über die Formatierung von Big-Data-Verbindungsdateien.

  • Dieses Geoverarbeitungswerkzeug wird unterstützt durch Spark. Weitere Informationen über Big-Daten-Verbindungen und deren Verwendung finden Sie unter Big-Data-Verbindungen.

Syntax

arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
ParameterErklärungDatentyp
bdc_dataset

Das zu aktualisierende BDC-Dataset. Die Bearbeitungsoptionen hängen von den Quelldaten ab (Shapefile, durch Trennzeichen getrennte Datei, ORC- oder Parquet-Datei).

Table View
expression
(optional)

Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.

SQL Expression
field_properties
[field_properties,...]
(optional)

Gibt die zu ändernden Feldnamen und -eigenschaften an.

  • SHORTDas Feld hat den Typ "Short".
  • LONGDas Feld hat den Typ "Long".
  • DOUBLEDas Feld hat den Typ "Double".
  • FLOATDas Feld hat den Typ "Float".
  • STRINGDas Feld hat den Typ "String".
  • DATEDas Feld hat den Typ "Date".
  • BLOBDas Feld hat den Typ "BLOB".

Gibt an, ob Felder sichtbar oder ausgeblendet sind.

  • TRUEDie Felder sind sichtbar und können in Geoverarbeitungswerkzeugen verwendet werden. Dies ist die Standardeinstellung.
  • FALSEDie Felder werden ausgeblendet und können in Geoverarbeitungswerkzeugen nicht verwendet werden.
Value Table
geometry_type
(optional)

Gibt den Geometrietyp an, der für die räumliche Darstellung des Datasets verwendet wird. Die Geometrie kann für Datasets mit einem Shapefile als Quelle nicht geändert werden.

  • POINTDer Geometrietyp ist "Punkt".
  • LINEDer Geometrietyp ist "Polylinie".
  • POLYGONDer Geometrietyp ist "Polygon".
  • NONEKein Geometrietyp.
String
spatial_reference
(optional)

Der WKID-Wert oder die WKT-Zeichenfolge für den Raumbezug des Datasets. Die Standardeinstellung ist WKID 4326 (WGS84). Der Raumbezug kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

String
geometry_format_type
(optional)

Gibt an, wie die Geometrie formatiert wird. Die Geometrie kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

  • XYZZwei oder mehr Felder stellen X, Y und optional Z dar.
  • WKTDie Geometrie wird mit einem einzelnen Feld in einem Well-Known-Text-Feld dargestellt.
  • WKBDie Geometrie wird mit einem einzelnen Feld in einem Well-Kown-Binary-Feld dargestellt.
  • GEOJSONDie Geometrie wird mit einem einzelnen Feld im GeoJSON-Format dargestellt.
  • ESRIJSONDie Geometrie wird mit einem einzelnen Feld im EsriJSON-Format dargestellt.
String
geometry_field
(optional)

Ein einzelnes Feld zur Darstellung der Geometrie. Dieses Feld wird verwendet, wenn das Geometrieformat WKT, WKB, GeoJSON oder EsriJSON ist.

String
x_field
(optional)

Das Feld zur Darstellung der X-Position. Wenn mehr als ein Feld die X-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
y_field
(optional)

Das Feld zur Darstellung der Y-Position. Wenn mehr als ein Feld die Y-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
z_field
(optional)

Das Feld zur Darstellung der Z-Position. Wenn mehr als ein Feld die Z-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
time_type
(optional)

Gibt den Zeittyp an, mit dem das Dataset zeitlich dargestellt wird.

  • INTERVALDer Zeittyp stellt eine Zeitdauer mit einer Start- und Endzeit dar.
  • INSTANTDer Zeittyp stellt einen bestimmten Zeitpunkt dar.
  • NONEZeit ist nicht aktiviert.
String
time_zone
(optional)

Die Zeitzone des Datasets.

String
start_time_format
[start_time_format,...]
(optional)

Die Felder, mit denen die Startzeit und die Zeitformatierung definiert werden.

Value Table
end_time_format
[end_time_format,...]
(optional)

Die Felder, mit denen die Endzeit und die Zeitformatierung definiert werden.

Value Table
file_extension
(optional)

Die Dateierweiterung des Quellen-Datasets. Der Parameterwert kann nicht geändert werden.

String
field_delimiter
(optional)

Das im Quellen-Dataset verwendete Feldtrennzeichen.

String
record_terminator
(optional)

Das im Quellen-Dataset verwendete Datensatzabschlusszeichen.

String
quote_character
(optional)

Das im Quellen-Dataset verwendete Anführungszeichen.

String
has_header_row
(optional)

Gibt an, ob das Quellen-Dataset eine Kopfzeile aufweist.

  • HAS_HEADERDas Quellen-Dataset weist eine Kopfzeile auf.
  • NO_HEADERDas Quellen-Dataset weist keine Kopfzeile auf.
Boolean
encoding
(optional)

Der Typ der für das Quellen-Dataset verwendeten Codierung. Standardmäßig wird UTF-8 verwendet.

String

Abgeleitete Ausgabe

NameErklärungDatentyp
updated_bdc

Die aktualisierte BDC-Datei mit den bearbeiteten Eigenschaften, die auf das angegebene Dataset angewendet wird.

Datei

Codebeispiel

UpdateBDCDatasetProperties – Beispiel (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion UpdateBDCDatasetProperties verwendet wird.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extenstion = "csv"
file_delimitor = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"
# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimitor, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Umgebungen

Dieses Werkzeug verwendet keine Geoverarbeitungsumgebungen.

Lizenzinformationen

  • Basic: Nein
  • Standard: Nein
  • Advanced: Ja

Verwandte Themen