Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren (GeoAnalytics Desktop)

Zusammenfassung

Aktualisiert die Eigenschaften eines Big-Data-Verbindungs-Datasets (BDC). Mit diesem Werkzeug werden die Einstellungen für Feld, Geometrie, Zeit und Datei für ein angegebenes BDC-Dataset geändert.

Verwendung

  • Für dieses Werkzeug ist eine Big-Data-Verbindung (BDC) erforderlich. Verwenden Sie zum Erstellen einer BDC das Dialogfeld Neue Big-Data-Verbindung oder das Werkzeug Big-Data-Verbindung erstellen.

  • Verwenden Sie dieses Werkzeug, um Schema, Geometrie oder Zeit eines BDC-Datasets zu ändern, damit Sie es in Analysen oder Visualisierungen beispielsweise in den folgenden Szenarien nutzen können:

    • Ihr CSV-Dataset wurde nur mit Feldern vom Typ Zeichenfolge registriert, und Sie möchten die Felder als numerisch festlegen, um sie in Analysen zu verwenden.
    • Ihr BDC-Dataset weist Attributwerte für zwei getrennte Standorte auf, z. B. Ein- und Ausstiegsorte von Taxis, und Sie möchten die Geometrie ändern, um sie in Analysen zu verwenden.
    • Für Ihren Workflow muss die Zeit im Eingabe-Layer festgelegt sein.
    • Sie möchten ein BDC-Dataset für einen Kollegen freigeben, für den nur eine Teilmenge der Features relevant ist, also fügen Sie einen Definitionsabfrageausdruck hinzu, und blenden einige nicht verwendete Felder aus.

  • Sie können die folgenden Eigenschaften ändern:

    • Definitionsabfrage: Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.
    • Felder: Feldname, Feldtyp und Sichtbarkeit.
    • Geometrie: Die Darstellung der Geometrie. Sie sind für Shapefiles nicht editierbar.
    • Zeit: Die Darstellung der Zeit.
    • Datei: Die zum Lesen des Datasets verwendeten Dateieigenschaften.

  • Verwenden Sie das Dialogfeld Neue Big-Data-Verbindung, in dem Sie problemlos eine Big-Data-Verbindung erstellen, bearbeiten und in der Vorschau anzeigen können.

  • Geben Sie mit dem Parameter Big-Data-Verbindungs-Dataset das BDC-Dataset mit den Eigenschaften an, die Sie ändern möchten. Sie können zum Dataset navigieren oder es mit einem Pfad wie c:\<path>\MyBDC.bdc\<dataset_name> angeben, z. B. c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset.

  • Definieren Sie mit dem Parameter Ausdruck einen Ausdruck, um die in der Analyse verwendeten Features zu beschränken. Das Hinzufügen eines Filters zu einem BDC-Dataset ist mit dem Anwenden einer Definitionsabfrage auf ein Dataset in einer Karte vergleichbar: Sie geben einen SQL-Ausdruck an, um relevante Features zu filtern.

  • Sie können den Feldtyp für durch Trennzeichen getrennte Dateien aktualisieren. Für andere Datenquellen (wie Shapefiles, ORC- oder Parquet-Dateien) können Sie den Feldtyp nicht aktualisieren.

  • Sie können die Geometrie für durch Trennzeichen getrennte, ORC- und Parquet-Dateien ändern. Sie können die Geometrie nicht für ein Dataset mit einem Shapefile als Quelle ändern.

  • In der folgenden Tabelle ist dargestellt, wie Zeitformate für die Parameter Startzeit und Endzeit angegeben werden, wenn Sie ein BDC-Dataset bearbeiten. Das Beispiel zeigt, wie der 2. Januar 2016, um 21:45:02,05 Uhr dargestellt wird.

    Zeitformate in Big-Data-Verbindungen

    SymbolBedeutungBeispiel

    yy

    Das Jahr – durch zwei Ziffern dargestellt.

    16

    yyyy

    Das Jahr – durch vier Ziffern dargestellt.

    2016

    MM

    Der Monat – als numerischer Wert dargestellt.

    01 oder 1

    MMM

    Der Monat – durch drei Buchstaben dargestellt.

    Jan

    MMMM

    Der Monat – vollständig ausgeschrieben.

    January

    dd

    Der Tag.

    02 oder 2

    HH

    Die Stunde – wobei das 24-Stunden-Format mit Werten von 0 bis 23 verwendet wird.

    21

    hh

    Die Stunde – wobei das 12-Stunden-Format mit Werten von 1 bis 12 verwendet wird.

    9

    mm

    Die Minute – Werte liegen zwischen 0 und 59.

    45

    ss

    Die Sekunde – Werte liegen zwischen 0 und 59.

    02

    SSS

    Die Millisekunde – Werte liegen zwischen 0 und 999.

    50

    a

    Die AM/PM-Angabe.

    PM

    epoch_millis

    Die Zeit in Millisekunden von der Unixzeit.

    1509581781000

    epoch_seconds

    Die Zeit in Sekunden von der Unixzeit.

    1509747601

    Z

    Der Zeitzonenversatz, ausgedrückt in Stunden.

    -0100 oder -01:00

    ZZZ

    Der Zeitzonenversatz, ausgedrückt in Zeitzonen-IDs.

    America/Los_Angeles

    ''

    Verwenden Sie einzelne Anführungszeichen, um Text hinzuzufügen, der keinen in dieser Tabelle angegebenen Wert darstellt.

    'T'

    Die folgende Tabelle zeigt anhand von Beispielen, wie dasselbe Datum – 2. Januar 2016, 21:45:02,05 Uhr – in verschiedenen Formaten dargestellt wird:

    Beispiele für Zeitformate

    EingabedatumDatumsformat

    01/02/2016 9:45:02PM

    MM/dd/yyyy hh:mm:ssa

    Jan02-16 21:45:02

    MMMdd-yy HH:mm:ss

    Januar 02 2016 9:45:02.050PM

    MMMM dd yyyy hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/TT/JJJJ hh:mm:ssa

    You can specify the time zone using one of the following:
    • Der vollständige Name der Zeitzone, z. B. "Pacific Normalzeit"
    • Mit dem Zeitzonenversatz, ausgedrückt in Stunden: -0100 oder -01:00
    • Mit der UTC- oder GMT-Abkürzung
  • Sie können die folgenden Eigenschaften einer durch Trennzeichen getrennten Datei ändern:

    • Feldtrennzeichen: Das Trennzeichen für jedes Feld. Gebräuchliche Trennzeichen sind Komma (,) und Semikolon (;).
    • Datensatzabschlusszeichen: Das Abschlusszeichen für jede Datenzeile. Gebräuchliche Datensatzabschlusszeichen sind \n und \t.
    • Anführungszeichen: Das verwendete Anführungszeichen im Quellen-Dataset.
    • Hat Kopfzeile: Der Wert "True" oder "False" zur Angabe, ob das Quellen-Dataset Überschriften aufweist. Wenn eine Kopfzeile im Dataset enthalten ist, werden die Überschriften für die Feldnamen verwendet.
    • Codierung: Der vom Quellen-Dataset verwendete Codierungstyp. Die Standardeinstellung ist "UTF-8".

  • Das Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren aktualisiert die Eigenschaften eines einzelnen Datasets. Mit den folgenden Werkzeugen können Sie die BDC ändern:

  • Sie können optional die BDC-Datei manuell bearbeiten. In den folgenden Situationen sollten Sie die .bdc-Datei immer manuell ändern:

    • Die X-, Y- oder Z-Position wird von einem oder mehreren Feldern dargestellt.
    • Sie möchten den Quellenpfad aktualisieren.

    Erfahren Sie mehr über die Formatierung von Big-Data-Verbindungsdateien.

  • Dieses Geoverarbeitungswerkzeug wird unterstützt durch Spark. Weitere Informationen über Big-Daten-Verbindungen und deren Verwendung finden Sie unter Big-Data-Verbindungen.

Parameter

BeschriftungErläuterungDatentyp
Big-Data-Verbindungs-Dataset

Das BDC-Dataset, das aktualisiert wird. Die Bearbeitungsoptionen hängen von den Quelldaten ab (Shapefile, durch Trennzeichen getrennte Datei, ORC- oder Parquet-Datei).

Table View
Ausdruck
(optional)

Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.

SQL Expression
Feldeigenschaften
(optional)

Gibt die Feldnamen und -eigenschaften an, die geändert werden.

Gibt an, ob Felder sichtbar oder ausgeblendet sind.

  • Aktiviert: Die Felder sind sichtbar und können in Geoverarbeitungswerkzeugen verwendet werden. Dies ist die Standardeinstellung.
  • Deaktiviert: Die Felder werden ausgeblendet und können in Geoverarbeitungswerkzeugen nicht verwendet werden.

  • ShortDas Feld hat den Typ "Short".
  • LongDas Feld hat den Typ "Long".
  • DoubleDas Feld hat den Typ "Double".
  • FloatDas Feld hat den Typ "Float".
  • ZeichenfolgeDas Feld hat den Typ "String".
  • DatumDas Feld hat den Typ "Date".
  • BLOBDas Feld hat den Typ "BLOB".
Value Table
Geometrie-Typ
(optional)

Gibt den Geometrietyp an, der für die räumliche Darstellung des Datasets verwendet wird. Die Geometrie kann für Datasets mit einem Shapefile als Quelle nicht geändert werden.

  • PunktDer Geometrietyp lautet "Punkt".
  • PolylinieDer Geometrietyp lautet "Polylinie".
  • PolygonDer Geometrietyp lautet "Polygon".
  • KeineEs ist kein Geometrietyp angegeben.
String
Raumbezug
(optional)

Der WKID-Wert oder die WKT-Zeichenfolge für den Raumbezug des Datasets. Die Standardeinstellung ist WKID 4326 (WGS84). Der Raumbezug kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

String
Geometrieformattyp
(optional)

Gibt an, wie die Geometrie formatiert wird. Die Geometrie kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

  • XYZZwei oder mehr Felder stellen X, Y und optional Z dar.
  • WKTDie Geometrie wird mit einem einzelnen Feld in einem Well-Known-Text-Feld dargestellt.
  • WKBDie Geometrie wird mit einem einzelnen Feld in einem Well-Kown-Binary-Feld dargestellt.
  • GeoJSONDie Geometrie wird mit einem einzelnen Feld im GeoJSON-Format dargestellt.
  • EsriJSONDie Geometrie wird mit einem einzelnen Feld im EsriJSON-Format dargestellt.
  • EsriShapeDie Geometrie wird mit einem einzelnen Feld im EsriShape-Format dargestellt.
String
Geometriefeld
(optional)

Ein einzelnes Feld zur Darstellung der Geometrie. Dieses Feld wird verwendet, wenn das Geometrieformat WKT, WKB, GeoJSON, EsriJSON oder EsriShape ist.

String
X-Feld
(optional)

Das Feld zur Darstellung der X-Position. Wenn mehr als ein Feld die X-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
Y-Feld
(optional)

Das Feld zur Darstellung der Y-Position. Wenn mehr als ein Feld die Y-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
Z-Feld
(optional)

Das Feld zur Darstellung der Z-Position. Wenn mehr als ein Feld die Z-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
Zeittyp
(optional)

Gibt den Zeittyp an, mit dem das Dataset zeitlich dargestellt wird.

  • IntervallDer Zeittyp stellt eine Zeitdauer mit einer Start- und Endzeit dar.
  • ZeitpunktDer Zeittyp stellt einen bestimmten Zeitpunkt dar.
  • KeineZeit ist nicht aktiviert.
String
Zeitzone
(optional)

Die Zeitzone des Datasets.

String
Startzeit
(optional)

Die Felder, mit denen die Startzeit und die Zeitformatierung definiert werden.

Value Table
Endzeit
(optional)

Die Felder, mit denen die Endzeit und die Zeitformatierung definiert werden.

Value Table
Dateierweiterung
(optional)

Die Dateierweiterung des Quellen-Datasets. Der Parameterwert kann nicht geändert werden.

String
Feldtrennzeichen
(optional)

Das im Quellen-Dataset verwendete Feldtrennzeichen.

String
Datensatzabschlusszeichen
(optional)

Das im Quellen-Dataset verwendete Datensatzabschlusszeichen.

String
Anführungszeichen
(optional)

Das im Quellen-Dataset verwendete Anführungszeichen.

String
Hat Kopfzeile
(optional)

Gibt an, ob das Quellen-Dataset eine Kopfzeile aufweist.

  • Aktiviert: Das Quellen-Dataset weist eine Kopfzeile auf.
  • Deaktiviert: Das Quellen-Dataset weist keine Kopfzeile auf.

Boolean
Codierung
(optional)

Der Typ der für das Quellen-Dataset verwendeten Codierung. Standardmäßig wird UTF-8 verwendet.

String

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Aktualisierte BDC

Die aktualisierte BDC-Datei mit den bearbeiteten Eigenschaften, die auf das angegebene Dataset angewendet wird.

File

arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
NameErläuterungDatentyp
bdc_dataset

Das BDC-Dataset, das aktualisiert wird. Die Bearbeitungsoptionen hängen von den Quelldaten ab (Shapefile, durch Trennzeichen getrennte Datei, ORC- oder Parquet-Datei).

Table View
expression
(optional)

Ein Ausdruck, mit dem die in der Analyse verwendeten Features beschränkt werden.

SQL Expression
field_properties
[field_properties,...]
(optional)

Gibt die Feldnamen und -eigenschaften an, die geändert werden.

  • SHORTDas Feld hat den Typ "Short".
  • LONGDas Feld hat den Typ "Long".
  • DOUBLEDas Feld hat den Typ "Double".
  • FLOATDas Feld hat den Typ "Float".
  • STRINGDas Feld hat den Typ "String".
  • DATEDas Feld hat den Typ "Date".
  • BLOBDas Feld hat den Typ "BLOB".

Gibt an, ob Felder sichtbar oder ausgeblendet sind.

  • TRUEDie Felder sind sichtbar und können in Geoverarbeitungswerkzeugen verwendet werden. Dies ist die Standardeinstellung.
  • FALSEDie Felder werden ausgeblendet und können in Geoverarbeitungswerkzeugen nicht verwendet werden.
Value Table
geometry_type
(optional)

Gibt den Geometrietyp an, der für die räumliche Darstellung des Datasets verwendet wird. Die Geometrie kann für Datasets mit einem Shapefile als Quelle nicht geändert werden.

  • POINTDer Geometrietyp lautet "Punkt".
  • LINEDer Geometrietyp lautet "Polylinie".
  • POLYGONDer Geometrietyp lautet "Polygon".
  • NONEEs ist kein Geometrietyp angegeben.
String
spatial_reference
(optional)

Der WKID-Wert oder die WKT-Zeichenfolge für den Raumbezug des Datasets. Die Standardeinstellung ist WKID 4326 (WGS84). Der Raumbezug kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

String
geometry_format_type
(optional)

Gibt an, wie die Geometrie formatiert wird. Die Geometrie kann für Daten mit einem Shapefile als Quelle nicht geändert werden.

  • XYZZwei oder mehr Felder stellen X, Y und optional Z dar.
  • WKTDie Geometrie wird mit einem einzelnen Feld in einem Well-Known-Text-Feld dargestellt.
  • WKBDie Geometrie wird mit einem einzelnen Feld in einem Well-Kown-Binary-Feld dargestellt.
  • GEOJSONDie Geometrie wird mit einem einzelnen Feld im GeoJSON-Format dargestellt.
  • ESRIJSONDie Geometrie wird mit einem einzelnen Feld im EsriJSON-Format dargestellt.
  • ESRISHAPEDie Geometrie wird mit einem einzelnen Feld im EsriShape-Format dargestellt.
String
geometry_field
(optional)

Ein einzelnes Feld zur Darstellung der Geometrie. Dieses Feld wird verwendet, wenn das Geometrieformat WKT, WKB, GeoJSON, EsriJSON oder EsriShape ist.

String
x_field
(optional)

Das Feld zur Darstellung der X-Position. Wenn mehr als ein Feld die X-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
y_field
(optional)

Das Feld zur Darstellung der Y-Position. Wenn mehr als ein Feld die Y-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
z_field
(optional)

Das Feld zur Darstellung der Z-Position. Wenn mehr als ein Feld die Z-Position darstellt, ändern Sie die .bdc-Datei manuell.

String
time_type
(optional)

Gibt den Zeittyp an, mit dem das Dataset zeitlich dargestellt wird.

  • INTERVALDer Zeittyp stellt eine Zeitdauer mit einer Start- und Endzeit dar.
  • INSTANTDer Zeittyp stellt einen bestimmten Zeitpunkt dar.
  • NONEZeit ist nicht aktiviert.
String
time_zone
(optional)

Die Zeitzone des Datasets.

String
start_time_format
[start_time_format,...]
(optional)

Die Felder, mit denen die Startzeit und die Zeitformatierung definiert werden.

Value Table
end_time_format
[end_time_format,...]
(optional)

Die Felder, mit denen die Endzeit und die Zeitformatierung definiert werden.

Value Table
file_extension
(optional)

Die Dateierweiterung des Quellen-Datasets. Der Parameterwert kann nicht geändert werden.

String
field_delimiter
(optional)

Das im Quellen-Dataset verwendete Feldtrennzeichen.

String
record_terminator
(optional)

Das im Quellen-Dataset verwendete Datensatzabschlusszeichen.

String
quote_character
(optional)

Das im Quellen-Dataset verwendete Anführungszeichen.

String
has_header_row
(optional)

Gibt an, ob das Quellen-Dataset eine Kopfzeile aufweist.

  • HAS_HEADERDas Quellen-Dataset weist eine Kopfzeile auf.
  • NO_HEADERDas Quellen-Dataset weist keine Kopfzeile auf.
Boolean
encoding
(optional)

Der Typ der für das Quellen-Dataset verwendeten Codierung. Standardmäßig wird UTF-8 verwendet.

String

Abgeleitete Ausgabe

NameErläuterungDatentyp
updated_bdc

Die aktualisierte BDC-Datei mit den bearbeiteten Eigenschaften, die auf das angegebene Dataset angewendet wird.

File

Codebeispiel

UpdateBDCDatasetProperties – Beispiel (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion UpdateBDCDatasetProperties verwendet wird.

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extension = "csv"
file_delimiter = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"


# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimiter, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Umgebungen

Dieses Werkzeug verwendet keine Geoverarbeitungsumgebungen.

Lizenzinformationen

  • Basic: Nein
  • Standard: Nein
  • Advanced: Ja

Verwandte Themen