Big-Data-Verbindung aktualisieren (GeoAnalytics Desktop)

Zusammenfassung

Aktualisiert eine bestehende Big-Data-Verbindung (BDC) und registriert neue Datasets, die zum Quellspeicherort hinzugefügt wurden.

Verwendung

  • Für dieses Werkzeug ist eine Big-Data-Verbindung (BDC) erforderlich. Um eine BDC zu erstellen, verwenden Sie das Werkzeug Big-Data-Verbindung erstellen.

  • Verwenden Sie dieses Werkzeug, um ein oder mehrere Datasets zu einer bestehenden Big-Data-Verbindung hinzuzufügen. Darüber hinaus registriert das Werkzeug alle Datasets neu, die mit dem Werkzeug Dataset aus Big-Data-Verbindung entfernen entfernt wurden. Nachfolgend finden Sie Beispiele für den Einsatz dieses Werkzeugs:

    • Sie haben einen Ordner mit Daten in Ihren vorhandenen BDC-Quellordner kopiert und möchten, dass er als Dataset in der BDC dargestellt wird.
    • Sie haben das Werkzeug Dataset aus Big-Data-Verbindung entfernen verwendet und möchten die entfernten Datasets wieder zur BDC hinzufügen.

  • Mit diesem Werkzeug werden keine vorhandenen Dataset-Eigenschaften, die mit dem Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren bearbeitet wurden, aktualisiert. Alle geänderten Eigenschaften bleiben erhalten. Die folgenden Szenarien enthalten empfohlene Workflows:

  • Die Werkzeugmeldungen enthalten die folgenden Informationen zu den ermittelten Datasets und deren Status:

    • Übersprungen: Alle vorhandenen Datasets werden bei der Aktualisierung übersprungen und bleiben unverändert bestehen.
    • Erfolgreich: Neue Datasets, die ermittelt und zur BDC hinzugefügt wurden.
    • Fehlgeschlagen: Datasets, die nicht erfolgreich zur BDC hinzugefügt wurden.

    Beim Ermitteln von Datasets in Ihrer BDC können zwei Probleme auftreten:

    • Erwartete Datasets fehlen. Überprüfen Sie in diesem Fall, ob der als Quellordner angegebene Pfad, der die Unterordner enthält, richtig ist und einen unterstützten Datentyp aufweist.
    • Mindestens ein Dataset wird nicht registriert. Wenn Datasets nicht registriert werden, könnte Ihnen Folgendes auffallen:

      ProblemLösungBeispiel

      Das Dataset hat nicht das erwartete Format.

      Öffnen Sie die Datei, um festzustellen, ob sie wie erwartet aussieht. Wenn die Daten falsch strukturiert sind, ändern Sie dies, und versuchen Sie es erneut.

      Eine .csv-Datei enthält einige Zeilen und eine Zusammenfassung der Daten und dann nur leere Zeilen.

      Die Schemas von Datasets in einem Ordner stimmen nicht überein.

      Alle Dateien in einem Dataset-Ordner müssen das gleiche Schema aufweisen. Öffnen Sie die Dateien, um die Schemas zu vergleichen. Beheben Sie Schemakonflikte, und wiederholen Sie das Registrieren des Datasets.

      Sie haben eine .csv-Datei mit 10 Feldern und eine mit 8.

      Die Dateitypen eines Datasets in einem Ordner stimmen nicht überein.

      Alle Dateien in einem Dataset-Ordner müssen die gleiche Erweiterung (Dateityp) aufweisen. Überprüfen Sie die Dateitypen des Datenquellenspeicherorts, und entfernen oder verschieben Sie falsch platzierte Dateien.

      Ein Shapefile-Dataset befindet sich im gleichen Ordner wie eine Parquet-Datei.

      Ein Feldformat wurde nicht erkannt.

      Dies ist unwahrscheinlich, aber möglich, wenn ORC und Parquet ein unerwartetes Format verwenden. Stellen Sie sicher, dass Sie gültige Feldformate verwenden.

      Sie haben eine Parquet-Datei mit einem unbekannten Feldformat.

    Weitere Informationen zu den Gründen, aus denen Datasets nicht zu einer BDC-Datei hinzugefügt wurden

  • Nachdem Sie eine BDC aktualisiert haben, überprüfen Sie mit dem Werkzeug Dataset beschreiben, ob das aktualisierte Dataset wie erwartet aussieht.

  • Mit dem Werkzeug Big-Data-Verbindung aktualisieren werden neue Datasets identifiziert. Eine BDC kann auch mit den folgenden Werkzeugen geändert werden:

  • Dieses Geoverarbeitungswerkzeug wird unterstützt durch Spark. Weitere Informationen über Big-Daten-Verbindungen und deren Verwendung finden Sie unter Big-Data-Verbindungen.

Parameter

BeschriftungErläuterungDatentyp
Big-Data-Verbindungsdatei

Die zu aktualisierende BDC-Datei.

File
Sichtbare Geometriefelder
(optional)

Legt fest, ob die zum Identifizieren der Geometrie verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Geometriefelder nicht sichtbar sind, wird die Geometrie auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Geometrie kann in der BDC geändert werden.

  • Aktiviert: Geometriefelder werden als Felder für die Analyse einbezogen. Dies ist die Standardeinstellung.
  • Deaktiviert: Geometriefelder werden als Felder für die Analyse nicht einbezogen.

Boolean
Sichtbare Zeitfelder
(optional)

Legt fest, ob die zum Angeben der Zeit verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Zeitfelder nicht sichtbar sind, wird die Zeit auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Zeit kann in der BDC geändert werden.

  • Aktiviert: Zeitfelder werden als Felder für die Analyse einbezogen. Dies ist die Standardeinstellung.
  • Deaktiviert: Zeitfelder werden als Felder für die Analyse nicht einbezogen.

Boolean

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Aktualisierte BDC

Die .bdc-Eingabedatei mit aktualisierten Datasets.

File

arcpy.gapro.RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
NameErläuterungDatentyp
bdc_file

Die zu aktualisierende BDC-Datei.

File
visible_geometry
(optional)

Legt fest, ob die zum Identifizieren der Geometrie verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Geometriefelder nicht sichtbar sind, wird die Geometrie auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Geometrie kann in der BDC geändert werden.

  • GEOMETRY_VISIBLEGeometriefelder werden als Felder für die Analyse einbezogen. Dies ist die Standardeinstellung.
  • GEOMETRY_NOT_VISIBLEGeometriefelder werden als Felder für die Analyse nicht einbezogen.
Boolean
visible_time
(optional)

Legt fest, ob die zum Angeben der Zeit verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Zeitfelder nicht sichtbar sind, wird die Zeit auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Zeit kann in der BDC geändert werden.

  • TIME_VISIBLEZeitfelder werden als Felder für die Analyse einbezogen. Dies ist die Standardeinstellung.
  • TIME_NOT_VISIBLEZeitfelder werden als Felder für die Analyse nicht einbezogen.
Boolean

Abgeleitete Ausgabe

NameErläuterungDatentyp
updated_bdc

Die .bdc-Eingabedatei mit aktualisierten Datasets.

File

Codebeispiel

RefreshBDC (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion RefreshBDC verwendet wird.

# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that 
#              have been added.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"

# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)

Umgebungen

Dieses Werkzeug verwendet keine Geoverarbeitungsumgebungen.

Lizenzinformationen

  • Basic: Nein
  • Standard: Nein
  • Advanced: Ja

Verwandte Themen