Zusammenfassung
Aktualisiert eine bestehende Big-Data-Verbindung (BDC) und registriert neue Datasets, die zum Quellspeicherort hinzugefügt wurden.
Verwendung
Für dieses Werkzeug ist eine Big-Data-Verbindung (BDC) erforderlich. Um eine BDC zu erstellen, verwenden Sie das Werkzeug Big-Data-Verbindung erstellen.
Verwenden Sie dieses Werkzeug, um ein oder mehrere Datasets zu einer bestehenden Big-Data-Verbindung hinzuzufügen. Darüber hinaus registriert das Werkzeug alle Datasets neu, die mit dem Werkzeug Dataset aus Big-Data-Verbindung entfernen entfernt wurden. Nachfolgend finden Sie Beispiele für den Einsatz dieses Werkzeugs:
- Sie haben einen Ordner mit Daten in Ihren vorhandenen BDC-Quellordner kopiert und möchten, dass er als Dataset in der BDC dargestellt wird.
- Sie haben das Werkzeug Dataset aus Big-Data-Verbindung entfernen verwendet und möchten die entfernten Datasets wieder zur BDC hinzufügen.
Mit diesem Werkzeug werden die vorhandenen Dataset-Eigenschaften, die mit dem Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren bearbeitet wurden, nicht aktualisiert. Alle geänderten Eigenschaften bleiben erhalten. Die folgenden Szenarien enthalten empfohlene Workflows:
- Sie haben das Schema eines vorhandenen Quellen-Datasets geändert: Ändern Sie die Felder mit dem Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren. Sie können auch mit dem Werkzeug Dataset aus Big-Data-Verbindung entfernen das Dataset entfernen und dann das Werkzeug Big-Data-Verbindung aktualisieren verwenden, wenn es keine Änderungen am BDC-Dataset gibt, die Sie behalten möchten.
- Sie haben neue Dateien zu einem vorhandenen Dataset hinzugefügt: Es sind keine weiteren Schritte erforderlich. Wenn Sie ein Geoverarbeitungswerkzeug zur Analyse Ihrer BDC-Daten ausführen, werden alle Dateien im BDC-Dataset für die Analyse berücksichtigt.
- Sie haben ein vorhandenes Dataset gelöscht: Entfernen Sie das Dataset mit dem Werkzeug Dataset aus Big-Data-Verbindung entfernen aus der BDC.
Die Werkzeugmeldungen enthalten die folgenden Informationen zu den ermittelten Datasets und deren Status:
- Übersprungen: Alle vorhandenen Datasets werden bei der Aktualisierung übersprungen und bleiben unverändert bestehen.
- Erfolgreich: Neue Datasets, die ermittelt und zur BDC hinzugefügt wurden.
- Fehlgeschlagen: Datasets, die nicht erfolgreich zur BDC hinzugefügt wurden.
Beim Ermitteln von Datasets in Ihrer BDC können zwei Probleme auftreten:
- Erwartete Datasets fehlen. Überprüfen Sie in diesem Fall, ob der als Quellordner angegebene Pfad, der die Unterordner enthält, richtig ist und einen unterstützten Datentyp aufweist.
- Mindestens ein Dataset wird nicht registriert. Wenn Datasets nicht registriert werden, könnte Ihnen Folgendes auffallen:
Problem Lösung Beispiel Das Dataset hat nicht das erwartete Format.
Öffnen Sie die Datei, um festzustellen, ob sie wie erwartet aussieht. Wenn die Daten falsch strukturiert sind, ändern Sie dies, und versuchen Sie es erneut.
Eine .csv-Datei enthält einige Zeilen und eine Zusammenfassung der Daten und dann nur leere Zeilen.
Die Schemas von Datasets in einem Ordner stimmen nicht überein.
Alle Dateien in einem Dataset-Ordner müssen das gleiche Schema aufweisen. Öffnen Sie die Dateien, um die Schemas zu vergleichen. Beheben Sie Schemakonflikte, und wiederholen Sie das Registrieren des Datasets.
Sie haben eine .csv-Datei mit 10 Feldern und eine mit 8.
Die Dateitypen eines Datasets in einem Ordner stimmen nicht überein.
Alle Dateien in einem Dataset-Ordner müssen die gleiche Erweiterung (Dateityp) aufweisen. Überprüfen Sie die Dateitypen des Datenquellenspeicherorts, und entfernen oder verschieben Sie falsch platzierte Dateien.
Ein Shapefile-Dataset befindet sich im gleichen Ordner wie eine Parquet-Datei.
Ein Feldformat wurde nicht erkannt.
Dies ist unwahrscheinlich, aber möglich, wenn ORC und Parquet ein unerwartetes Format verwenden. Stellen Sie sicher, dass Sie gültige Feldformate verwenden.
Sie haben eine Parquet-Datei mit einem unbekannten Feldformat.
Weitere Informationen zu den Gründen, aus denen Datasets nicht zu einer BDC-Datei hinzugefügt wurden
Nachdem Sie eine BDC aktualisiert haben, überprüfen Sie mit dem Werkzeug Dataset beschreiben, ob das aktualisierte Dataset wie erwartet aussieht.
Mit dem Werkzeug Big-Data-Verbindung aktualisieren werden neue Datasets identifiziert. Eine BDC kann auch mit den folgenden Werkzeugen geändert werden:
- Dataset aus Big-Data-Verbindung kopieren: Kopiert ein Dataset aus einer BDC in eine Feature-Class.
- Dataset aus Big-Data-Verbindung duplizieren: Erstellt eine Sicht eines vorhandenen BDC-Datasets.
- Dataset aus Big-Data-Verbindung entfernen: Entfernt ein Dataset aus der BDC.
- Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren: Ändert die Eigenschaften eines einzelnen BDC-Datasets.
- Vorschau von Dataset aus Big-Data-Verbindung anzeigen: Zeigt eine Vorschau der ersten zehn Features im Dataset an, um zu überprüfen, ob sie richtig registriert wurden.
- Dataset beschreiben: Um zu überprüfen, ob das Dataset wie erwartet dargestellt wird.
Dieses Geoverarbeitungswerkzeug wird unterstützt durch Spark. Weitere Informationen über Big-Daten-Verbindungen und deren Verwendung finden Sie unter Big-Data-Verbindungen.
Syntax
arcpy.gapro.RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
Parameter | Erklärung | Datentyp |
bdc_file | Die zu aktualisierende BDC-Datei. | File |
visible_geometry (optional) | Legt fest, ob die zum Identifizieren der Geometrie verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Geometriefelder nicht sichtbar sind, wird die Geometrie auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Geometrie kann in der BDC geändert werden.
| Boolean |
visible_time (optional) | Legt fest, ob die zum Angeben der Zeit verwendeten Felder als Felder für die Analyse einbezogen werden (sichtbar sind), wenn die BDC-Datei in anderen Geoverarbeitungswerkzeugen genutzt wird. Auch wenn Zeitfelder nicht sichtbar sind, wird die Zeit auf das Dataset angewendet. Die Einstellung für die Sichtbarkeit der Zeit kann in der BDC geändert werden.
| Boolean |
Abgeleitete Ausgabe
Name | Erklärung | Datentyp |
updated_bdc | Die .bdc-Eingabedatei mit aktualisierten Datasets. | Datei |
Codebeispiel
Das folgende Python-Skript veranschaulicht, wie die Funktion RefreshBDC verwendet wird.
# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that
# have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)
Umgebungen
Lizenzinformationen
- Basic: Nein
- Standard: Nein
- Advanced: Ja