Verwenden von Big-Data-Verbindungen

Sie können Big-Data-Verbindungen (BDC) konfigurieren, visualisieren und zur Analyse verwenden.

Verwenden einer BDC

Wenn Sie Ihre Daten strukturiert haben, können Sie folgende Vorgänge ausführen:

  1. Konfigurieren einer BDC
  2. Visualisieren eines BDC-Datasets
  3. Verwenden von BDC-Datasets in Analysen

Konfigurieren einer BDC

Zuerst müssen Sie eine BDC erstellen. Zum Erstellen einer BDC gibt es zwei Möglichkeiten:

  • Verwenden Sie das Dialogfeld Neue Big-Data-Verbindung. Um auf das Dialogfeld zuzugreifen, klicken Sie auf dem Menüband Einfügen auf Verbindungen und wählen Sie Neue Big-Data-Verbindung aus. Das Dialogfeld bietet eine interaktive Benutzeroberfläche zum Erstellen einer BDC sowie zum Konfigurieren von Eigenschaften für jedes Dataset.
  • Verwenden Sie das Geoverarbeitungswerkzeug Big-Data-Verbindung erstellen.

Beim Ermitteln von Datasets in Ihrer BDC können zwei Probleme auftreten:

  • Erwartete Datasets fehlen. Überprüfen Sie in diesem Fall, ob der als Quellordner angegebene Pfad, der die Unterordner enthält, richtig ist und einen unterstützten Datentyp aufweist.
  • Mindestens ein Dataset wird nicht registriert. Wenn Datasets nicht registriert werden, könnte Ihnen Folgendes auffallen:

    ProblemLösungBeispiel

    Das Dataset hat nicht das erwartete Format.

    Öffnen Sie die Datei, um festzustellen, ob sie wie erwartet aussieht. Wenn die Daten falsch strukturiert sind, ändern Sie dies, und versuchen Sie es erneut.

    Eine .csv-Datei enthält einige Zeilen und eine Zusammenfassung der Daten und dann nur leere Zeilen.

    Die Schemas von Datasets in einem Ordner stimmen nicht überein.

    Alle Dateien in einem Dataset-Ordner müssen das gleiche Schema aufweisen. Öffnen Sie die Dateien, um die Schemas zu vergleichen. Beheben Sie Schemakonflikte, und wiederholen Sie das Registrieren des Datasets.

    Sie haben eine .csv-Datei mit 10 Feldern und eine mit 8.

    Die Dateitypen eines Datasets in einem Ordner stimmen nicht überein.

    Alle Dateien in einem Dataset-Ordner müssen die gleiche Erweiterung (Dateityp) aufweisen. Überprüfen Sie die Dateitypen des Datenquellenspeicherorts, und entfernen oder verschieben Sie falsch platzierte Dateien.

    Ein Shapefile-Dataset befindet sich im gleichen Ordner wie eine Parquet-Datei.

    Ein Feldformat wurde nicht erkannt.

    Dies ist unwahrscheinlich, aber möglich, wenn ORC und Parquet ein unerwartetes Format verwenden. Stellen Sie sicher, dass Sie gültige Feldformate verwenden.

    Sie haben eine Parquet-Datei mit einem unbekannten Feldformat.

Wenn Sie eine BDC mit einer durch Trennzeichen getrennten Datei erstellen und keine Kopfzeilen dargestellt werden, ist die Kopfzeile möglicherweise ungültig. Stellen Sie sicher, dass alle Felder eine Kopfzeile aufweisen und dass keine davon leer ist. Wenn Sie das Dialogfeld zum Erstellen der Big-Data-Dateifreigabe verwenden, können Sie die Feldköpfe im Bereich Felder aktualisieren. Sie können die Feldnamen auch mit dem Werkzeug Eigenschaften des Big-Data-Verbindungs-Datasets aktualisieren aktualisieren.

Wenn Sie eine BDC erstellen, werden Schema, Geometrie und Zeit für jedes der Datasets ermittelt. Häufig können Sie ändern, wie die Datasets diese Werte darstellen. Überprüfen Sie mit dem Geoverarbeitungswerkzeug Dataset beschreiben, ob jedes Dataset Geometrie, Zeit und Felder richtig darstellt. Wenn Sie Ihre Datasets prüfen, könnten Sie beispielsweise die folgenden Änderungen an einem oder mehreren Datasets in Ihrer BDC vornehmen:

  • Ändern Sie die Feldnamen von durch Trennzeichen getrennten Datasets.
  • Ändern Sie, welche Felder für Analysen sichtbar sind.
  • Ändern Sie die Felder, mit denen Geometrie und Zeit dargestellt werden.
  • Fügen Sie einen Filter zu einem Dataset hinzu.
  • Fügen Sie einen Alias zu einem Dataset hinzu.
  • Entfernen Sie Datasets aus der BDC, die Sie nicht analysieren möchten.
  • Aktualisieren Sie die BDC, damit sie ein neu hinzugefügtes Dataset enthält (ein neuer Unterordner unter dem Quellordner).

Diese optionalen Änderungen können Sie mit dem Dialogfeld Neue Big-Data-Verbindung oder einer beliebigen Kombination der folgenden Werkzeuge vornehmen:

Visualisieren eines BDC-Datasets

Sie können durch Trennzeichen getrennte und auf Shapefiles basierende BDC-Datasets auf einer Karte visualisieren.

Hinweis:
BDC-Datensätze mit Parquet- oder ORC-Quelldateien können nicht visualisiert werden.

Um Ihr Dataset zur Karte hinzuzufügen, suchen Sie im Bereich Katalog nach dem BDC-Element, klicken Sie, um die Datasets zu erweitern, und fügen Sie das Dataset zur Karte hinzu.

BDC-Datasets weisen in Ihrer Karte eine vereinfachte Benutzeroberfläche und folgende Beschränkungen auf:

  • Beim Visualisieren von BDC-Datasets werden die Zeiteigenschaften in den BDC-Dataset-Eigenschaften im neuen Layer nicht automatisch festgelegt. Um das Dataset mit Zeitangaben zu visualisieren, legen Sie die Zeiteigenschaften des Layers nach dem Hinzufügen des Datasets zur Karte fest.
  • Durch die Darstellung von durch Trennzeichen getrennten Dateien wird auf die volle Ausdehnung des Raumbezugs des BDC-Datasets gezoomt.
  • Wenn Sie neue Datensätze zu einem vorhandenen BDC-Dataset hinzufügen, beispielsweise neue Zeilen zu einer CSV-Datei in einer vorhandenen BDC, werden die neuen Datensätze erst dargestellt, nachdem Sie ArcGIS Pro gestartet haben.
  • Wenn Sie neue Dateien, beispielsweise eine neue CSV-Datei, zu einem vorhandenen BDC-Dataset hinzufügen, werden die neuen Datensätze erst dargestellt, nachdem Sie ArcGIS Pro gestartet haben.

Verwenden von BDC-Datasets in Analysen

Wenn BDC-Datasets als Eingaben für GeoAnalytics Desktop-Werkzeuge verwendet werden, wird die Analyse so optimiert, dass die Daten gelesen und parallel auf den Kernen des Computers ausgeführt werden. In allen Geoverarbeitungswerkzeugen ist das Lesen und Verarbeiten von BDC-Datasets nicht so optimiert, dass es parallel erfolgt, sondern sequenziell und in einem Thread.

Sie können Big-Data-Verbindungs-Datasets, die auf durch Trennzeichen getrennten Dateien oder Shapefiles basieren, in den meisten Geoverarbeitungswerkzeugen verwenden.

Hinweis:
BDC-Datasets, die Parquet- und ORC-Quelldateien verwenden, können nur in GeoAnalytics Desktop-Werkzeugen genutzt werden.

Sie können keine Auswahl auf ein BDC-Dataset anwenden, während es als Eingabe für ein GeoAnalytics Desktop-Werkzeug verwendet wird.

Um ein BDC-Dataset in einem Geoverarbeitungswerkzeug zu verwenden, fügen Sie ein BDC-Dataset zu einer Karte hinzu, und wählen Sie den Layer-Namen aus der Auswahlliste der Parameter aus. Navigieren Sie alternativ über die Schaltfläche "Durchsuchen" zu einem BDC-Workspace, und wählen Sie das Eingabe-Dataset aus. Die folgenden Werkzeuge unterstützen keine BDC-Eingabedateien:


In diesem Thema
  1. Verwenden einer BDC