Vorbereiten von Daten

Sie können Data Engineering-Werkzeuge verwenden, um Ihre Daten zu bereinigen und vorzubereiten. Die Ansicht "Data Engineering" beinhaltet einige Geoverarbeitungswerkzeuge, mit denen Sie Ihre Daten für die Verwendung in einer Karte oder einer Analyse vorbereiten können. Diese sind in die folgenden Kategorien eingeteilt:

  • Bereinigen: Die Daten bereinigen. Sie können z. B. unnötige Zeilen oder Felder löschen. Sie können die Felder auch ändern oder fehlende Werte ergänzen.
  • Konstruieren: Neue Felder aus vorhandenen Feldern oder Eigenschaften des Layers erstellen. Sie können z. B. neue Felder hinzufügen und berechnen, vorhandene Felder standardisieren, transformieren oder reklassifizieren und Felder basierend auf der Geometrie des Eingabe-Layers hinzufügen.
  • Integrieren: Integrieren oder Hinzufügen von Daten aus einer anderen Datenquelle in die Eingabetabelle oder -Feature-Klasse. Sie können z. B. Felder verbinden oder Felder hinzufügen, indem Sie die Daten anreichern.
  • Formatieren: Das Format der Felder ändern oder die Felder in der Tabelle oder Feature-Klasse reorganisieren. Sie können z. B. Zeitfelder konvertieren, kategorische Felder kodieren oder die Dimensionen vorhandener Felder reduzieren.

Hinweis:

Für nicht editierbare Ebenen sind einige Geoverarbeitungswerkzeuge in der Ansicht "Data Engineering" nicht verfügbar. Erstellen Sie in diesem Fall eine editierbare Kopie des Layers und öffnen Sie eine neue Ansicht "Data Engineering".

Gehen sie wie folgt vor, um auf diese Gruppen und Werkzeuge in der Ansicht "Data Engineering" zuzugreifen:

Kontextbezogenes Menüband "Data Engineering"

Wenn die Ansicht "Data Engineering" aktiviert ist, erscheint oben in der Anwendung ein kontextbezogenes Menüband. Über das Menüband können Sie auf Befehle und Werkzeuge zum Erkunden und Vorbereiten von Daten zugreifen.

Kontextbezogenes Menüband "Data Engineering"

Die Gruppe Daten im Menüband bietet Zugriff auf die Ansicht "Felder" und die Attributtabelle des Layers, der mit der aktiven Ansicht "Data Engineering" verbunden ist. Die Gruppe Werkzeuge beinhaltet vier Werkzeuggalerien: Bereinigen, Konstruieren, Integrieren und Formatieren. Jede Werkzeuggalerie enthält Geoverarbeitungswerkzeuge für den entsprechenden Data Engineering-Task. Standardmäßig wird der mit der aktiven Ansicht "Data Engineering" verknüpfe Layer verwendet, um den Parameter für die Eingabe-Features dieser Werkzeuge automatisch zu füllen.

Werkzeuge für das Data Engineering

Die folgenden Tabellen beschreiben alle Werkzeuge im Menüband Data Engineering.

Hinweis:

Einige Geoverarbeitungswerkzeuge sind für nichträumliche Daten, wie z. B. Standalone-Tabellen, nicht verfügbar.

Fehlerbereinigung und Topologie erstellen (Clean)

Die Kategorie Bereinigen enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Fehlende Werte ausfüllen

Ersetzt fehlende Werte (NULL-Werte) durch Schätzwerte, die auf räumlichen Nachbarn, Raum-Zeit-Nachbarn oder Zeitserienwerten basieren.

Feld löschen

Mit diesem Werkzeug können Sie ein oder mehrere Felder aus einer Tabelle, einer Feature-Class, einem Feature-Layer oder einem Raster-Dataset löschen.

Erkennung räumlicher Ausreißer

Erkennt räumliche Ausreißer in Punkt-Features durch Berechnen des lokalen Ausreißer-Faktors (Local Outlier Factor, LOF) für die einzelnen Features. Räumliche Ausreißer sind Features an anormal isolierten Positionen, und der LOF ist ein Maß, mit dem beschrieben wird, wie isoliert eine Position von ihren lokalen Nachbarn ist.

Projizieren

Projiziert räumliche Daten von einem Koordinatensystem in ein anderes.

Konstruieren

Die Kategorie Konstruieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Geometrieattribute berechnen

Fügt Informationen zu den Attributfeldern eines Features hinzu, die den räumlichen oder geometrischen Eigenschaften und der Position des Features entsprechen, darunter Länge, Fläche oder die X-, Y-, Z- und M-Koordinaten.

Feld berechnen

Hiermit werden die Werte eines Feldes für eine Feature-Class, einen Feature-Layer oder ein Raster berechnet.

Feld transformieren

Transformiert kontinuierliche Werte in einem oder mehreren Feldern, indem auf die einzelnen Werte mathematische Funktionen angewendet werden und die Form der Verteilung geändert wird. Zu den Transformationsmethoden dieses Werkzeugs gehören "Logarithmisch", "Quadratwurzel", "Box-Cox", "Kehrwert", "Quadrat", "Exponentiell" und "Box-Cox invers".

Feld standardisieren

Standardisiert Werte in Feldern, indem sie in Werte konvertiert werden, die einem bestimmten Maßstab folgen. Zu dem Standardisierungsmethoden gehören "Z-Wert", "Minimum-Maximum", "Absolutes Maximum" und "Robuste Standardisierung".

Feld hinzufügen

Fügt einer Tabelle oder der Tabelle einer Feature-Class bzw. eines Feature-Layers sowie Rastern mit Attributtabellen ein neues Feld hinzu.

Dimensionsreduktion

Reduziert die Anzahl der Dimensionen eines Satzes an kontinuierlichen Variablen durch die Aggregation der größtmöglichen Varianz in weniger Komponenten. Dazu wird die Hauptkomponentenanalyse (Principal Component Analysis, PCA) oder die lineare Diskriminanzanalyse mit reduziertem Rang (Reduced-Rank Linear Discriminant Analysis, LDA) verwendet.

Glätten von Zeitserien

Glättet Zeitseriendaten, sodass kurzfristige Schwankungen bei der Erkennung von langfristigen Trends und Zyklen berücksichtigt werden können. Das Werkzeug, das die numerische Variable mindestens einer Zeitserie mit zentriert, vorwärts und rückwärts gleitenden Durchschnittswerten sowie einer adaptiven Methode verwendet, die auf lokaler linearer Regression basiert.

Integrieren

Die Kategorie Integrieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Feld verbinden

Stellt Verbindungen des Inhalts einer Tabelle auf der Grundlage eines gemeinsamen Attributfeldes mit einer anderen Tabelle her. Die Eingabetabelle wird so aktualisiert, dass sie die Felder aus der Join-Tabelle enthält. Sie können auswählen, welche Felder aus der Join-Tabelle der Eingabetabelle hinzugefügt werden.

Anreichern

Reichert Daten an, indem demografische und landschaftliche Fakten zu Personen und Orten, die sich in der Umgebung und innerhalb der Positionen der Daten befinden, hinzugefügt werden. Die Ausgabe ist ein Duplikat der Eingabe mit zusätzlichen Attributfeldern. Dieses Werkzeug erfordert ein ArcGIS Online-Organisationskonto oder ein lokal installiertes Business Analyst-Dataset.

Benachbart

Berechnet die Entfernung und weitere Nachbarschaftsinformationen zwischen den Eingabe-Features und dem nächstgelegenen Feature in einem anderen Layer oder einer anderen Feature-Class.

Räumliche Verbindung

Vereinigt Attribute eines Features basierend auf der räumlichen Beziehung mit den Attributen eines anderen. Die Ziel-Features und die vereinigten Attribute aus den Verbindungs-Features werden in die Ausgabe-Feature-Class geschrieben.

Zusammenfassen (innerhalb)

Überlagert einen Polygon-Layer mit einem anderen Layer, um die Anzahl der Punkte, die Länge der Linien oder die Fläche der Polygone in jedem Polygon zusammenzufassen und Attributfeldstatistiken zu den Features innerhalb des Polygons zu berechnen.

Stichprobe

Erstellt eine Tabelle oder eine Point-Feature-Class, die für definierte Positionen die Werte der Zellen aus einem Raster oder einer Gruppe von Rastern anzeigt. Die Positionen werden durch Raster-Zellen, Punkte, Polylinien oder Polygone definiert.

Zusammenfassen (in der Nähe)

Sucht Features, die sich innerhalb einer angegebenen Entfernung von Features im Eingabe-Layer befinden und berechnet Statistiken für die nahe gelegenen Features.

Polygon aufteilen

Fasst die Attribute eines Eingabe-Polygon-Layers basierend auf der räumlichen Überlagerung eines Ziel-Polygon-Layers zusammen und weist die zusammengefassten Attribute den Ziel-Polygonen zu. Die Ziel-Polygone weisen summierte numerische Attribute auf, die von den Eingabe-Polygonen abgeleitet werden, die jedes Ziel überlappt.

Format

Die Kategorie Formatieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Feld codieren

Mit diesem Werkzeug werden Kategoriewerte (Zeichenfolgen, ganze Zahlen oder Datumsangaben) im mehrere numerische Felder konvertiert, die jeweils eine Kategorie darstellen. Die codierten numerischen Felder können in den meisten Data Science-Workflows und statistischen Workflow wie etwa in Regressionsmodellen verwendet werden.

Zeitfeld konvertieren

Konvertiert in einer Zeichenfolge oder einem Zahlenfeld gespeicherte Zeitwerte in ein Datumsfeld. Das Werkzeug kann auch dazu verwendet werden, um Zeitwerte, die in Zeichenfolgen-, numerischen oder Datumsfeldern gespeichert sind, in benutzerdefinierte Formate wie Tag der Woche, Monat des Jahres zu konvertieren.

Felder umgruppieren

Gruppiert in Feldern oder Spalten gespeicherte Daten zu Zeilen in einer neuen Tabelle oder Feature-Class um.

Zeitzone konvertieren

Konvertiert in einem Datumsfeld aufgezeichnete Zeitwerte aus einer Zeitzone in eine andere Zeitzone.

Feld reklassifizieren

Reklassifiziert Werte in einem numerischen Feld oder Textfeld auf der Basis von Grenzen, die manuell oder mithilfe einer Reklassifizierungsmethode definiert wurden.

Pivot-Tabelle

Erstellt eine Tabelle aus der Eingabetabelle durch das Reduzieren von Redundanz in Datensätzen und die Normalisierung von Eins-zu-Viele-Beziehungen.

Hinweis:

Die meisten Geoverarbeitungsvorgänge, bei denen Eingabedaten geändert werden, können nicht rückgängig gemacht werden.

Verwandte Themen