Vorbereiten von Daten

Sie können Data Engineering-Werkzeuge verwenden, um Ihre Daten zu bereinigen und vorzubereiten. Die Ansicht "Data Engineering" beinhaltet einige Geoverarbeitungswerkzeuge, mit denen Sie Ihre Daten für die Verwendung in einer Karte oder einer Analyse vorbereiten können. Diese sind in die folgenden Kategorien eingeteilt:

  • Bereinigen: Die Daten bereinigen. Sie können z. B. unnötige Felder löschen. Sie können die Felder auch ändern oder fehlende Werte ergänzen.
  • Konstruieren: Neue Felder aus vorhandenen Feldern oder Eigenschaften des Layers erstellen. Sie können z. B. neue Felder hinzufügen und berechnen, vorhandene Felder standardisieren, transformieren oder reklassifizieren und Felder basierend auf der Geometrie des Eingabe-Layers hinzufügen.
  • Integrieren: Integrieren oder Hinzufügen von Daten aus einer anderen Datenquelle in die Eingabetabelle oder -Feature-Klasse. Sie können z. B. Felder verbinden oder Felder hinzufügen, indem Sie die Daten anreichern.
  • Formatieren: Das Format der Felder ändern oder die Felder in der Tabelle oder Feature-Klasse reorganisieren. Sie können z. B. Zeitfelder konvertieren, kategorische Felder kodieren oder die Dimensionen vorhandener Felder reduzieren.

Hinweis:

Für nicht editierbare Ebenen sind einige Geoverarbeitungswerkzeuge in der Ansicht "Data Engineering" nicht verfügbar. Erstellen Sie in diesem Fall eine editierbare Kopie des Layers und öffnen Sie eine neue Ansicht "Data Engineering".

Gehen sie wie folgt vor, um auf diese Gruppen und Werkzeuge in der Ansicht "Data Engineering" zuzugreifen:

Kontextbezogenes Menüband "Data Engineering"

Wenn die Ansicht "Data Engineering" aktiviert ist, erscheint oben in der Anwendung ein kontextbezogenes Menüband. Über das Menüband können Sie auf Befehle und Werkzeuge zum Erkunden und Vorbereiten von Daten zugreifen.

Kontextbezogenes Menüband "Data Engineering"

Die Gruppe Daten im Menüband bietet Zugriff auf die Ansicht "Felder" und die Attributtabelle des Layers, der mit der aktiven Ansicht "Data Engineering" verbunden ist. Die Gruppe Werkzeuge beinhaltet vier Werkzeuggalerien: Bereinigen, Konstruieren, Integrieren und Formatieren. Jede Werkzeuggalerie enthält Geoverarbeitungswerkzeuge für den entsprechenden Data Engineering-Task. Standardmäßig wird der mit der aktiven Ansicht "Data Engineering" verknüpfe Layer verwendet, um den Parameter für die Eingabe-Features dieser Werkzeuge automatisch zu füllen. Konvertieren Sie Ihre nicht räumlichen Standalone-Tabellen in der Gruppe Räumlich unter XY-Daten anzeigen und Tabelle geokodieren in räumliche Daten.

Werkzeuge für das Data Engineering

Die folgenden Tabellen beschreiben alle Werkzeuge im Menüband Data Engineering.

Hinweis:

Einige Geoverarbeitungswerkzeuge sind für nichträumliche Daten, wie z. B. Standalone-Tabellen, nicht verfügbar.

Bereinigen

Die Kategorie Bereinigen enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Feld löschen

Mit diesem Werkzeug können Sie ein oder mehrere Felder aus einer Tabelle, einer Feature-Class, einem Feature-Layer oder einem Raster-Dataset löschen.

Feld ändern

Benennt Felder und Feldaliasnamen um oder ändert Feldeigenschaften.

Projizieren

Projiziert räumliche Daten von einem Koordinatensystem in ein anderes.

Zeilen löschen

Löscht alle Zeilen oder die ausgewählte Teilmenge der Zeilen aus der Eingabe.

Fehlende Werte ausfüllen

Ersetzt fehlende Werte (NULL-Werte) durch geschätzte Werte basierend auf Werten von räumlichen Nachbarn, Raum-Zeit-Nachbarn, Zeitserien oder globalen Statistiken.

Räumliche Ausreißer erkennen

Erkennt globale oder lokale räumliche Ausreißer in Punkt-Features.

Konstruieren

Die Kategorie Konstruieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Feld berechnen

Hiermit werden die Werte eines Feldes für eine Feature-Class, einen Feature-Layer oder ein Raster berechnet.

Feld hinzufügen

Fügt einer Tabelle oder der Tabelle einer Feature-Class bzw. eines Feature-Layers sowie Rastern mit Attributtabellen ein neues Feld hinzu.

Raten berechnen

Berechnet Bruttoraten oder geglättete Raten. Die Methode "Globale empirische Bayes-Rate" glättet die Raten entsprechend einer globalen Referenzrate. Bei den Methoden "Lokale empirische Bayes-Rate", "Lokal gewichtete Durchschnittsrate" und "Lokal gewichtete Medianrate" werden lokale Nachbarn für die räumliche Glättung von Raten verwendet.

Geometrieattribute berechnen

Fügt Informationen zu den Attributfeldern eines Features hinzu, die den räumlichen oder geometrischen Eigenschaften und der Position des Features entsprechen, darunter Länge, Fläche oder die X-, Y- und Z-Koordinaten sowie M-Werte.

Feld transformieren

Transformiert kontinuierliche Werte in einem oder mehreren Feldern, indem auf die einzelnen Werte mathematische Funktionen angewendet werden und die Form der Verteilung geändert wird. Zu den Transformationsmethoden dieses Werkzeugs gehören "Logarithmisch", "Quadratwurzel", "Box-Cox", "Kehrwert", "Quadrat", "Exponentiell" und "Box-Cox invers".

Feld standardisieren

Standardisiert Werte in Feldern, indem sie in Werte konvertiert werden, die einem bestimmten Maßstab folgen. Zu dem Standardisierungsmethoden gehören "Z-Wert", "Minimum-Maximum", "Absolutes Maximum" und "Robuste Standardisierung".

Dimensionsreduktion

Reduziert die Anzahl der Dimensionen eines Satzes an kontinuierlichen Variablen durch die Aggregation der größtmöglichen Varianz in weniger Komponenten. Dazu wird die Hauptkomponentenanalyse (Principal Component Analysis, PCA) oder die lineare Diskriminanzanalyse mit reduziertem Rang (Reduced-Rank Linear Discriminant Analysis, LDA) verwendet.

Zeitserien glätten

Glättet Zeitseriendaten, sodass kurzfristige Schwankungen bei der Erkennung von langfristigen Trends und Zyklen berücksichtigt werden können. Das Werkzeug, das die numerische Variable mindestens einer Zeitserie mit zentriert, vorwärts und rückwärts gleitenden Durchschnittswerten sowie einer adaptiven Methode verwendet, die auf lokaler linearer Regression basiert.

Integrieren

Die Kategorie Integrieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Anhängen

Hängt ein vorhandenes Ziel-Dataset an mehrere Eingabe-Datasets an oder aktualisiert diese optional. Eingabe-Datasets können Feature-Classes, Tabellen, Shapefiles, Raster sowie Annotation- oder Dimension-Feature-Classes sein.

Räumliche Verbindung

Vereinigt Attribute eines Features basierend auf der räumlichen Beziehung mit den Attributen eines anderen. Die Ziel-Features und die vereinigten Attribute aus den Verbindungs-Features werden in die Ausgabe-Feature-Class geschrieben.

Feld verbinden

Stellt Verbindungen des Inhalts einer Tabelle auf der Grundlage eines gemeinsamen Attributfeldes mit einer anderen Tabelle her. Die Eingabetabelle wird so aktualisiert, dass sie die Felder aus der Join-Tabelle enthält. Sie können auswählen, welche Felder aus der Join-Tabelle der Eingabetabelle hinzugefügt werden.

Near

Berechnet die Entfernung und weitere Nachbarschaftsinformationen zwischen den Eingabe-Features und dem nächstgelegenen Feature in einem anderen Layer oder einer anderen Feature-Class.

Zusammenfassen (innerhalb)

Überlagert einen Polygon-Layer mit einem anderen Layer, um die Anzahl der Punkte, die Länge der Linien oder die Fläche der Polygone in jedem Polygon zusammenzufassen und Attributfeldstatistiken zu den Features innerhalb der Polygone zu berechnen.

Zusammenfassen (in der Nähe)

Sucht Features, die sich innerhalb einer angegebenen Entfernung von Features im Eingabe-Layer befinden und berechnet Statistiken für die nahe gelegenen Features.

Stichprobe aus Raster

Erstellt eine Tabelle oder eine Point-Feature-Class, die für definierte Positionen die Werte der Zellen aus einem Raster oder einer Gruppe von Rastern anzeigt. Die Positionen werden durch Raster-Zellen, Punkte, Polylinien oder Polygone definiert.

Anreichern

Reichert Daten an, indem demografische und landschaftliche Fakten zu Personen und Orten, die sich in der Umgebung und innerhalb der Positionen der Daten befinden, hinzugefügt werden. Die Ausgabe ist ein Duplikat der Eingabe mit zusätzlichen Attributfeldern. Dieses Werkzeug erfordert ein ArcGIS Online-Organisationskonto oder ein lokal installiertes Business Analyst-Dataset.

Polygon aufteilen

Fasst die Attribute eines Eingabe-Polygon-Layers basierend auf der räumlichen Überlagerung eines Ziel-Polygon-Layers zusammen und weist die zusammengefassten Attribute den Ziel-Polygonen zu. Die Ziel-Polygone weisen summierte numerische Attribute auf, die von den Eingabe-Polygonen abgeleitet werden, die jedes Ziel überlappt.

Formatieren

Die Kategorie Formatieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Zeitfeld konvertieren

Überträgt in einem Feld gespeicherte Zeitwerte in ein anderes Feld. Das Werkzeug kann verwendet werden, um Konvertierungen zwischen Feldtypen (Text-, numerischen oder Datums-/Uhrzeitfeldern) durchzuführen oder um die Werte in ein anderes Format zu konvertieren, z. B. "dd/MM/yy HH:mm:ss in yyyy-MM-dd".

Zeitzone konvertieren

Konvertiert in einem Datumsfeld aufgezeichnete Zeitwerte aus einer Zeitzone in eine andere Zeitzone.

Pivot-Tabelle

Erstellt eine Tabelle aus der Eingabetabelle durch das Reduzieren von Redundanz in Datensätzen und die Normalisierung von Eins-zu-Viele-Beziehungen.

Felder umgruppieren

Gruppiert in Feldern oder Spalten gespeicherte Daten zu Zeilen in einer neuen Tabelle oder Feature-Class um.

Feld reklassifizieren

Reklassifiziert Werte in einem numerischen Feld oder Textfeld auf der Basis von Grenzen, die manuell oder mithilfe einer Reklassifizierungsmethode definiert wurden.

Feld codieren

Mit diesem Werkzeug werden Kategoriewerte (Zeichenfolgen, ganze Zahlen oder Datumsangaben) im mehrere numerische Felder konvertiert, die jeweils eine Kategorie darstellen. Die codierten numerischen Felder können in den meisten Data Science-Workflows und statistischen Workflow wie etwa in Regressionsmodellen verwendet werden.

Hinweis:

Die meisten Geoverarbeitungsvorgänge, bei denen Eingabedaten geändert werden, können nicht rückgängig gemacht werden.

Verwandte Themen