Die klassischen Überlagerungswerkzeuge (Puffer, Ausschneiden, Zusammenführen (Dissolve), Radieren, Integrieren und Überschneiden (Intersect)) und die Werkzeuge für die paarweise Überlagerung (Paarweise puffern, Paarweise ausschneiden, Paarweise zusammenführen, Paarweise radieren, Paarweise integrieren und Paarweise überschneiden) wurden entwickelt, um die Performance und die Genauigkeit der Analyse bei der Verarbeitung sehr großer und komplexer Datasets auf einem einzelnen Desktop zu maximieren. Funktions- und Performance-Unterschiede zwischen Werkzeugen mit ähnlicher Funktionalität bestimmen das Werkzeug, das Sie in Ihrem Workflow verwenden sollten. Es gibt weitere Überlegungen, die alle Geoverarbeitungswerkzeuge betreffen und sich je nach verwendetem Werkzeug auf die Genauigkeit der Ausgabe und die Analyse-Performance auswirken.
Werkzeugvergleich
Das Toolset "Paarweise Überlagerung" enthält eine Reihe von Alternativen zu traditionellen Überlagerungswerkzeugen.
"Paarweise puffern" und "Puffer"
Im Folgenden werden die Werkzeuge Paarweise puffern und Puffer verglichen:
- Beide Werkzeuge verwenden die parallele Verarbeitung. Für das Werkzeug Paarweise puffern ist die parallele Verarbeitung standardmäßig aktiviert. Beim Werkzeug Puffer wird sie in der Umgebung "Faktor für parallele Verarbeitung" aktiviert.
- Die Ausgabe-Features des Werkzeugs Paarweise puffern weisen eine geringere Glätte auf als die Ausgabe-Features, die das Werkzeug Puffer standardmäßig erzeugt.
- Mit dem Werkzeug Paarweise puffern können Sie die Glätte der Pufferausgabe-Features steuern. Informationen zum Parameter Maximale Abweichung bei Versatz finden Sie in der Werkzeugdokumentation.
- Das Werkzeug Puffer stellt Ausgabepufferoptionen wie "Seitentyp" und "Endtyp" bereit.
"Paarweise ausschneiden" und "Ausschneiden"
Beide Werkzeuge verwenden die parallele Verarbeitung. Für das Werkzeug Paarweise ausschneiden ist die parallele Verarbeitung standardmäßig aktiviert. Beim Werkzeug Ausschneiden wird sie in der Umgebung "Faktor für parallele Verarbeitung" aktiviert.
"Paarweise zusammenführen" und "Zusammenführen (Dissolve)"
Hiermit werden die Werkzeuge Paarweise zusammenführen und Zusammenführen (Dissolve) verglichen:
- Die Ausgabe dieser Werkzeuge ist ähnlich, und die Werkzeuge können austauschbar verwendet werden.
- Das Werkzeug Paarweise zusammenführen verwendet standardmäßig die parallele Verarbeitung. Das Werkzeug Zusammenführen (Dissolve) verfügt nicht über Parallelfunktionen.
"Paarweise radieren" und "Radieren"
Hiermit werden die Werkzeuge Paarweise radieren und Radieren verglichen:
- Die Ausgabe dieser Werkzeuge ist ähnlich, und die Werkzeuge können austauschbar verwendet werden.
- Beide Werkzeuge verwenden die parallele Verarbeitung. Für das Werkzeug Paarweise radieren ist die parallele Verarbeitung standardmäßig aktiviert. Beim Werkzeug Radieren wird die parallele Verarbeitung in der Umgebung "Faktor für parallele Verarbeitung" aktiviert.
"Paarweise integrieren" und "Integrieren"
Hiermit werden die Werkzeuge Paarweise integrieren und Integrieren verglichen:
- Das Werkzeug Paarweise integrieren verwendet standardmäßig die parallele Verarbeitung.
- Die interne Toleranz des Werkzeugs Paarweise integrieren ist aufgrund von Unterschieden bei den zugrunde liegenden Engines, die die Integration durchführen, etwas größer als die des Werkzeugs Integrieren.
"Paarweise überschneiden" und "Überschneiden (Intersect)"
Hiermit werden die Werkzeuge Paarweise überschneiden und Überschneiden (Intersect) verglichen:
- Die Ausgabe dieser beiden Werkzeuge ist grundlegend verschieden. Die Werkzeuge können nicht austauschbar verwendet werden, ohne dass Sie Ihren Workflow evaluieren und prüfen, inwiefern dieser geändert werden muss, um die unterschiedlichen Ausgaben zu berücksichtigen. Weitere Informationen finden Sie unter Funktionsweise des Werkzeugs "Paarweise überschneiden".
- Beide Werkzeuge verwenden die parallele Verarbeitung. Für das Werkzeug Paarweise überschneiden ist die parallele Verarbeitung standardmäßig aktiviert. Beim Werkzeug Überschneiden (Intersect) wird sie in der Umgebung "Faktor für parallele Verarbeitung" aktiviert.
Funktions- und Performance-Überlegungen für alle Analysewerkzeuge
Bei der Entscheidung, welches dieser ergänzenden Werkzeuge in Ihrem Workflow verwendet werden soll, kommen oft beide Werkzeuge in Frage. Die folgenden Informationen können Ihnen helfen, die Unterschiede zwischen den Werkzeugen besser zu verstehen, und Sie bei der Entscheidung unterstützen.
Funktionelle Überlegungen
Die wichtigste Überlegung bei der Auswahl des zu verwendenden Werkzeugs ist, ob die Ausgabe den Anforderungen Ihres Projekts entspricht. In einigen Fälle erzeugen die vergleichbaren Werkzeuge eine äquivalente Ausgabe, in anderen dagegen nicht. Die wichtigsten Unterschiede bei der Ausgabe der Werkzeuge wurden im vorausgehenden Abschnitt beschrieben. In der Dokumentation zu den einzelnen Werkzeugen finden Sie alle Informationen für den Vergleich der zu verwendenden Werkzeuge.
Bei allen Werkzeugen sollte vermieden werden, während der Analyse "on-the-fly" zu projizieren. Die On-the-fly-Projektion wird verwendet, wenn die Werkzeugeingaben nicht dieselben Raumbezüge aufweisen. Darüber hinaus wird die On-the-fly-Projektion beim Festlegen von Geoverarbeitungsumgebungen eingesetzt, die das Ausgabekoordinatensystem verändern (Ausgabekoordinatensystem, XY-Toleranz, XY-Auflösung usw.). Die On-the-fly-Projektion kann zu Ungenauigkeiten aufgrund von falsch ausgerichteten Daten zwischen Layern führen. Weitere Informationen finden Sie unter Koordinatensysteme und Projektionen.
XY-Auflösung und XY-Toleranz haben funktionelle Auswirkungen auf die Ausgabe aller Werkzeuge. Weitere Informationen finden Sie unter Grundlagen zu Feature-Classes. Über Jahrzehnte wurde eine Vielzahl von Untersuchungen durchgeführt, um die geeignete XY-Auflösung und XY-Toleranz zu ermitteln, die bei der Verarbeitung von Daten im zugewiesenen Raumbezug die genauesten Ergebnisse erzeugen. Es wird empfohlen, die Standard-XY-Auflösung und -XY-Toleranz für den Raumbezug der Eingabedaten zu verwenden und diese während der Datengenerierung oder der Verwendung von Geoverarbeitungsumgebungen während der Analyse nicht zu ändern. Um ungenaue Analyseergebnisse zu vermeiden, wird außerdem empfohlen, den Werkzeugparameter "XY-Toleranz" nicht zu verwenden.
- Jedes Werkzeug implementiert die XY-Toleranz mit leichten Unterschieden.
- Die interne Implementierung der klassischen Überlagerungswerkzeuge und der Werkzeug für die paarweise Überlagerung ist sehr unterschiedlich. Die Werkzeuge weisen zwar aufgrund der Art und Weise, wie Geometrie in einer Geodatabase gespeichert wird, einige Gemeinsamkeiten auf, unterscheiden sich aber grundlegend in der Verarbeitung der Daten, sodass leichte Unterschiede in den Ausgabegeometrien zu erwarten sind.
- Die klassischen Überlagerungswerkzeuge können je nach Komplexität der Daten iterativ sein. Dass bedeutet, dass die Toleranz während der Analyse mehrmals angewendet werden kann. Die Auswirkung einer Änderung der XY-Toleranz von ihrem Standardwert in einen größeren oder kleineren Wert wird multipliziert. Je mehr der verwendete Wert für die XY-Toleranz vom Standardwert abweicht, desto wahrscheinlicher kommt es zu Problemen.
- Während der Cluster-Bildung fangen die klassischen Überlagerungswerkzeuge zwei Punkte aneinander, wenn der Abstand zwischen ihnen kleiner oder gleich dem folgenden Wert ist:
2 * sqrt(2) * Toleranz
- Während des Zerteilen-Prozesses gehen die klassischen Überlagerungswerkzeuge davon aus, dass ein Punkt auf dem Segment liegt, wenn der kürzeste Abstand zwischen dem Punkt und dem Inneren des Segments kleiner oder gleich dem Folgenden ist:
In diesem Fall wird das Segment geteilt, und die neuen Endpunkte werden an dem Punkt gefangen.sqrt(2) * Toleranz
- Während der Cluster-Bildung fangen die klassischen Überlagerungswerkzeuge zwei Punkte aneinander, wenn der Abstand zwischen ihnen kleiner oder gleich dem folgenden Wert ist:
- Die paarweisen Werkzeuge gehen davon aus, dass die Ausgabe als topologisch sauber zu betrachten ist, wenn die Ausgabe anschließend durch ein klassisches Überlagerungswerkzeug laufen würde. Das heißt, dass bei der Verarbeitung von Geometrien in einem topologischen Vorgang die Ausgabe keine neuen Segmentschnittpunkte oder Punkte enthalten sollte, die eigentlich hätten geclustert werden sollen. Damit dies immer der Fall ist, wurden die Berechnungen zur Bestimmung des Abstands, der beim Zerteilen und bei der Cluster-Bildung verwendet wird, angepasst. Dieser Prozess kann zu sehr geringen Geometrieunterschieden zwischen den Ausgaben der Werkzeuge führen.
Weitere Informationen zur Cluster-Bildung finden Sie unter Grundlagen zu Feature-Classes.
- Während der Cluster-Bildung fangen die paarweisen Werkzeuge zwei Punkte aneinander, wenn der Abstand zwischen ihnen kleiner oder gleich dem folgenden Wert ist:
1,01 * sqrt(2) * (2 * Toleranz + 2 * Auflösung)
- Während des Zerteilen-Prozesses gehen die paarweisen Werkzeuge davon aus, dass ein Punkt auf dem Segment liegt, wenn der kürzeste Abstand zwischen dem Punkt und dem Inneren des Segments kleiner oder gleich dem Folgenden ist:
1,01 * sqrt(2) * (Toleranz + 2 * Auflösung)
Hinweis:
Der Faktor 1,01 wird verwendet, um den ursprünglichen Wert für die Stabilität zu erhöhen.
- Während der Cluster-Bildung fangen die paarweisen Werkzeuge zwei Punkte aneinander, wenn der Abstand zwischen ihnen kleiner oder gleich dem folgenden Wert ist:
- Eine fehlerhafte Änderung der XY-Toleranz kann Fehler, ungenaue Analysen, Feature-Verschiebungen, topologische Fehler und sogar Abstürze zur Folge haben.
- Eine falsche Änderung der XY-Auflösung kann dazu führen, dass die Ausgabegeometrie die Eingabegeometrie nicht mehr genau darstellt und die Analyseergebnisse falsch sind. Wird die XY-Auflösung so geändert, dass sie kleiner ist als die Standardeinstellung, nimmt die Größe des Features zu. Dies kann Änderungen bei der Verarbeitung der Daten nach sich ziehen. Bei klassischen Überlagerungswerkzeugen kann diese Vergrößerung dazu führen, dass die Daten stärker gekachelt werden, um die Analyse mit den verfügbaren Ressourcen abzuschließen. Dadurch kann sich die Anzahl der in die Features eingefügten Stützpunkte, die Kachelgrenzen überschreiten, erhöhen. Weitere Informationen finden Sie unter Gekachelte Verarbeitung großer Datasets.
Die Eingabe-Feature-Geometrie muss gültig sein. Alle Werkzeuge, die Geometrie verarbeiten, sind von ungültiger Geometrie betroffen, die einen Fehler, eine ungenaue Analyse, den Abbruch des Prozesses oder einen Absturz bewirken kann. Im schlimmsten Fall wird kein Hinweis auf die Ursache des Problems angezeigt. Es liegt bei Ihnen, sicherzustellen, dass alle Eingabedaten gültige Geometrien enthalten.
Weitere Informationen zum Überprüfen und Reparieren von Geometrien
- Ungültige Geometrien können stärkere Auswirkungen auf klassische Überlagerungswerkzeuge als auf paarweise Werkzeuge haben.
Überlegungen zur Performance
Die Performance aller Geoverarbeitungswerkzeuge variiert je nach Größe und Komplexität der Eingabedaten. Es gibt einige Trends, die bei der Auswahl eines für das Szenario effizienten Werkzeugs nützlich sein können.
Flächen mit starker Überlappung
Flächen mit starker Überlappung von Linien und Polygonen können die Performance klassischer Überlagerungswerkzeuge beeinträchtigen.
Im Fall dicht gepackter Pufferausgabepolygone überlappen sich die Pufferpolygone möglicherweise so stark, dass bei Auswahl einer einzelnen Fläche in den Daten Zehn- oder sogar Hunderttausende von Puffer-Features zurückgegeben werden. Für Kernüberlagerungswerkzeuge wie Überschneiden (Intersect) oder Radieren ist die Bestimmung jedes einzelnen aus diesen Überlappungen entstandenen Polygons sehr aufwändig. Die Werkzeuge für die paarweise Überlagerung sind in diesem Szenario möglicherweise die bessere Wahl.
Im Fall dicht gepackter, sich schneidender Linien wird jeder Schnittpunkt und jede Überlappung mithilfe der klassischen Überlagerungswerkzeuge (Überschneiden (Intersect), Radieren und teilweise auch Ausschneiden) im Voraus bestimmt. Dies kann in gravierenden Fällen sehr aufwändig sein. Die Werkzeuge für die paarweise Überlagerung sind in diesem Szenario möglicherweise die bessere Wahl.
Wenn es für Ihre Analyse erforderlich ist, jede Überlappung zu finden (z. B. bei Verwendung der Werkzeuge Überschneiden (Intersect) oder Vereinigen (Union)), müssen Sie die klassischen Überlagerungswerkzeuge verwenden. Wenn allerdings Zehntausende oder Hunderttausende von Eingabe-Features eine Ausgabe mit Hunderten Millionen von Ausgabe-Features ergeben, die jede einzelne Überlappung repräsentieren, müssen Sie Ihren Ansatz möglicherweise überdenken, damit die Ergebnisse des Überlagerungsvorgangs sinnvoll genutzt werden können. Eine Neubewertung des Ziels Ihrer Analyse kann ergeben, dass Größe und Umfang der Analyse geändert werden müssen, um das Ergebnis der Analyse besser zu verstehen. Die Aufteilung der Daten in sinnvollere Interessenbereiche kann die Performance klassischer Überlagerungswerkzeuge verbessern, wenn die Überlappung der Eingabe-Features besonders ausgeprägt ist.
Überlegungen für sehr große Features
Weder die klassischen noch die Werkzeuge für die paarweise Überlagerung können Features bewältigen, die die Ressourcen des Computers, auf dem die Daten verarbeitet werden, übersteigen.
- Diese Features sind so groß, dass sie auf dem Computer, auf dem die Analyse durchgeführt wird, nicht verarbeitet werden können. Oft sind sie das Ergebnis eines Raster in Polygon- oder Zusammenführen-Vorgangs, der auf einem Computer durchgeführt wurde, der über mehr Ressourcen verfügt als der Computer für die Analyse.
- Diese Features können möglicherweise nicht oder nur teilweise gezeichnet werden.
- Die Verwendung dieser Features mit einem Geoverarbeitungswerkzeug kann ein Einfrieren des Verarbeitungsvorgangs, einen Speicherfehler, eine falsche Ausgabe oder in schweren Fällen sogar einen Absturz zur Folge haben.
- Ein Feature kann auf einem Computer zu groß sein, auf einem anderen jedoch nicht. Ob ein Feature als zu groß eingestuft wird, hängt von der Menge des verfügbaren Arbeitsspeichers auf dem Computer ab, der die Analyse durchführt. Je mehr Arbeitsspeicher ein Computer hat, desto größer kann ein Feature sein, bevor es Probleme verursacht.
- Die maximale Größe für ein einzelnes Feature in der Geodatabase beträgt 2 GB.
- Wenn Sie über Features verfügen, die aufgrund ihrer Größe nicht verarbeitet werden können, müssen diese mithilfe des Werkzeugs Stückeln unterteilt werden, damit die Analyse erfolgreich ist. Andere Werkzeuge, die traditionell zur Bearbeitung vorhandener Features verwendet werden, schlagen für ein Feature mit Millionen Stützpunkten sehr wahrscheinlich fehl.
Zu große Features verursachen möglicherweise Probleme bei der Verarbeitung, aber einfache Tasks können u. U. durchgeführt werden. Sie enthalten zwar eine sehr große Anzahl Stützpunkte, sind jedoch nicht so groß, dass sie allein dadurch Probleme verursachen. Allerdings können sie aufgrund ihrer Größe die Performance beeinträchtigen und sowohl bei klassischen Überlagerungswerkzeugen als auch bei Werkzeugen für die paarweise Überlagerung Fehler erzeugen.
- Diese Features können gezeichnet und ohne Probleme in einfachen Analysen verwendet werden, aber selbst bei diesen einfachen Vorgängen kann es zu deutlichen Performance-Einbußen und einer Erhöhung des Speicherbedarfs kommen.
- Wenn diese Features einen großen Teil des Interessenbereichs abdecken, kann es erforderlich sein, das Feature für die Verarbeitung (insbesondere für die parallele Verarbeitung) im Speicher zu duplizieren. Dies kann letztlich zu einer Verringerung der verfügbaren Ressourcen auf dem Computer führen. Die Folge davon können schwerwiegende Performance-Einbußen und Fehler sein.
- Diese Features führen sowohl bei den klassischen Überlagerungswerkzeugen als auch bei den Werkzeugen für die paarweise Überlagerung zu Performance-Einbußen. Werkzeuge für die paarweise Überlagerung, die bei der Analyse von Daten eine einfachere Methode anwenden und im Allgemeinen weniger Speicherplatz benötigen, können diese Art von Features erfolgreicher bewältigen.
- Wenn Ihre Daten sehr große Features enthalten, sollten Sie Ihre Analyseziele neu bewerten. Überlegen Sie z. B., ob Sie für die Analyse der Küstenlinien von Kontinenten oder die Definition von Vogelzuggrenzen eine Genauigkeit im Millimeterbereich benötigen.
- Es gibt zwei Methoden, um den Erfolg der Analyse zu verbessern, wenn Ihre Daten große Features enthalten. Wenn Sie den für die Darstellung der Daten verwendeten Genauigkeitsgrad nicht benötigen, können Sie die Daten (mithilfe von Polygon vereinfachen oder ähnlicher Werkzeuge) vereinfachen. Um die Genauigkeit der Features beizubehalten, können Sie die Features in kleinere Teile zerlegen. Besteht das Feature aus zahlreichen Teilen, kann die Größe des Features mithilfe des Werkzeugs Multipart in Singlepart u. U. so weit reduziert werden, dass eine erfolgreiche Analyse möglich ist. Andernfalls kann das Werkzeug Stückeln verwendet werden, um das Feature zu unterteilen, bevor die Analyse durchgeführt wird. Features, die unterteilt wurden, können in einem späteren Schritt des Workflows mithilfe von Zusammenführen (Dissolve) oder Paarweise zusammenführen wieder zusammengesetzt werden, wobei jedem Feature vor der Unterteilung eine eindeutige ID zugewiesen wird.
Überlegungen zum Raumbezug und zur On-the-fly-Projektion
Wenn Sie ein Geoverarbeitungswerkzeug mit zwei Eingaben verwenden, die unterschiedliche Raumbezüge aufweisen, verfahren die meisten Werkzeuge so, dass sie das Ausgabekoordinatensystem auf die erste Eingabe festlegen und die Daten aus der zweiten Eingabe mit einem anderen Raumbezug für die Analyse auf dieses Koordinatensystem projizieren. Eine dynamische Änderung der Projektion "on-the-fly" kann zu Performance-Einbußen führen (und Ungenauigkeiten aufgrund von falsch ausgerichteten Daten verursachen). Nach Möglichkeit sollten alle Eingaben denselben Raumbezug aufweisen, um eine zuverlässige Performance und die Genauigkeit der Ausgabe zu gewährleisten.