Räumlich eingeschränkte multivariate Cluster-Bildung (Spatial Statistics)

Zusammenfassung

Findet räumlich zusammenhängende Feature-Cluster basierend auf verschiedenen Feature-Attributwerten und optionalen Cluster-Größenbeschränkungen.

Weitere Informationen zur Funktionsweise der räumlich eingeschränkten multivariaten Cluster-Bildung

Abbildung

Räumlich eingeschränktes multivariates Schema

Verwendung

  • Mit diesem Werkzeug wird eine Ausgabe-Feature-Class mit den in der Analyse verwendeten Feldern sowie einem neuen ganzzahligen Feld mit der Bezeichnung CLUSTER_ID erstellt. Das Standard-Rendering basiert auf dem Feld CLUSTER_ID und zeigt an, in welche Cluster die einzelnen Features unterteilt sind. Wenn Sie drei zu erstellende Cluster angeben, enthält jeder Datensatz im Feld CLUSTER_ID eine 1, 2 oder 3.

  • Bei der Eingabe kann es sich um Punkte oder Polygone handeln.
  • Mit diesem Werkzeug werden auch Meldungen und Schemas erstellt, mit denen Sie die Merkmale der identifizierten Cluster leichter verstehen. Sie können auf die Meldungen zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auf die Meldungen für eine frühere Ausführung des Werkzeugs Räumlich eingeschränkte multivariate Cluster-Bildung auch über den Geoverarbeitungsverlauf zugreifen. Die erstellten Schemas können über den Bereich Inhalt aufgerufen werden.

  • Der Parameter Analysefelder muss numerisch sein und verschiedene Werte enthalten. Felder ohne Variation (d. h. Felder, die in jedem Datensatz denselben Wert aufweisen) werden in der Analyse nicht berücksichtigt, jedoch in die Ausgabe-Features einbezogen. Kategoriefelder können mit dem Werkzeug verwendet werden, sofern sie als Dummy-Variablen dargestellt werden (Wert 1 für alle Features einer Kategorie und Wert 0 für alle anderen Features).

  • Mit dem Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung werden Cluster mit räumlichen (und bei der Verwendung einer räumlichen Gewichtungsmatrix möglicherweise zeitlichen) Einschränkungen erstellt. Die Vorgabe von Nachbarschafts- oder anderen Proximitätsanforderungen hinsichtlich der zu erstellenden Cluster ist nicht bei allen Anwendungen erwünscht. In solchen Fällen verwenden Sie das Werkzeug Multivariate Cluster-Bildung, um Cluster ohne räumliche Einschränkung zu erstellen.

  • Die Größe der Cluster kann mit dem Parameter Cluster-Größenbeschränkungen verwaltet werden. Sie können minimale und maximale Schwellenwerte festlegen, die jeder Cluster erfüllen muss. Die Größenbeschränkungen können entweder der Anzahl der Features entsprechen, die jeder Cluster enthält, oder die Summe eines Attributwerts darstellen. Beispiel: Wenn Sie einen Cluster für die US-Landkreise basierend auf verschiedenen wirtschaftlichen Variablen bilden, können Sie festlegen, dass jeder Cluster eine minimale Bevölkerung von 5 Millionen und eine maximale Bevölkerung von 25 Millionen aufweisen soll.

  • Wenn eine Einschränkung des Typs Bis Begrenzung füllen angegeben wird, beginnt der Algorithmus mit einem einzelnen Cluster und teilt die Cluster anschließend auf. Es werden so lange Berechnungen durchgeführt, bis jeder der Cluster unter dem Wert für Bis Begrenzung füllen liegt. Dabei werden alle Variablen bei jeder Aufteilung berücksichtigt. Die Aufteilung wird sofort beendet, sobald die Einschränkung erfüllt ist, selbst wenn ein weiteres Aufteilen der vorhandenen Cluster ein besseres Ergebnis liefern würde.

  • Wenn das Maximum und das Minimum auf Werte gesetzt werden, die eng beieinander liegen, kann der Parameterwert Cluster-Größenbeschränkungen für einen der resultierenden Cluster möglicherweise nicht erfüllt werden.

  • In einigen Fällen wird der Parameter Cluster-Größenbeschränkungen aufgrund der Art und Weise, in der der minimale Spannbaum erstellt wird, möglicherweise nicht für alle Cluster berücksichtigt. Das Werkzeug wird beendet, und der Cluster, der die Größenbeschränkungen nicht erfüllt hat, wird gemeldet.

  • Mit diesem Werkzeug werden Cluster erstellt, die räumlich zusammenhängen. Die für Polygon-Feature-Classes aktivierten Nachbarschaftsoptionen geben an, dass Features nur dann demselben Cluster angehören können, wenn sie über eine gemeinsame Kante (Nur benachbarte Kanten) oder entweder über eine gemeinsame Kante oder einen gemeinsamen Stützpunkt (Benachbarte Kanten/Ecken) mit einem anderen Mitglied des Clusters verfügen. Mit der Option Gekürzte Delaunay-Triangulation wird sichergestellt, dass Cluster für Ausreißer- oder Insel-Features und getrennte Cluster gebildet werden können.

  • Die standardmäßigen Räumlichen Einschränkungen für Punkt-Eingabe-Features lautet Gekürzte Delaunay-Triangulation. Damit wird sichergestellt, dass alle Cluster-Mitglieder benachbart sind und dass ein Feature nur dann in einem Cluster enthalten sein wird, wenn mindestens ein anderes Feature ein natürlicher Nachbar ist. Diese Methode verwendet die Delaunay-Triangulation, um Punktnachbarn zu finden. Anschließend werden die Dreiecke mit einer konvexen Hülle zugeschnitten. Dadurch wird sichergestellt, dass Punkt-Features keine Nachbarn anderer Features außerhalb der konvexen Hülle sein können.

  • Mit der Option Gekürzte Delaunay-Triangulation wird sichergestellt, dass benachbarte Features sehr eng beieinander liegen. Wenn die Daten räumliche Ausreißer aufweisen, zeigt diese Methode wenig Wirkung. Grund dafür ist, dass sich die Delaunay-Dreiecke so weit nach außen erstrecken, dass das Beschneiden der konvexen Hülle kaum Auswirkungen auf Features hat, die ohne die räumlichen Ausreißer keine direkte Nachbarschaft aufweisen.

  • Sie können zusätzliche Räumliche Einschränkungen vorgeben, z. B. eine feste Entfernung oder "Nächste Nachbarn (K)", indem Sie mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen zuerst eine Datei mit räumlicher Gewichtungsmatrix (.swm) erstellen und anschließend den Pfad zu dieser Datei für den Parameter Datei mit räumlicher Gewichtungsmatrix angeben.

    Hinweis:

    Sie können zwar eine Datei mit einer räumlichen Gewichtungsmatrix (SWM-Datei) erstellen, um räumliche Einschränkungen zu definieren, eine tatsächliche Gewichtung kommt jedoch nicht zur Anwendung. Die Beziehungen werden binär, wenn Sie räumliche Einschränkungen innerhalb des Cluster-Algorithmus definieren, selbst wenn eine Methode wie "Inverse Entfernung" verwendet wird. Wenn "Inverse Entfernung" ohne Entfernungsgrenzwert verwendet wird, ist das Ergebnis eine SWM, mit der Features basierend auf Gewichtungen definiert werden. Der Cluster-Algorithmus ignoriert diese Gewichtungen jedoch und definiert jedes Feature als Nachbar jedes anderen Features. Dies kann sich auf die Performance auswirken und führt zu Gruppen, die nicht wirklich räumlich eingeschränkt sind. Auf ähnliche Weise kann die Auswahl der Konzeptualisierung "Nächste Nachbarn (K)" dazu führen, dass Cluster zwar räumlich eingeschränkt, aber nicht notwendigerweise zusammenhängend sind.

  • Um Cluster zu erstellen, die sowohl räumliche als auch zeitliche Einschränkungen aufweisen, erstellen Sie mithilfe des Werkzeugs Räumliche Gewichtungsmatrix erstellen zuerst eine Datei mit räumlicher Gewichtungsmatrix (.swm), in der die Raum-Zeit-Beziehungen zwischen den Features definiert werden. Setzen Sie anschließend über das Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung den Parameter Räumliche Einschränkungen auf Räumliche Gewichtungen aus Datei abrufen und den Parameter Datei mit räumlicher Gewichtungsmatrix auf die erstellte SWM-Datei.

  • Zum Erstellen dreidimensionaler Cluster, die die Z-Werte der Features berücksichtigen, verwenden Sie das Werkzeug Räumliche Gewichtungsmatrix erstellen mit dem aktivierten Parameter Z-Werte verwenden, um zuerst eine Datei mit der räumlichen Gewichtungsmatrix (.swm) zu erstellen, in der die 3D-Beziehungen der Features definiert sind. Setzen Sie anschließend über das Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung den Parameter Räumliche Einschränkungen auf Räumliche Gewichtungen aus Datei abrufen und den Parameter Datei mit räumlicher Gewichtungsmatrix auf die erstellte SWM-Datei.

  • Dieses Werkzeug ist speicherabhängig. Wenn Sie eine räumliche Gewichtungsmatrix verwenden, erhöht eine Konzeptualisierung von räumlichen Beziehungen, die dazu führt, dass jedes Feature eine große Anzahl Nachbarn aufweist, die Wahrscheinlichkeit für das Auftreten von Speicherproblemen.

  • Durch Festlegen einer räumlichen Einschränkung erhalten Sie kompakte, angrenzende oder sich in der Nähe befindliche Cluster. Durch Aufnehmen räumlicher Variablen in die Liste der Analysefelder können diese Clusterattribute ebenfalls konfiguriert werden. Beispiele für räumliche Variablen sind Entfernung zu Autobahnauf- und -abfahrten, Zugang zu freien Stellen, Nähe zu Einkaufsmöglichkeiten, Verbindungsmessungen und Koordinaten (X, Y). Durch Einschließen von Variablen, die eine Uhrzeit, einen Wochentag oder eine zeitliche Entfernung darstellen, kann die zeitliche Kompaktheit unter den Cluster-Mitgliedern optimiert werden.

  • Existiert für Ihre Features ein bestimmtes räumliches Muster (z. B. drei separate, räumlich getrennte Cluster) kann dies mit einer höheren Komplexität des räumlich eingeschränkten Clustering-Algorithmus einhergehen. Der Cluster-Algorithmus überprüft daher zuerst, ob getrennte Cluster vorhanden sind. Ist die Anzahl der getrennten Cluster größer als die angegebene Clusteranzahl, kann das Werkzeug keine Auflösung durchführen und es wird eine entsprechende Fehlermeldung angezeigt. Entspricht die Anzahl der getrennten Cluster genau der angegebenen Anzahl der Cluster, werden die Cluster-Ergebnisse allein von der räumlichen Konfiguration der Features bestimmt, wie in Abbildung (A) dargestellt. Ist die angegebene Anzahl der Cluster größer als die Anzahl der getrennten Cluster, beginnt die Cluster-Bildung mit den bereits bestimmten getrennten Clustern. Sind beispielsweise drei getrennte Cluster vorhanden und ist die angegebene Anzahl der Cluster gleich 4, wird einer der drei Cluster geteilt, um einen vierten Cluster zu bilden, wie in Abbildung (B) dargestellt.

    Getrennte Cluster

  • In manchen Fällen können die auferlegten räumlichen Einschränkungen nicht mit dem Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung erfüllt werden, und Features ohne Nachbarn stellen das einzige Feature im jeweiligen Cluster dar. Wenn Sie den Parameter Räumliche Einschränkungen so einstellen, dass die Gekürzte Delaunay-Triangulation verwendet wird, lassen sich Probleme mit getrennten Clustern leichter beheben.

  • Zwar ist man geneigt, möglichst viele Analysefelder aufzunehmen, allerdings hat es sich bei diesem Werkzeug bewährt, zunächst mit einer einzigen Variablen zu beginnen. Sind weniger Analysefelder vorhanden, ist es einfacher, die Ergebnisse zu interpretieren. Ebenso können die Variablen, die sich am besten als Diskriminatoren eignen, einfacher bestimmt werden, wenn weniger Felder vorhanden sind.

  • Manchmal ist Ihnen die Anzahl der Cluster, die sich für Ihre Daten am besten eignet, bekannt. Anderenfalls müssen Sie möglicherweise verschiedene Werte für die Clusteranzahl ausprobieren, um herauszufinden, welche Werte die beste Gruppendifferenzierung ermöglichen. Wenn Sie den Parameter Anzahl der Cluster leer lassen, wertet das Werkzeug die optimale Anzahl der Cluster aus, indem eine Pseudo-F-Statistik für die Cluster-Bildung von Lösungen mit 2 bis 30 Clustern berechnet und die optimale Anzahl Cluster im Meldungsfenster angezeigt wird. Wenn Sie einen optionalen Parameterwert für Ausgabetabelle für die Auswertung der Anzahl der Cluster angeben, wird ein Diagramm erstellt, in dem die F-Statistik-Werte für Lösungen mit 2 bis 30 Clustern angezeigt werden. Die höchsten Werte der Pseudo-F-Statistik weisen auf Lösungen hin, mit denen bei Maximierung sowohl der Ähnlichkeiten innerhalb von Clustern als auch der Unterschiede zwischen Clustern eine optimale Performance erzielt werden kann. Wenn Sie für die Auswahl der Clusteranzahl kein anderes Kriterium heranziehen können, verwenden Sie eine Zahl, die mit einem der höchsten Werte der Pseudo-F-Statistik verknüpft ist.

    Schema zur Pseudo-F-Statistik zur Ermittlung der optimalen Anzahl Cluster

  • Unabhängig von der angegebenen Anzahl der Cluster wird das Werkzeug beendet, wenn die Unterteilung in zusätzliche Cluster beliebig wird. Beispiel: Ihre Daten bestehen aus drei räumlich geclusterten Polygonen und einem Analysefeld. Wenn alle Features in einem Cluster denselben Analysefeldwert aufweisen, kann jedes der einzelnen Cluster beliebig unterteilt werden, nachdem drei Gruppen erstellt wurden. Wenn in dieser Situation mehr als drei Cluster angegeben werden, erstellt das Werkzeug weiterhin nur drei Cluster. Solange mindestens eines der Analysefelder in einem Cluster einige unterschiedliche Werte aufweist, kann die Unterteilung in weitere Cluster fortgesetzt werden.

    Es werden keine Cluster mehr erstellt
    Cluster werden nicht weiter unterteilt, wenn die Analysefeldwerte keine Variation aufweisen.

  • Wenn Sie eine räumliche oder eine räumlich-zeitliche Einschränkung in Ihre Analyse aufnehmen, sind die Pseudo-F-Statistik-Werte vergleichbar (vorausgesetzt, die Eingabe-Features und die Analysefelder bleiben unverändert). Folglich können Sie mithilfe der Werte der F-Statistik nicht nur die optimale Anzahl der Cluster ermitteln, sondern auch die effektivste Option für Räumliche Einschränkungen ermitteln.

  • Die einem Feature-Set zugewiesene Anzahl Cluster kann zwischen den einzelnen Ausführungen variieren. Wenn Sie Features basierend auf einer Einkommensvariablen in zwei Cluster partitionieren, werden in der ersten Analyse die Features mit hohem Einkommen möglicherweise als Cluster 2 und die Features mit niedrigem Einkommen als Cluster 1 markiert. Führen Sie dieselbe Analyse ein zweites Mal aus, werden die Features mit hohem Einkommen möglicherweise als Cluster 1 markiert. Eventuell stellen Sie fest, dass einige Features für mittleres Einkommen einem anderen Cluster angehören als zuvor.

  • Der Parameter Permutationen zum Berechnen von Mitgliedschaftswahrscheinlichkeiten verwendet Permutationen und eine Beweisakkumulation, um die Wahrscheinlichkeit der Cluster-Mitgliedschaft für jedes Feature zu berechnen. Bei einer hohen Wahrscheinlichkeit können Sie davon ausgehen, dass das Feature zum zugewiesenen Cluster gehört. Eine niedrige Wahrscheinlichkeit kann darauf hinweisen, dass sich das Feature deutlich von dem zugewiesenen Cluster unterscheidet oder dass das Feature in einen anderen Cluster eingeschlossen werden könnte, wenn die Parameterwerte Analysefelder, Cluster-Größenbeschränkungen oder Räumliche Einschränkungen auf irgendeine Weise geändert würden. Bei der Berechnung dieser Wahrscheinlichkeiten werden Permutationen zufälliger Spannbäume und eine Beweisakkumulation verwendet. Dadurch kann sich die Ausführungszeit bei größeren Datasets deutlich erhöhen. Es empfiehlt sich, zuerst eine Iteration durchzuführen und die optimale Clusteranzahl für die Analyse zu ermitteln. Berechnen Sie anschließend die Wahrscheinlichkeiten für die Analyse in einer weiteren Ausführung des Werkzeugs. Sie können die Performance auch steigern, indem Sie die Umgebung Faktor für parallele Verarbeitung erhöhen.

  • Wenn die Eingabe-Features nicht projiziert werden (d. h., wenn Koordinaten in Grad, Minuten und Sekunden angegeben werden) oder als Ausgabe-Koordinatensystem ein geographisches Koordinatensystem festgelegt wurde, werden Entfernungen mit Sehnenmesswerten berechnet. Sehnenentfernungsmesswerte werden verwendet, weil sie schnell berechnet werden können und ausgezeichnete Schätzungen von echten geodätischen Entfernungen zulassen, zumindest für Punkte innerhalb von 30 Grad voneinander. Sehnenentfernungen basieren auf einem abgeplatteten Sphäroid. Im Fall von zwei beliebigen Punkten auf der Erdoberfläche ist die Sehnenentfernung zwischen diesen die Länge einer Linie, die durch die dreidimensionale Erde führt, um diese beiden Punkte zu verbinden. Sehnenentfernungen werden in Metern angegeben.

    Vorsicht:

    Als Best Practice hat es sich bewährt, die Daten zu projizieren, insbesondere, wenn sich das Untersuchungsgebiet über 30 Grad hinaus erstreckt. Sehnenentfernungen erlauben keine sichere Schätzung von geodätischen Entfernungen über 30 Grad hinaus.

  • Dieses Werkzeug unterstützt Parallelverarbeitung zur Berechnung von Wahrscheinlichkeiten und nutzt standardmäßig 50 Prozent der verfügbaren Prozessoren. Die Anzahl der Prozessoren kann mit der Umgebung "Faktor für parallele Verarbeitung" erhöht oder verringert werden.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Feature-Class bzw. der Feature-Layer, für die/den Sie Cluster erstellen möchten.

Feature Layer
Ausgabe-Features

Die neu erstellte Ausgabe-Feature-Class mit allen Features, den angegebenen Analysefeldern und einem Feld, das angibt, zu welchem Cluster die einzelnen Features gehören.

Feature Class
Analysefelder

Eine Liste mit Feldern, mit deren Hilfe Sie die Cluster voneinander abgrenzen können.

Field
Cluster-Größenbeschränkungen
(optional)

Gibt die Cluster-Größe basierend auf der Anzahl der Features pro Gruppe oder einem Zielattributwert pro Gruppe an.

  • KeinerEs werden keine Cluster-Größenbeschränkungen verwendet. Dies ist die Standardeinstellung.
  • Anzahl der FeaturesEs wird eine minimale und eine maximale Anzahl von Features pro Gruppe verwendet.
  • AttributwertEs wird ein minimaler und ein maximaler Attributwert pro Gruppe verwendet.
String
Bedingungsfeld
(optional)

Der Attributwert, der pro Cluster summiert werden soll.

Field
Minimum pro Cluster
(optional)

Die minimale Anzahl der Features pro Cluster oder der minimale Attributwert pro Cluster. Der Wert muss positiv sein.

Double
Bis Begrenzung füllen
(optional)

Die maximale Anzahl der Features pro Cluster oder der maximale Attributwert pro Cluster. Wenn eine maximale Beschränkung festgelegt wird, ist der Parameter Anzahl der Cluster inaktiv. Der Wert muss positiv sein.

Double
Anzahl der Cluster
(optional)

Die Anzahl der zu erstellenden Cluster. Wenn dieser Parameter leer ist, wertet das Werkzeug die optimale Anzahl der Cluster aus, indem ein Pseudo-F-Statistikwert für die Cluster-Bildung von Lösungen mit 2 bis 30 Clustern berechnet wird.

Dieser Parameter wird deaktiviert, wenn eine maximale Anzahl von Features oder ein maximaler Attributwert festgelegt wurde.

Long
Räumliche Einschränkungen
(optional)

Gibt an, wie räumliche Beziehungen zwischen Features definiert werden.

  • Nur benachbarte KantenCluster enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante aufweisen, können demselben Cluster angehören.
  • Benachbarte Kanten/Ecken Cluster enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante oder einen gemeinsamen Stützpunkt aufweisen, können demselben Cluster angehören. Hierbei handelt es sich um den Standard für Polygon-Features.
  • Gekürzte Delaunay-Triangulation Features im gleichen Cluster haben mindestens einen gemeinsamen neutralen Nachbarn mit einem anderen Feature im Cluster. Beziehungen mit natürlichen Nachbarn basieren auf einer gekürzten Delaunay-Triangulation. Konzeptionell wird bei der Delaunay-Triangulation ausgehend von den Schwerpunkten der Features ein Netz nicht überlappender Dreiecke erstellt. Jedes Feature entspricht einem Dreiecksknoten. Knoten, die über eine gemeinsame Kante verfügen, gelten als Nachbarn. Diese Dreiecke werden anschließend auf eine konvexe Hülle zugeschnitten, sodass Features keine Nachbarn anderer Features außerhalb der konvexen Hülle sein können. Hierbei handelt es sich um den Standard für Punkt-Features.
  • Räumliche Gewichtungen aus Datei abrufenRäumliche und optional auch zeitliche Beziehungen werden in einer räumlichen Gewichtungsdatei (.swm) angegeben. Erstellen Sie die räumliche Gewichtungsmatrix mithilfe des Werkzeugs Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerks generieren. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter Datei mit räumlicher Gewichtungsmatrix angegeben.
String
Datei mit räumlicher Gewichtungsmatrix
(optional)

Der Pfad zu einer Datei mit räumlichen Gewichtungen, die räumliche und möglicherweise zeitliche Beziehungen zwischen Features definieren.

File
Permutationen zum Berechnen von Mitgliedschaftswahrscheinlichkeiten
(optional)

Die Anzahl der zufälligen Permutationen für die Berechnung von Punktzahlen für die Stabilität von Mitgliedschaften. Wenn 0 (NULL) ausgewählt wird, werden die Wahrscheinlichkeiten nicht berechnet. Bei der Berechnung dieser Wahrscheinlichkeiten werden Permutationen zufälliger Spannbäume und eine Beweisakkumulation verwendet.

Durch diese Berechnung kann sich die Ausführungszeit bei größeren Datasets deutlich erhöhen. Es empfiehlt sich, zuerst eine Iteration durchzuführen und die optimale Clusteranzahl für die Analyse zu ermitteln. Berechnen Sie anschließend die Wahrscheinlichkeiten für die Analyse in einer weiteren Ausführung des Werkzeugs. Wenn Sie die Umgebungseinstellung Faktor für parallele Verarbeitung auf "50" setzen, lässt sich die Ausführung des Werkzeugs eventuell beschleunigen.

Long
Ausgabetabelle zur Auswertung der Anzahl der Cluster

Die erstellte Tabelle mit den Ergebnissen der berechneten Werten der F-Statistik zum Auswerten der optimalen Anzahl der Cluster. Auf das Diagramm, das über diese Tabelle erstellt wird, können Sie im Bereich Inhalt unter dem Ausgabe-Feature-Layer zugreifen.

Table

arcpy.stats.SpatiallyConstrainedMultivariateClustering(in_features, output_features, analysis_fields, {size_constraints}, {constraint_field}, {min_constraint}, {max_constraint}, {number_of_clusters}, {spatial_constraints}, {weights_matrix_file}, {number_of_permutations}, output_table)
NameErläuterungDatentyp
in_features

Die Feature-Class bzw. der Feature-Layer, für die/den Sie Cluster erstellen möchten.

Feature Layer
output_features

Die neu erstellte Ausgabe-Feature-Class mit allen Features, den angegebenen Analysefeldern und einem Feld, das angibt, zu welchem Cluster die einzelnen Features gehören.

Feature Class
analysis_fields
[analysis_fields,...]

Eine Liste mit Feldern, mit deren Hilfe Sie die Cluster voneinander abgrenzen können.

Field
size_constraints
(optional)

Gibt die Cluster-Größe basierend auf der Anzahl der Features pro Gruppe oder einem Zielattributwert pro Gruppe an.

  • NONEEs werden keine Cluster-Größenbeschränkungen verwendet. Dies ist die Standardeinstellung.
  • NUM_FEATURESEs wird eine minimale und eine maximale Anzahl von Features pro Gruppe verwendet.
  • ATTRIBUTE_VALUEEs wird ein minimaler und ein maximaler Attributwert pro Gruppe verwendet.
String
constraint_field
(optional)

Der Attributwert, der pro Cluster summiert werden soll.

Field
min_constraint
(optional)

Die minimale Anzahl der Features pro Cluster oder der minimale Attributwert pro Cluster. Der Wert muss positiv sein.

Double
max_constraint
(optional)

Die maximale Anzahl der Features pro Cluster oder der maximale Attributwert pro Cluster. Wenn eine maximale Beschränkung festgelegt wird, ist der Parameter number_of_clusters deaktiviert. Der Wert muss positiv sein.

Double
number_of_clusters
(optional)

Die Anzahl der zu erstellenden Cluster. Wenn dieser Parameter leer ist, wertet das Werkzeug die optimale Anzahl der Cluster aus, indem ein Pseudo-F-Statistikwert für die Cluster-Bildung von Lösungen mit 2 bis 30 Clustern berechnet wird.

Dieser Parameter wird deaktiviert, wenn eine maximale Anzahl von Features oder ein maximaler Attributwert festgelegt wurde.

Long
spatial_constraints
(optional)

Gibt an, wie räumliche Beziehungen zwischen Features definiert werden.

  • CONTIGUITY_EDGES_ONLYCluster enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante aufweisen, können demselben Cluster angehören.
  • CONTIGUITY_EDGES_CORNERS Cluster enthalten angrenzende Polygon-Features. Nur Polygone, die eine gemeinsame Kante oder einen gemeinsamen Stützpunkt aufweisen, können demselben Cluster angehören. Hierbei handelt es sich um den Standard für Polygon-Features.
  • TRIMMED_DELAUNAY_TRIANGULATION Features im gleichen Cluster haben mindestens einen gemeinsamen neutralen Nachbarn mit einem anderen Feature im Cluster. Beziehungen mit natürlichen Nachbarn basieren auf einer gekürzten Delaunay-Triangulation. Konzeptionell wird bei der Delaunay-Triangulation ausgehend von den Schwerpunkten der Features ein Netz nicht überlappender Dreiecke erstellt. Jedes Feature entspricht einem Dreiecksknoten. Knoten, die über eine gemeinsame Kante verfügen, gelten als Nachbarn. Diese Dreiecke werden anschließend auf eine konvexe Hülle zugeschnitten, sodass Features keine Nachbarn anderer Features außerhalb der konvexen Hülle sein können. Hierbei handelt es sich um den Standard für Punkt-Features.
  • GET_SPATIAL_WEIGHTS_FROM_FILERäumliche und optional auch zeitliche Beziehungen werden in einer räumlichen Gewichtungsdatei (.swm) angegeben. Erstellen Sie die räumliche Gewichtungsmatrix mithilfe des Werkzeugs Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerks generieren. Der Pfad zur Datei mit räumlichen Gewichtungen wird durch den Parameter Weights_Matrix_File angegeben.
String
weights_matrix_file
(optional)

Der Pfad zu einer Datei mit räumlichen Gewichtungen, die räumliche und möglicherweise zeitliche Beziehungen zwischen Features definieren.

File
number_of_permutations
(optional)

Die Anzahl der zufälligen Permutationen für die Berechnung von Punktzahlen für die Stabilität von Mitgliedschaften. Wenn 0 (NULL) ausgewählt wird, werden die Wahrscheinlichkeiten nicht berechnet. Bei der Berechnung dieser Wahrscheinlichkeiten werden Permutationen zufälliger Spannbäume und eine Beweisakkumulation verwendet.

Durch diese Berechnung kann sich die Ausführungszeit bei größeren Datasets deutlich erhöhen. Es empfiehlt sich, zuerst eine Iteration durchzuführen und die optimale Clusteranzahl für die Analyse zu ermitteln. Berechnen Sie anschließend die Wahrscheinlichkeiten für die Analyse in einer weiteren Ausführung des Werkzeugs. Wenn Sie die Umgebungseinstellung Faktor für parallele Verarbeitung auf "50" setzen, lässt sich die Ausführung des Werkzeugs eventuell beschleunigen.

Long
output_table

Die erstellte Tabelle mit den Ergebnissen der berechneten Werten der F-Statistik zum Auswerten der optimalen Anzahl der Cluster. Auf das Diagramm, das über diese Tabelle erstellt wird, können Sie im Bereich Inhalt unter dem Ausgabe-Feature-Layer zugreifen.

Table

Codebeispiel

SpatiallyConstrainedMultivariateClustering – Beispiel 1 (Python-Fenster)

Das folgende Skript veranschaulicht die Verwendung des Werkzeugs SpatiallyConstrainedMultivariateClustering im Python-Fenster.

import arcpy arcpy.env.workspace = r"C:\Analysis arcpy.SpatiallyConstrainedMultivariateClustering_stats("CA_schools", "CA_Schools_100k_Students", "NumStudent",                                          "ATTRIBUTE_VALUE", "NumStudent", 100000, None, None,
                                          "CONTIGUITY_EDGES_CORNERS")
SpatiallyConstrainedMultivariateClustering – Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht die Verwendung des Werkzeugs SpatiallyConstrainedMultivariateClustering.

# Creating regions of similar schools districts with at least 100,0000 students each
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"E:\working\data.gdb"
arcpy.env.workspace = workspace
# Create clusters of schools with a minimum of 100,000 students
arcpy.stats.SpatiallyConstrainedMultivariateClustering("CA_schools", "CA_Schools_100k_Students", "NumStudent",
                                          "ATTRIBUTE_VALUE", "NumStudent", 100000, None, None,
                                          "CONTIGUITY_EDGES_CORNERS")
# Create a spatial weights matrix using k nearest neighbors 16 to have more control over the search neighborhood
arcpy.stats.GenerateSpatialWeightsMatrix(r"E:\working\data.gdb\CA_schools", "UID",
                                         r"E:\working\schools_knn_16.swm", "K_NEAREST_NEIGHBORS", "EUCLIDEAN", 1,
                                         None, 16, "NO_STANDARDIZATION", None, None, None, None, "DO_NOT_USE_Z_VALUES")
# Create clusters again this time using the SWM file for search neighborhood and a maximum number
# of students per cluster
arcpy.stats.SpatiallyConstrainedMultivariateClustering("CA_schools", "CA_Schools_SWM_Knn16", "NumStudent", "ATTRIBUTE_VALUE",
                                          "NumStudent", None, 250000, None, "GET_SPATIAL_WEIGHTS_FROM_FILE",
                                          r"E:\working\schools_knn_16.swm")
# Use Summary Statistics with Cluster ID as a case field to see how many students were assigned to each cluster
arcpy.analysis.Statistics("CA_Schools_SWM_Knn16", "School_SummaryStatistics", "NumStudent SUM", "CLUSTER_ID")

Umgebungen

Sonderfälle

Ausgabe-Koordinatensystem

Die Feature-Geometrie wird vor der Analyse auf das Ausgabe-Koordinatensystem projiziert. Alle mathematischen Berechnungen basieren auf dem Raumbezug des Ausgabe-Koordinatensystems. Wenn das Ausgabekoordinatensystem auf Grad, Minuten und Sekunden basiert, werden geodätische Entfernungen mithilfe von Sehnenentfernungen geschätzt.

Zufallszahlengenerator

Der verwendete Zufallsgeneratortyp ist stets Mersenne Twister.

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen