Eine häufige Vorgehensweise beim Messen des Trends für eine Gruppe von Flächen ist die getrennte Berechnung der Standardabweichung in der X-, Y- und Z-Richtung. Anhand dieser Messungen werden die Achsen einer Ellipse (oder eines Ellipsoids) definiert, die die Verteilung von Features umfassen. Die Ellipse wird als Standardabweichungsellipse bezeichnet, da bei dieser Methode die Standardabweichung der X- und Y-Koordinaten vom arithmetischen Mittelpunkt berechnet wird, um die Achsen der Ellipse zu definieren. In 3D wird die Standardabweichung der Z-Koordinaten vom arithmetischen Mittelpunkt ebenfalls berechnet, und das Ergebnis wird als Standardabweichungsellipsoid bezeichnet. Mithilfe der Ellipse oder des Ellipsoids können Sie ermitteln, ob die Feature-Verteilung gestreckt und somit eine bestimmte Ausrichtung aufweist.
Sie können zwar einen Eindruck von der Ausrichtung erhalten, indem Sie die Features auf der Karte darstellen, durch die Berechnung der Standardabweichungsellipse wird der Trend jedoch deutlich. Sie können die Standardabweichungsellipse anhand der Positionen der Features oder der Positionen berechnen, die durch einen mit den Features verknüpften Attributwert beeinflusst werden. Letztere Methode wird als gewichtete Standardabweichungsellipse bezeichnet.
Berechnungen
Die Standardabweichungsellipse wird folgendermaßen angegeben:
Während x und y die Koordinaten für das Feature i sind, stellen {x̄, ȳ} den arithmetischen Mittelpunkt der Features dar und n entspricht der Gesamtzahl der Features.
Die Beispiel-Kovarianzmatrix wird in einem Standardformular berücksichtigt, was dazu führt, dass die Matrix durch Eigenwerte und Eigenvektoren dargestellt wird. Die Standardabweichungen für die X- und Y-Achse lauten dann:
Diese Gleichungen können auf Lösungen für dreidimensionale Daten ausgedehnt werden.
Die Abweichungen werden durch einen Anpassungsfaktor skaliert, um eine Ellipse oder ein Ellipsoid mit dem gewünschten Prozentsatz der Datenpunkte zu erstellen. Diese Anpassungsfaktoren sind in der folgenden Tabelle aufgeführt.
Eindimensionale Daten | Zweidimensionale Daten | Dreidimensionale Daten | |
---|---|---|---|
1 Standardabweichung | 1,00 | 1,41 | 1,73 |
2 Standardabweichungen | 2,00 | 2,83 | 3,46 |
3 Standardabweichungen | 3,00 | 4,24 | 5,20 |
Weitere Informationen zu Eigenwerten und Eigenvektoren finden Sie unter Zusätzliche Ressourcen.
Ausgabe und Interpretation
Mithilfe von Standardabweichungen können Sie die Verteilung von Daten besser verstehen. Beim Arbeiten mit eindimensionalen Daten ist die "drei Sigma"-Regel die allgemeine Faustregel, die den Prozentsatz der Datenwerte, die in eine, zwei oder drei Standardabweichungen fallen, vom Mittelwert vermittelt. In einer normalen Verteilung bedeutet dies, dass 68 %, 95 % und 99,7 % der Datenwerte in einer, zwei bzw. drei Standardabweichungen liegen. Wenn jedoch mit höher dimensionalen räumlichen Daten (Y-, Y- und Z-Variablen) gearbeitet wird, wird diese Aufschlüsselung von Prozentsätzen selten beobachtet. Eine geeignetere Faustregel, die von der Rayleigh-Verteilung abgeleitet ist, legt nahe, dass eine Standardabweichungsellipse ca. 63 Prozent der Features und drei Standardabweichungen ca. 99,9 Prozent der Features in zwei Dimensionen (X und Y) abdeckt. Entsprechend resultiert der dreidimensionale Fall (X, Y und Z) in der 61-99-100-Prozentsatzregel.
Für zweidimensionale Daten erstellt das Werkzeug Richtungsverteilung (Standardabweichungsellipse) eine neue Feature-Class mit einem elliptische Polygon, das auf den arithmetischen Mittelpunkt für alle Features zentriert ist (oder für alle Fälle, in denen ein Wert für Case-Feld angegeben wurde). Die Attributwerte für diese Ausgabe-Ellipsenpolygone schließen zwei Standardentfernungen (lange und kurze Achse) ein; die Ausrichtung der Ellipse und ggf. das Case-Feld. Die Ausrichtung stellt die Rotation der langen Achse gemessen im Uhrzeigersinn von 12 Uhr aus dar. Sie können auch die Anzahl der darzustellenden Standardabweichungen (1, 2 oder 3) angeben.
Für dreidimensionale Punktdaten (die Daten sind Z-aktiviert und enthalten 3D-Attributinformationen wie Höhe), erstellt dieses Werkzeug eine neue Feature-Class mit einem Ellipsoid-Multipatch, das auf den arithmetischen Mittelpunkt aller Features zentriert ist (oder für alle Fälle, in denen ein Wert für das Case-Feld angegeben wurde). Die Attributwerte für diese Ausgabe-Ellipsoide schließen drei Standardentfernungen (lange, kurze und hohe Achse) ein; Informationen zum Winkel, zum Rollwinkel des Ellipsoids und ggf. zum Case-Feld. Bei den Werten für den Winkel, die Neigung und den Rollwinkel des Ellipsoids handelt es sich um Euler-Winkel, die die Ausrichtung des Ellipsoids in einem 3D-Raum beschreiben. Sie können auch die Anzahl der darzustellenden Standardabweichungen (1, 2 oder 3) angeben.
Potenzielle Anwendungsbereiche
- Durch die Darstellung des Verteilungstrends für eine Reihe von Delikten kann eine Beziehung zu bestimmten physischen Features (eine Reihe von Bars oder Restaurants, ein bestimmter Boulevard usw.) identifiziert werden.
- Durch die Darstellung von Stichproben eines bestimmten Schadstoffs in Grundwasserbrunnen kann die Ausbreitung des Giftstoffs ermittelt werden, was für die Einleitung entsprechender Entschärfungsmaßnahmen hilfreich sein.
- Der Vergleich der Größe, des Shape und der Überlappung von Ellipsen für Gruppen aus verschiedenen ethnischen Herkünften kann Einblicke in die Trennung nach ethnischer Herkunft (die so genannte "racial segregation") liefern.
- Anhand der Darstellung von Ellipsen für den Ausbruch einer Krankheit im Zeitverlauf lässt sich deren Verbreitung modellieren.
- Die Überprüfung der Höhenverteilung für Stürme einer bestimmten Kategorie kann ein nützlicher Gesichtspunkt sein, der bei der Untersuchung der Beziehung zwischen atmosphärischen Bedingungen und Flugzeugunglücken berücksichtigt werden sollte.
Zusätzliche Quellen
Chew, Victor. "Confidence, prediction, and tolerance regions for the multivariate normal distribution." Journal of the American Statistical Association 61.315 (1966): 605-617.
Fisher, N. I., T. Lewis, and B. J. J. Embleton. Statistical Analysis of Spherical Data. 1st ed. Cambridge: Cambridge University Press, 1987. Cambridge Books Online. Web. 26 April 2016.
Levine, Ned. "CrimeStat III: a spatial statistics program for the analysis of crime incident locations (version 3.0)." Houston (TX): Ned Levine & Associates/Washington, DC: National Institute of Justice (2004).
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.
Wang, Bin, Wenzhong Shi, and Zelang Miao. (2015) Confidence Analysis of Standard Deviational Ellipse and Its Extension into Higher Dimensional Euclidean Space. PLoS ONE 10(3), e0118537.