Métodos de clasificación de datos

Al clasificar los datos, con símbolos graduados, colores graduados o la simbología de colores bivariables, se puede utilizar uno de los muchos métodos de clasificación estándar de ArcGIS Pro o se pueden definir de forma manual los propios rangos de clases personalizados. Los métodos de clasificación se utilizan para clasificar campos numéricos para la simbología graduada.

Rupturas naturales (Jenks)

Con una clasificación de cortes naturales (Jenks) Cortes Naturales Jenks, las clases se basan en las agrupaciones naturales inherentes a los datos. Las rupturas de clase se crean de manera que los valores similares se agrupan mejor y se maximizan las diferencias entre clases. Las entidades se dividen en clases cuyos límites quedan establecidos dónde hay diferencias considerables entre los valores de los datos.

Los cortes naturales son clasificaciones específicas de los datos y no sirven para comparar varios mapas creados a partir de información subyacente distinta.

Esta clasificación se basa en el algoritmo de rupturas naturales de Jenks. Para obtener más información, consulte Univariate classification schemes en Geospatial Analysis—A Comprehensive Guide, 6.ª edición; 2007–2018; de Smith, Goodchild, Longley.

Cuantil

En una clasificación de cuantiles Clasificación cuantil, cada clase contiene el mismo número de entidades. La clasificación de cuantiles es adecuada para los datos distribuidos linealmente. El cuantil asigna el mismo número de valores de datos a cada clase. No hay clases vacías ni clases con demasiados valores ni con pocos valores.

Puesto que las entidades se agrupan en igual número en cada clase mediante la clasificación de cuantiles, el mapa resultante puede ser erróneo en algunas ocasiones: Entidades similares se pueden situar en clases adyacentes, o entidades con valores muy diferentes se pueden poner en la misma clase. Esta distorsión se puede reducir al mínimo aumentando el número de clases.

Intervalo equivalente

Utilice un intervalo equivalente Intervalos iguales para dividir el rango de valores de atributo en subrangos de igual tamaño. De este modo, puede especificar el número de intervalos. Asimismo, las rupturas de clase según el rango de valores se determinan automáticamente. Por ejemplo, si especifica tres clases para un campo cuyos valores van de 0 a 300, se crearán tres clases con los rangos 0-100, 101-200 y 201-300.

El intervalo de igualdad se aplica mejor en rangos de datos familiares, tales como porcentajes y temperatura. Este método enfatiza la cantidad de un valor de atributo relativo al resto de valores. Por ejemplo, muestra que una tienda forma parte del grupo de tiendas que realizan el tercio mayor de todas las ventas.

Intervalo definido

Utilice un intervalo definido Intervalo definido para especificar el tamaño de intervalo utilizado para definir una serie de clases con el mismo rango de valores. Por ejemplo, si el tamaño de intervalo es 75, cada clase abarcará 75 unidades. El número de clases se determina automáticamente según el tamaño del intervalo y el tamaño máximo de muestra. El tamaño de intervalo debe ser lo bastante pequeño como para adecuarse al número mínimo de clases permitido, que es tres.

Intervalo manual

Utilice un intervalo manual Clasificación manual para definir sus propias clases, agregar manualmente rupturas de clase y establecer rangos de clase adecuados para los datos. Empiece con una de las clasificaciones estándar y luego cambia a la clasificación de intervalos manual para realizar los ajustes según sea necesario.

Intervalo geométrico

El esquema de clasificación de intervalos geométricos Intervalo geométrico crea rupturas de clase basadas en los intervalos de clase que tienen una serie geométrica. El coeficiente geométrico de este clasificador puede cambiar una vez (a su inverso) para optimizar los rangos de clase. El algoritmo crea intervalos geométricos al minimizar la suma de cuadrados del número de elementos de cada clase. Con esto se garantiza que cada rango de clase tenga aproximadamente el mismo número de valores en cada clase y que el cambio entre intervalos sea bastante coherente.

Este algoritmo se diseñó específicamente para acomodar datos continuos. Es un compromiso entre los métodos de intervalos equivalentes, cortes naturales (Jenks) y cuantiles. Crea un equilibrio entre los cambios resaltados en los valores centrales y en los valores extremos, produciendo así un resultado visualmente atractivo y cartográficamente comprensible.

Un ejemplo del uso de la clasificación de intervalo geométrico es un dataset de precipitaciones en el que solo 15 de las 100 estaciones meteorológicas (menos del 50 por ciento) registraron precipitaciones (el resto no registró precipitaciones), por lo que sus valores de atributo son cero.

Desviación estándar

El método de clasificación de la desviación estándar Desviación estándar muestra la diferencia entre el valor de atributo de una entidad y el valor medio. El valor medio y la desviación estándar se calculan automáticamente. Las rupturas de clase se crean con rangos de valores equivalentes que son una proporción de la desviación estándar (normalmente a intervalos de 1, 1/2, 1/3 o 1/4) utilizando valores medios y las desviaciones estándar de la media.

Temas relacionados