Los diagramas cuantil-cuantil son una herramienta de exploración utilizada para evaluar las similitudes entre la distribución de una variable numérica y una distribución normal, o entre las distribuciones de dos variables numéricas.
Existen dos tipos de diagramas cuantil-cuantil: diagramas cuantil-cuantil normales y diagramas cuantil-cuantil generales.
- Los diagramas cuantil-cuantil normales se construyen trazando los cuantiles de una variable numérica respecto de los cuantiles de una distribución normal.
- Los diagramas cuantil-cuantil generales trazan los cuantiles de una variable numérica respecto de los cuantiles de una segunda variable numérica.
Si las distribuciones de los cuantiles comparados son idénticas, los puntos del diagrama formarán una línea recta de 45 grados. Cuanto más lejos se desvíen los puntos del diagrama de una línea recta, menos similares serán las distribuciones comparadas.
Variables
Los diagramas cuantil-cuantil normales requieren una variable numérica que se traza respecto de una distribución normal. Los diagramas cuantil-cuantil generales requieren dos variables numéricas, que se representarán en un diagrama para compararlas entre sí.
Transformación
Algunos métodos analíticos requieren que los datos se distribuyan normalmente. Cuando los datos están sesgados (la distribución es asimétrica), es posible que le convenga transformar los datos para que sean normales. Los diagramas cuantil-cuantil normales le permiten explorar los efectos de las transformaciones logarítmicas y de raíz cuadrada en la distribución de sus datos mientras los compara con una distribución normal.
Transformación logarítmica
La transformación logarítmica se usa normalmente si los datos tienen una distribución sesgada de forma positiva y algunos valores son muy grandes. Si estos valores grandes están en su dataset, la transformación logarítmica le ayudará a que las varianzas sean más constantes y normalizará sus datos.
Nota:
Las transformaciones logarítmicas solo se pueden aplicar si todos los valores de la variable son mayores que cero. Todos los valores de cero generarán un error.
Transformación de raíz cuadrada
Una transformación de raíz cuadrada es similar a una transformación logarítmica en cuanto a que reduce el sesgo derecho de un dataset. A diferencia de las transformaciones logarítmicas, las transformaciones de raíz cuadrada se pueden aplicar a cero.
Nota:
Las transformaciones de raíz cuadrada solo se pueden aplicar si todos los valores de la variable son mayores o iguales que cero. Todos los valores negativos generarán un error.
Inversa
Una transformación inversa calcula el valor recíproco (1/x) de cada valor (x) en el campo.
Nota:
Las transformaciones inversas no se pueden aplicar a valores de cero. Si hay valores de cero en el campo, se tratan como nulos.
Box-Cox
Una transformación de Box-Cox aplica la siguiente función de potencia para distribuir normalmente los valores:
donde x' es el valor transformado, x es el valor original, λ1 es el parámetro Potencia y λ2 es el parámetro Desplazamiento.
Nota:
Las transformaciones de Box-Cox solo se pueden aplicar a valores positivos. En los casos en los que existan valores negativos o de cero, utilice el parámetro Desplazamiento para asegurarse de que todos los valores sean positivos.
Ejes
Límites de ejes
Los límites mínimo y máximo predeterminados del eje se establecen en función del rango de valores de datos representados en el eje. Estos valores se pueden personalizar escribiendo un nuevo valor deseado de límite de eje. Al hacer clic en el icono de restablecer, el límite de eje volverá al valor predeterminado.
Formato de número
Puede formatear el modo en que un eje mostrará valores numéricos especificando una categoría de formato de número o definiendo una cadena de formato personalizada.
Apariencia
Títulos y descripción
Los gráficos y los ejes usan títulos predeterminados basados en los nombres de las variables y el tipo de gráfico. Estos valores se pueden editar en la pestaña General del panel Propiedades de gráfico. También puede proporcionar una Descripción del gráfico, que es un bloque de texto que aparece en la parte inferior de la ventana del gráfico.
Color
Los diagramas cuantil-cuantil heredan sus colores de relleno y contorno de la simbología de la capa de origen. Al simbolizar una capa con un atributo distinto de las variables del diagrama cuantil-cuantil, se puede mostrar una tercera variable en la visualización del diagrama cuantil-cuantil.
Guías
Es posible agregar líneas o rangos de guía a los gráficos como referencia o como modo de resaltar valores importantes. Para agregar una nueva guía, en la pestaña Guías del panel Propiedades de gráfico, haga clic en Agregar guía. Para dibujar una línea, introduzca un Valor donde desee que se dibuje la línea. Para crear un rango, introduzca un valor a. También puede agregar texto a su guía especificando una Etiqueta.
Ejemplo
Cree un diagrama cuantil-cuantil para evaluar si las muestras de partículas de California están distribuidas de forma normal.
- Comparar la distribución de: Partículas
- Con transformación: Ninguna
- A: <Normal Distribution>