Una matriz de gráficos de dispersión es una cuadrícula (o matriz) de gráficos de dispersión que se utiliza para visualizar relaciones bivariantes entre combinaciones de variables. Cada gráfico de dispersión de la matriz muestra la relación entre un par de variables, lo que permite explorar muchas relaciones en un solo gráfico.
Variables
Una matriz de gráficos de dispersión está formadas por tres o más Campos numéricos. Se crea un gráfico de dispersión para todas las combinaciones de variables por pares seleccionadas.
Estadísticas
Se calcula una ecuación de regresión para cada gráfico de dispersión de la matriz. Puede agregar líneas de tendencia asociadas a los gráficos de dispersión activando Mostrar tendencia lineal en el panel Propiedades de gráfico. Como alternativa, puede visualizar los gráficos pequeños en la cuadrícula como valores R² con un degradado de color que se corresponde con la intensidad del valor R² activando Mostrar como R cuadrado en el panel Propiedades de gráfico.
Diseño
Un diseño de matriz de gráficos de dispersión consta de dos mitades cortadas a través de una diagonal. La mitad inferior izquierda muestra una cuadrícula de gráficos pequeños, uno para cada par de variables.
De forma predeterminada, la mitad superior derecha del diseño muestra un gráfico de vista previa grande que muestra un gráfico pequeño seleccionado con mayor detalle. Si no se necesita un gráfico de vista previa, puede dejar la mitad superior derecha del diseño en blanco o utilizarla para mostrar gráficos pequeños reflejados con vistas de relación adicionales.
Las siguientes opciones de Vista de esquina de matriz están disponibles para la mitad superior derecha del diseño de matriz de gráficos de dispersión:
- Vista previa de gráfico: muestra una vista interactiva y detallada del gráfico pequeño seleccionado
- Gráfico de dispersión reflejado: muestra una cuadrícula reflejada de los gráficos pequeños
- R cuadrado: muestra una cuadrícula reflejada de los gráficos pequeños mostrados como valores R², con un degradado de color correspondiente a la intensidad de la relación
- R de Pearson: muestra una cuadrícula reflejada de los gráficos pequeños mostrados como valores r con un degradado de color divergente que corresponde a la intensidad y dirección de la relación
- Ninguno: la mitad superior derecha del diseño se deja en blanco
Además, puede agregar a la matriz un histograma que muestre la distribución de cada variable numérica activando Mostrar histogramas en la pestaña Datos del panel Propiedades de gráfico.
Apariencia
Títulos y descripción
Los gráficos y los ejes usan títulos predeterminados basados en los nombres de las variables y el tipo de gráfico. Estos valores se pueden editar en la pestaña General del panel Propiedades de gráfico. También puede proporcionar una Descripción del gráfico, que es un bloque de texto que aparece en la parte inferior de la ventana del gráfico.
Aplicación de formato visual
Puede configurar la apariencia de su gráfico cambiando el formato de los elementos de texto y símbolo o aplicando un tema de gráfico. Las propiedades de formato se pueden configurar en la pestaña Formato del panel Propiedades de gráfico o a través de la cinta de contexto Formato de gráfico. Entre las opciones para aplicar formato al gráfico se incluyen las siguientes:
- El tamaño, el color y el estilo de la fuente utilizados para los títulos de los ejes, las etiquetas de los ejes, el texto de la descripción, el título de la leyenda, el texto de la leyenda y las etiquetas de guía
- El color, el ancho y el tipo de línea para la cuadrícula y las líneas de los ejes
- Color de fondo del gráfico
Color
Los puntos del gráfico de dispersión se pueden mostrar en un solo color o en los colores especificados en la simbología de la capa. De forma predeterminada, los gráficos de dispersión utilizan colores de la capa y heredan sus colores de relleno y contorno de la simbología de la capa de origen.
Ejemplo
Cree un gráfico de dispersión para visualizar las relaciones entre varias enfermedades crónicas e identificar qué correlaciones son las más sólidas.
- Variables numéricas: EPOC, diabetes, insuficiencia cardíaca, hipertensión, colesterol elevado
- Mostrar como R cuadrado: activado