Точечная диаграмма

Точечная диаграмма используется для отображения отношений между двумя числовыми переменными, где одна из них отображается по оси x, а другая – по оси y. Для каждой записи в диаграмме на пересечении значений двух переменных ставится отдельная точка. Когда получившиеся точки создают неслучайную структуру, это говорит о наличии взаимосвязи между двумя переменными.

Переменные

Диаграмма рассеяния создается из двух Чисел, одно – для оси x, а другое – для оси y. Кроме того, можно задать третью переменную для пропорционального изменения размера каждой точки диаграммы.

Статистика

Вычисляется уравнение регрессии, а на диаграмме появляется связанная линия тренда и R2. Линия тренда моделирует линейную зависимость между значениями x и y, а R2 определяет, насколько хорошо данные укладываются в модель. Это подходит только в случае, если зависимость линейная. Для выключения линии тренда снимите отметку Показать линейный тренд на панели Свойства диаграммы либо переключите видимость, щелкнув элемент легенды. Чтобы поменять цвет линии тренда, щелкните образец цвета линии тренда в Свойствах диаграммы и выберите новый цвет.

Более подробно об анализе регрессии

Корреляция

Когда маленькие величины X соответствуют малым значениям Y, а большие значения X – большим Y (линия поднимается вверх), это значит, что есть положительная зависимость. Когда маленькие величины X соответствуют большим значениям Y, а большие значения X, наоборот, малым Y (линия опускается вниз), это значит, что есть отрицательная зависимость.

Примечание:

Важно помнить, что если X коррелирует с Y, это вовсе не обязательно значит, что X вызывает Y.

Символ

Размер

Точки диаграммы рассеяния могут быть одинакового размера или разного размера, определяющегося числовым значением атрибута. Изменение размера на основе третьей числовой переменной добавляет дополнительное измерение для визуализации путем создания пузырьковой диаграммы.

Цвет

Точки диаграммы рассеяния можно визуализировать одним цветом или цветами, заданными в символах слоя. По умолчанию, диаграммы рассеяния наследуют цвет контура и заливки из условных знаков слоя-источника. Если настроить символы слоя по другом атрибуту, отличному от переменных диаграммы рассеяния, то эта третья переменная будет также показана на диаграмме.

Оси

Границы по осям

Минимальное и максимальное значения осей по умолчанию задаются на основе диапазона значений данных по осям. Эти значения можно изменить, задав новые. Щелчок на значке сброса вернет граничные значения оси к установке по умолчанию.

Логарифмическая

По умолчанию все числовые оси графика отображаются в линейном шкале. Одна или даже обе оси могут быть отображены в логарифмическом масштабе, если поставить отметку Логарифмические оси в разделе Оси панели Свойства графика.

Логарифмические шкалы применяются при визуализации данных с большим положительным сдвигом, когда есть большое число точечных данных с маленькими значениями и небольшое - с большими значениями. Изменение шкалы оси не изменяет значения данных, меняется просто способ их отображения.

Линейные шкалы основаны на суммировании, а логарифмические - на умножении.

На линейной шкале приращение по оси представляет собой одинаковое расстояние в значениях. Например, на диаграмме оси ниже каждый инкремент оси больше предыдущего на 10.

Линейный масштаб оси

В логарифмической шкале каждое приращение увеличивается на определенную величину. Например, на диаграмме оси ниже каждое приращение по оси увеличивается умножением на 10.

Логарифмический масштаб оси
Примечание:

В логарифмических шкалах нельзя отобразить отрицательные и нулевые значения. Если вы выбрали логарифмическую шкалу оси для переменной с отрицательными или нулевыми значениями, эти значения не будут отображены на диаграмме.

Числовой формат

Вы можете отформатировать способ отображения числовых значений оси, указав категорию форматирования или задав пользовательский формат. Например, $#,### можно использовать как строку пользовательского формата для отображения денежных значений.

Оформление

Заголовки и описание

Диаграммам и осям присваиваются названия по умолчанию на основе имен переменных и типа диаграммы. Эти значения можно редактировать на вкладке Общие панели Свойства диаграммы. Также для диаграммы можно ввести Описание, которое представляет из себя текстовый блок, появляющийся в нижней части окна диаграммы.

Направляющие

В диаграмму можно добавить линии направляющих или диапазоны для сравнения или выделения значимых величин. Чтобы добавить новую направляющую, перейдите на вкладку Направляющие на панели Свойства диаграммы, выберите отображение вертикальной или горизонтальной направляющей и щелкните Добавить направляющую. Чтобы нарисовать линию, введите Значение, где вы хотите ее отобразить. Для создания диапазона введите значение до. Дополнительно можно добавить текст к направляющей, указав Подпись.

Пример

Создайте точную диаграмму для визуализации взаимосвязи между диабетом и гипертонией среди владельцев страховки Medicare. Выберите объекты в диаграмме, чтобы просмотреть, куда они попадают на карте.

  • Ось X – уровень диабета
  • Ось Y – уровень гипертонии

Диаграмма рассеяния отображает взаимосвязь между диабетом и гипертонией среди владельцев страховки Medicare.