Гистограмма

Гистограмма визуально представляет распределение непрерывной числовой переменной, при котором измеряется частота появления в наборе данных сходных значений. По оси х откладываются числовые значения, которые разбиты на диапазоны или интервалы. Каждому диапазону соответствует столбец гистограммы; ширина столбца соответствует величине интервала, а высота представляет собой количество элементов в наборе данных, значения которых попадают в этот интервал. Понимание распределения данных – это важный момент в процессе их изучения.

Переменная

Для построения гистограммы необходима одна непрерывная Числовая переменная по оси x.

Преобразование

Некоторые аналитические методы интерполяции требуют нормального распределения данных. Если данные сдвинуты (распределение несимметрично), то может понадобиться преобразовать данные к нормальному распределению. Гистограммы позволяют вам оценить эффект логарифмического преобразования и преобразования по методу квадратного корня на распределение данных. Для информации вы можете добавить график нормального распределения поверх вашей гистограммы, щелкнув отметку Показать нормальное распределение на панели Свойства диаграммы.

Логарифмическое преобразование

Логарифмическое преобразование часто используется, когда данные смещены в положительном направлении и присутствует мало очень больших значений. Если эти большие значения есть в вашем наборе данных, логарифмическое преобразование поможет сделать дисперсию более постоянной и приблизить распределение данных к нормальному.

Например, распределение со смещением в положительную сторону на диаграмме слева трансформировано в нормальное распределение с использованием логарифмического преобразования на диаграмме справа:

Диаграмма с исходным распределением данных – слева, и после логарифмического преобразования – справа.

Примечание:

Логарифмическое преобразование можно применять только к значениям больше нуля.

Преобразование по методу квадратного корня

Преобразование по методу квадратного корня похоже на логарифмическое тем, что уменьшает правое смещение набора данных.. В отличие от логарифмических преобразований, преобразования по методу квадратного корня могут применяться к нулевым значениям.

Примечание:

Преобразование преобразование по методу квадратного корня можно применять только к значениям больше или равно нулю.

Количество бинов

Количество диапазонов по умолчанию соответствует квадратному корню из общего количества записей в наборе данных. Это можно настроить, изменив значение параметра Бины на вкладке Данные панели Свойства диаграммы. Изменение количества столбцов позволяют увидеть более или менее детальную структуру ваших данных.

Статистика

Несколько описательных статистических данных вычисляются и отображаются в виде вертикальных линий на гистограммах. Среднее и медиана отображаются каждое одной линией, по одному стандартному отклонению от среднего (выше и ниже) отображается двумя линиями. Вы можете щелкнуть эти элементы в легенде диаграммы для включения или выключения их.

Таблица Статистика, которая отображается на вкладке Данные панели Свойства диаграммы, содержит следующую статистику для выбранного числового поля:

  • Среднее
  • Медиана
  • Среднеквадратическое отклонение
  • Число
  • Минимум
  • Максимум
  • Сумма
  • Значения NULL
  • Асимметрия
  • Эксцесс

Если исходный слой диаграммы содержит набор элементов, то в таблице статистики будет один столбец, отображающий статистику для всего набора данных, и один столбец со статистикой только для набора элементов.

Таблица статистики также содержит элементы управления для включения и выключения линий среднего, медианы и стандартного отклонения гистограмм и изменения их цвета.

Щелкните правой кнопкой мыши таблицу статистики и выберите команду, чтобы Копировать таблицу, Копировать строку или Копировать значение в буфер обмена. Это позволит копировать и вставлять статистику из панели Свойства диаграммы в другие окна или приложения.

Оси

Границы по оси Y

Границы по оси Y устанавливаются в соответствии с диапазоном данных по оси Y. Эти значения можно изменить, вручную введя нужные граничные значения по оси. Настройки границ оси можно использовать для сохранения масштаба согласованности диаграммы для сравнения. Щелчок на значке сброса вернет граничные значения оси к установке по умолчанию.

Числовой формат

Вы можете отформатировать способ отображения числовых значений оси, указав категорию форматирования или задав пользовательский формат. Например, $#,### можно использовать как строку пользовательского формата для отображения денежных значений.

Оформление

Заголовки и описание

Диаграммам и осям присваиваются названия по умолчанию на основе имен переменных и типа диаграммы. Эти значения можно редактировать на вкладке Общие панели Свойства диаграммы. Также для диаграммы можно ввести Описание, которое представляет из себя текстовый блок, появляющийся в нижней части окна диаграммы.

Цвет

Цвет бинов гистограммы можно изменить с помощью палитры цветов в разделе Бины во вкладке Данные панели Свойства диаграммы.

Направляющие

Направляющие или диапазоны могут быть добавлены на диаграммы для ориентировки или как способ выделить важнейшие значения. Чтобы добавить новые направляющие, на вкладке Направляющие панели Свойства диаграммы и щелкните Добавить направляющую. Чтобы нарисовать линию, введите Значение, где вы хотите ее отобразить. Для создания диапазона введите значение до. Дополнительно можно добавить текст к направляющей, указав Подпись.

Пример

Создайте гистограммы для отображения распределения плотности населения по группам населения г. Вашингтон (США).

  • Число – плотность населения

Гистограмма, отображающая распределение плотности населения по группам населения федерального округа Колумбия (США).