Методы классификации данных

При выполнении классификации данных с помощью градуированных символов, градуированных цветов или двумерных цветовых символов можно использовать один из стандартных методов в ArcGIS Pro, или вручную задавать собственные пользовательские диапазоны классов. Методы классификации используются для классификации числовых полей для градуированных символов.

Естественные границы (по Дженксу)

По классификации естественных границ (по Дженксу) Естественные границы по Дженксу классы основаны на классы основаны на естественных группах, присущих данным. Границы классов создаются таким образом, чтобы наилучшим образом сгруппировать сходные значения и максимизировать различия между классами. Объекты делятся на классы, границы которых устанавливаются там, где встречаются относительно большие различия между значениями данных.

Классификация методом естественных границ индивидуальна для конкретных данных и не подходит для сравнения нескольких карт, построенных на различной исходной информации.

Данная классификация опирается на алгоритм естественных границ Дженкса. Дополнительную информацию см. в Univariate classification schemes в Geospatial Analysis – A Comprehensive Guide, 6th edition; 2007-2018; de Smith, Goodchild, Longley.

Квантиль

В классификации по квантилям Класс квантиля каждый класс содержит одинаковое количество объектов. Такая классификация хорошо подходит для линейно распределенных данных. Этот метод назначает в каждый класс одинаковое количество данных. Здесь не бывает пустых классов или классов, содержащих слишком малое или слишком большое количество значений.

Поскольку при классификации методом квантилей объекты сгруппированы по принципу их одинакового количества в каждом классе, полученная карта может ввести в заблуждение. Похожие объекты могут попасть в разные классы, а объекты с существенно различающимися значениями могут оказаться в одном классе. Вы можете минимизировать искажение, увеличивая число классов.

Равные интервалы

Используйте Равные интервалы равных интервалов, чтобы разбить диапазон атрибутивных значений на под-диапазоны равного размера. Это позволит вам задать число интервалов, а разделители классов будут определены автоматически в зависимости от диапазона значений. Например, если задать три класса для поля со значениями в диапазоне от 0 до 300, то будут созданы три класса с диапазонами значений 0–100, 101–200 и 201–300.

Метод равных интервалов наиболее подходит для известных диапазонов значений, например, процентов или температур. Данный метод акцентирует внимание на величине значения атрибута относительно других значений. В частности, он показывает, что магазин является частью группы магазинов, которая обеспечивает третью часть всех продаж.

Заданный интервал

Используйте заданный интервал Заданный интервал для того, чтобы указать размер интервала, который будет использован для определения серии классов с одинаковым диапазоном значений. Например, если размер интервала равен 75, то каждый класс будет охватывать 75 единиц. Количество классов определяется автоматически, исходя из размера интервала и максимального размера выборки. Размер интервала должен быть достаточно мал, чтобы соответствовать минимальному разрешенному числу классов, которое равно трем.

Интервал вручную

Используйте интервал вручную Класс вручную, чтобы задать свои собственные классы, чтобы вручную добавить разделители классов и задать диапазоны классов, которые подходили бы для ваших данных. Начните с выбора стандартной схемы классификации, затем перейдите к ручной классификации интервалов, чтобы внести нужные изменения.

Геометрический интервал

Схема классификации методом геометрических интервалов Геометрические интервалы строит границы классов, основываясь на интервалах, имеющих геометрическую последовательность. Геометрический коэффициент в этом классификаторе может измениться (на обратный к нему), чтобы оптимизировать диапазоны классов. Алгоритм создает геометрические интервалы путем минимизации суммы квадратов числа элементов в каждом классе. Это позволяет добиться того, чтобы в каждом диапазоне классов было примерно равное количество значений, и чтобы изменения между интервалами были согласующимися.

Этот алгоритм был специально разработан для обработки непрерывных данных. Этот метод сочетает в себе достоинства методов равного интервала, естественных границ (Дженкса) и квантиля. Он позволяет корректно разделить средние значения и выбивающиеся из ряда крайние, позволяя получить результат, адекватный с картографической точки зрения и визуально привлекательный.

Например, метод классификации по геометрическому интервалу подходит для набора данных об уровне осадков, где зарегистрированы остатки только в атрибутах 15 из 100 метеостанций (менее 50%), и атрибуты остальных метеостанций равны 0.

Среднеквадратическое отклонение

Метод классификации стандартное отклонение Среднеквадратическое отклонение показывает, насколько значение атрибута объекта отличается от среднего значения. Среднее значение и стандартное отклонение вычисляются автоматически. Границы классов строятся с равными диапазонами значений, пропорциональными стандартному отклонению (обычно в интервалах один, половина, одна треть или одна четверть), используя средние значения и стандартное отклонение от среднего.

Связанные разделы