Сводка
Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию.
Иллюстрация
Использование
Есть четыре метода стандартизации: Z-оценка, Минимум-максимум, Абсолютный максимум и Надежная стандартизация.
- Метод Z-оценка измеряет разницу между значением и средним всех значений в поле, используя стандартные отклонения. Он также называется стандартной оценкой.
- Возможное применение - оценка важности значения в отношении распределения значений в поле. Например, можно оценить участие округа в голосовании в контексте других округов страны, что поможет определить типичные модели участия избирателей и округа с особенно высоким и низким уровнем участия.
- Замечание: этот метод рассчитан на нормальное распределение. Следовательно, этот метод не рекомендуется использовать в случаях, когда распределение данных сильно искажено.
- Уравнение - , в котором x' - это стандартизированное значение, x - исходное значение, x̄ - среднее, а σx - стандартное отклонение.
- Метод Минимум-максимум сохраняет отношения между исходными значениями при преобразовании значений в шкалу между заданными пользователем минимальным и максимальным значениями.
- Возможное применение: оценщик недвижимости хочет масштабировать такие характеристики домов, как число комнат в доме или возраст дома в годах, в ту же шкалу перед использованием этой характеристики в модели, например, в инструменте Инструмент классификации на основе леса и регрессия.
- Замечание: этот подход подвержен влиянию выбросов, то есть экстремальных значений данных.
- Уравнение - , в котором x' - стандартизированное значение, x - исходное значение, min(x) - минимальное значение, max(x) - максимальное значение, a - заданный пользователем минимум, а b - заданный пользователем максимум.
- Метод Абсолютный максимум сравнивает разницу между текущим и максимальным абсолютным значениями в распределении путем деления каждого значения на максимальное абсолютное значение поля.
- Возможное применение: этот метод может пригодиться, если вы работаете с данными, имеющими стабильный и надежный максимум, и вы хотите сравнить каждое значение с этим максимумом. Например, количество поданных в округе голосов не может превышать число жителей округа, имеющих избирательное право. Округ с наибольшей долей голосов становится этим максимумом, и все остальные округа оцениваются по отношению к абсолютному максимальному числу участвовавших в выборах избирателей.
- Замечание: выходные масштабы находится между -1 и 1. Большие положительные значения соответствуют значениям, близким к 1, а большие отрицательные значения - значениям, близким к -1.
- Уравнение - , где x' - стандартизированное значение, x - исходное значение, а max(|x|) - максимальное абсолютное значение данных.
- Метод Надежной стандартизации стандартизирует значения в указанных полях, используя надежный вариант z-оценки. В этом варианте вместо среднего и стандартного отклонения используются медиана и межквартильный размах.
- Возможное применение: оценщик недвижимости хочет оценить стоимость жилья в городе, где один конкретный район с чрезвычайно высокой стоимостью домов приводит к появлению выбросов в данных. Оценщик использует надежную стандартизацию, чтобы смягчить влияние этих выбросов на распределение стоимости недвижимости в городе.
- Замечание: благодаря использованию медианы и межквартильного размаха этот метод может оказаться эффективным в случае необходимости смягчения влияния выбросов в распределении.
- Уравнение - , где x' - стандартизированное значение, x - исходное значение, median(x) - медиана данных, а IQR(x) - межквартильный размах данных.
- Метод Z-оценка измеряет разницу между значением и средним всех значений в поле, используя стандартные отклонения. Он также называется стандартной оценкой.
Если задано несколько полей, указанный метод стандартизации применяется ко всем полям.
Инструмент изменяет входные данные и добавляет вновь созданные стандартизированные поля во входную таблицу или класс пространственных объектов.
Для каждого выбранного поля в сообщениях геообработки отображается сводная статистика. Она содержит максимальное и минимальное значения, сумму, среднее, медиану, асимметрию и эксцесс.
Синтаксис
arcpy.management.StandardizeField(in_table, fields, {method}, {min_value}, {max_value})
Parameter | Объяснение | Тип данных |
in_table | Таблица, содержащая поля со стандартизируемыми значениями. | Table View; Raster Layer; Mosaic Layer |
fields [[input_field, output_field],...] | Поля, содержащие значения, которые будут стандартизироваться. Для каждого поля можно указать имя выходного поля. Если имя выходного поля не указано, инструмент создаст имя выходного поля, используя имя поля и выбранный метод. | Value Table |
method (Дополнительный) | Задает метод, используемый для стандартизации значений, содержащихся в указанных полях.
| String |
min_value (Дополнительный) | Значение, используемое методом MIN-MAX параметра method, для указания минимального значения в масштабе предоставленных выходных значений. | Double |
max_value (Дополнительный) | Значение, используемое методом MIN-MAX параметра method для указания максимального значения в шкале предоставленных выходных значений. | Double |
Производные выходные данные
Name | Объяснение | Тип данных |
updated_table | Таблица, содержащая новые закодированные поля. | Представление таблицы |
Пример кода
В следующем скрипте окна Python показано, как используется инструмент StandardizeField.
arcpy.management.StandardizeField("County_VoterTurnout",
"voter_turnout voter_turnout_Z_SCORE", "Z-SCORE")
В следующем автономном скрипте показано, как использовать инструмент StandardizeField.
# Import system modules
import arcpy
try:
# Set the workspace and input features.
arcpy.env.workspace = r"C:\\Standardize\\MyData.gdb"
inputFeatures = ”County_VoterTurnout”
# Set the input fields that will be standardized
fields = "votes_total;rawdiff_dem_vs_gop;pctdiff_dem_vs_gop"
# Set the standardization method.
method = "ROBUST"
# Run the Standardize Field tool
arcpy.management.StandardizeField(inputFeatures, fields, method)
except arcpy.ExecuteError:
# If an error occurred when running the tool, print the error message.
print(arcpy.GetMessages())
Environments
Информация о лицензиях
- Basic: Да
- Standard: Да
- Advanced: Да