Статистика поля в таблицу (Управление данными)

Краткая информация

Создает таблицу описательной статистики для одного или нескольких входных полей таблицы или класса объектов.

Иллюстрация

Иллюстрация инструмента Статистика поля в таблицу

Использование

  • Инструмент использует в качестве входных класс объектов или автономную таблицу.

  • Для параметра Входные поля можно указать несколько полей, для которых вычисляется статистика. В параметре можно указать числовые (короткое целое, длинное целое, с плавающей точкой, двойной точности), текстовые поля или поля даты.

  • Порядок полей, указанный в параметре Входные поля будет соответствовать порядку строк в выходной таблице.

  • Параметр Группировать по полю используется для вычисления статистики атрибутов входного поля, отдельно для каждого уникального значения другого поля, указанного в параметре. Статистика для значений входного поля будет рассчитана для отдельных групп, определяемых уникальными значениями поля группировки.

  • Параметр Выходные таблицы включает четыре опции для столбца Тип поля:

    • Все — все входные поля и выходные статистики, независимо от типа поля будут экспортированы в одну выходную таблицу.
    • Числовые — только входные поля числового типа (Short, Long, Float и Double) будут экспортированы, и только статистика, применимая для числовых полей, будет экспортирована в выходную таблицу.
    • Текст — только входные поля типа Текст будут экспортированы, и только статистика, применимая для полей типа текст, будет экспортирована в выходную таблицу.
    • Дата — только входные поля типа Дата будут экспортированы, и только статистика, применимая для полей типа дата, будет экспортирована в выходную таблицу.

    Для каждой выходной таблицы указывается имя таблицы, в столбце Выходное имя параметра Выходные таблицы, и таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

  • Выходная статистика и имена полей для нее можно настроить в параметре Выходная статистика. Если в параметре не указаны никакие значения, все доступные типы статистики будут включены в выходную таблицу. Ниже перечислены доступные статистики и соответствующие типы выходных полей для каждой опции в столбце Типы полей параметра Выходные таблицы:

    Выходная статистикаВсеЧисловоеTextDate

    Имя поля

    Text

    Text

    Text

    Text

    Псевдоним

    Text

    Text

    Text

    Text

    Тип поля

    Text

    Text

    Text

    Text

    Значения NULL

    Long

    Long

    Long

    Long

    Минимум

    Text

    Double

    -

    Date

    Максимум

    Text

    Double

    -

    Date

    Среднее

    Text

    Double

    -

    Date

    Среднеквадратическое отклонение

    Double

    Double

    -

    -

    Медиана

    Text

    Double

    -

    Date

    Количество

    Long

    Long

    Long

    Long

    Количество уникальных значений

    Long

    Long

    Long

    Long

    Мода

    Text

    Double

    Text

    Date

    Наименьшее общее

    Text

    Double

    Text

    Date

    Выбросы

    Long

    Long

    -

    -

    Сумма

    Double

    Double

    -

    -

    Диапазон

    Text

    Double

    -

    -

    Межквартильный диапазон

    Double

    Double

    -

    -

    Квартиль 1

    Text

    Double

    -

    Date

    Квартиль 3

    Text

    Double

    -

    Date

    Коэффициент дисперсии

    Double

    Double

    -

    -

    Скошенность

    Double

    Double

    -

    -

    Эксцесс

    Double

    Double

    -

    -

    Доступные статистики и соответствующие типы выходных полей для каждого типа выходной таблицы.
  • Доступные типы статистики совпадают с типами, доступными для вычисления в панели Data Engineering. Подробную информацию о каждом типе статистики см. в разделе Работа со статистикой.

  • Если вы выбрали Все в столбце Типы полей параметра Выходные таблицы, все типы полей экспортируются в единую выходную таблицу. Таким образом, вы можете визуализировать все входные поля и типы статистики сразу. Это обеспечивает преимущества множества применений - например, если вы хотите использовать статистику в компоновке или отчете. Но есть вещи, которые надо принимать во внимание при экспорте различных типов полей в виде одной таблицы. Некоторые типы статистики, которые одинаковы для всех типов полей, включая Моду, Наименьшее общее, Минимум и Максимум сохраняются в выходной таблице как текстовые поля. Это может вызвать проблемы, например, при сортировке значений в столбцах статистики или включении выходной статистики в модель. Кроме того, если конкретная статистика не применима к текстовым полям или полям дат, в таблице будут пустые ячейки.

  • Если вы выбрали Числовые, Текст или Дата в столбце Типы полей параметра Выходные таблицы каждый тип поля экспортируется в отдельную таблицу, и выходные таблицы будут включать только те типы статистики, которые применимы к этому типу поля. Некоторые статистики, которые применимы к нескольким типам полей, будут сохранены в формате, который соответствует входному типу поля. Например, в числовой таблице поле Minimum будет типа Double, а если таблица дат, то поле будет типа Date. Рекомендуется создавать разные выходные таблицы. Например, если вам необходимо сохранять статистику в полях того же типа, что и входные, если в дальнейшем потребуется сортировать статистику в выходной таблице или использовать значения статистики в модели.

  • Типы статистики Мода и Наименьшее общее могут соответствовать нескольким значениям входного поля в случае равенства. В это случае несколько значений приведут к образованию значений <Null> для Числовых таблиц и таблиц, Текст и Дата. Если выбрана опция Все выходные ячейки будут содержать текст Multiple Values.

Параметры

ПодписьОписаниеТип данных
Входная таблица

Входная таблица, содержащая поля, для которых требуется вычислить статистику.

Table View
Входные поля

Поля, содержащие значения, которые будут использованы при вычислении статистики.

Field
Выходное местоположение

Местоположение, в котором будет создана выходная таблица. Это может быть папка, база геоданных или набор классов объектов.

Workspace
Выходные таблицы

Выходные таблицы, содержащие статистику. Столбец Типы полей указывает типы полей, которые будут включены в каждую выходную таблицу, а имя каждой выходной таблицы задается в столбце Выходные имена. Вы можете создать единую таблицу с суммированием по всем типам полей, или вы можете создать отдельные таблицы для суммирований по типам полей Числовые, Текст и Дата.

Доступны следующие варианты для столбца Типы полей:

  • Числовые — будет создана таблица для суммирования входных полей числового типа (Short, Long, Float и Double).
  • Текст — будет создана таблица для суммирования входных полей типа Текст.
  • Дата — будет создана таблица для суммирования входных полей типа Дата.
  • Все — будет создана таблица для суммирования всех входных полей, числового типа, типа Текст и Дата. Выходные поля, содержащие статистики, которые применимы к нескольким типам полей, будут сохранены в формате Текст. Выходные статистики, которые не применимы к полям типа Текст или Дата, будут пустыми.

Value Table
Группировать по полю
(Дополнительный)

Поле или поля, используемые для группировки строк в категории. Если указывается поле группировки, то каждое уникальное значение этого поля появляется как строка в выходной таблиц, и для каждого такого значения считается статистика

Field
Выходные типы статистика
(Дополнительный)

Указывается типы статистики, которые будут вычислены и имена выходных полей, содержащих результаты. Тип статистики указывается в столбце Статистика, а имя каждого выходного поля задается в столбце Выходные имена полей. Если значение не задано, будет вычислена вся доступная статистика для всех входных полей.

Доступны следующие варианты для выбора в столбце Статистика (отображаются только доступные типы для входных полей):

  • Имя поля — имя поля.
  • Псевдоним – псевдоним поля.
  • Тип поля — тип поля (Короткое целое (Short), Длинное целое (Long), Двойной точности (Double), с плавающей точкой (Float), Текст или Дата).
  • Значения NULL — Количество записей, содержащих пустые значения в поле.
  • Минимум – минимальное значение в поле.
  • Максимум – максимальное значение в поле.
  • Среднее - среднее значение (сумма, разделенная на общее количество) значений в поле. Чтобы вычислить среднюю дату для полей даты, каждая дата преобразуется в число путем вычисления разницы между датой и контрольной датой (например, 1900-01-01), рассчитанной в миллисекундах.
  • Среднеквадратическое отклонение – среднеквадратическое отклонение значений в поле. Он рассчитывается как квадратный корень из дисперсии, в которой дисперсия представляет собой среднее значение квадрата разницы каждого значения от среднего значения поля.
  • Медиана — медиана для всех значений в поле. Медиана - это серединное значение в отсортированном списке значений. Если имеется четное количество значений, медиана - это среднее между двумя средними значениями в распределении.
  • Количество – количество не пустых значений в поле.
  • Число уникальных значений – число уникальных в поле.
  • Мода — наиболее часто встречающееся значение в поле.
  • Наименьшее общее — наименьшее общее значение в поле.
  • Выбросы — количество записей со значениями выбросов в поле. Выбросы - это значения, которые более чем в 1,5 раза превышают межквартильный диапазон выше третьего квартиля или ниже первого квартиля выбранного поля.
  • Сумма – сумма всех значений в поле.
  • Диапазон — разница между наименьшим и наибольшим значениями в поле.
  • Межквартильный диапазон — диапазон между значениями первого и третьего квартилей в поле. Представляет диапазон средней половины значений данных.
  • Первый квартиль — значение первого квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение первого квартиля - это верхняя граница первой группы в порядке возрастания.
  • Третий квартиль — значение третьего квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение третьего квартиля - это верхняя граница третей группы в порядке возрастания.
  • Коэффициент дисперсии — коэффициент дисперсии для значений в поле. Коэффициент дисперсии - это мера относительного разброса значений. Он рассчитывается как стандартное отклонение, деленное на среднее значение поля.
  • Скошенность — скошенность (асимметрия) значений в поле. Скошенность – это показатель симметрии распределения. Скошенность рассчитывается как третий момент (среднее значение данных в кубе), деленный на среднеквадратическое отклонение в кубе.
  • Эксцесс — эксцесс значений в поле. Эксцесс описывает тяжесть хвостов распределения по сравнению с нормальным распределением, помогая определить частоту экстремальных значений. Эксцесс рассчитывается как четвертый момент (среднее значение значений данных, взятых в четвертой степени), разделенный на четвертую степень среднеквадратичного отклонения.

Value Table

Производные выходные данные

ПодписьОписаниеТип данных
Входная таблица для числовых полей.

Выходная таблица для числовых типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
Входная таблица для тестовых полей.

Выходная таблица для текстовых типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
Входная таблица для полей типа Дата.

Выходная таблица для данных типа Дата. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
Входная таблица для всех полей.

Выходная таблица для всех типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table

arcpy.management.FieldStatisticsToTable(in_table, in_fields, out_location, out_tables, {group_by_field}, {out_statistics})
ИмяОписаниеТип данных
in_table

Входная таблица, содержащая поля, для которых требуется вычислить статистику.

Table View
in_fields
[in_fields,...]

Поля, содержащие значения, которые будут использованы при вычислении статистики.

Field
out_location

Местоположение, в котором будет создана выходная таблица. Это может быть папка, база геоданных или набор классов объектов.

Workspace
out_tables
[[field_type, output_name],...]

Выходные таблицы, содержащие статистику. Столбец field_type указывает типы полей, которые будут включены в каждую выходную таблицу, а имя каждой выходной таблицы задается в столбце output_name. Вы можете создать единую таблицу с суммированием по всем типам полей, или вы можете создать отдельные таблицы для суммирований по типам полей Числовые, Текст и Дата.

Доступны следующие варианты для столбца field_type:

  • NUMERIC — будет создана таблица для суммирования входных полей числового типа (Short, Long, Float и Double).
  • TEXT — будет создана таблица для суммирования входных полей типа Текст.
  • DATE — будет создана таблица для суммирования входных полей типа Дата.
  • ALL — будет создана таблица для суммирования всех входных полей, числового типа, типа Текст и Дата. Выходные поля, содержащие статистики, которые применимы к нескольким типам полей, будут сохранены в формате Текст. Выходные статистики, которые не применимы к полям типа Текст или Дата, будут пустыми.

Value Table
group_by_field
(Дополнительный)

Поле или поля, используемые для группировки строк в категории. Если указывается поле группировки, то каждое уникальное значение этого поля появляется как строка в выходной таблиц, и для каждого такого значения считается статистика

Field
out_statistics
[[out_statistic, output_name],...]
(Дополнительный)

Указывается типы статистики, которые будут вычислены и имена выходных полей, содержащих результаты. Тип статистики указывается в столбце out_statistic, а имя каждого выходного поля задается в столбце output_name. Если значение не задано, будет вычислена вся доступная статистика для всех входных полей.

Доступны следующие варианты для выбора в столбце out_statistic (отображаются только доступные типы для входных полей):

  • FIELDNAME — имя поля.
  • ALIAS – псевдоним поля.
  • FIELDTYPE — тип поля (Короткое целое (Short), Длинное целое (Long), Двойной точности (Double), с плавающей точкой (Float), Текст или Дата).
  • NULLS — количество записей, содержащих пустые значения в поле.
  • MINIMUM - наименьшее значение в поле.
  • MAXIMUM - наибольшее значение в поле.
  • MEAN - среднее значение (сумма, разделенная на общее количество) значений в поле. Чтобы вычислить среднюю дату для полей даты, каждая дата преобразуется в число путем вычисления разницы между датой и контрольной датой (например, 1900-01-01), рассчитанной в миллисекундах.
  • STANDARDDEVIATION – среднеквадратическое отклонение значений в поле. Он рассчитывается как квадратный корень из дисперсии, в которой дисперсия представляет собой среднее значение квадрата разницы каждого значения от среднего значения поля.
  • MEDIAN - медиана для всех значений в поле. Медиана - это серединное значение в отсортированном списке значений. Если имеется четное количество значений, медиана - это среднее между двумя средними значениями в распределении.
  • COUNT – количество не пустых значений в поле.
  • NUMBEROFUNIQUEVALUES - количество уникальных значений в поле.
  • MODE — наиболее часто встречающееся значение в поле.
  • LEASTCOMMON - наименьшее общее значение в поле.
  • OUTLIERS - количество записей со значениями выбросов в поле. Выбросы - это значения, которые более чем в 1,5 раза превышают межквартильный диапазон выше третьего квартиля или ниже первого квартиля выбранного поля.
  • SUM - сумма всех значений в поле.
  • RANGE — разница между наименьшим и наибольшим значениями в поле.
  • INTERQUARTILERANGE - диапазон между значениями первого и третьего квартилей в поле. Представляет диапазон средней половины значений данных.
  • FIRSTQUARTILE — значение первого квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение первого квартиля - это верхняя граница первой группы в порядке возрастания.
  • THIRDQUARTILE — значение третьего квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение третьего квартиля - это верхняя граница третей группы в порядке возрастания.
  • COEFFICIENTOFVARIATION - коэффициент дисперсии для значений в поле. Коэффициент дисперсии - это мера относительного разброса значений. Он рассчитывается как стандартное отклонение, деленное на среднее значение поля.
  • SKEWNESS - Скошенность (асимметрия) значений в поле. Скошенность – это показатель симметрии распределения. Скошенность рассчитывается как третий момент (среднее значение данных в кубе), деленный на среднеквадратическое отклонение в кубе.
  • KURTOSIS - эксцесс значений в поле. Эксцесс описывает тяжесть хвостов распределения по сравнению с нормальным распределением, помогая определить частоту экстремальных значений. Эксцесс рассчитывается как четвертый момент (среднее значение значений данных, взятых в четвертой степени), разделенный на четвертую степень среднеквадратичного отклонения.

Value Table

Производные выходные данные

ИмяОписаниеТип данных
out_numeric

Выходная таблица для числовых типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
out_text

Выходная таблица для текстовых типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
out_date

Выходная таблица для данных типа Дата. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table
out_all

Выходная таблица для всех типов данных. Таблица сохраняется в рабочую область, указанную в параметре Выходное местоположение.

Table

Пример кода

FieldStatisticsToTable, пример 1 (окно Python)

Пример скрипта в окне Python для использования функции FieldStatisticsToTable.

import arcpy
arcpy.management.FieldStatisticsToTable("SNAP_County_Rates", 
      "LocId;Program_Name;Participants;SNAP_Rate;TimeofYear", r"C:\Output.gdb", 
      "ALL All_Table;DATE Date_Table;NUMERIC Num_Table;TEXT Text_Table")
FieldStatisticsToTable, пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать функцию FieldStatisticsToTable.

# Import system modules.
import arcpy

try:
    # Set the workspace and input features. 
    arcpy.env.workspace = r"C:\\Statistics\\MyData.gdb" 
    in_table = "County_Data" 
 
    # Set the input fields that will be used to calculate statistics. 
    in_fields = "population_total;unemployment_rate;income;county_name;sample_date" 
 
    # Set the output location.
    out_location = r"C:\\Statistics\\MyData.gdb"

    # Set the output table field type and name.
    out_tables = "ALL AllStats_Table;DATE DateStats_Table;NUMERIC NumStats_Table;TEXT TextStats_Table"
 
    # Run the Field Statistics To Table tool 
    arcpy.management.FieldStatisticsToTable (in_table, in_fields, out_location, out_tables) 
 
except arcpy.ExecuteError: 
    # If an error occurred when running the tool, print the error message. 
    print(arcpy.GetMessages())

Параметры среды

Этот инструмент не использует параметры среды геообработки

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы