out_tables [[field_type, output_name],...] | Выходные таблицы, содержащие статистику. Столбец field_type указывает типы полей, которые будут включены в каждую выходную таблицу, а имя каждой выходной таблицы задается в столбце output_name. Вы можете создать единую таблицу с суммированием по всем типам полей, или вы можете создать отдельные таблицы для суммирований по типам полей Числовые, Текст и Дата. Доступны следующие варианты для столбца field_type: - NUMERIC — будет создана таблица для суммирования входных полей числового типа (Short, Long, Float и Double).
- TEXT — будет создана таблица для суммирования входных полей типа Текст.
- DATE — будет создана таблица для суммирования входных полей типа Дата.
- ALL — будет создана таблица для суммирования всех входных полей, числового типа, типа Текст и Дата. Выходные поля, содержащие статистики, которые применимы к нескольким типам полей, будут сохранены в формате Текст. Выходные статистики, которые не применимы к полям типа Текст или Дата, будут пустыми.
| Value Table |
group_by_field (Дополнительный) | Поле или поля, используемые для группировки строк в категории. Если указывается поле группировки, то каждое уникальное значение этого поля появляется как строка в выходной таблиц, и для каждого такого значения считается статистика | Field |
out_statistics [[out_statistic, output_name],...] (Дополнительный) | Указывается типы статистики, которые будут вычислены и имена выходных полей, содержащих результаты. Тип статистики указывается в столбце out_statistic, а имя каждого выходного поля задается в столбце output_name. Если значение не задано, будет вычислена вся доступная статистика для всех входных полей. Доступны следующие варианты для выбора в столбце out_statistic (отображаются только доступные типы для входных полей): - FIELDNAME — имя поля.
- ALIAS – псевдоним поля.
- FIELDTYPE — тип поля (Короткое целое (Short), Длинное целое (Long), Двойной точности (Double), с плавающей точкой (Float), Текст или Дата).
- NULLS — количество записей, содержащих пустые значения в поле.
- MINIMUM - наименьшее значение в поле.
- MAXIMUM - наибольшее значение в поле.
- MEAN - среднее значение (сумма, разделенная на общее количество) значений в поле. Чтобы вычислить среднюю дату для полей даты, каждая дата преобразуется в число путем вычисления разницы между датой и контрольной датой (например, 1900-01-01), рассчитанной в миллисекундах.
- STANDARDDEVIATION – среднеквадратическое отклонение значений в поле. Он рассчитывается как квадратный корень из дисперсии, в которой дисперсия представляет собой среднее значение квадрата разницы каждого значения от среднего значения поля.
- MEDIAN - медиана для всех значений в поле. Медиана - это серединное значение в отсортированном списке значений. Если имеется четное количество значений, медиана - это среднее между двумя средними значениями в распределении.
- COUNT – количество не пустых значений в поле.
- NUMBEROFUNIQUEVALUES - количество уникальных значений в поле.
- MODE — наиболее часто встречающееся значение в поле.
- LEASTCOMMON - наименьшее общее значение в поле.
- OUTLIERS - количество записей со значениями выбросов в поле. Выбросы - это значения, которые более чем в 1,5 раза превышают межквартильный диапазон выше третьего квартиля или ниже первого квартиля выбранного поля.
- SUM - сумма всех значений в поле.
- RANGE — разница между наименьшим и наибольшим значениями в поле.
- INTERQUARTILERANGE - диапазон между значениями первого и третьего квартилей в поле. Представляет диапазон средней половины значений данных.
- FIRSTQUARTILE — значение первого квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение первого квартиля - это верхняя граница первой группы в порядке возрастания.
- THIRDQUARTILE — значение третьего квартиля в поле. Квартили делят отсортированный список значений на четыре группы, содержащие равное количество значений. Значение третьего квартиля - это верхняя граница третей группы в порядке возрастания.
- COEFFICIENTOFVARIATION - коэффициент дисперсии для значений в поле. Коэффициент дисперсии - это мера относительного разброса значений. Он рассчитывается как стандартное отклонение, деленное на среднее значение поля.
- SKEWNESS - Скошенность (асимметрия) значений в поле. Скошенность – это показатель симметрии распределения. Скошенность рассчитывается как третий момент (среднее значение данных в кубе), деленный на среднеквадратическое отклонение в кубе.
- KURTOSIS - эксцесс значений в поле. Эксцесс описывает тяжесть хвостов распределения по сравнению с нормальным распределением, помогая определить частоту экстремальных значений. Эксцесс рассчитывается как четвертый момент (среднее значение значений данных, взятых в четвертой степени), разделенный на четвертую степень среднеквадратичного отклонения.
| Value Table |