Случайная выборка образца (Data Reviewer)

Доступно с лицензией Data Reviewer.

Краткая информация

Выбирает случайную выборку входных объектов или строк на основе указанного метода выборки.

Выходные данные представляют собой выборку, сделанную на входном слое в рамке карты. Также инструмент может создать файл .json, в котором записаны идентификаторы выбранных объектов (OID) и SQL-выражение, используемое для выбора. Выборку можно использовать для инструмента визуального обзора Просмотреть объекты и рабочих процессов инструмента Запустить проверку данных.

Использование

  • Параметр Метод выборки имеет следующие опции:

    • Фиксированное число — число выбранных записей будет зависеть от значения параметра Число записей.
    • Процент — число выбранных записей будет основано на значении параметра Процент записей.
    • Автоматическое вычисление — число выбранных записей будет основано на вычислении с использованием значений параметров Уровень доверия и Допустимая погрешность.

  • Опция Автоматическое вычисление параметра Метод выборки использует следующие переменные для вычисления числа записей:

    z=scipy.stats.norm.ppf(1-(1-confidence_level)/2) n=((z/m)^2)*(p*(1-p)) n'=(n*N)/(n+(N-1))
    • Z-статистика для желаемого уровня доверия (z). Z-статистика вычисляется с использованием переменной уровня доверия и модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2).
    • Предельно допустимая величина ошибки в доверительном интервале (m).
    • Вероятность (p) достигает максимума при 0,5, поскольку отсутствуют какие-либо предыдущие знания о том, будет ли определенный процент записей проверен или нет. Поскольку шансы на то, что записи пройдут или не пройдут, равны, 0,5 является наиболее консервативным значением для использования в уравнении дисперсии.
    • Размер совокупности (N) — это общее число записей в векторном слое или таблице.

  • Случайные OID выбираются с помощью модуля random Python random.sample(population, k), где population — список значений OID, а k — размер выборки.

  • Результатом работы этого инструмента является случайная выборка записей из значения параметра Входные строки на основе значения параметра Метод выборки.

  • Используйте опционный параметр Выходной файл, чтобы создать файл .json, включающий следующее:

    • Дата и время запуска инструмента
    • Рабочая область, из которой поступают входные данные
    • Название входных векторных слоев или таблиц
    • Общее число выбранных записей.
    • OID выбранных записей
    • SQL-выражение, которое использовалось для создания выборки

  • Все выборки, сделанные в параметре Входные строки, будут реализованы независимо от того, отключен ли переключатель Использовать выбранные записи.

  • Перед запуском этого инструмента в векторном слое или таблице должно быть поле ObjectID.

  • Если кнопка Использовать выбранные записи выключена, значение параметра Выходной файл записывает произвольную выборку объектов на основе всего набора данных. Однако если применяется определяющий запрос, во фрейме карты будут выбраны только объекты или строки, соответствующие запросу.

Параметры

ПодписьОписаниеТип данных
Входные строки

Данные, к которым будет применяться эта выборка.

Feature Layer; Table View
Метод выборки

Определяет метод выборки, который будет использоваться.

  • Фиксированное числоЧисло выбранных записей будет основано на значении параметра Число записей.
  • ПроцентЧисло выбранных записей будет основано на значении параметра Процент записей.
  • Автоматическое вычислениеЧисло выбранных записей будет основано на вычислении с использованием значений параметров уровня доверия и допустимой погрешности.
String
Число записей
(Дополнительный)

Число записей, которые будут выбраны.

Этот параметр активен, если значение параметра Метод выборки задано как Фиксированное число.

Long
Процент записей
(Дополнительный)

Процент записей во входных данных, которые будут выбраны.

Этот параметр активен, если значение параметра Метод выборки задано как Процент.

Long
Уровень доверия
(Дополнительный)

Уровень доверия — это вероятность того, что размер выборки статистически значим, выраженная в процентах, например 98 или 95.

Этот параметр будет использоваться для расчета z-статистики (z).

Z-статистика может быть вычислена с помощью модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2).

Этот параметр активен, если значение параметра Метод выборки задано как Автоматическое вычисление.

Long
Предел погрешности
(Дополнительный)

Предельно допустимая погрешность в уровне доверия, введенная в процентах, например, 8 или 5.

Этот параметр использует вычисленную z-статистику (z) для расчета фактического размера выборки (n') с использованием следующих уравнений: n=((z/m)^2)*(p*(1-p)) до n'=(n*N)/(n+(N-1)).

Этот параметр активен, если значение параметра Метод выборки задано как Автоматическое вычисление.

Long
Выходной файл
(Дополнительный)

Выходной файл .json, который будет содержать запись выбранных данных.

File

Производные выходные данные

ПодписьОписаниеТип данных
Обновленные строки

Обновленный входной слой с применением выборки.

Feature Layer; Table View

arcpy.Reviewer.SelectRandomSample(in_layer_or_view, sample_method, {number_of_records}, {percentage_of_records}, {confidence_level}, {margin_of_error}, {out_file})
ИмяОписаниеТип данных
in_layer_or_view

Данные, к которым будет применяться эта выборка.

Feature Layer; Table View
sample_method

Определяет метод выборки, который будет использоваться.

  • FIXED_NUMBERЧисло выбранных записей будет основано на значении параметра Число записей.
  • PERCENTAGEЧисло выбранных записей будет основано на значении параметра Процент записей.
  • AUTO_CALCULATEЧисло выбранных записей будет основано на вычислении с использованием значений параметров уровня доверия и допустимой погрешности.
String
number_of_records
(Дополнительный)

Число записей, которые будут выбраны.

Этот параметр включен, если значение параметра sample_method задано как FIXED_NUMBER.

Long
percentage_of_records
(Дополнительный)

Процент записей во входных данных, которые будут выбраны.

Этот параметр включен, если значение параметра sample_method задано как PERCENTAGE.

Long
confidence_level
(Дополнительный)

Уровень доверия — это вероятность того, что размер выборки статистически значим, выраженная в процентах, например 98 или 95.

Этот параметр будет использоваться для расчета z-статистики (z).

Z-статистика может быть вычислена с помощью модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2).

Этот параметр включен, если значение параметра sample_method задано как AUTO_CALCULATE.

Long
margin_of_error
(Дополнительный)

Предельно допустимая погрешность в уровне доверия, введенная в процентах, например, 8 или 5.

Этот параметр использует вычисленную z-статистику (z) для расчета фактического размера выборки (n') с использованием следующих уравнений: n=((z/m)^2)*(p*(1-p)) до n'=(n*N)/(n+(N-1)).

Этот параметр включен, если значение параметра sample_method задано как AUTO_CALCULATE.

Long
out_file
(Дополнительный)

Выходной файл .json, который будет содержать запись выбранных данных.

File

Производные выходные данные

ИмяОписаниеТип данных
out_layer_or_view

Обновленный входной слой с применением выборки.

Feature Layer; Table View

Пример кода

SelectRandomSample, пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование функции SelectRandomSample.

import arcpy
arcpy.env.workspace = r"C:\USAData\Data.gdb"
arcpy.SelectRandomSample_Reviewer("Cities", "FIXED_NUMBER", number_of_records = 35, out_file = "C:\\USAData\\Cities_Sample.json")
SelectRandomSample, пример 2 (автономный скрипт)

Следующий автономный скрипт создает случайную выборку объектов в векторном слое Cities (Города).

# Name: SelectRandomSample_Example.py
# Description: Use the SelectRandomSample tool in ArcGIS Pro to select a random sample of features from a feature class.

# Import system modules
import arcpy

# Set environment workspace
arcpy.env.workspace = r"C:\USAData\Data.gdb"

# Set local variables
in_layer_or_view = "Cities"
sampling_method = "AUTO_CALCULATE"
confidence_level = 98
margin_of_error = 5
out_file = r"C:\USAData\Cities_Sample.json"

# Generate a random sample of features
arcpy.SelectRandomSample_Reviewer(in_layer_or_view, sampling_method, confidence_level, margin_of_error, out_file)

Информация о лицензиях

  • Basic: Обязательно Data Reviewer
  • Standard: Обязательно Data Reviewer
  • Advanced: Обязательно Data Reviewer

Связанные разделы