Случайная выборка образца (Data Reviewer)—ArcGIS Pro

Доступно с лицензией Data Reviewer.

Краткая информация

Выбирает случайную выборку входных объектов или строк на основе указанного метода выборки.

Выходные данные представляют собой выборку, сделанную на входном слое в рамке карты. Также инструмент может создать файл .json, в котором записаны идентификаторы выбранных объектов (OID) и SQL-выражение, используемое для выбора. Выборку можно использовать для инструмента визуального обзора Просмотреть объекты и рабочих процессов инструмента Запустить проверку данных.

Использование

Параметр Метод выборки имеет следующие опции:
- Фиксированное число — число выбранных записей будет зависеть от значения параметра Число записей.
- Процент — число выбранных записей будет основано на значении параметра Процент записей.
- Автоматическое вычисление — число выбранных записей будет основано на вычислении с использованием значений параметров Уровень доверия и Допустимая погрешность.
Опция Автоматическое вычисление параметра Метод выборки использует следующие переменные для вычисления числа записей:
```
z=scipy.stats.norm.ppf(1-(1-confidence_level)/2) n=((z/m)^2)*(p*(1-p)) n'=(n*N)/(n+(N-1))
```
- Z-статистика для желаемого уровня доверия (z). Z-статистика вычисляется с использованием переменной уровня доверия и модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2).
- Предельно допустимая величина ошибки в доверительном интервале (m).
- Вероятность (p) достигает максимума при 0,5, поскольку отсутствуют какие-либо предыдущие знания о том, будет ли определенный процент записей проверен или нет. Поскольку шансы на то, что записи пройдут или не пройдут, равны, 0,5 является наиболее консервативным значением для использования в уравнении дисперсии.
- Размер совокупности (N) — это общее число записей в векторном слое или таблице.
Случайные OID выбираются с помощью модуля random Python random.sample(population, k), где population — список значений OID, а k — размер выборки.
Результатом работы этого инструмента является случайная выборка записей из значения параметра Входные строки на основе значения параметра Метод выборки.
Используйте опционный параметр Выходной файл, чтобы создать файл .json, включающий следующее:
- Дата и время запуска инструмента
- Рабочая область, из которой поступают входные данные
- Название входных векторных слоев или таблиц
- Общее число выбранных записей.
- OID выбранных записей
- SQL-выражение, которое использовалось для создания выборки
Все выборки, сделанные в параметре Входные строки, будут реализованы независимо от того, отключен ли переключатель Использовать выбранные записи.
Перед запуском этого инструмента в векторном слое или таблице должно быть поле ObjectID.
Если кнопка Использовать выбранные записи выключена, значение параметра Выходной файл записывает произвольную выборку объектов на основе всего набора данных. Однако если применяется определяющий запрос, во фрейме карты будут выбраны только объекты или строки, соответствующие запросу.

Параметры

Подпись	Описание	Тип данных
Входные строки	Данные, к которым будет применяться эта выборка.	Feature Layer; Table View
Метод выборки	Определяет метод выборки, который будет использоваться. Фиксированное число—Число выбранных записей будет основано на значении параметра Число записей. Процент—Число выбранных записей будет основано на значении параметра Процент записей. Автоматическое вычисление—Число выбранных записей будет основано на вычислении с использованием значений параметров уровня доверия и допустимой погрешности.	String
Число записей (Дополнительный)	Число записей, которые будут выбраны. Этот параметр активен, если значение параметра Метод выборки задано как Фиксированное число.	Long
Процент записей (Дополнительный)	Процент записей во входных данных, которые будут выбраны. Этот параметр активен, если значение параметра Метод выборки задано как Процент.	Long
Уровень доверия (Дополнительный)	Уровень доверия — это вероятность того, что размер выборки статистически значим, выраженная в процентах, например 98 или 95. Этот параметр будет использоваться для расчета z-статистики (z). Z-статистика может быть вычислена с помощью модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2). Этот параметр активен, если значение параметра Метод выборки задано как Автоматическое вычисление.	Long
Предел погрешности (Дополнительный)	Предельно допустимая погрешность в уровне доверия, введенная в процентах, например, 8 или 5. Этот параметр использует вычисленную z-статистику (z) для расчета фактического размера выборки (n') с использованием следующих уравнений: n=((z/m)^2)(p(1-p)) до n'=(n*N)/(n+(N-1)). Этот параметр активен, если значение параметра Метод выборки задано как Автоматическое вычисление.	Long
Выходной файл (Дополнительный)	Выходной файл .json, который будет содержать запись выбранных данных.	File

Производные выходные данные

Подпись	Описание	Тип данных
Обновленные строки	Обновленный входной слой с применением выборки.	Feature Layer; Table View

arcpy.Reviewer.SelectRandomSample(in_layer_or_view, sample_method, {number_of_records}, {percentage_of_records}, {confidence_level}, {margin_of_error}, {out_file})

Имя	Описание	Тип данных
in_layer_or_view	Данные, к которым будет применяться эта выборка.	Feature Layer; Table View
sample_method	Определяет метод выборки, который будет использоваться. FIXED_NUMBER—Число выбранных записей будет основано на значении параметра Число записей. PERCENTAGE—Число выбранных записей будет основано на значении параметра Процент записей. AUTO_CALCULATE—Число выбранных записей будет основано на вычислении с использованием значений параметров уровня доверия и допустимой погрешности.	String
number_of_records (Дополнительный)	Число записей, которые будут выбраны. Этот параметр включен, если значение параметра sample_method задано как FIXED_NUMBER.	Long
percentage_of_records (Дополнительный)	Процент записей во входных данных, которые будут выбраны. Этот параметр включен, если значение параметра sample_method задано как PERCENTAGE.	Long
confidence_level (Дополнительный)	Уровень доверия — это вероятность того, что размер выборки статистически значим, выраженная в процентах, например 98 или 95. Этот параметр будет использоваться для расчета z-статистики (z). Z-статистика может быть вычислена с помощью модуля scipy.stats z=scipy.stats.norm.ppf(1-(1-confidence_level)/2). Этот параметр включен, если значение параметра sample_method задано как AUTO_CALCULATE.	Long
margin_of_error (Дополнительный)	Предельно допустимая погрешность в уровне доверия, введенная в процентах, например, 8 или 5. Этот параметр использует вычисленную z-статистику (z) для расчета фактического размера выборки (n') с использованием следующих уравнений: n=((z/m)^2)(p(1-p)) до n'=(n*N)/(n+(N-1)). Этот параметр включен, если значение параметра sample_method задано как AUTO_CALCULATE.	Long
out_file (Дополнительный)	Выходной файл .json, который будет содержать запись выбранных данных.	File

Производные выходные данные

Имя	Описание	Тип данных
out_layer_or_view	Обновленный входной слой с применением выборки.	Feature Layer; Table View

Пример кода

SelectRandomSample, пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование функции SelectRandomSample.

import arcpy
arcpy.env.workspace = r"C:\USAData\Data.gdb"
arcpy.SelectRandomSample_Reviewer("Cities", "FIXED_NUMBER", number_of_records = 35, out_file = "C:\\USAData\\Cities_Sample.json")

SelectRandomSample, пример 2 (автономный скрипт)

Следующий автономный скрипт создает случайную выборку объектов в векторном слое Cities (Города).

# Name: SelectRandomSample_Example.py
# Description: Use the SelectRandomSample tool in ArcGIS Pro to select a random sample of features from a feature class.

# Import system modules
import arcpy

# Set environment workspace
arcpy.env.workspace = r"C:\USAData\Data.gdb"

# Set local variables
in_layer_or_view = "Cities"
sampling_method = "AUTO_CALCULATE"
confidence_level = 98
margin_of_error = 5
out_file = r"C:\USAData\Cities_Sample.json"

# Generate a random sample of features
arcpy.SelectRandomSample_Reviewer(in_layer_or_view, sampling_method, confidence_level, margin_of_error, out_file)

Параметры среды

Текущая рабочая область

Информация о лицензиях

Basic: Обязательно Data Reviewer
Standard: Обязательно Data Reviewer
Advanced: Обязательно Data Reviewer

Связанные разделы

Отзыв по этому разделу?

Краткая информация

Использование

Параметры

Производные выходные данные

Производные выходные данные

Пример кода

Параметры среды

Информация о лицензиях

Связанные разделы

В этом разделе