Структура выборки – это важнейшая часть любого исследования, связанного с моделированием и оценкой на основании данных, получаемых из естественных ресурсов, или других явлений, происходящих на местности. Статистические соображения, связанные с формированием выборки, являются частью более общей ситуации, которая включает теоретические знания, ранее зафиксированное поведение и шаблоны явления, расходы, доступность участков выборки, политические вопросы и т. д. Таким образом, алгоритм создания структуры выборки должен быть достаточно гибким, чтобы допускать влияние внешних факторов.
В настоящее время ArcGIS предлагает несколько методов для создания структуры выборки:
- Простая случайная выборка: Участки формируются независимо с использованием инструмента Создать произвольно расположенные точки (Create Random Points). Аналогичный результат можно получить с помощью инструмента Создать произвольный растр (Create Random Raster) и предельного значения вероятности (обратите внимание, что в инструменте Создать произвольный растр из дополнительного модуля Дополнительный модуль ArcGIS Spatial Analyst используется случайное число с равномерным распределением, а в инструменте Создать произвольный растр из набора Управление данными поддерживается несколько различных распределений). Этот метод простой и гибкий, однако результат конкретной реализации может включать области со скоплением образцов и области без образцов совсем.
- Стратифицированная случайная выборка: Исследуемая область разбивается на слои (страты), и для каждого слоя формируются случайные образцы. Слоями можно управлять на основании имеющихся знаний о явлении (например, концентрические круги можно делать больше по мере увеличение расстояния от точечного источника выброса), что формирует некоторую пространственную структуру для образца.
Другие типы структур достаточно легко создавать с помощью скриптов или моделей:
- Систематическая случайная выборка: Исходный участок-образец выбирается случайно, а все остальные участки выбираются на основании определенной регулярной закономерности (например, из вершин равносторонних треугольников, квадратов, шестиугольников и т. д.). Этот метод прост и позволяет создавать структуры с хорошей пространственной балансировкой (с хорошим распределением в пространстве).
- Групповая случайная выборка: Расположение группы участков выбирается случайно, после чего участки внутри каждой группы размещаются относительно близко друг к другу. Этого можно добиться, создавая случайно расположенные центры с помощью параметра Минимально допустимое расстояние инструмента Создать произвольно расположенные точки и размещая дополнительные образцы в пределах заданного расстояния от каждого центра. Этот метод легко реализовать на практике, поскольку много образцов собирается в ближайших окрестностях (в отличие от шаблона простой случайной выборки, где участки-образцы могут размещаться в любом месте исследуемой области).
При использовании этих методов нет удобного способа учитывать отклонения в вероятности выбора определенного участка (за исключением разбиения исследуемой области на слои, что обычно требует проверки исследуемого участка вручную и хорошего знания исследуемого процесса). Кроме того, не все из них гарантируют, что структура выборки будет пространственно сбалансированной (то есть, что структура будет включать образцы из всей совокупности, что объясняется неотъемлемой случайностью выбора участков-образцов). Поэтому пользователям предлагается инструмент Создать пространственно сбалансированные точки в наборе инструментов Geostatistical Analyst. Описание работы этого инструмента и публикации о нем можно найти в разделе: Как работает инструмент Создать пространственно сбалансированные точки.