Доступно с лицензией Geostatistical Analyst.
Существует множество факторов, принимаемых во внимание при разработке сети выборки. В частности, пространственно сбалансированные данные строятся для повышения эффективности оценочных значений путем максимизации пространственных зависимостей между опорными местоположениями. Также пространственно сбалансированные проекты приводят к более эффективному отбору за счет большего количества информации на элемент отбора, поскольку опорные точки равномерно распределены по всей совокупности. Заметьте, что данные комментарии относятся к статистической эффективности, являющейся одним из нескольких критериев, которые можно применить к разработке выборок.
Алгоритм создания пространственно сбалансированных точек был предложен Дэвидом Тиболдом и др. и частично основан на методе, разработанном Доном Стивенсом и Энтони Олсеном. Метод основан на следующем:
- Алгоритм Обратно рандомизированного квадратно-рекурсивного растра (RRQRR) используется для отображения двумерного пространства в одномерном пространстве, где последовательные опорные точки формируют пространственно сбалансированный отбор данных.
- Для обработки изменений в интенсивности отбора используются неравные вероятности включения. Вероятности включения являются относительными значениями (между 0 и 1 включительно), которые определяют вероятного того, что будет выбрано это местоположение (ячейка растра), а не другое.
Входные данные для инструмента — это растр, который одновременно определяет следующие значения:
- максимальный обрамляющий прямоугольник для проведения анализа;
- вероятности включения (местоположения в изучаемой области имеют ненулевые, большие 0, вероятности включения);
- Рамка отбора (изучаемая область);
- самое высокое разрешение, при котором будут созданы местоположения выборки.
Результирующий пространственно сбалансированный проект обладает следующими свойствами:
- Низкая дисперсия в области полигонов Вороного, созданных из опорных точек. Другим словами, каждая опорная точка представляет примерно одинаковую долю общей изучаемой области.
- Гибкость, то есть изменения по времени, доступность участков выборки, бюджет и т. д. могут использоваться для обновления опорных местоположений. Для этого требуется, чтобы процесс рандомизации, упомянутый выше, был управляемым и повторяемым. Этого можно достичь с помощью установки начального значения для генератора случайных чисел. Начальное значение, равное 0, во время работы инструмента выдаст неповторяемые (новые) выходные данные. Использование постоянного начального значения, большего 0, выдаст повторяемые результаты и может использоваться для повышения или уменьшения количества опорных точек без нарушения пространственного баланса проекта.
Для получения лучших результатов Тиболд и другие рекомендуют использовать количество точек меньше 1 % от всех возможных опорных местоположений в изучаемой области
Ресурсы
- Stevens, D.L., and A.R. Olsen. 2004. "Spatially balanced sampling of natural resources." Journal of the American Statistical Association 99 (465): 262–278.
- Theobald, D.M., D.L. Stevens, Jr., D. White, N.S. Urquhart, A.R. Olsen, and J.B. Norman. 2007. "Using GIS to Generate Spatially Balanced Random Survey Designs for Natural Resource Applications." Environmental Management 40: 134–146.
- Warrick, A.W., and D.E. Myers. 1987. "Optimization of sampling locations for variogram calculations." Water Resources Research 23 (3): 496–500.