Доступно с лицензией Geostatistical Analyst.
В этой главе подробно описывается генерализованный рабочий процесс для геостатических исследований и объясняются его основные шаги. Как уже упоминалось в главе Что такое геостатистика, геостатистика – это класс статистических данных, использующихся для анализа и прогнозирования значений, связанных с пространственным или пространственно-временным явлением. Geostatistical Analyst предоставляет набор инструментов, позволяющих создавать модели, использующие эти пространственные координаты. Эти модели могут быть применены в широком ряде сценариев, обычно они используются для интерполяции значений внеопорных местоположениях и измерения неопределенности этой интерполяции.
Первый шаг, как и почти в любом исследовании, – это тщательное изучение данных. С него обычно начинается картографирование набора данных с использованием классификации и цветовой схемы, которая позволяет четко визуализировать важные характеристики набора данных, например, значительный рост значений данных от севера к югу или смешение высоких и низких значений без определенного порядка (возможно, как знак того, что данные собирались на масштабе, который не показывает пространственной корреляции).
Вторая стадия – это построение геостатистической модели. Этот процесс может включать несколько шагов в зависимости от целей изучения (то есть типы информации, которую предположительно предоставляет модель) и от характеристик набора данных, которые считались достаточно важными для включения. На этой стадии информация, собранная во время тщательного исследования набора данных, и первичные знания о явлении, определяют уровень сложности модели и степень точности интерполируемых значений и мер неопределенности. На рисунке выше построение модели может включать предварительную обработку данных для удаления пространственных трендов, которые моделируются отдельно и добавляются обратно на финальном шаге процесса интерполяции. Вы можете также включить преобразование данных для большего соответствия гауссову распределению (требуется для некоторых методов и выходных моделей). Тогда как большое количество информации можно получить, тщательно исследуя набор данных, тем не менее важно включить любые сведения, которые у вас могут быть об этом явлении. Разработчик не может полагаться только на набор данных, чтобы показать все важные характеристики. Те характеристики, которые не отобразятся, все еще могут быть включены в модель путем настройки значений параметров для отображения ожидаемого итога. Очень важно, чтобы модель была реалистичной, насколько это возможно, для точного представления интерполируемых значений и связанных с ними неопределенностей в качестве характеристики реального явления.
Кроме предварительной обработки данных, в наборе данных может быть необходимо смоделировать пространственную структуру (пространственную корреляцию). Некоторые методы, например, кригинг, требуют тщательного моделирования с использованием функций вариограммы или ковариации (см. Функции вариограммы и ковариации), тогда как другие методы, такие как метод обратных взвешенных расстояний, опираются только на предполагаемую степень пространственной структуры, информацию о которой проектировщик должен предоставить на основе предварительных сведений об явлении.
Итоговым компонентом модели является поиск стратегии. Стратегия определяет, как много точек данных будет использоваться для вычисления значения для неопорного местоположения. Также можно задать их пространственную конфигурацию (положение относительно друг друга и неопорного местоположения). Оба фактора влияют на интерполируемое значение и связанную с ним неопределенность. Для многих методов задаётся эллипс поиска наряду с количеством секторов эллипса и количеством точек, взятых из каждого сектора для построения прогноза (см. Окрестности поиска).
После того как модель будет полностью задана, она будет использована вместе с набором данных для создания интерполируемых значений для всех неопорных местоположений, находящихся в области интереса. Итогом обычно является создание карты, показывающей значения моделируемой переменной. Итог выпадающих значений может быть исследован на этой стадии, поскольку эти значения, возможно, изменят значения параметра модели, и таким образом изменится интерполяция карты. В зависимости от метода интерполяции, также можно использовать похожую модель для вычисления мер неопределенности интерполируемых значений. Не все модели имеют эту возможность, поэтому важно вначале задать, необходимы ли измерения неопределенности. Это в свою очередь определит, какая из моделей является подходящей (см. Дерево классификации).
Поскольку используются все типы моделирования, результат моделирования необходимо проверить, то есть убедиться, что интерполируемые значения и связанные с ними меры неопределенности являются значимыми и соответствуют ожиданиям.
После построения соответствующей модели, ее настройки и проверки результата, полученные результаты могут быть использованы в анализе рисков и принятия решений.