Ключевые слова конфигурации для файловых баз геоданных

При создании набора данных в файловой базе геоданных вы можете выбрать ключевое слово конфигурации для настройки способа хранения данных. Каждое ключевое слово оптимизирует процесс хранения для конкретного типа данных, слегка улучшая эффективность и производительность работы. Доступно семь ключевых слов. Их нельзя настроить.

В большинстве случаев вы будете использовать ключевое слово DEFAULTS при создании класса пространственных объектов или растра в файловой базе геоданных. Ключевое слово DEFAULTS работает, как правило, отлично, за исключением тех ситуаций, когда

  • вам нужно хранить очень большой набор растровых данных, который занимает более 1 ТБ.В такой ситуации вам было бы лучше определить ключевое слово MAX_FILE_SIZE_256TB.
  • Если вы храните данные с символами не-латинского алфавита (китайский или арабский, например), укажите ключевое слово TEXT_UTF16.
  • Если вы храните наборы данных terrain в файловой базе геоданных, укажите ключевое слово GEOMETRY_OUTOFLINE.
  • Если вы храните наборы данных terrain, и там еще есть столбцы BLOB, укажите ключевое слово GEOMETRY_AND_BLOB_OUTOFLINE.
  • Если вы храните класс пространственных объектов со столбцами BLOB, к которым часто обращаетесь, укажите ключевое слово конфигурации BLOB_OUTOFLINE.

Если вы не определили никакое ключевое слово конфигурации, то будет использоваться DEFAULTS.

Данное ключевое словоВлияет на хранение данных

DEFAULTS

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF-8.

TEXT_UTF16

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF16.

MAX_FILE_SIZE_4GB

Ограничение на размер данных 4 Гб

Текст хранится в формате UTF-8.

MAX_FILE_SIZE_256TB

Сохраняет данные размером до 256 TB

Текст хранится в формате UTF-8.

GEOMETRY_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF-8.

Сохраняет атрибуты геометрии в файле отдельно от непространственных атрибутов

BLOB_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF-8.

Сохраняет атрибуты BLOB в файле отдельно от остальных атрибутов

GEOMETRY_AND_BLOB_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF-8.

Сохраняет атрибуты геометрии и BLOB в файлах отдельно от прочих атрибутов

Ключевые слова конфигурации, доступные для наборов данных в файловых базах геоданных

Хранение текста: UTF8 по сравнению с UTF16

UTF8 является самым лучшим форматом хранения в том случае, если у вас имеются текстовые данные на английском, ином западноевропейском языке или на любом другом языке, в котором используется латинский алфавит, например, польский, турецкий или индонезийский. UTF8 хранит каждый символ латинского алфавита без диакритического знака в 1 байте, а каждый символ с диакритическим знаком или другой символ, не найденный в латинском алфавите, в различном числе байт – от 2 до 6. Поскольку UTF8 хранит подавляющее большинство текстовых символов в 1 байте, его использование для этих языков требует меньше места и увеличивает производительность.

UTF16 является наиболее эффективным форматом хранения текстовых данных на языках, использующих алфавит, отличный от латинского:китайский, японский, русский, греческий или арабский. Для этих языков в данном формате на один символ приходится 2 байта. Для представления того же самого символа в формате UTF8 может потребоваться до 6 байт, что приведет к увеличению размеров данных и несколько снизит производительность в работе с данными на этих языках. Данный метод хранения текста доступен только с ключевым словом TEXT_UTF16, который имеет ограничение в размере на 1 ТБ.

MAX_FILE_SIZE_4GB

Данное ключевое слово обеспечивает несколько лучшее хранение наборов данных размером меньше 4 ГБ, чем ключевое слово DEFAULTS, хотя размеры экономии сравнительно незначительны:на каждой записи будет экономиться 1 байт, т.е. около 1 МБ для миллиона записей. Например, класс объектов всех дорог Калифорнии (2092079 записей) занимает 312 МБ при использовании ключевого слова DEFAULTS и 310 МБ при использовании ключевого слова MAX_FILE_SIZE_4GB.

Данное ключевое слово устанавливает для набора данных ограничение на максимальный размер в 4 ГБ, так что вам следует определять это ключевое слово только в том случае, если вы уверены, что класс пространственных объектов и набор растровых данных никогда не будут занимать больше 4 ГБ.

MAX_FILE_SIZE_256TB

Определение ключевого слова конфигурации MAX_FILE_SIZE_256TB позволит вам создать набор данных, который может занимать до 256 ТБ. Вы могли бы использовать это ключевое слово только для хранения очень больших наборов растровых данных.

Примечание:

Хотя файловая база геоданных сможет позволить вам хранить наборы данных таких размеров, убедитесь в том, что у вас имеется для этого достаточно места на диске.

Вложенное (In-line) хранение и связанное (out-of-line) хранение

Вложенное хранение данных означает хранение всех атрибутов объекта в одном файле или в одной виртуальной таблице файловой базы геоданных. Когда вы храните данные в связанном режиме, они будут храниться в отдельном месте.

Если все данные хранятся во вложенном состоянии, они будут загружаться в память при выполнении запросов или редактировании класса объектов. Таким образом класс объектов, который хранит большие объемы информации в атрибутах, будет занимать больше дискового пространства и потреблять больше памяти для обработки.

Атрибуты типа Geometry и BLOB потенциально могут хранить большие объемы данных. Например, если много объектов в классе объектов состоят из тысяч вершин, то возможно вам потребуется хранить информацию о геометрии объектов в связанном режиме в другом файле. Или, если данные в атрибутах занимают много дискового пространства (например, состоят из нескольких полей с текстом или больших объектов BLOB в полях атрибутов), вы, возможно, захотите хранить геометрию объектов в отдельном файле, чтобы автоматически не загружать большие объемы данных в память компьютера. Если вы храните и геометрию и данные типа BLOB в отдельных файлах, они будут загружены в память только при обращении к ним. Например, если вы выбираете объекты на карте на основе значений типа BLOB, атрибуты BLOB будут загружены в память.

Если класс объектов содержит большие объемы данных в атрибутах типа BLOB, вы можете указать ключевое слово BLOB_OUTOFLINE при создании класса объектов. Тогда атрибуты типа BLOB будут загружаться только при запросе к ним.

Примечание:

Ключевое слово GEOMETRY_AND_BLOB_OUTOFLINE всегда используется, если создаются наборы данных terrain, для улучшения скорости работы. Это делается внутри программы и невозможно изменить.