Сжать данные файловой базы геоданных

Чтобы уменьшить требования к хранению информации, можно сжать таблицы и классы объектов файловой базы геоданных (вместе называемые в этом разделе наборами данных) в формат, предназначенный только для чтения. После сжатия скорость отображения данных и обработки запросов сопоставима со скоростью для несжатых данных. Вы можете заметить, что некоторые операции станут выполняться немного быстрее, а другие – немного медленнее.

Существует два типа сжатия, применимые к данным файловой базы геоданных: без потерь и с потерей качества. При использовании сжатия без потери качества информация не теряется независимо от системы координат и типов атрибутивных данных, содержащихся в базе классов объектов и таблиц. Все значения с плавающей точкой при этом сжатии будут сохранены. Сжатие с потерями позволяют получить на 20 процентов лучший результат для файловой базы геоданных, но значения с плавающей точкой будут изменены. Сжатие с потерей качества является хорошим вариантом в случае, если вам требуется максимальное сжатие ваших данных, точность которых не очень велика, либо вы не сильно беспокоитесь о сохранении максимальной точности своих данных, к примеру, вы выполняете сжатие географических данных масштаба 1:1 000 000 и мельче.

Сжатые данные отличаются от несжатых при редактировании: сжатый набор данных доступен только для чтения, и его нельзя отредактировать. Можно только его переименовать, изменить атрибутивные индексы и метаданные.

Сжатие идеально подходит для наборов данных, не требующих дальнейшего редактирования. Однако, при необходимости восстановления исходного формата «чтение/запись» сжатые наборы данных могут быть всегда переведены в несжатый формат.

Сжатие данных в ArcGIS Pro

Вы можете сжать базу геоданных, набор данных, отдельный класс объектов или таблицу, используя инструмент геообработки Сжать данные файловой базы геоданных и отменить сжатие посредством инструмента геообработки Отменить сжатие данных файловой базы геоданных. Оба инструмента находятся в группе инструментов Файловая база геоданных набора Управление данными.

Преимущества сжатия

Сжатые данные файловой базы геоданных занимают на диске меньше места, чем несжатые, но в то же время обеспечивают высокую производительность при отображении и обработке запросов.

Степень возможного сжатия данных классов пространственных объектов и таблиц может изменяться от незначительной до показателя, превышающего 4:1. Возможную степень сжатия определяют координаты, а также количество атрибутивных полей и их содержание.

Самым важным фактором, определяющим уровень сжатия, является число вершин, приходящихся на объект. Точечные объекты и простые линии с двумя вершинами сжимаются лучше, чем линии или полигоны с множеством вершин. Классы точечных объектов адресов или дорог с несколькими вершинами могут быть сжаты с отношением 3:1, в то время как класс объектов речной сети или данных о почвенном покрове с объектами, образованными большим количеством вершин, может быть сжат только с отношением 3:2. Объекты, состоящие из большого количества вершин, уже хранятся эффективно в несжатом формате, поэтому возможность их сжатия значительно меньше. Поля атрибутов также играют роль в определении уровня сжатия: поля с типом text и integer, а также поля с типом date сжимаются лучше, чем поля с типами float и double.

В расположенной ниже таблице сравниваются размеры файлов в сжатом и несжатом форматах. Класс пространственных объектов, который по сравнению с исходным размером был максимально сжат, – Europe places – является классом точечных объектов. Класс пространственных объектов, который по сравнению с исходным размером был сжат в минимальной степени, – Mexico roads – является классом линейных объектов, содержащим объекты, которые образованы большим количеством вершин.

Сравнение обычного и сжатого форматов

Класс пространственных объектовРазмер без сжатияРазмер со сжатиемСтепень сжатия

Europe places (61541 точечных объектов, 14 полей)

6,2 МБ

0,67 МБ

9.3

U.S. census blocks США (8205055 точечных объектов, 11 полей)

705 МБ

80 МБ

8.8

California roads (2092079 линейных объектов, 29 полей)

329 МБ

60 МБ

5.5

Europe rails (383531 линейных объектов, 12 полей)

58 МБ

9,7 МБ

6.0

Calgary addresses (285,285 point features, 8 fields)

21 МБ

6,4 МБ

3.3

Calgary buildings (319000 полигональных объектов, 9 полей)

48 МБ

20 МБ

2.4

U.S. rivers and streams (2844231 линейных объектов, 9 полей)

878 МБ

288 МБ

3.0

U.S. counties (3140 полигональных объектов, 57 полей)

1,6 МБ

0,8 МБ

2.5

Europe water (232375 полигональных объектов, 10 полей)

176 МБ

70 МБ

2.5

U.S. traffic analysis zones (166747 полигональных объектов, 10 полей)

68 МБ

35 МБ

1.9

Mexico roads (5847 линейных объектов, 7 полей)

3,5 МБ

1,6 МБ

2.2

Таблицы обычно сжимаются с отношением свыше 2:1. Таблицы обычно сжимаются с отношением, превышающим 2:1, причем повторы значений являются самым важным фактором: поля, значения которых при переходе от одной записи к другой часто не меняются, сжимаются лучше, чем поля с множеством уникальных значений. Как и в классе объектов текстовые, целочисленные поля и поля даты сживаются лучше, чем поля с плавающей точкой и поля двойной точности.

Несмотря на то, что вы можете сжимать данные любого размера, эффективнее всего использовать сжатие для больших объемов данных. Сжатие больших наборов данных или большого количества средних и небольших наборов данных может сэкономить вам значительный объем свободного дискового пространства, что может оказаться очень актуальным, если у вас имеется дефицит свободного места на диске или если вы пытаетесь уместить свои данные на один CD или DVD диск. Например, файловую базу геоданных переписи населения США размером 8,9 ГБ можно сжать до 3,4 ГБ – этого достаточно, чтобы она поместилась на DVD.

При минимизации требований к объему места на диске для хранения вы должны помнить о том, что сжатие файловой базы геоданных не является единственной находящейся в вашем расположении опцией. Если ваши данные хранятся с меньшим разрешением x,y, чем необходимо, то вы можете уменьшить объем, необходимый для хранения данных, перезагрузив данные перед сжатием с более крупным разрешением. Например, если у вас есть набор данных, хранящий по умолчанию информацию с разрешением 1/10 мм, но вы знаете, что точность данных составляет лишь 1 м, можно заново загрузить данные с метровым разрешением. Перезагрузка класса объектов зданий г. Калгари разрешения 1/10 мм в метровом разрешении уменьшит объем данных с 48 до 31 МБ. Дальнейшее сжатие класса пространственных объектов размером 31 Мб сократит размер данных до 12 МБ.

Влияние разрешения x,y на место на диске

Класс пространственных объектовРазмер без сжатияРазмер со сжатием

Calgary buildings, разрешение 0,0001 метра

48 МБ

20 МБ

Calgary buildings, разрешение 1,0 метр

31 МБ

12 МБ

Чтобы перезагрузить класс пространственных объектов с другим разрешением, вам необходимо экспортировать данные в новый класс пространственных объектов. Щелкните правой кнопкой класс объектов в дереве Каталога и выберите Экспорт > В базу геоданных (выберите команду Несколько для экспорта нескольких классов объектов одновременно). Задайте новое разрешение в диалоговом окне Параметры среды перед выполнением экспорта. Для получения более подробной информации см. Разрешение XY, Разрешение Z и Класс объектов в класс объектов.

Что вы можете сжать

Можно сжать базу геоданных, набор классов объектов, отдельный класс пространственных объектов или таблицу. При сжатии базы геоданных происходит сжатие всех классов пространственных объектов и таблиц, хранимых в ней. Точно так же, при сжатии набора классов объектов происходит сжатие всех содержащихся в нем классов пространственных объектов. Любой элемент, который не может быть сжат, будет пропущен. В представленной ниже таблице указаны элементы дерева Каталога, которые могут и не могут быть сжаты.

Данные файловой базы геоданныхМогут быть сжаты

База геоданных

Да (Все векторные классы пространственных объектов и таблицы в базе геоданных могут быть сжаты.)

Класс пространственных объектов (только отдельные классы)

Да

Набор пространственных данных

Да (Все векторные классы пространственных объектов в наборе классов объектов могут быть сжаты.)

Набор сетевых данных

Да

Набор растровых данных

Нет

Таблица

Да

Набор данных Terrain

Нет

Топология

Да

Вы не можете сжать или перевести в несжатый формат отдельный класс пространственных объектов в наборе классов объектов. Вы сжимаете и отменяете сжатие пространственного набора – то есть всех его объектов.

Ограничения при работе со сжатыми данными

Помимо возможности редактирования сжатого класса объектов или таблицы нельзя изменить следующие дополнительные свойства:

  • Информация о системе координат
  • Подтипы, атрибутивные домены и значения по умолчанию
  • Поля и их свойства
  • Представления

Единственными свойствами, которые могут быть изменены, являются псевдоним класса пространственных объектов или таблицы и атрибутивные индексы.

Сжатые наборы объектов позволяют добавлять несжатые классы объектов с использованием таких операций, как создание пустого класса объектов, копирование, вставка и импорт данных. Это приводит к появлению разнородной среды, когда некоторые классы пространственных объектов в наборе классов объектов сжаты, а некоторые – нет. Если набор классов объектов содержит и сжатые, и несжатые классы пространственных объектов, то вы не сможете редактировать несжатые классы пространственных объектов. Чтобы отредактировать класс пространственных объектов, вам придется перевести в несжатый формат все классы из набора классов объектов.

Можно сжимать классы объектов в классах отношений и топологиях. Однако для этих типов данных существуют следующие ограничения:

  • Нельзя создать топологию для сжатых классов объектов.
  • Если вы сжали одну «сторону» класса отношений, то независимо от того, когда вы это сделали, вы уже не сможете редактировать другую «сторону». Это происходит в связи с тем, что при обновлении несжатой «стороны» может потребоваться автоматическое обновление сжатой «стороны», которая хранится в формате «только для чтения».
  • Вы не можете изменять параметры топологии, если ее классы пространственных объектов сжаты.

Класс отношенийТопологияНабор сетевых данныхНабор данных Terrain

Позволяет сжимать их классы пространственных объектов

Да

Да

Да

Да

Позволяет создавать в них сжатые классы пространственных объектов

Да

Нет

Да

Да

Позволяет редактировать свойства

Да

Нет

Да

Да