ファイル ジオデータベースの圧縮

格納要件を軽減するために、テーブルおよびベクター ファイル ジオデータベース フィーチャクラス (データセットと総称) を読み取り専用形式に圧縮できます。 圧縮したときの表示やクエリのパフォーマンスは、非圧縮データとほぼ同じです。 操作によってはパフォーマンスが若干向上することもあれば、処理が若干遅くなることもあります。

ファイル ジオデータベース データに適用できる圧縮のタイプには、可逆と非可逆の 2 種類があります。 可逆圧縮では、データを圧縮する際に、フィーチャクラスまたはテーブルに含まれている座標系または属性データの種類にかかわらず、情報は失われず、浮動小数点値もすべて維持されます。 非可逆圧縮では、ファイル ジオデータベース データの圧縮率が最大 20% 向上しますが、浮動小数点値が変化します。 非可逆圧縮が適切な選択肢になるのは、最大限の圧縮が必要で、データが特に正確ではない場合や、1:1000000 以上の縮尺でデータを圧縮する場合のように、データの精度を完全に維持する必要がない場合です。

圧縮されたデータセットと非圧縮データセットの違いは、編集にあります。圧縮されたデータセットは読み取り専用なので、その名前の変更または属性インデックスおよびメタデータの修正を除き、どのような方法でも編集または変更することはできません。

圧縮は、それ以上編集する必要のないデータセットに最適です。 ただし、必要であれば、圧縮されたデータセットを元の非圧縮状態 (読み取り/書き込み形式) にいつでも戻すことができます。

ArcGIS Pro でのデータの圧縮

ジオデータベース、フィーチャ データセット、スタンドアロン フィーチャクラス、またはテーブルは、[ファイル ジオデータベースの圧縮 (Compress File Geodatabase Data)] ジオプロセシング ツールを使用して圧縮し、[ファイル ジオデータベースの圧縮解除 (Uncompress File Geodatabase Data)] ジオプロセシング ツールを使用して圧縮解除することができます。 どちらのツールも [データ管理] ツールボックスの [ファイル ジオデータベース] ツールセットにあります。

圧縮の利点

圧縮されたファイル ジオデータベースは、非圧縮データよりもディスク領域を消費しないにもかかわらず、表示や検索のパフォーマンスは維持されます。

フィーチャクラスとテーブルで可能な圧縮率は、ほんのわずかな圧縮から 4 対 1 を超えるものまで幅があります。 どれくらいの圧縮が可能であるかは、座標の構成や、属性フィールドの数と属性値の内容によります。

フィーチャクラスの圧縮率を決定する最も重要な要素は、フィーチャあたりの頂点の平均点数です。 ポイントとシンプルな頂点 2 つのラインでは、多くの頂点を持つラインやポリゴンよりも、よい圧縮率が得られます。 たとえば、住所座標のポイントや頂点の数が少ない道路のフィーチャクラスが 3 対 1 の比率で圧縮されるとすれば、頂点の数が多い河川や土壌データのフィーチャクラスは 3 対 2 の比率でしか圧縮されないなどの場合があります。 頂点の数が多いフィーチャは、非圧縮状態ですでに効率的に格納されており、結果として、圧縮の効果はあまり期待できません。 属性フィールドも、圧縮率を決定する 1 つの要因となります。テキスト、整数、日付フィールドは、単精度や倍精度の浮動小数点数のフィールドよりも圧縮することができます。

次の例は、非圧縮形式と圧縮形式のファイル サイズを比較したものです。 元のサイズからの大幅な圧縮を達成したフィーチャクラス Europe places は、ポイント フィーチャクラスです。 最も圧縮率の低かったフィーチャクラス Mexico roads は、フィーチャあたりの頂点の数が多いライン フィーチャクラスです。

標準形式と圧縮形式の比較

フィーチャクラス圧縮解除後のサイズ圧縮サイズ圧縮率

Europe places (61,541 ポイント フィーチャ、14 フィールド)

6.2 MB

0.67 MB

9.3

U.S. census blocks (8,205,055 ポイント フィーチャ、11 フィールド)

705 MB

80 MB

8.8

California roads (2,092,079 ライン フィーチャ、29 フィールド)

329 MB

60 MB

5.5

Europe rails (383,531 ライン フィーチャ、12 フィールド)

58 MB

9.7 MB

6.0

Calgary addresses (285,285 ポイント フィーチャ、8 フィールド)

21 MB

6.4 MB

3.3

Calgary buildings (319,000 ポリゴン フィーチャ、9 フィールド)

48 MB

20 MB

2.4

U.S. rivers and streams (2,844,231 ライン フィーチャ、9 フィールド)

878 MB

288 MB

3.0

U.S. counties (3,140 ポリゴン フィーチャ、57 フィールド)

1.6 MB

0.8 MB

2.5

Europe water (232,375 ポリゴン フィーチャ、10 フィールド)

176 MB

70 MB

2.5

U.S. traffic analysis zones (166,747 ポリゴン フィーチャ、10 フィールド)

68 MB

35 MB

1.9

Mexico roads (5,847 ライン フィーチャ、7 フィールド)

3.5 MB

1.6 MB

2.2

通常、テーブルは 2 対 1 を超える比率で圧縮されます。 圧縮率において冗長性は最も重要な要素です。レコード間であまり変化しない値を持つフィールドは、多くの一意な値を持つフィールドよりも圧縮されます。 フィーチャクラスと同様に、テキスト、整数、日付フィールドは、単精度や倍精度の浮動小数点数のフィールドよりも圧縮されます。

どのようなサイズのデータでも圧縮を行うことが可能ですが、圧縮が最も効果的なのは、大量のデータを圧縮した場合です。 大規模なデータセットを圧縮したり、中規模から小規模なデータセットを大量に圧縮すると、格納領域を大幅に節約することができ、ディスク領域が不足している場合や、データを CD/DVD に収録しようとしている場合に役立ちます。 たとえば、U.S. Census (国勢調査) データが格納された 8.9GB のファイル ジオデータベースを、DVD への収録が可能な 3.4GB に圧縮することができます。

ただし、格納要件を最小限に抑えたい場合は、ファイル ジオデータベースの圧縮が唯一のオプションではありません。 データが必要以上に高い XY 座標精度で格納されている場合は、データを圧縮する前に解像度の値を低く設定してデータをジオデータベースに再格納すると、格納要件を抑えることができます。 たとえば、実際に必要なデータ精度は 1 メートルであるデータが、デフォルトの解像度 1/10 ミリメートルで格納されているような場合は、データを 1 メートルの解像度で再格納します。 例を挙げると、解像度が 1/10 ミリメートルの Calgary buildings フィーチャクラスを 1 メートルの解像度で再格納すると、格納サイズが 48 MB から 31 MB に減ります。 31MB のフィーチャクラスを圧縮すると、データのサイズはさらに 12MB に減ります。

ストレージへの XY 座標精度の効果

フィーチャクラス圧縮解除後のサイズ圧縮サイズ

Calgary buildings (0.0001 メートルの解像度)

48 MB

20 MB

Calgary buildings (1.0 メートルの解像度)

31 MB

12 MB

フィーチャクラスを別の解像度で再格納するには、データを新しいフィーチャクラスにエクスポートします。 [カタログ] ウィンドウでフィーチャクラスを右クリックし、[エクスポート] > [ジオデータベースへ変換] の順に選択します (複数のフィーチャクラスに一度にエクスポートする場合は、[複数] コマンドを選択します)。 エクスポートの前に、[環境] ダイアログ ボックスで新しい解像度を指定します。 詳細については、「XY 座標精度」および「Z 座標精度」をご参照ください。

圧縮が可能な状況

圧縮の対象になるのは、ジオデータベース、フィーチャ データセット、スタンドアロン フィーチャクラス、またはテーブルです。 ジオデータベースを圧縮すると、そのジオデータベース内のすべてのフィーチャクラスとテーブルが圧縮されます。 フィーチャ データセットを圧縮すると、そのデータセットに属するすべてのフィーチャクラスが圧縮されます。 圧縮できないアイテムはスキップされます。 次に、圧縮可能なアイテムと圧縮不可能なアイテムについて説明します。

ファイル ジオデータベース データ圧縮可能かどうか

ジオデータベース

可 (ジオデータベース内のすべてのベクター フィーチャクラスとテーブルが圧縮される)

カタログ データセット

Yes

フィーチャクラス (スタンドアロンのみ)

Yes

フィーチャ データセット

可 (フィーチャ データセット内のすべてのベクター フィーチャクラスが圧縮される)

モザイク データセット

可 (データセットは圧縮されるが、データセットのリンク先のモザイク処理された画像ファイルは圧縮されない)

ネットワーク データセット

Yes

方向付き画像データセット

可 (データセットは圧縮されるが、データセットのリンク先の画像ファイルは圧縮されない)

パーセル ファブリック

Yes

ラスター データセット

No

テーブル

Yes

テレイン

No

トポロジ

Yes

トレース ネットワーク

Yes

軌道データセット

Yes

ユーティリティ ネットワーク

Yes

注意:

  • 上記のいずれかのデータセット タイプに、次に示すフィールド データ タイプが 1 つ以上含まれている場合、そのデータセットは圧縮されません。
    • Big integer
    • 日付のみ
    • 時間のみ
    • タイムスタンプ オフセット
    • 64 ビット オブジェクト ID
  • フィーチャ データセットのフィーチャクラスを個別に圧縮/圧縮解除することはできません。 フィーチャ データセットを圧縮/圧縮解除します。フィーチャ データセット内のすべてのオブジェクトが圧縮/圧縮解除されます。

圧縮データを操作するときの制限

データを圧縮した場合、圧縮されたフィーチャクラスやテーブルの編集が不可能であることに加えて、次のプロパティを変更できません。

  • 座標系情報
  • サブタイプ、属性ドメイン、デフォルト値
  • フィールドとそれらのプロパティ
  • リプレゼンテーション

変更可能なプロパティは、フィーチャクラスまたはテーブルのエイリアスと属性インデックスだけです。

圧縮されたフィーチャ データセットには、空のフィーチャクラスの作成、コピーと貼り付け、インポートなどの操作を通じて、非圧縮フィーチャクラスを追加することができます。 これにより、フィーチャ データセット内に、一部の圧縮されたフィーチャクラスと、それ以外の圧縮されていないフィーチャクラスが混在することになります。 フィーチャ データセット内に圧縮されたフィーチャクラスと非圧縮フィーチャクラスの両方が含まれている場合、非圧縮フィーチャクラスを編集することはできません。 フィーチャ データセット内のフィーチャクラスを編集するには、フィーチャ データセット内のすべてのフィーチャクラスを圧縮解除しなければなりません。

リレーションシップ クラスまたはトポロジ内のフィーチャクラスを圧縮できます。 ただし、これらのクラスに関する制限がいくつかあります。

  • 圧縮されたフィーチャクラスからトポロジを作成することはできません。
  • リレーションシップ クラスによって関連付けられたデータセットの一方だけを圧縮した場合、もう一方のデータセットも編集をすることは不可能になります。 これは、圧縮されていないデータセットを更新した場合に、読み取り専用の圧縮されたデータセットの自動更新が必要になる可能性があるためです。
  • フィーチャクラスが圧縮されている場合、トポロジのプロパティを変更することはできません。

関連トピック