格納要件を軽減するために、テーブルおよびベクター ファイル ジオデータベース フィーチャクラス (このトピックでは、まとめてデータセットと呼びます) を読み取り専用形式に圧縮できます。 圧縮したときの表示やクエリのパフォーマンスは、非圧縮データとほぼ同じです。 操作によってはパフォーマンスが若干向上することもあれば、処理が若干遅くなることもあります。
ファイル ジオデータベース データに適用できる圧縮のタイプには、可逆と非可逆の 2 種類があります。 可逆圧縮では、データを圧縮する際に、フィーチャクラスまたはテーブルに含まれている座標系または属性データの種類にかかわらず、情報は失われず、浮動小数点値もすべて維持されます。 非可逆圧縮では、ファイル ジオデータベース データの圧縮率が最大 20% 向上しますが、浮動小数点値が変化します。 非可逆圧縮が適切な選択肢になるのは、最大限の圧縮が必要で、データが特に正確ではない場合や、1:1000000 以上の縮尺でデータを圧縮する場合のように、データの精度を完全に維持する必要がない場合です。
圧縮されたデータセットと非圧縮データセットの違いは、編集にあります。圧縮されたデータセットは読み取り専用なので、その名前の変更または属性インデックスおよびメタデータの修正を除き、どのような方法でも編集または変更することはできません。
圧縮は、それ以上編集する必要のないデータセットに最適です。 ただし、必要であれば、圧縮されたデータセットを元の非圧縮状態 (読み取り/書き込み形式) にいつでも戻すことができます。
ArcGIS Pro でのデータの圧縮
ジオデータベース、フィーチャ データセット、スタンドアロン フィーチャクラス、またはテーブルは、[ファイル ジオデータベースの圧縮 (Compress File Geodatabase Data)] ジオプロセシング ツールを使用して圧縮し、[ファイル ジオデータベースの圧縮解除 (Uncompress File Geodatabase Data)] ジオプロセシング ツールを使用して圧縮解除することができます。 どちらのツールも [データ管理] ツールボックスの [ファイル ジオデータベース] ツールセットにあります。
圧縮の利点
圧縮されたファイル ジオデータベースは、非圧縮データよりもディスク領域を消費しないにもかかわらず、表示や検索のパフォーマンスは維持されます。
フィーチャクラスとテーブルで可能な圧縮率は、ほんのわずかな圧縮から 4 対 1 を超えるものまで幅があります。 どれくらいの圧縮が可能であるかは、座標の構成や、属性フィールドの数と属性値の内容によります。
フィーチャクラスの圧縮率を決定する最も重要な要素は、フィーチャあたりの頂点の平均点数です。 ポイントとシンプルな頂点 2 つのラインでは、多くの頂点を持つラインやポリゴンよりも、よい圧縮率が得られます。 たとえば、住所座標のポイントや頂点の数が少ない道路のフィーチャクラスが 3 対 1 の比率で圧縮されるとすれば、頂点の数が多い河川や土壌データのフィーチャクラスは 3 対 2 の比率でしか圧縮されないなどの場合があります。 頂点の数が多いフィーチャは、非圧縮状態ですでに効率的に格納されており、結果として、圧縮の効果はあまり期待できません。 属性フィールドも、圧縮率を決定する 1 つの要因となります。テキスト、整数、日付フィールドは、単精度や倍精度の浮動小数点数のフィールドよりも圧縮することができます。
次の例は、非圧縮形式と圧縮形式のファイル サイズを比較したものです。 元のサイズからの大幅な圧縮を達成したフィーチャクラス Europe places は、ポイント フィーチャクラスです。 最も圧縮率の低かったフィーチャクラス Mexico roads は、フィーチャあたりの頂点の数が多いライン フィーチャクラスです。
標準形式と圧縮形式の比較
フィーチャクラス | 圧縮解除後のサイズ | 圧縮サイズ | 圧縮率 |
---|---|---|---|
Europe places (61,541 ポイント フィーチャ、14 フィールド) | 6.2 MB | 0.67 MB | 9.3 |
U.S. census blocks (8,205,055 ポイント フィーチャ、11 フィールド) | 705 MB | 80 MB | 8.8 |
California roads (2,092,079 ライン フィーチャ、29 フィールド) | 329 MB | 60 MB | 5.5 |
Europe rails (383,531 ライン フィーチャ、12 フィールド) | 58 MB | 9.7 MB | 6.0 |
Calgary addresses (285,285 ポイント フィーチャ、8 フィールド) | 21 MB | 6.4 MB | 3.3 |
Calgary buildings (319,000 ポリゴン フィーチャ、9 フィールド) | 48 MB | 20 MB | 2.4 |
U.S. rivers and streams (2,844,231 ライン フィーチャ、9 フィールド) | 878 MB | 288 MB | 3.0 |
U.S. counties (3,140 ポリゴン フィーチャ、57 フィールド) | 1.6 MB | 0.8 MB | 2.5 |
Europe water (232,375 ポリゴン フィーチャ、10 フィールド) | 176 MB | 70 MB | 2.5 |
U.S. traffic analysis zones (166,747 ポリゴン フィーチャ、10 フィールド) | 68 MB | 35 MB | 1.9 |
Mexico roads (5,847 ライン フィーチャ、7 フィールド) | 3.5 MB | 1.6 MB | 2.2 |
通常、テーブルは 2 対 1 を超える比率で圧縮されます。 圧縮率において冗長性は最も重要な要素です。レコード間であまり変化しない値を持つフィールドは、多くの一意な値を持つフィールドよりも圧縮されます。 フィーチャクラスと同様に、テキスト、整数、日付フィールドは、単精度や倍精度の浮動小数点数のフィールドよりも圧縮されます。
どのようなサイズのデータでも圧縮を行うことが可能ですが、圧縮が最も効果的なのは、大量のデータを圧縮した場合です。 大規模なデータセットを圧縮したり、中規模から小規模なデータセットを大量に圧縮すると、格納領域を大幅に節約することができ、ディスク領域が不足している場合や、データを CD/DVD に収録しようとしている場合に役立ちます。 たとえば、U.S. Census (国勢調査) データが格納された 8.9GB のファイル ジオデータベースを、DVD への収録が可能な 3.4GB に圧縮することができます。
ただし、格納要件を最小限に抑えたい場合は、ファイル ジオデータベースの圧縮が唯一のオプションではありません。 データが必要以上に高い XY 座標精度で格納されている場合は、データを圧縮する前に解像度の値を低く設定してデータをジオデータベースに再格納すると、格納要件を抑えることができます。 たとえば、実際に必要なデータ精度は 1 メートルであるデータが、デフォルトの解像度 1/10 ミリメートルで格納されているような場合は、データを 1 メートルの解像度で再格納します。 例を挙げると、解像度が 1/10 ミリメートルの Calgary buildings フィーチャクラスを 1 メートルの解像度で再格納すると、格納サイズが 48 MB から 31 MB に減ります。 31MB のフィーチャクラスを圧縮すると、データのサイズはさらに 12MB に減ります。
ストレージへの XY 座標精度の効果
フィーチャクラス | 圧縮解除後のサイズ | 圧縮サイズ |
---|---|---|
Calgary buildings (0.0001 メートルの解像度) | 48 MB | 20 MB |
Calgary buildings (1.0 メートルの解像度) | 31 MB | 12 MB |
フィーチャクラスを別の解像度で再格納するには、データを新しいフィーチャクラスにエクスポートします。 カタログ ウィンドウでフィーチャクラスを右クリックし、[エクスポート] > [ジオデータベースへ変換] の順に選択します (複数のフィーチャクラスに一度にエクスポートする場合は、[複数] コマンドを選択します)。 エクスポートの前に、[環境] ダイアログ ボックスで新しい解像度を指定します。 詳細については、「XY 座標精度」および「Z 座標精度」をご参照ください。
圧縮が可能な状況
圧縮の対象になるのは、ジオデータベース、フィーチャ データセット、スタンドアロン フィーチャクラス、またはテーブルです。 ジオデータベースを圧縮すると、そのジオデータベース内のすべてのフィーチャクラスとテーブルが圧縮されます。 フィーチャ データセットを圧縮すると、そのデータセットに属するすべてのフィーチャクラスが圧縮されます。 圧縮できないアイテムはスキップされます。 次に、カタログ ツリーのアイテムのうち、圧縮可能なアイテムと圧縮不可能なアイテムをまとめます。
ファイル ジオデータベース データ | 圧縮可能かどうか |
---|---|
ジオデータベース | 可 (ジオデータベース内のすべてのベクター フィーチャクラスとテーブルが圧縮される) |
フィーチャクラス (スタンドアロンのみ) |
はい |
フィーチャ データセット |
可 (フィーチャ データセット内のすべてのベクター フィーチャクラスが圧縮される) |
ネットワーク データセット | はい |
ラスター データセット |
No |
テーブル |
はい |
テレイン | No |
トポロジ | はい |
フィーチャ データセットのフィーチャクラスを個別に圧縮/圧縮解除することはできません。 フィーチャ データセットを圧縮/圧縮解除します。フィーチャ データセット内のすべてのオブジェクトが圧縮/圧縮解除されます。
圧縮データを操作するときの制限
データを圧縮した場合、圧縮されたフィーチャクラスやテーブルの編集が不可能であることに加えて、次のプロパティを変更できません。
- 座標系情報
- サブタイプ、属性ドメイン、デフォルト値
- フィールドとそれらのプロパティ
- リプレゼンテーション
変更可能なプロパティは、フィーチャクラスまたはテーブルのエイリアスと属性インデックスだけです。
圧縮されたフィーチャ データセットには、空のフィーチャクラスの作成、コピーと貼り付け、インポートなどの操作を通じて、非圧縮フィーチャクラスを追加することができます。 これにより、フィーチャ データセット内に、一部の圧縮されたフィーチャクラスと、それ以外の圧縮されていないフィーチャクラスが混在することになります。 フィーチャ データセット内に圧縮されたフィーチャクラスと非圧縮フィーチャクラスの両方が含まれている場合、非圧縮フィーチャクラスを編集することはできません。 フィーチャ データセット内のフィーチャクラスを編集するには、フィーチャ データセット内のすべてのフィーチャクラスを圧縮解除しなければなりません。
リレーションシップ クラスまたはトポロジ内のフィーチャクラスを圧縮できます。 ただし、これらのクラスに関する制限がいくつかあります。
- 圧縮されたフィーチャクラスからトポロジを作成することはできません。
- リレーションシップ クラスによって関連付けられたデータセットの一方だけを圧縮した場合、もう一方のデータセットも編集をすることは不可能になります。 これは、圧縮されていないデータセットを更新した場合に、読み取り専用の圧縮されたデータセットの自動更新が必要になる可能性があるためです。
- フィーチャクラスが圧縮されている場合、トポロジのプロパティを変更することはできません。
リレーションシップ クラス | トポロジ | ネットワーク データセット | テレイン | |
---|---|---|---|---|
構成しているフィーチャクラスの圧縮 | はい | はい |
はい | はい |
圧縮されたフィーチャクラスからの作成 | はい | No |
はい | はい |
プロパティの編集 | はい | No |
はい | はい |