次の質問と答えによって、ArcGIS Pro におけるローカル フォルダー接続またはクラウド ストレージ コネクションからの Apache Parquet ファイルの使用に関する詳細情報を説明します。
キャッシュ
クラウド ストレージ
マッピング
共有
キャッシュ
Parquet は高度に圧縮されたストレージ形式であるため、ArcGIS Pro が作成するローカル永続キャッシュ ファイルは通常、元のファイルよりもはるかに大きくなります。
たとえば、20 MB の Parquet ファイルに 100 万のポイント レコードが格納されている Parquet ファイルの場合、キャッシュ サイズは 250 MB になります。 サイズの違いは、列の数やデータおよびエンティティー タイプなど、Parquet ファイルに含まれているデータによって異なります。
ファイルとキャッシュのサイズの差は線形ではありません。
ArcGIS Pro を閉じると、メモリー内キャッシュが削除されます。
永続キャッシュの場合、ParquetCache ディレクトリー内にあるファイルは削除できます。 このディレクトリーのデフォルトの場所は、C:\Users\<username>\AppData\Local\ESRI\Local Caches\ParquetCacheV1 です。 キャッシュ ファイルを削除すると、「キャッシュした Parquet データ」で説明されている ArcGIS Pro がローカル キャッシュを作成する方法で、ArcGIS Pro は Parquet ファイルに次回アクセスしたときにキャッシュ ファイルを再作成します。
または、ローカル永続キャッシュを削除してから、[パーケット キャッシュの作成 (Create Parquet Cache)] ジオプロセシング ツールまたは CreateParquetCache ArcPy 関数を使用して必要なキャッシュを再作成することもできます。
クラウド ストレージ
クラウド ストレージ コネクションは、Amazon Simple Storage Service (S3)、Google Cloud Storage、Microsoft Azure Blob Storage、または Microsoft Azure Data Lake Storage Gen2 に作成できます。
[クラウド コネクション ファイルの作成 (Create Cloud Connection File)] ジオプロセシング ツールのドキュメントには、サポートされている認証情報タイプがリストされています。
IAM ロールには、最低でも次のポリシーが必要です。
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "<statement-id>",
"Effect": "Allow",
"Action": [
"s3:ListBucket",
"s3:GetObject",
"s3:GetObjectVersion"
],
"Resource": [
"arn:aws:s3:::<cache-bucket-name>/*",
"arn:aws:s3:::<cache-bucket-name>"
]
}
]
}大なり小なり記号 (<>) で囲まれた値を、IAM ロールとバケットに固有の値に置き換えます。
上記のポリシー ドキュメント形式のバージョンは、2012-10-17 です。 このバージョン日付を変更する場合は、ドキュメント形式も変更が必要になることがあります。
マッピング
[XY テーブル → ポイント (XY Table To Point)] ジオプロセシング ツールを、Parquet のマップ レイヤーを入力として実行して、サポートされている出力形式でフィーチャクラスを作成します。 次に、その出力フィーチャクラスをマップまたはシーンに追加します。
共有
はい。すべてのデータをコピーする、ホスト Web レイヤーを公開できます。 公開できる Web レイヤーのタイプのリストについては、「ArcGIS Pro の Parquet」をご参照ください。