概要
既存の BDC (ビッグ データ コネクション) を更新し、ソースの位置に追加された新しいデータセットを登録します。
使用法
このツールには BDC が必要です。BDC を作成するには、[ビッグ データ コネクションの作成 (Create Big Data Connection)] ツールを使用します。
このツールは、既存のビック データ コネクションに 1 つ以上の新しいデータセットを追加するために使用します。また、このツールは [ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] ツールを使用して削除されたデータセットを再登録します。このツールは、次のような状況で使用します。
- データのフォルダーを既存の BDC ソース フォルダーからコピーした後で、BDC 内のデータセットとして表現する。
- [ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] ツールを使用した後で、削除されたデータセットを BDC に戻す。
このツールは、[ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] ツールを使用して編集された既存のデータセット プロパティは更新しません。変更されたプロパティはすべて維持されます。推奨されるワークフローには次のシナリオがあります。
- 既存のソース データセットのスキーマを変更した - [ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] ツールを使用してフィールドを変更します。また、[ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] ツールを使用してデータセットを削除すこともできます。BDC データセットへの変更を維持する必要がない場合は、[ビッグ データ コネクションの更新 (Refresh Big Data Connection)] ツールも使用できます。
- 既存のデータセットに新しいファイルを追加した場合 - それ以上の手順は必要ありません。BDC データを分析するためジオプロセシング ツールを実行したとき、BDC データセットのすべてのファイルが分析に含まれます。
- 既存のデータセットを削除した場合 - [ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] ツールを使用して BDC からデータセットを削除します。
ツールのメッセージには、見つかったデータベースとそのステータスに関する次の情報が含まれています。
- スキップ - 既存のすべてのデータセットは更新時にスキップされ、そのままの状態に維持されました。
- 成功 - 新しいデータセットが見つかり、BDC に追加されました。
- 失敗 - このデータセットは BDC に正しく追加されませんでした。
BDC 内のデータセットを探しているとき、次の 2 つの問題が起きることがあります:
- 予期していたデータセットが見当たらない。この場合、サブフォルダーを含むソース フォルダーとして指定したパスが正しく、データ タイプをサポートしていることを確認します。
- 1 つ以上のデータセットが登録できない。データセットを登録できない場合、次の点を確認します。
問題 解決策 例 データセットが予期した形式ではない。
ファイルを開き、予期した形式であるか確認します。データが正しく構成されていない場合、更新して再度登録します。
*.csv ファイルにはデータについて数行の記述とサマリーがあるのみで、残りは空白行となっています。
フォルダー内にあるデータセットのスキーマが一致しない。
データセット フォルダー内のファイルはすべて同じスキーマを持つ必要があります。ファイルを開き、スキーマを比較します。一致しないスキーマがあれば削除し、データセットを再度登録します。
ある *.csv ファイルは 10 個のフィールドがあり、別のファイルは 8 個のフィールドがある。
フォルダー内にあるデータセットのファイル タイプが一致しない。
データセット フォルダー内のファイルはすべて同じエクステンション (ファイル タイプ) である必要があります。データ ソースがある場所のファイル タイプを確認し、適切でないファイルは削除または移動します。
シェープファイルのデータセットがパーケット ファイルと同じフォルダーにある。
認識されないフィールド形式がある。
ORC やパーケットが予期しない形式の場合に起こることがあります。有効なフィールド形式を使用してください。
不明なフィールド形式のパーケット ファイルがある。
BDC を更新したら、[データセットの記述 (Describe Dataset)] ツールを使用して、更新されたデータセットが期待するように表示されることを確認します。
[ビッグ データ コネクションの更新 (Refresh Big Data Connection)] ツールは、新しいデータセットを識別します。BDC の変更には、次のツールも使用できます。
- [ビッグ データ コネクションからデータセットをコピー (Copy Dataset From Big Data Connection)] - BDC からフィーチャクラスにデータセットをコピーします。
- [ビッグ データ コネクションからデータセットを複製 (Duplicate Dataset From Big Data Connection)] - 既存の BDC データセットのビューを作成します。
- [ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] - データセットを BDC から削除します。
- [ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] - 個々の BDC データセットのプロパティを変更します。
- [ビッグ データ コネクションからデータセットをプレビュー (Preview Dataset From Big Data Connection)] - データセットのフィーチャが正しく登録していることを確認するため、最初の 10 のフィーチャをプレビューします。
- [データセットの記述 (Describe Dataset)] - データセットが期待するように表示されることを確認します。
ジオプロセシング ツールは、Spark を活用しています。ビッグ データ コネクションとその使用方法の詳細については、「「ビッグ データ コネクション」をご参照ください。
構文
arcpy.gapro.RefreshBDC(bdc_file, {visible_geometry}, {visible_time})
パラメーター | 説明 | データ タイプ |
bdc_file | 更新される BDC ファイル。 | File |
visible_geometry (オプション) | BDC ファイルを他のジオプロセシング ツールで使用するとき、ジオメトリを識別するため使用されるフィールドを分析に含める (表示) かどうかを指定します。ジオメトリ フィールドが非表示のときでも、ジオメトリはデータセットに適用されます。ジオメトリの表示設定は、BDC で変更できます。
| Boolean |
visible_time (オプション) | BDC ファイルを他のジオプロセシング ツールで使用するとき、時間を示すフィールドを分析に含める (表示) かどうかを指定します。時間フィールドが非表示のときでも、時間はデータセットに適用されます。時間の表示設定は、BDC で変更できます。
| Boolean |
派生した出力
名前 | 説明 | データ タイプ |
updated_bdc | 更新されたデータセットを含む入力 *.bdc ファイル。 | ファイル |
コードのサンプル
次の Python スクリプトは、RefreshBDC 関数の使用方法を示しています。
# Name: RefreshBDC.py
# Description: Refreshes a big data connection to automatically discover datasets that
# have been added.
#
# Requirements: ArcGIS Pro Advanced License
# Import system modules
import arcpy
# Set local variables
bdcFile = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc"
# Execute Refresh Big Data Connection
arcpy.gapro.refreshBDC(bdcFile)
環境
ライセンス情報
- Basic: いいえ
- Standard: いいえ
- Advanced: はい