ビッグ データ コネクション (BDC) を構成、視覚化し、解析に使用することができます。
BDC の使用
データを構成したら、以下を実行できます。
- BDC の設定
- BDC データセットの可視化
- BDC データセットを解析で使用
BDC の設定
まず BDC を作成する必要があります。 BDC を作成する方法として、次の 2 通りの方法があります。
- [新しいビッグ データ コネクション] ダイアログ ボックスを使用します。 ダイアログ ボックスにアクセスするには、[挿入] リボンで [接続] をクリックし、[新しいビッグ データ コネクション] を選択します。 このダイアログ ボックスでは、BDC の作成や各データセットのプロパティの構成を対話形式で行うことができます。
- [ビッグ データ コネクション作成 (Create Big Data Connection)] ジオプロセシング ツールを使用します。
BDC 内のデータセットを探しているとき、次の 2 つの問題が起きることがあります:
- 予期していたデータセットが見当たらない。 この場合、サブフォルダーを含むソース フォルダーとして指定したパスが正しく、データ タイプをサポートしていることを確認します。
- 1 つ以上のデータセットが登録できない。 データセットを登録できない場合、次の点を確認します。
問題 解決策 例 データセットが予期した形式ではない。
ファイルを開き、予期した形式であるか確認します。 データが正しく構成されていない場合、更新して再度登録します。
*.csv ファイルにはデータについて数行の記述とサマリーがあるのみで、残りは空白行となっています。
フォルダー内にあるデータセットのスキーマが一致しない。
データセット フォルダー内のファイルはすべて同じスキーマを持つ必要があります。 ファイルを開き、スキーマを比較します。 一致しないスキーマがあれば削除し、データセットを再度登録します。
ある *.csv ファイルは 10 個のフィールドがあり、別のファイルは 8 個のフィールドがある。
フォルダー内にあるデータセットのファイル タイプが一致しない。
データセット フォルダー内のファイルはすべて同じエクステンション (ファイル タイプ) である必要があります。 データ ソースがある場所のファイル タイプを確認し、適切でないファイルは削除または移動します。
シェープファイルのデータセットがパーケット ファイルと同じフォルダーにある。
認識されないフィールド形式がある。
ORC やパーケットが予期しない形式の場合に起こることがあります。 有効なフィールド形式を使用してください。
不明なフィールド形式のパーケット ファイルがある。
区切り文字で区切られたファイルを使用して BDC を作成し、ヘッダー行が表示されない場合は、ヘッダー行が無効である可能性があります。 すべてのフィールドにヘッダーがあり、どれも空でないことを確認します。 ダイアログ ボックスを使用してビッグ データ ファイル共有を作成する場合は、[フィールド] ウィンドウでフィールド ヘッダーを更新できます。 [ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] ツールを使用してフィールド名を更新することもできます。
BDC を作成する際、各データセットそれぞれにスキーマ、ジオメトリ、および時間が見つかります。 データセットでこれらの値を表示する方法は変更されることが多いです。 各データセットが正しくジオメトリや、時間、フィールドを表示しているか確認するには、[データセットの記述 (Describe Dataset)] ジオプロセシング ツールを使用します。 たとえば、データセットをレビューする際に次の変更を 1 つ以上、BDC 内の 1 つ以上のデータセットに対して行う場合は以下のようにします:
- 区切りデータセットのフィールド名を変更します。
- 解析で表示するフィールドを変更します。
- ジオメトリまたは時間を表すために使用するフィールドを変更します。
- データセットへフィールドを追加します。
- データセットにエイリアスを追加します。
- 解析しないデータセットを BDC から削除します。
- BDC を更新し、新規に追加されたデータセット (ソース フォルダー内の新しいサブフォルダー) を含めます。
これらオプションの変更を行うと、[新しいビッグ データ コネクション] ダイアログ ボックスを使用するか、次のツールを自由に組み合わせて使用できます。
- [ビッグ データ コネクションからデータセットをコピー (Copy Dataset From Big Data Connection)] - BDC からフィーチャクラスにデータセットをコピーします。
- [ビッグ データ コネクションからデータセットを複製 (Duplicate Dataset From Big Data Connection)] - 既存の BDC データセットのビューを作成します。
- [ビッグ データ コネクションの更新 (Refresh Big Data Connection)] - 新しいデータセットを確認して BDC に追加します。
- [ビッグ データ コネクションからデータセットを削除 (Remove Dataset From Big Data Connection)] - データセットを BDC から削除します。
- [ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] - 個々の BDC データセットのプロパティを変更します。
- [ビッグ データ コネクションからデータセットをプレビュー (Preview Dataset From Big Data Connection)] - データセットのフィーチャが正しく登録していることを確認するため、最初の 10 のフィーチャをプレビューします。
- [データセットの記述 (Describe Dataset)] - データセットが期待通りのものか確認します。
BDC データセットの可視化
区切りおよびシェープファイルベースの BDC データセットをマップ上に可視化できます。
注意:
パーケットまたは ORC ソース ファイルを使用する BDC データセットは可視化できません。データセットをマップへ追加するには、[カタログ] ウィンドウで BDC 項目を探し、クリックしてデータセットを展開、データセットをマップへ追加します。
BDC データセットはマップで簡素化されたエクスペリエンスを提供しますが、次の制限事項があります。
- BDC データセットを可視化する際、BDC データセット プロパティの時間プロパティが新しいレイヤーで自動的に設定されない。 データセットを時間で可視化するには、マップにデータセットを追加した後にレイヤーの時間プロパティを設定します。
- 区切り文字で区切られたファイルを描画すると、BDC データセットの空間参照のフル範囲に拡大される。
- 既存の BDC データセットに新しいレコードを追加すると (たとえば、既存の BDC の CSV ファイルに新しい行を追加するなど)、ArcGIS Pro を再起動するまで新しいレコードは描画されない。
- 既存の BDC データセットに新しいファイルを追加すると (たとえば、既存の BDC に新しい CSV ファイルを追加するなど)、ArcGIS Pro を再起動するまで新しいレコードは描画されない。
BDC データセットを解析に使用
BDC データセットを GeoAnalytics Desktop への入力として使用する場合、解析はデータを読み取り、お使いのコンピューターのコア間で並列に実行するよう最適化されます。 その他すべてのジオプロセシング ツールについては、BDC データセットの読み取りと処理は並列で実行するよう最適化されず、シングルスレッドで順番に処理されます。
区切りファイルまたはシェープファイル ベースの BDC データセットはほとんどのジオプロセシング ツールで使用できます。
注意:
パーケットと ORC ソース ファイルを使用する BDC データセットは、GeoAnalytics Desktop ツールでのみ使用できます。BDC データセットが GeoAnalytics Desktop ツールへの入力として使用されている場合、選択を BDC データセットに適用することはできません。
ジオプロセシング ツールで BDC データセットを使用するには、BDC データセットをマップに追加し、パラメーター選択リストからレイヤー名を選択するか、参照ボタンを使用して BDC ワークスペースに移動し、入力データセットを選択します。 次に示すツールは入力 BDC ファイルをサポートしていません:
- GeoAnalytics Server、標準フィーチャ解析、および ArcGIS Online 解析ツールを含むサービス ベースのツール
- [フィールド演算 (Calculate Field)] や [最近接 (Near)] などの入力データセットを変更するツール