ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties) (GeoAnalytics Desktop)

サマリー

BDC (ビッグ データ コネクション) データセットのプロパティを更新します。 このツールは、指定された BDC データセットのフィールド、ジオメトリ、時間、ファイル設定を変更します。

使用法

  • このツールには BDC が必要です。 BDC を作成するには、[新しいビッグ データ コネクション] ダイアログを使用するか、[ビッグ データ コネクションの作成 (Create Big Data Connection)] ツールを使用します。

  • このツールは次のようなシナリオで、解析または視覚化に使用する BDC データセットのスキーマ、ジオメトリ、時間を変更するために使用します。

    • CSV データセットがすべて文字列型フィールドで登録されているとき、解析で使用するためフィールドを数値に設定する。
    • BDC データセットに 2 つの異なる場所、たとえばタクシーの乗車と降車場所の属性値が含まれており、解析のため使用するジオメトリを変更する。
    • ワークフローで、入力レイヤーに時間を設定する必要がある。
    • BDC データセットを同僚と共有するとき、同僚にはフィーチャの一部しか必要ないため、定義クエリ式を追加して一部の未使用フィールドを非表示にする。

  • 変更できるプロパティを以下に示します。

    • 定義クエリ - 解析に使用するフィーチャを制限するため使用される式。
    • フィールド - フィールド名、フィールド タイプ、表示設定。
    • ジオメトリ - ジオメトリをどのように表現するか。 シェープファイルでは、これらのプロパティは編集できません。
    • 時間 - 時間をどのように表現するか。
    • ファイル - データセットを読み取るため使用されるファイル プロパティ。

  • [新しいビッグ データ コネクション] ダイアログ ボックスを使用すると、ビッグ データ コネクションを簡単に作成、編集、プレビューできます。

  • 変更するプロパティを含む BDC データセットを、[ビッグ データ コネクション データセット] パラメーターで指定します。 データセットを参照するか、c:\<path>\MyBDC.bdc\<dataset_name> などのパス (c:\MyBDCFolder\MyBDC.bdc\earthquakes_dataset など) を使用して指定できます。

  • [式] パラメーターを使用し、解析で使用するフィーチャを制限する式を定義します。 BDC データセットにフィルターを追加する操作は、マップのデータセットにフィルター設定を適用する操作と似ており、SQL 式を指定して対象フィーチャをフィルタリングします。

  • フィールド タイプは、区切り付きファイルで更新できます。 他のデータ ソース (シェープファイル、ORC、パーケット ファイルなど) のフィールド タイプは更新できません。

  • ジオメトリは、区切り付きファイル、ORC、パーケット ファイルで変更できます。 シェープファイルがソースのデータセットでは、ジオメトリを変更できません。

  • 次の表は、BDC データセットを編集するとき、[開始時間] および [終了時間] パラメーターの時間形式を指定する方法の要約です。 例では、2016 年 1 月 2 日 9:45:02.05 PM の時間を表す方法を示します。

    ビッグ データ コネクションの時間形式

    シンボル意味

    yy

    2 桁で表された年。

    16

    yyyy

    4 桁で表された年。

    2016

    MM

    数値で表された月。

    01 または 1

    MMM

    3 文字で表された月。

    Jan

    MMMM

    完全なつづりで表された月。

    January

    dd

    日。

    02 または 2

    HH

    24 時間表記の場合の時。値の範囲は 0 ~ 23 です。

    21

    hh

    12 時間表記の場合の時。値の範囲は 1 ~ 12 です。

    9

    mm

    分 (値の範囲は 0 ~ 59)。

    45

    ss

    秒 (値の範囲は 0 ~ 59)。

    02

    SSS

    ミリ秒 (値の範囲は 0 ~ 999)。

    50

    a

    AM/PM マーカー。

    PM

    epoch_millis

    エポックからの時間 (ミリ秒)。

    1509581781000

    epoch_seconds

    エポックからの時間 (秒)。

    1509747601

    Z

    タイム ゾーンのオフセット (時)。

    -0100 または -01:00

    ZZZ

    タイム ゾーンのオフセット (ID)。

    America/Los_Angeles

    ''

    この表に説明されている値を表していないテキストを追加するには、一重引用符を使用します。

    'T'

    以下の表では、同じ日付 (2016 年 1 月 2 日 9:45:02.05 PM) の異なるフォーマットの例を示します。

    時間フォーマットの例

    入力データ日付フォーマット

    01/02/2016 9:45:02PM

    MM/dd/yyyy hh:mm:ssa

    Jan02-16 21:45:02

    MMMdd-yy HH:mm:ss

    January 02 2016 9:45:02.050PM

    MMMM dd yyyy hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/dd/yyyy'T'HH:mm:ssZ

    You can specify the time zone using one of the following:
    • タイム ゾーンの完全な名称 (太平洋標準時など)。
    • タイム ゾーンのオフセット (時) を使用: -0100 または -01:00
    • UTC または GMT の省略表現
  • 区切り付きファイルでは、次のプロパティを変更できます。

    • フィールド区切り文字 - 各フィールドの区切り文字。 一般的な区切り文字はカンマ (,) またはセミコロン (;) です。
    • レコード ターミネーター - データの各行のターミネーター。 一般的なターミネーターは \n と \t です。
    • 引用符 - ソース データセットで引用に使用する文字。
    • ヘッダー行を含む - true または false の値で、ソース データセットがヘッダーを含むかどうかを示します。 データセットにヘッダー行が含まれている場合、そのヘッダーがフィールド名に使用されます。
    • エンコード - ソース データセットで使用されるエンコード タイプ。 デフォルトは UTF-8 です。

  • [ビッグ データ コネクション データセット プロパティの更新 (Update Big Data Connection Dataset Properties)] ツールは、各データセットのプロパティを更新します。 BDC を変更するには、次のツールを使用します。

  • オプションとして、BDC ファイルを手動で編集することもできます。 次のような状況では、常に *.bdc ファイルを手動で変更します。

    • x、y、z 座標を表すフィールドが 1 つ以上存在する。
    • ソース パスを更新する。

    ビッグ データ コネクション ファイルの形式の詳細について説明します。

  • ジオプロセシング ツールは、Spark を活用しています。ビッグ データ コネクションとその使用方法の詳細については、「「ビッグ データ コネクション」をご参照ください。

パラメーター

ラベル説明データ タイプ
ビッグ データ コネクション データセット

更新される BDC データセット。 編集のオプションは、ソース データ (シェープファイル、区切り付きファイル、ORC、パーケット ファイル) によって異なります。

Table View
(オプション)

解析で使用するフィーチャの制限に使用される式。

SQL Expression
フィールド プロパティ
(オプション)

変更するフィールド名とプロパティを指定します。

フィールドの表示/非表示を指定します。

  • オン - フィールドは表示され、ジオプロセシング ツールで使用できます。 これがデフォルトです。
  • オフ - フィールドは表示されず、ジオプロセシング ツールへの入力として使用できません。

  • Shortフィールドは short タイプになります。
  • Longフィールドは long タイプになります。
  • Doubleフィールドは double タイプになります。
  • Floatフィールドは float タイプになります。
  • Stringフィールドは string タイプになります。
  • Dateフィールドは date タイプになります。
  • BLOBフィールドは BLOB タイプになります。
Value Table
ジオメトリ タイプ
(オプション)

データセットを空間的に表すため使用されるジオメトリのタイプを指定します。 シェープファイルがソースのデータセットでは、ジオメトリを変更できません。

  • ポイントジオメトリ タイプはポイントになります。
  • ポリラインジオメトリ タイプはポリラインになります。
  • ポリゴンジオメトリ タイプはポリゴンになります。
  • なしジオメトリ タイプは指定されません。
String
空間参照
(オプション)

データセットの空間参照に使用される WKID 値または WKT 文字列。 デフォルトは WKID 4326 (WGS84) です。 シェープファイルがソースのデータでは、空間参照を変更できません。

String
ジオメトリ形式タイプ
(オプション)

ジオメトリがどのような形式かを指定します。 シェープファイルがソースのデータでは、ジオメトリを変更できません。

  • XYZ2 つ以上のフィールドが X、Y、オプションとして Z を表します。
  • WKTジオメトリは、既知のテキスト フィールドに含まれる単一のフィールドによって表されます。
  • WKBジオメトリは、既知のバイナリ フィールドに含まれる単一のフィールドによって表されます。
  • GeoJSONジオメトリは、GeoJSON 形式の単一のフィールドによって表されます。
  • EsriJSONジオメトリは、EsriJSON 形式の単一のフィールドによって表されます。
  • EsriShapeジオメトリは、EsriShape 形式の単一のフィールドで表されます。
String
ジオメトリ フィールド
(オプション)

ジオメトリの表現に使用される単一のフィールド。 このフィールドは、ジオメトリ形式が WKT、WKB、GeoJSON、EsriJSON、または EsriShape である場合に使用されます。

String
X フィールド
(オプション)

X 位置の表現に使用されるフィールド。 複数のフィールドが X 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
Y フィールド
(オプション)

Y 位置の表現に使用されるフィールド。 複数のフィールドが Y 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
Z フィールド
(オプション)

Z 位置の表現に使用されるフィールド。 複数のフィールドが Z 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
時間タイプ
(オプション)

データセットを時間的に表現するために使用する時間タイプを指定します。

  • 間隔時間タイプは、開始時間と終了時間を持つ期間を表します。
  • インスタント時間タイプは、特定の時刻を表します。
  • なし時間は有効にされません。
String
タイム ゾーン
(オプション)

データセットのタイム ゾーン。

String
開始時間
(オプション)

開始時間と時間形式を定義するため使用されるフィールド。

Value Table
終了時間
(オプション)

終了時間と時間形式を定義するため使用されるフィールド。

Value Table
ファイル拡張子
(オプション)

ソース データセットのファイル拡張子。 パラメーターの値は変更できません。

String
フィールド区切り文字
(オプション)

ソース データセットで使用されるフィールド区切り文字。

String
レコード ターミネーター
(オプション)

ソース データセットで使用されるレコード ターミネーター。

String
引用符
(オプション)

ソース データセットで使用される引用符。

String
ヘッダー行を含む
(オプション)

ソース データセットがヘッダー行を含むかどうかを指定します。

  • オン - ソース データセットはヘッダー行を含みます。
  • オフ - ソース データセットはヘッダー行を含みません。

Boolean
エンコード
(オプション)

ソース データセットで使用されるエンコードのタイプ。 デフォルトは UTF-8 です。

String

派生した出力

ラベル説明データ タイプ
更新された BDC

編集したプロパティが指定したデータセットに適用され、更新された BDC ファイル。

File

arcpy.gapro.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
名前説明データ タイプ
bdc_dataset

更新される BDC データセット。 編集のオプションは、ソース データ (シェープファイル、区切り付きファイル、ORC、パーケット ファイル) によって異なります。

Table View
expression
(オプション)

解析で使用するフィーチャの制限に使用される式。

SQL Expression
field_properties
[field_properties,...]
(オプション)

変更するフィールド名とプロパティを指定します。

  • SHORTフィールドは short タイプになります。
  • LONGフィールドは long タイプになります。
  • DOUBLEフィールドは double タイプになります。
  • FLOATフィールドは float タイプになります。
  • STRINGフィールドは string タイプになります。
  • DATEフィールドは date タイプになります。
  • BLOBフィールドは BLOB タイプになります。

フィールドの表示/非表示を指定します。

  • TRUEフィールドは表示され、ジオプロセシング ツールで使用できます。 これがデフォルトです。
  • FALSEフィールドは表示されず、ジオプロセシング ツールへの入力として使用できません。
Value Table
geometry_type
(オプション)

データセットを空間的に表すため使用されるジオメトリのタイプを指定します。 シェープファイルがソースのデータセットでは、ジオメトリを変更できません。

  • POINTジオメトリ タイプはポイントになります。
  • LINEジオメトリ タイプはポリラインになります。
  • POLYGONジオメトリ タイプはポリゴンになります。
  • NONEジオメトリ タイプは指定されません。
String
spatial_reference
(オプション)

データセットの空間参照に使用される WKID 値または WKT 文字列。 デフォルトは WKID 4326 (WGS84) です。 シェープファイルがソースのデータでは、空間参照を変更できません。

String
geometry_format_type
(オプション)

ジオメトリがどのような形式かを指定します。 シェープファイルがソースのデータでは、ジオメトリを変更できません。

  • XYZ2 つ以上のフィールドが X、Y、オプションとして Z を表します。
  • WKTジオメトリは、既知のテキスト フィールドに含まれる単一のフィールドによって表されます。
  • WKBジオメトリは、既知のバイナリ フィールドに含まれる単一のフィールドによって表されます。
  • GEOJSONジオメトリは、GeoJSON 形式の単一のフィールドによって表されます。
  • ESRIJSONジオメトリは、EsriJSON 形式の単一のフィールドによって表されます。
  • ESRISHAPEジオメトリは、EsriShape 形式の単一のフィールドで表されます。
String
geometry_field
(オプション)

ジオメトリの表現に使用される単一のフィールド。 このフィールドは、ジオメトリ形式が WKT、WKB、GeoJSON、EsriJSON、または EsriShape である場合に使用されます。

String
x_field
(オプション)

X 位置の表現に使用されるフィールド。 複数のフィールドが X 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
y_field
(オプション)

Y 位置の表現に使用されるフィールド。 複数のフィールドが Y 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
z_field
(オプション)

Z 位置の表現に使用されるフィールド。 複数のフィールドが Z 位置を表示する場合は、*.bdc ファイルを手動で変更します。

String
time_type
(オプション)

データセットを時間的に表現するために使用する時間タイプを指定します。

  • INTERVAL時間タイプは、開始時間と終了時間を持つ期間を表します。
  • INSTANT時間タイプは、特定の時刻を表します。
  • NONE時間は有効にされません。
String
time_zone
(オプション)

データセットのタイム ゾーン。

String
start_time_format
[start_time_format,...]
(オプション)

開始時間と時間形式を定義するため使用されるフィールド。

Value Table
end_time_format
[end_time_format,...]
(オプション)

終了時間と時間形式を定義するため使用されるフィールド。

Value Table
file_extension
(オプション)

ソース データセットのファイル拡張子。 パラメーターの値は変更できません。

String
field_delimiter
(オプション)

ソース データセットで使用されるフィールド区切り文字。

String
record_terminator
(オプション)

ソース データセットで使用されるレコード ターミネーター。

String
quote_character
(オプション)

ソース データセットで使用される引用符。

String
has_header_row
(オプション)

ソース データセットがヘッダー行を含むかどうかを指定します。

  • HAS_HEADERソース データセットはヘッダー行を含みます。
  • NO_HEADERソース データセットはヘッダー行を含みません。
Boolean
encoding
(オプション)

ソース データセットで使用されるエンコードのタイプ。 デフォルトは UTF-8 です。

String

派生した出力

名前説明データ タイプ
updated_bdc

編集したプロパティが指定したデータセットに適用され、更新された BDC ファイル。

File

コードのサンプル

UpdateBDCDatasetProperties の例 (スタンドアロン スクリプト)

次の Python スクリプトは、UpdateBDCDatasetProperties 関数の使用方法を示しています。

# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a BDC dataset
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.bdc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extension = "csv"
file_delimiter = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"


# Execute Update BDC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimiter, file_terminator, 
file_quotechar, has_header_row, file_encoding)

環境

このツールは、ジオプロセシング環境を使用しません。

ライセンス情報

  • Basic: No
  • Standard: No
  • Advanced: Yes

関連トピック