データの準備—ArcGIS Pro | ドキュメント

データエンジニアリングツールを使用して、データをクリーニングおよび準備できます。データエンジニアリングビューでは、ジオプロセシングツールのサブセットを使用して、マップや解析に使用するデータを準備することができます。これらのツールは次のカテゴリに分類されています。

[クリーン] - データをクリーニングします。たとえば、不要なフィールドを削除することができます。また、フィールドを変更したり、欠損値を補完したりすることもできます。
[構築] - レイヤーの既存のフィールドまたはプロパティから派生したフィールドを作成します。たとえば、新しいフィールドを追加して計算したり、既存のフィールドを標準化、変換、または再分類したり、入力レイヤーのジオメトリに基づいてフィールドを追加したりすることができます。
[統合] - 別のデータソースから入力テーブルまたはフィーチャクラスにデータを統合または追加します。たとえば、データに情報付加することで、フィールドを結合または追加できます。
[フォーマット] - テーブルまたはフィーチャクラスのフィールドのフォーマットを変更したり、フィールドを再編成したりします。たとえば、時間フィールドを変換したり、カテゴリフィールドをエンコードしたり、既存のフィールドの次元を減らしたりすることができます。

注意:

データエンジニアリングビューの一部のジオプロセシングツールは、編集不可レイヤーでは使用できません。このような場合は、レイヤーの編集可能なコピーを作成し、新しいデータエンジニアリングビューを開きます。

データエンジニアリングビューのこれらのグループやツールには、次のいずれかの方法でアクセスできます。

フィールドパネル内のフィールドのショートカットメニューを右クリックします。
フィールドの探索の詳細
統計情報パネル内のフィールドのショートカットメニューを右クリックします。
統計情報を操作する方法の詳細
[データエンジニアリング] リボンのツールをクリックします。

データエンジニアリングリボン

データエンジニアリングビューがアクティブな場合、アプリケーションの上部にコンテキストリボンが表示されます。リボンから、データの調査や準備に使用するコマンドやツールにアクセスできます。

データエンジニアリングリボン

リボンの [データ] グループから、アクティブなデータエンジニアリングビューに関連付けられたレイヤーのフィールドビューと属性テーブルにアクセスできます。 [ツール] グループには、[クリーン]、[構築]、[統合]、および [フォーマット] の 4 つのツールギャラリーがあります。各ツールギャラリーには、それぞれのデータエンジニアリングタスクに使用するジオプロセシングツールのサブセットが含まれています。デフォルトでは、アクティブなデータエンジニアリングビューに関連付けられたレイヤーを使用して、これらのツールの入力フィーチャパラメーターが自動的に設定されます。 [空間] グループで、[XY データの表示] および [テーブルのジオコーディング] を実行して、非空間スタンドアロンテーブルを空間データに変換します。

データエンジニアリングツール

次の表に、[データエンジニアリング] リボン上のすべてのツールを示します。

注意:

ジオプロセシングツールの中には、スタンドアロンテーブルなどの非空間データで使用できないものがあります。

クリーン

[クリーン] カテゴリで使用できるツールを次に示します。


ツール	説明
フィールドの削除	テーブル、フィーチャクラス、フィーチャレイヤー、またはラスターデータセットから 1 つ以上のフィールドを削除します。
キーフレームの追加	既存のターゲットデータセットに複数の入力データセットを追加し、必要に応じて更新します。入力データセットとして、フィーチャクラス、テーブル、シェープファイル、ラスター、アノテーションフィーチャクラス、ディメンションフィーチャクラスを使用できます。
フィールドの変更	フィールド名およびフィールドエイリアス名を変更するか、フィールドプロパティを変更します。
投影変換	空間データをある座標系から別の座標系に変換します。
行の削除	すべての行または選択した行のサブセットを入力から削除します。
欠損値の補完	空間近傍、時空間近傍、時系列、またはグローバル統計の値に基づいて欠損 (NULL) 値を推定値に置き換えます。
空間的な外れ値の検出	ポイントフィーチャのグローバルまたはローカルの空間的外れ値を特定します。

構築

[構築] カテゴリで使用できるツールを次に示します。


ツール	説明
フィールド演算	フィーチャクラス、フィーチャレイヤー、またはラスターのフィールドの値を計算します。
フィールドの追加	新しいフィールドを単独のテーブル、あるいはフィーチャクラス、フィーチャレイヤー、属性テーブルのあるラスターなどのテーブルに追加します。
ジオメトリ属性の計算	フィーチャの属性フィールドに、空間特性またはジオメトリック特性および各フィーチャの位置 (長さや面積、X、Y、Z 座標、M 値など) を示す情報を追加します。
フィールドの変換	それぞれの値に数学関数を適用し、分布の形状を変更して、1 つ以上のフィールド内の連続値を変換します。このツールでの変換方法には、対数、平方根、Box-Cox、逆数、二乗、指数、および逆 Box-Cox があります。
フィールドの標準化	フィールド内の値を指定のスケールに準拠した値に変換することで標準化します。標準化方法には、Z スコア、最小値-最大値、絶対最大値、およびロバスト標準化があります。
ディメンションの削減	主成分分析 (PCA) またはランク縮小線形判別分析 (LDA) を使用して、可能な限り高い分散量をより少ない成分に集約することにより、連続変数のセットの次元数を減らします。
時系列の平滑化	時系列データのスムージング処理を実行することで、短期的な変動を考慮し、長期的な傾向やサイクルを明らかにします。このツールでは、中心移動平均、前方移動平均、後方移動平均を使用した 1 つまたは複数の時系列の数値変数や、局所線形回帰に基づく適応的手法を使用することができます。

統合

[統合] カテゴリで使用できるツールを次に示します。


ツール	説明
空間結合	フィーチャクラスの属性を、空間リレーションシップに基づいて別のフィーチャクラスの属性に結合します。ターゲットフィーチャと、結合フィーチャの結合された属性は、出力フィーチャクラスに書き込まれます。
フィールドの結合	共通属性フィールドに基づいて、テーブルの内容を別のテーブルに永続的に結合します。入力テーブルが更新され、結合テーブル内のフィールドが格納されます。結合テーブルからのフィールドの中から、入力テーブルに追加するフィールドを選択することができます。
最近接	入力フィーチャと、別のレイヤーまたはフィーチャクラス内の最近接フィーチャとの間の、距離および他の近接情報を計算します。
エリア内での集計	ポリゴンレイヤーを別のレイヤーに重ねて、各ポリゴン内のポイントの数、ラインの長さ、またはポリゴンの面積を集計し、各ポリゴン内のフィーチャに関して属性フィールドの統計を計算します。
近接範囲内での集計	入力レイヤー内のフィーチャから指定した距離の範囲内にあるフィーチャを検出し、それらの近接フィーチャについて統計情報を計算します。
ラスターからのサンプリング	定義された位置のラスターまたは一連のラスターからのセルの値を表示するテーブルまたはポイントフィーチャクラスを作成します。位置は、ラスターセル、ポイント、ポリライン、またはポリゴンによって定義されます。
情報付加	データの場所の周囲または内部にある人々や場所に関する人口統計および地勢要素を追加して、データに情報を付加します。出力は入力を複製したもので、属性フィールドが追加されています。このツールを使用するには、ArcGIS Online 組織アカウントまたはローカルにインストールされた Business Analyst データセットが必要です。
ポリゴンの按分	ターゲットポリゴンレイヤーの空間オーバーレイに基づき、入力ポリゴンレイヤーの属性を集計します。また、ターゲットポリゴンに属性を割り当てます。ターゲットポリゴンには、各ターゲットが重複する入力ポリゴンから取得した合計の数値属性が含まれます。

形式

[フォーマット] カテゴリで使用できるツールを次に示します。


ツール	説明
時間フィールドの変換	フィールドに格納された日付と時間の値を、別のフィールドに変換します。このツールを使用すると、複数のフィールドタイプ (テキスト、数値、または日付フィールド) 間で変換したり、dd/MM/yy HH:mm:ss 形式から yyyy-MM-dd など、値を別の形式に変換したりできます。
タイムゾーンの変換	日付フィールドに記録されている時間値をタイムゾーン間で変換します。
ピボットテーブル	レコードの重複を削除し、1 対多のリレーションシップを単純化して、入力テーブルからテーブルを作成します。
フィールドの転置	フィールドまたは列に格納されたデータを、新しいテーブルまたはフィーチャクラスの行に転置します。
フィールドの再分類	手動で定義した境界に基づき、または再分類方法を使用して、数字フィールドまたはテキストフィールドの値をクラスに再分類します。
フィールドのエンコード	カテゴリ値 (文字列、整数、または日付) を複数の数値フィールド (それぞれが 1 つのカテゴリを表す) に変換します。エンコードされた数値フィールドは、ほとんどのデータサイエンスワークフローと統計ワークフロー (回帰モデルを含む) で使用できます。

注意:

入力データを変更するほとんどのジオプロセシング操作を取り消すことはできません。

注意:

データ エンジニアリング リボン

データ エンジニアリング ツール

注意:

クリーン

構築

統合

形式

注意:

関連トピック

このトピックの内容

データエンジニアリングリボン

データエンジニアリングツール