データの準備

データ エンジニアリング ツールを使用して、データをクリーニングおよび準備できます。 データ エンジニアリング ビューでは、ジオプロセシング ツールのサブセットを使用して、マップや解析に使用するデータを準備することができます。 これらのツールは次のカテゴリに分類されています。

  • [クリーン] - データをクリーニングします。 たとえば、不要なフィールドを削除することができます。 また、フィールドを変更したり、欠損値を補完したりすることもできます。
  • [構築] - レイヤーの既存のフィールドまたはプロパティから派生したフィールドを作成します。 たとえば、新しいフィールドを追加して計算したり、既存のフィールドを標準化、変換、または再分類したり、入力レイヤーのジオメトリに基づいてフィールドを追加したりすることができます。
  • [統合] - 別のデータ ソースから入力テーブルまたはフィーチャクラスにデータを統合または追加します。 たとえば、データに情報付加することで、フィールドを結合または追加できます。
  • [フォーマット] - テーブルまたはフィーチャクラスのフィールドのフォーマットを変更したり、フィールドを再編成したりします。 たとえば、時間フィールドを変換したり、カテゴリ フィールドをエンコードしたり、既存のフィールドの次元を減らしたりすることができます。

注意:

データ エンジニアリング ビューの一部のジオプロセシング ツールは、編集不可レイヤーでは使用できません。 このような場合は、レイヤーの編集可能なコピーを作成し、新しいデータ エンジニアリング ビューを開きます。

データ エンジニアリング ビューのこれらのグループやツールには、次のいずれかの方法でアクセスできます。

  • フィールド パネル内のフィールドのショートカット メニューを右クリックします。

    フィールドの探索の詳細

  • 統計情報パネル内のフィールドのショートカット メニューを右クリックします。

    統計情報を操作する方法の詳細

  • [データ エンジニアリング] リボンのツールをクリックします。

データ エンジニアリング リボン

データ エンジニアリング ビューがアクティブな場合、アプリケーションの上部にコンテキスト リボンが表示されます。 リボンから、データの調査や準備に使用するコマンドやツールにアクセスできます。

データ エンジニアリング リボン

リボンの [データ] グループから、アクティブなデータ エンジニアリング ビューに関連付けられたレイヤーのフィールド ビューと属性テーブルにアクセスできます。 [ツール] グループには、[クリーン][構築][統合]、および [フォーマット] の 4 つのツール ギャラリーがあります。 各ツール ギャラリーには、それぞれのデータ エンジニアリング タスクに使用するジオプロセシング ツールのサブセットが含まれています。 デフォルトでは、アクティブなデータ エンジニアリング ビューに関連付けられたレイヤーを使用して、これらのツールの入力フィーチャ パラメーターが自動的に設定されます。 [空間] グループで、[XY データの表示] および [テーブルのジオコーディング] を実行して、非空間スタンドアロン テーブルを空間データに変換します。

データ エンジニアリング ツール

次の表に、[データ エンジニアリング] リボン上のすべてのツールを示します。

注意:

ジオプロセシング ツールの中には、スタンドアロン テーブルなどの非空間データで使用できないものがあります。

クリーン

[クリーン] カテゴリで使用できるツールを次に示します。

ツール説明

フィールドの削除

テーブル、フィーチャクラス、フィーチャ レイヤー、またはラスター データセットから 1 つ以上のフィールドを削除します。

フィールドの変更

フィールド名およびフィールド エイリアス名を変更するか、フィールド プロパティを変更します。

投影変換

空間データをある座標系から別の座標系に変換します。

欠損値の補完

空間近傍、時空間近傍、時系列、またはグローバル統計の値に基づいて欠損 (NULL) 値を推定値に置き換えます。

空間的な外れ値の検出

ポイント フィーチャのグローバルまたはローカルの空間的外れ値を特定します。

構築

[構築] カテゴリで使用できるツールを次に示します。

ツール説明

フィールド演算

フィーチャクラス、フィーチャ レイヤー、またはラスターのフィールドの値を計算します。

フィールドの追加

新しいフィールドを単独のテーブル、あるいはフィーチャクラス、フィーチャ レイヤー、属性テーブルのあるラスターなどのテーブルに追加します。

ジオメトリ属性の計算

フィーチャの属性フィールドに、空間特性またはジオメトリック特性および各フィーチャの位置 (長さや面積、X、Y、Z、M 座標など) を示す情報を追加します。

フィールドの変換

それぞれの値に数学関数を適用し、分布の形状を変更して、1 つ以上のフィールド内の連続値を変換します。 このツールでの変換方法には、対数、平方根、Box-Cox、逆数、二乗、指数、および逆 Box-Cox があります。

フィールドの標準化

フィールド内の値を指定のスケールに準拠した値に変換することで標準化します。標準化方法には、Z スコア、最小値-最大値、絶対最大値、およびロバスト標準化があります。

ディメンションの削減

主成分分析 (PCA) またはランク縮小線形判別分析 (LDA) を使用して、可能な限り高い分散量をより少ない成分に集約することにより、連続変数のセットの次元数を減らします。

時系列の平滑化

時系列データのスムージング処理を実行することで、短期的な変動を考慮し、長期的な傾向やサイクルを明らかにします。 このツールでは、中心移動平均、前方移動平均、後方移動平均を使用した 1 つまたは複数の時系列の数値変数や、局所線形回帰に基づく適応的手法を使用することができます。

統合

[統合] カテゴリで使用できるツールを次に示します。

ツール説明

空間結合

フィーチャクラスの属性を、空間リレーションシップに基づいて別のフィーチャクラスの属性に結合します。 ターゲット フィーチャと、結合フィーチャの結合された属性は、出力フィーチャクラスに書き込まれます。

フィールドの結合

共通属性フィールドに基づいて、テーブルの内容を別のテーブルに永続的に結合します。 入力テーブルが更新され、結合テーブル内のフィールドが格納されます。 結合テーブルからのフィールドの中から、入力テーブルに追加するフィールドを選択することができます。

最近接

入力フィーチャと、別のレイヤーまたはフィーチャクラス内の最近接フィーチャとの間の、距離および他の近接情報を計算します。

エリア内での集計

ポリゴン レイヤーを別のレイヤーに重ねて、各ポリゴン内のポイント数、ラインの長さ、またはポリゴンの面積を集計し、各ポリゴン内のフィーチャに関して属性フィールドの統計情報を計算します。

近接範囲内での集計

入力レイヤー内のフィーチャから指定した距離の範囲内にあるフィーチャを検出し、それらの近接フィーチャについて統計情報を計算します。

ラスターからのサンプリング

定義された位置のラスターまたは一連のラスターからのセルの値を表示するテーブルまたはポイント フィーチャクラスを作成します。 位置は、ラスター セル、ポイント、ポリライン、またはポリゴンによって定義されます。

情報付加

データの場所の周囲または内部にある人々や場所に関する人口統計および地勢要素を追加して、データに情報を付加します。 出力は入力を複製したもので、属性フィールドが追加されています。 このツールを使用するには、ArcGIS Online 組織アカウントまたはローカルにインストールされた Business Analyst データセットが必要です。

ポリゴンの按分

ターゲット ポリゴン レイヤーの空間オーバーレイに基づき、入力ポリゴン レイヤーの属性を集計します。また、ターゲット ポリゴンに属性を割り当てます。 ターゲット ポリゴンには、各ターゲットが重複する入力ポリゴンから取得した合計の数値属性が含まれます。

フォーマット

[フォーマット] カテゴリで使用できるツールを次に示します。

ツール説明

時間フィールドの変換

フィールドに格納された日付と時間の値を、別のフィールドに変換します。 このツールを使用すると、複数のフィールド タイプ (テキスト、数値、または日付フィールド) 間で変換したり、dd/MM/yy HH:mm:ss 形式から yyyy-MM-dd など、値を別の形式に変換したりできます。

タイム ゾーンの変換

日付フィールドに記録されている時間値をタイム ゾーン間で変換します。

ピボット テーブル

レコードの重複を削除し、1 対多のリレーションシップを単純化して、入力テーブルからテーブルを作成します。

フィールドの転置

フィールドまたは列に格納されたデータを、新しいテーブルまたはフィーチャクラスの行に転置します。

フィールドの再分類

手動で定義した境界に基づき、または再分類方法を使用して、数字フィールドまたはテキスト フィールドの値をクラスに再分類します。

フィールドのエンコード

カテゴリ値 (文字列、整数、または日付) を複数の数値フィールド (それぞれが 1 つのカテゴリを表す) に変換します。エンコードされた数値フィールドは、ほとんどのデータ サイエンス ワークフローと統計ワークフロー (回帰モデルを含む) で使用できます。

注意:

入力データを変更するほとんどのジオプロセシング操作を取り消すことはできません。

関連トピック