ラベル | 説明 | データ タイプ |
予測タイプ
| このツールの操作モードを指定します。このツールでは、パフォーマンスの評価、フィーチャの予測、または予測サーフェスの作成の目的にのみモデルのトレーニングを実行できます。
| String |
入力トレーニング フィーチャ
| [予測対象変数] パラメーターと (オプションで) フィールドから生成された説明トレーニング変数を含むフィーチャクラス。 | Feature Layer |
予測対象変数
(オプション) | モデルのトレーニングに使用される値を含む [入力トレーニング フィーチャ] パラメーターから生成された変数。このフィールドには、不明な位置での予測に使用される変数の既知 (トレーニング) の値が含まれます。 | Field |
変数をカテゴリとして処理 (オプション) | [予測対象変数] をカテゴリ変数にするかどうかを指定します。
| Boolean |
説明トレーニング変数
(オプション) | [予測対象変数] の値またはカテゴリの予測に役立つ説明変数を表すフィールドのリスト。クラスまたはカテゴリを表す変数 (土地被覆や有無など) の場合に [カテゴリ] チェックボックスをオンにします。 | Value Table |
説明トレーニング距離フィーチャ
(オプション) | 指定されたフィーチャから [入力トレーニング フィーチャ] までの距離を算出して、説明変数を自動的に作成します。入力された各 [説明トレーニング距離フィーチャ] から最近隣の [入力トレーニング フィーチャ] までの距離が算出されます。入力された [説明トレーニング距離フィーチャ] がポリゴンまたはラインの場合、距離の属性は、フィーチャのペアの最も近いセグメント間の距離として計算されます。 | Feature Layer |
説明トレーニング ラスター (オプション) | 値がラスターから抽出されるモデルで説明トレーニング変数を自動的に作成します。[入力トレーニング フィーチャ] のフィーチャごとに、該当する位置でラスター セルの値が抽出されます。連続ラスターからラスター値を抽出する場合には、共一次内挿法によるラスターのリサンプリングが使用されます。カテゴリ ラスターからラスター値を抽出する場合には、最近隣内挿法による近接割り当てが使用されます。クラスまたはカテゴリを表すラスター (土地被覆や有無など) の場合に [カテゴリ] チェックボックスをオンにします。 | Value Table |
入力予測フィーチャ (オプション) | 予測が行われる位置を表すフィーチャクラス。このフィーチャクラスには、トレーニング データ (存在する場合) から使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。 | Feature Layer |
出力予測済みフィーチャ
(オプション) | 予測の結果を取得するための出力フィーチャクラス。 | Feature Class |
出力予測サーフェス (オプション) | 予測結果を含む出力ラスター。デフォルトのセル サイズは、入力ラスターの最大セル サイズになります。別のセル サイズを設定するには、セル サイズ環境設定を使用します。 | Raster Dataset |
説明変数の照合
(オプション) | 右側の [入力トレーニング フィーチャ] に対して指定された [説明変数] と左側の [入力予測フィーチャ] の対応するフィールドのリスト。 | Value Table |
距離フィーチャの照合
(オプション) | 右側の [入力トレーニング フィーチャ] に対して指定された [説明距離フィーチャ] のリスト。対応するフィーチャ セットは、左側の [入力予測フィーチャ] に対して指定する必要があります。 [入力予測フィーチャ] に最適な [説明距離フィーチャ] は、これらが異なる分析範囲または期間内にトレーニングに使用されている場合に指定できます。 | Value Table |
説明ラスターの照合
(オプション) | 右側の [入力トレーニング フィーチャ] に対して指定された [説明ラスター] のリスト。対応するラスターを左側の作成対象の [入力予測フィーチャ] または [予測サーフェス] に対して指定する必要があります。 [入力予測フィーチャ] に最適な [説明ラスター] は、これらが異なる分析範囲または期間内にトレーニングに使用されている場合に指定できます。 | Value Table |
出力トレーニング済みフィーチャ
(オプション) | [出力トレーニング済みフィーチャ] には、トレーニングに使用されているすべての説明変数 (サンプリングされたラスター値と距離計算を含む) だけでなく、観測された [予測対象変数] フィールドとそれに伴う予測 (トレーニング済みのモデルのパフォーマンスを詳しく評価する際に使用できる) も含まれます。 | Feature Class |
出力変数重要度テーブル
(オプション) | 指定すると、作成されたモデルで使用されている説明変数 (フィールド、距離フィーチャ、およびラスター) ごとの重要度を示す情報がテーブルに含まれます。このテーブルから作成されたチャートには、[コンテンツ] ウィンドウでアクセスできます。 | Table |
トレーニング用にポリゴンをラスター解像度に変換
(オプション) | [入力トレーニング フィーチャ] が [予測対象変数] カテゴリのポリゴンであり、[説明トレーニング ラスター] だけが指定されている場合のモデルのトレーニング時のポリゴンの処理方法を示します。
| Boolean |
ツリー数
(オプション) | フォレスト モデル内で作成するツリーの数。通常、ツリーの数を多くすると、モデル予測の精度は上がりますが、そのモデルでの計算時間が長くなります。デフォルトのツリー数は 100 です。 | Long |
最小リーフ サイズ
(オプション) | リーフを維持するために最低限必要な観測数 (つまり、これ以上分割できないツリー上のターミナル ノード)。デフォルトの最小数は、回帰の場合には 5、分類の場合には 1 になります。大規模なデータの場合は、これらの数を増やすと、このツールの実行時間が短くなります。 | Long |
最大ツリー階層
(オプション) | ツリーの下に作成される分割の最大数。最大ツリー階層の値を大きくすると、さらに多くの分割が作成されるため、モデルの過剰適合の可能性が高くなります。デフォルト値は、データに基づき、作成されるツリー数と含まれる変数の数によって異なります。 | Long |
ツリーあたりの利用可能なデータ (%)
(オプション) | 決定木ごとに使用される [入力トレーニング フィーチャ] の割合を指定します。デフォルトはデータの 100% です。各ツリーのサンプルは、指定されたデータの 3 分の 2 の中からランダムに取得されます。 集合内の各決定木の作成には、ランダムなサンプルが使用されるか、利用可能なトレーニング データのサブセット (約 3 分の 2) が使用されます。各決定木の入力データの割合を低くすると、大規模なデータセットの場合、ツールの実行速度が上がります。 | Long |
ランダムにサンプリングされた変数の数
(オプション) | 各決定木の作成に使用される説明変数の数を指定します。 集合内の各決定木の作成には、指定された説明変数のランダムなサブセットが使用されます。各決定木で使用される変数の数を増やすと、特に 1 つ以上のドミナント変数が存在する場合に、モデルの超過適合の可能性が高くなります。一般的な方法として、[予測対象変数] が数値の場合は、説明変数の総数 (フィールド、距離、およびラスターの合計) の平方根を使用し、[予測対象変数] がカテゴリの場合は、説明変数の総数 (フィールド、距離、およびラスターの合計) を 3 で除算します。 | Long |
検証のために除外するトレーニング データ (%) (オプション) | 検証のためにテスト データセットとして確保する [入力トレーニング フィーチャ] の割合 (10 ~ 50 パーセント) を指定します。ここで指定したデータのランダムなサブセットなしでモデルのトレーニングが行われ、これらのフィーチャの観測値が予測値と比較されます。デフォルトは 10 パーセントです。 | Double |
出力分類パフォーマンス テーブル (混同行列) (オプション) | 指定した場合、作成されたモデルのパフォーマンスをまとめた分類の混同行列を作成します。このテーブルを使用すると、ツールが出力メッセージ内で計算する精度と感度の計測値を超える他の診断を計算できます。 | Table |
出力整合チェック テーブル (オプション) | 指定された [整合チェックの実行回数] が 2 より大きい場合、このテーブルは各モデルに対して R2 の分布のチャートを作成します。この分布を使用して、モデルの安定性を評価できます。 | Table |
散在するカテゴリの補正
(オプション) | 他より発生頻度が低いカテゴリがデータセット内に存在する場合、このパラメーターをオンにすると、それぞれのカテゴリが各ツリーで表されます。
| Boolean |
整合チェックの実行回数
(オプション) | このツールは、指定した反復回数だけ実行されます。各実行に対する R2 の分布は、[出力整合チェック テーブル] パラメーターを使用して表示できます。これが設定され、予測が生成される場合、最高の R2 値を生成するモデルのみが予測に使用されます。 | Long |
不確実性の計算
(オプション) | トレーニング、フィーチャの予測、またはラスターの予測の際に、予測の不確実性を計算するかどうかを指定します。
| Boolean |
派生した出力
ラベル | 説明 | データ タイプ |
出力不確実性ラスター レイヤー | [不確実性の計算] がオンの場合、ツールは [予測対象変数] の各予測値の周辺で 90 パーセントの予測間隔を計算します。 | ラスター レイヤー |