ラベル | 説明 | データ タイプ |
予測タイプ | このツールの操作モードを指定します。 このツールでは、パフォーマンスの評価、フィーチャの予測、または予測サーフェスの作成の目的にのみモデルのトレーニングを実行できます。
| String |
入力トレーニング フィーチャ | [予測対象変数] パラメーター値と (オプションで) フィールドから生成された説明トレーニング変数を含むフィーチャクラス。 | Feature Layer |
予測対象変数 (オプション) | モデルのトレーニングに使用される値を含む [入力トレーニング フィーチャ] パラメーターから生成された変数。 このフィールドには、不明なロケーションでの予測に使用される変数の既知 (トレーニング) の値が含まれます。 | Field |
変数をカテゴリとして処理 (オプション) | [予測対象変数] 値をカテゴリ変数にするかどうかを指定します。
| Boolean |
説明トレーニング変数 (オプション) | [予測対象変数] の値またはカテゴリの予測に役立つ説明変数を表すフィールドのリスト。 クラスまたはカテゴリを表す変数 (土地被覆や有無など) の場合に [カテゴリ] チェックボックスをオンにします。 | Value Table |
説明トレーニング距離フィーチャ (オプション) | 説明トレーニング距離フィーチャ。 指定されたフィーチャから [入力トレーニング フィーチャ] 値までの距離が算出され、説明変数が自動的に作成されます。 入力された各 [説明トレーニング距離フィーチャ] 値から最近隣の [入力トレーニング フィーチャ] 値までの距離が算出されます。 入力された [説明トレーニング距離フィーチャ] 値がポリゴンまたはラインの場合、距離の属性は、フィーチャのペアの最も近いセグメント間の距離として計算されます。 | Feature Layer |
説明トレーニング ラスター (オプション) | ラスターから抽出された説明トレーニング変数。 ラスター セル値が抽出され、説明トレーニング変数が自動的に作成されます。 [入力トレーニング フィーチャ] パラメーターのフィーチャごとに、該当するロケーションでラスター セルの値が抽出されます。 連続ラスターからラスター値を抽出する場合には、共一次内挿法によるラスターのリサンプリングが使用されます。 カテゴリ ラスターからラスター値を抽出する場合には、最近隣内挿法による近接割り当てが使用されます。 クラスまたはカテゴリを表すラスター (土地被覆や有無など) の場合に [カテゴリ] チェックボックスをオンにします。 | Value Table |
入力予測フィーチャ (オプション) | 予測が行われるロケーションを表すフィーチャクラス。 このフィーチャクラスには、トレーニング データから使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。 | Feature Layer |
出力予測済みフィーチャ (オプション) | 予測結果を含む出力フィーチャクラス。 | Feature Class |
出力予測サーフェス (オプション) | 予測結果を含む出力ラスター。 デフォルトのセル サイズは、入力ラスターの最大セル サイズになります。 別のセル サイズを設定するには、[セル サイズ] 環境設定を使用します。 | Raster Dataset |
説明変数の照合 (オプション) | 右側の [入力トレーニング フィーチャ] パラメーターに対して指定された [説明変数] 値と左側の [入力予測フィーチャ] パラメーターの対応するフィールドのリスト。 | Value Table |
距離フィーチャの照合 (オプション) | 右側の [入力トレーニング フィーチャ] パラメーターに対して指定された [説明距離フィーチャ] 値と左側の [入力予測フィーチャ] パラメーターの対応するフィーチャ セットのリスト。 [入力予測フィーチャ] パラメーターに最適な [説明距離フィーチャ] 値は、これらが異なる分析範囲または期間内にトレーニングに使用されている場合に指定できます。 | Value Table |
説明ラスターの照合 (オプション) | 右側の [入力トレーニング フィーチャ] パラメーターに対して指定された [説明ラスター] 値と、左側の作成対象の [入力予測フィーチャ] パラメーターまたは [予測サーフェス] パラメーターの対応するラスターのリスト。 [入力予測フィーチャ] パラメーターに最適な [説明ラスター] 値は、これらが異なる分析範囲または期間内にトレーニングに使用されている場合に指定できます。 | Value Table |
出力トレーニング済みフィーチャ (オプション) | トレーニングに使用されている説明変数 (サンプリングされたラスター値と距離計算を含む)、および観測された [予測対象変数] フィールドとそれに伴う予測 (トレーニング済みのモデルのパフォーマンスを詳しく評価する際に使用)。 | Feature Class |
出力変数重要度テーブル (オプション) | 作成されたモデルで使用されている説明変数 (フィールド、距離フィーチャ、およびラスター) ごとの重要度を示す情報を含むテーブル。 このテーブルから作成されたチャートには、[コンテンツ] ウィンドウでアクセスできます。 | Table |
トレーニング用にポリゴンをラスター解像度に変換 (オプション) | [入力トレーニング フィーチャ] 値が [予測対象変数] カテゴリ値のポリゴンであり、[説明トレーニング ラスター] 値だけが指定されている場合のモデルのトレーニング時のポリゴンの処理方法を示します。
| Boolean |
ツリーの数 (オプション) | フォレスト モデル内で作成されるツリーの数。 通常、ツリーの数を多くすると、モデル予測の精度は上がりますが、そのモデルでの計算時間が長くなります。 デフォルトのツリー数は 100 です。 | Long |
最小リーフ サイズ (オプション) | リーフを維持するために最低限必要な観測数 (つまり、これ以上分割できないツリー上のターミナル ノード)。 デフォルトの最小数は、回帰の場合には 5、分類の場合には 1 になります。 大規模なデータの場合は、これらの数を増やすと、このツールの実行時間が短くなります。 | Long |
最大ツリー階層 (オプション) | ツリーの下に作成される分割の最大数。 最大ツリー階層の値を大きくすると、さらに多くの分割が作成されるため、モデルの過剰適合の可能性が高くなります。 デフォルト設定はデータ ドリブンであり、作成されたツリーの数とそれに含まれている変数の数によって異なります。 | Long |
ツリーあたりの利用可能なデータ (%) (オプション) | 決定木ごとに使用される [入力トレーニング フィーチャ] 値の割合。 デフォルトはデータの 100% です。 各ツリーのサンプルは、指定されたデータの 3 分の 2 の中からランダムに取得されます。 集合内の各決定木の作成には、ランダムなサンプルが使用されるか、利用可能なトレーニング データのサブセット (約 3 分の 2) が使用されます。 各決定木の入力データの割合を低くすると、大規模なデータセットの場合のこのツールの実行速度が上がります。 | Long |
ランダムにサンプリングされる変数の数 (オプション) | 各決定木の作成に使用される説明変数の数。 集合内の各決定木の作成には、指定された説明変数のランダムなサブセットが使用されます。 各決定木で使用される変数の数を増やすと、特に 1 つ以上のドミナント変数がある場合は、モデルを過剰適合する可能性が増加します。 一般的な方法として、[予測対象変数] 値が数値の場合は、説明変数の総数 (フィールド、距離、およびラスターの合計) の平方根を使用し、[予測対象変数] 値がカテゴリの場合は、説明変数の総数 (フィールド、距離、およびラスターの合計) を 3 で除算します。 | Long |
検証のために除外するトレーニング データ (%) (オプション) | 検証のためにテスト データセットとして確保される [入力トレーニング フィーチャ] 値の割合 (10 ~ 50 パーセント)。 ここで指定したデータのランダムなサブセットなしでモデルのトレーニングが行われ、これらのフィーチャの観測値が予測値と比較されます。 デフォルトは 10 パーセントです。 | Double |
出力分類パフォーマンス テーブル (混同行列) (オプション) | 作成されたモデルのパフォーマンスをまとめた分類の混同行列。 このテーブルを使用すると、ツールが出力メッセージ内で計算する精度と感度の計測値に加えて、他の診断を計算できます。 | Table |
出力整合チェック テーブル (オプション) | [整合チェックの実行回数] 値が 2 より大きい場合、このテーブルは各モデルに対して R2 の分布のチャートを作成します。 この分布を使用して、モデルの安定性を評価できます。 | Table |
散在するカテゴリの補正 (オプション) | 頻度にかかわらず、トレーニング データセット内の各カテゴリを各ツリーで表すかどうかを指定します。
| Boolean |
整合チェックの実行回数 (オプション) | ツールの反復回数。 各実行に対する R2 の分布は、[出力整合チェック テーブル] パラメーターを使用して表示できます。 これが設定され、予測が生成される場合、最高の R2 値を生成するモデルのみが予測に使用されます。 | Long |
不確実性の計算 (オプション) | トレーニング、フィーチャの予測、またはラスターの予測の際に、予測の不確実性を計算するかどうかを指定します。
| Boolean |
派生した出力
ラベル | 説明 | データ タイプ |
出力不確実性ラスター レイヤー | [不確実性の計算] パラメーターがオンの場合、ツールは [予測対象変数] パラメーターの予測値の周辺で 90 パーセントの予測間隔を計算します。 | Raster Layer |