标注 | 说明 | 数据类型 |
预测类型 | 指定工具的操作模式。 可以运行此工具来训练模型,以仅评估性能、预测要素或创建预测表面。
| String |
输入训练要素 | 要素类,包含要预测的变量参数值以及字段中的解释训练变量(可选)。 | Feature Layer |
要预测的变量 (可选) | 输入训练要素参数中的变量,其中包含要用于训练模型的值。 该字段包含将用于在未知位置进行预测的变量的已知(训练)值。 | Field |
将变量视为分类变量 (可选) | 指定要预测的变量值是否为分类变量。
| Boolean |
解释训练变量 (可选) | 表示解释变量的字段列表,可帮助预测要预测的变量值的值或类别。 对于任何表示类或类别(例如土地覆被或存在/不存在)的变量,请选中分类复选框。 | Value Table |
解释训练距离要素 (可选) | 解释训练距离要素。 通过计算从提供的要素到输入训练要素值的距离,将自动创建解释变量。 将计算每个输入解释训练距离要素值与最近的输入训练要素值的距离。 如果输入解释训练距离要素值为面要素或线要素,则距离属性将计算为要素对的最近线段之间的距离。 | Feature Layer |
解释训练栅格 (可选) | 从栅格中提取的解释训练变量。 解释训练变量将通过提取栅格像元值自动创建。 对于输入训练要素参数中的每个要素,将在此确切位置处提取栅格像元的值。 提取连续栅格的栅格值时,将使用双线性栅格重采样。 从分类栅格中提取栅格值时,将使用最邻近分配法。 对于任何表示类或类别(例如土地覆被或存在/不存在)的栅格,请选中分类复选框。 | Value Table |
输入预测要素 (可选) | 表示将进行预测的位置的要素类。 此要素类还必须包含作为字段提供的任何解释变量,这些字段对应于训练数据中使用的字段。 | Feature Layer |
输出预测要素 (可选) | 包含预测结果的输出要素类。 | Feature Class |
输出预测表面 (可选) | 包含预测结果的输出栅格。 默认像元大小将为栅格输入的最大像元大小。 要设置其他像元大小,请使用像元大小环境设置。 | Raster Dataset |
匹配解释变量 (可选) | 根据右侧输入训练要素参数以及左侧输入预测要素参数中其对应字段指定的解释变量值的列表。 | Value Table |
匹配距离要素 (可选) | 根据右侧输入训练要素参数以及左侧输入预测要素参数中其对应要素指定的解释距离要素值的列表。 如果用于训练的要素位于不同的研究区域或时间段,则可以提供更适用于输入预测要素参数的解释距离要素值。 | Value Table |
匹配解释栅格 (可选) | 根据右侧输入训练要素参数以及左侧输入预测要素参数或预测表面参数中其对应栅格指定的解释栅格值的列表。 如果用于训练的要素位于不同的研究区域或时间段,则可以提供更适用于输入预测要素参数的解释栅格值。 | Value Table |
输出训练要素 (可选) | 用于训练(包括采样栅格值和距离计算)的解释变量、观察的要预测的变量字段,以及可用于进一步评估训练模型性能的相应预测。 | Feature Class |
输出变量重要性表格 (可选) | 表格将包含描述在所创建的模型中使用的每个解释变量(字段、距离要素和栅格)的重要性的信息。 基于该表创建的图表可通过内容窗格进行访问。 | Table |
将面转换为用于训练的栅格分辨率 (可选) | 如果输入训练要素值为面要素(要预测的变量为分类变量),并且仅指定了解释训练栅格值,则训练模型时需要指定面的处理方式。
| Boolean |
树数 (可选) | 要在森林模型中创建的树的数量。 增大树数通常将产生更加精确的模型预测,但是将增加模型计算的时间。 默认树数为 100。 | Long |
最小叶子大小 (可选) | 保留叶子(即未进一步进行分割的树上的终端节点)所需的最小观测值数。 回归的默认最小值为 5,分类的默认值为 1。 对于非常大的数据,增大这些数值将减少工具的运行时间。 | Long |
最大树深 (可选) | 对树进行的最大分割数。 如果使用较大的最大深度,则将创建更多分割,这可能会增大过度拟合模型的可能性。 默认值由数据驱动,并且取决于所创建的树数以及所包含的变量数。 | Long |
每棵树的可用数据 (%) (可选) | 用于每棵决策树的输入训练要素值的百分比。 默认值为 100% 的数据。 将根据指定数据的三分之二随机获取每棵树的样本。 可以使用可用训练数据的随机样本或子集(大约三分之二)来创建森林中的每棵决策树。 针对每棵决策树使用较低百分比的输入数据可以提高适用于大型数据集的工具的速度。 | Long |
随机采样变量数 (可选) | 用于创建每棵决策树的解释变量数。 可以使用指定解释变量的随机子集创建森林中的每棵决策树。 增大每棵决策树中使用的变量数将增大过度拟合模型的可能性,尤其是存在一个或多个主导变量时更是如此。 常用方法是:如果要预测的变量值为数值,则使用解释变量(组合字段、距离和栅格)总数的平方根;如果要预测的变量值为分类变量,则将解释变量(组合字段、距离和栅格)的总数除以 3。 | Long |
针对验证而排除的训练数据 (%) (可选) | 要保留为验证测试数据集的输入训练要素值的百分比(介于 10% 和 50% 之间)。 将在没有此随机数据子集的情况下对模型进行训练,并将这些要素的观测值与预测值进行比较。 默认值为 10%。 | Double |
输出分类性能表(混淆矩阵) (可选) | 用于分类汇总所创建模型的性能的混淆矩阵。 除了工具在输出消息中计算的精度和灵敏度测量值之外,此表格还可以用于计算其他诊断。 | Table |
输出验证表 (可选) | 如果验证的运行次数值大于 2,则此表将为每个模型创建 R 2 分布图表。 此分布可用于评估模型的稳定性。 | Table |
补偿稀疏类别 (可选) | 指定训练数据集中的每个类别(无论其频率如何)都将在每棵树中表示。
| Boolean |
验证的运行次数 (可选) | 工具迭代次数。 可以使用输出验证表参数来显示每次运行的 R2 分布。 设置此选项并生成预测后,仅生成了最高 R 2 值的模型将用于预测。 | Long |
计算不确定性 (可选) | 指定在训练、预测要素或预测栅格时是否计算预测不确定性。
| Boolean |
派生输出
标注 | 说明 | 数据类型 |
输出不确定性栅格图层 | 选中计算不确定性参数时,工具将计算要预测的变量参数的每个预测值周围的 90% 预测区间。 | Raster Layer |