标注 | 说明 | 数据类型 |
预测类型
| 指定工具的操作模式。可以运行此工具来训练模型,以仅评估性能、预测要素或创建预测表面。
| String |
输入训练要素
| 要素类,包含要预测的变量参数以及字段中的解释训练变量(可选)。 | Feature Layer |
要预测的变量
(可选) | 输入训练要素参数中的变量,其中包含要用于训练模型的值。该字段包含将用于在未知位置进行预测的变量的已知(训练)值。 | Field |
将变量视为分类变量 (可选) | 指定要预测的变量是否为分类变量。
| Boolean |
解释训练变量
(可选) | 表示解释变量的字段列表,可帮助预测要预测的变量的值或类别。对于任何表示类或类别(例如土地覆被或存在/不存在)的变量,请选中分类复选框。 | Value Table |
解释训练距离要素
(可选) | 通过计算给定要素与输入训练要素的距离可自动创建解释变量。将计算每个输入解释训练距离要素与最近的输入训练要素的距离。如果输入解释训练距离要素为面要素或线要素,则距离属性将计算为要素对的最近线段之间的距离。 | Feature Layer |
解释训练栅格 (可选) | 将在模型(其值从栅格中提取)中自动创建解释训练变量。对于输入训练要素中的每个要素,将在此确切位置处提取栅格像元的值。提取连续栅格的栅格值时,将使用双线性栅格重采样。从分类栅格中提取栅格值时,将使用最邻近分配法。对于任何表示类或类别(例如土地覆被或存在/不存在)的栅格,请选中分类复选框。 | Value Table |
输入预测要素 (可选) | 表示将进行预测的位置的要素类。此要素类还必须包含作为字段提供的任何解释变量,这些字段对应于训练数据(如果存在)中使用的字段。 | Feature Layer |
输出预测要素
(可选) | 用于接收预测结果的输出要素类。 | Feature Class |
输出预测表面 (可选) | 包含预测结果的输出栅格。默认像元大小将为栅格输入的最大像元大小。要设置其他像元大小,请使用像元大小环境设置。 | Raster Dataset |
匹配解释变量
(可选) | 根据右侧输入训练要素以及左侧输入预测要素中其对应字段指定的解释变量列表。 | Value Table |
匹配距离要素
(可选) | 针对右侧输入训练要素指定的解释距离要素的列表。应该针对左侧输入预测要素指定对应的要素集。 如果用于训练的要素位于不同的研究区域或时间段,则可以提供更适用于输入预测要素的解释距离要素。 | Value Table |
匹配解释栅格
(可选) | 针对右侧输入训练要素指定的解释栅格的列表。应该针对左侧要创建的输入预测要素或预测表面指定对应的栅格。 如果用于训练的要素位于不同的研究区域或时间段,则可以提供更适用于输入预测要素的解释栅格。 | Value Table |
输出训练要素
(可选) | 输出训练要素将包含所有用于训练(包括采样栅格值和距离计算)的解释变量、观察的要预测的变量字段,以及可用于进一步评估训练模型性能的相应预测。 | Feature Class |
输出变量重要性表格
(可选) | 如果指定,则表格将包含描述在所创建的模型中使用的每个解释变量(字段、距离要素和栅格)的重要性的信息。基于该表创建的图表可通过内容窗格进行访问。 | Table |
将面转换为用于训练的栅格分辨率
(可选) | 如果输入训练要素为面要素(要预测的变量为分类变量),并且仅指定了解释训练栅格,则训练模型时需要指定面的处理方式。
| Boolean |
树数
(可选) | 要在森林模型中创建的树的数量。增大树数通常将产生更加精确的模型预测,但是将增加模型计算的时间。默认树数为 100。 | Long |
最小叶子大小
(可选) | 保留叶子(即未进一步进行分割的树上的终端节点)所需的最小观测值数。回归的默认最小值为 5,分类的默认值为 1。对于非常大的数据,增大这些数值将减小工具的运行时间。 | Long |
最大树深
(可选) | 对树进行的最大分割数。如果使用较大的最大深度,则将创建更多分割,这可能会增大过度拟合模型的可能性。默认值由数据驱动,并且取决于所创建的树数以及所包含的变量数。 | Long |
每棵树的可用数据 (%)
(可选) | 指定用于每棵决策树的输入训练要素的百分比。默认值为 100% 的数据。将根据指定数据的三分之二随机获取每棵树的样本。 可以使用可用训练数据的随机样本或子集(大约三分之二)来创建森林中的每棵决策树。针对每棵决策树使用较低百分比的输入数据可以提高适用于大型数据集的工具的速度。 | Long |
随机采样的变量数
(可选) | 指定用于创建每棵决策树的解释变量数。 可以使用指定解释变量的随机子集创建森林中的每棵决策树。增大每棵决策树中使用的变量数将增大过度拟合模型的可能性,尤其是存在一个或多个主导变量时更是如此。常用方法是:如果要预测的变量为数值,则使用解释变量(组合字段、距离和栅格)总数的平方根;如果要预测的变量为分类变量,则将解释变量(组合字段、距离和栅格)的总数除以 3。 | Long |
针对验证而排除的训练数据 (%) (可选) | 指定要保留为验证测试数据集的输入训练要素的百分比(介于 10% 和 50% 之间)。将在没有此随机数据子集的情况下对模型进行训练,并将这些要素的观测值与预测值进行比较。默认值为 10%。 | Double |
输出分类性能表(混淆矩阵) (可选) | 如果指定,则将创建一个混淆矩阵,用于分类汇总所创建模型的性能。除了工具在输出消息中计算的精度和灵敏度测量值之外,此表格还可以用于计算其他诊断。 | Table |
输出验证表 (可选) | 如果指定验证的运行次数大于 2,则此表将为每个模型创建 R2 分布图表。此分布可用于评估模型的稳定性。 | Table |
补偿稀疏类别
(可选) | 如果数据集中存在出现频繁低于其他类别的类别,则选中此参数将确保每棵树中存在各个类别。
| Boolean |
验证的运行次数
(可选) | 工具将运行指定迭代次数。可以使用输出验证表参数来显示每次运行的 R2 分布。设置此选项并生成预测后,仅生成了最高 R2 值的模型将用于预测。 | Long |
计算不确定性
(可选) | 指定在训练、预测要素或预测栅格时是否计算预测不确定性。
| Boolean |
派生输出
标注 | 说明 | 数据类型 |
输出不确定性栅格图层 | 选中计算不确定性时,该工具将计算出要预测的变量中每个预测值周围 90% 的预测区间。 | 栅格图层 |