Étiquette | Explication | Type de données |
Type de prédiction
| Spécifie le mode opératoire de l’outil. Vous pouvez exécuter l’outil pour entraîner un modèle dédié à l’évaluation des performances, à la prévision d'entités ou à la création d'une surface de prévision,
| String |
Entités d’entraînement en entrée
| Classe d'entités contenant le paramètre Variable to Predict (Variable à prévoir) et, le cas échéant, les variables d'entraînement explicatives issues des champs. | Feature Layer |
Variable à prévoir
(Facultatif) | Variable du paramètre Input Training Features (Entités d’entraînement en entrée) contenant les valeurs à utiliser pour entraîner le modèle. Ce champ contient des valeurs (d'entraînement) connues de la variable qui sera utilisée pour réaliser des prévisions à des emplacements inconnus. | Field |
Traiter les variables comme catégorielles (Facultatif) | Indique si la variable à prévoir (Variable to Predict) est catégorielle.
| Boolean |
Variables d’entraînement explicatives
(Facultatif) | Liste des champs qui représentent les variables explicatives utilisées pour prévoir la valeur ou la catégorie de la variable à prévoir (Variable to Predict). Cochez la case Categorical (Catégoriel) des variables qui représentent des classes ou des catégories (comme l’occupation du sol, la présence ou l'absence). | Value Table |
Entités de distance d’entraînement explicatives
(Facultatif) | Ce paramètre crée automatiquement des variables explicatives en calculant la distance entre les entités fournies et les entités d'entraînement en entrée (Input Training Features). Les distances entre chacune des entités de distance d'entraînement explicatives (Explanatory Training Distance Features) en entrée et les entités d'entraînement en entrée (Input Training Feature) les plus proches sont calculées. Si les entités de distance d'entraînement explicatives (Explanatory Training Distance Features) en entrée sont des polygones ou des lignes, les attributs de distance sont calculés comme étant la distance entre les segments les plus proches de la paire d’entités. | Feature Layer |
Rasters d’entraînement explicatifs (Facultatif) | Ce paramètre crée automatiquement des variables d’entraînement explicatives dans votre modèle, dont les valeurs sont extraites de rasters. Pour chacune des Input Training Features (Entités d’entraînement en entrée), la valeur de la cellule raster est extraite à l’emplacement exact. Pour les rasters continus, la valeur de raster est extraite par la méthode de rééchantillonnage bilinéaire de raster. Pour les rasters catégoriels, la valeur de raster est extraite par la méthode d'affectation du voisin le plus proche. Cochez la case Categorical (Catégoriel) des rasters qui représentent des classes ou des catégories (comme l’occupation du sol, la présence ou l’absence). | Value Table |
Entités de prévision en entrée (Facultatif) | Classe d'entités qui représente les emplacements où des prévisions sont réalisées. Cette classe d'entités doit également comporter toutes les variables explicatives fournies en tant que champs et correspondant aux champs utilisés issus des données d’entraînement, le cas échéant. | Feature Layer |
Entités prévues en sortie
(Facultatif) | Classe d’entités en sortie qui reçoit les résultats de la prédiction. | Feature Class |
Surface de prédiction en sortie (Facultatif) | Le raster en sortie qui contient les résultats de la prévision. La taille de cellule par défaut correspond à la taille de cellule maximale des entrées raster. Pour définir une taille de cellule différente, utilisez le paramètre d'environnement Cell Size (Taille de cellule). | Raster Dataset |
Apparier les variables explicatives
(Facultatif) | Liste des variables explicatives (Explanatory Variables) spécifiées dans les entités d’entraînement en entrée (Input Training Features) à droite et de leurs champs correspondants dans les entités de prédiction en entrée (Input Prediction Features) à gauche. | Value Table |
Apparier les entités de distance
(Facultatif) | Liste des Explanatory Distance Features (Entités de distance explicatives) spécifiées pour les Input Training Features (Entités d’entraînement en entrée) à droite. Les jeux d'entités correspondants doivent être spécifiés pour les Input Prediction Features (Entités de prévision en entrée) à gauche. Si les entités de distance explicatives (Explanatory Distance Features) qui sont utilisées pour l'entraînement se situent dans une zone d’étude ou une période différente, il est possible de fournir celles qui sont les plus adaptées aux entités de prédiction en entrée (Input Prediction Features). | Value Table |
Apparier les rasters explicatifs
(Facultatif) | Liste des Explanatory Rasters (Rasters explicatifs) spécifiés pour les Input Training Features (Entités d'entraînement en entrée) à droite. Les rasters correspondants doivent être spécifiés pour les Input Prediction Features (Entités de prévision en entrée) ou les Prediction Surface (Surface de prévision) à créer à gauche. Si les rasters explicatifs (Explanatory Rasters) qui sont utilisées pour l'entraînement se situent dans une zone d’étude ou une période différente, il est possible de fournir ceux qui sont les plus adaptés aux entités de prédiction en entrée (Input Prediction Features). | Value Table |
Entités formées en sortie
(Facultatif) | Les entités formées en sortie (Output Trained Features) contiennent toutes les variables explicatives utilisées pour l’entraînement (notamment les valeurs de raster échantillonnées et les calculs de distance), ainsi que le champ Variable to Predict (Variable à prévoir) observé et les prédictions supplémentaires susceptibles d’être utilisées pour approfondir l'évaluation des performances du modèle formé. | Feature Class |
Table de l’importance des variables en sortie
(Facultatif) | Si ce paramètre est défini, cette table contient des informations décrivant l’importance de chaque variable explicative (champs, entités de distance et rasters) utilisée dans le modèle créé. Le diagramme créé à partir de cette table est accessible dans la fenêtre Contents (Contenu). | Table |
Convertir les polygones en résolution raster pour l'entraînement
(Facultatif) | Détermine le traitement des polygones pendant la formation du modèle si les entités d'entraînement en entrée (Input Training Features) sont des polygones avec une variable catégorielle à prévoir (Variable to Predict) et que seuls les rasters d’entraînement explicatifs (Explanatory Training Rasters) ont été spécifiés.
| Boolean |
Nombre d'arbres
(Facultatif) | Nombre d'arbres à créer dans le modèle de forêt. Un grand nombre d’arbres produit habituellement des résultats plus précis, mais le calcul du modèle prend davantage de temps. Le nombre d’arbres par défaut est défini sur 100. | Long |
Taille minimale des feuilles
(Facultatif) | Nombre minimal d’observations requises pour conserver une feuille (en d’autres termes, le nœud ultime d’un arbre sans fractionnements supplémentaires). La valeur minimale par défaut est de 5 pour la régression et de 1 pour la classification. Si les données sont très volumineuses, plus ces valeurs augmentent, plus le temps d’exécution de l’outil diminue. | Long |
Profondeur d'arbre maximum
(Facultatif) | Nombre maximum de fractionnements pouvant être effectués pour un arbre. Si la profondeur maximum est élevée, le nombre de fractionnements créés augmente, ce qui accroît les risques de sur-ajustement du modèle. La valeur par défaut est dynamique et dépend du nombre d’arbres créés et du nombre de variables incluse. | Long |
Données disponibles par arbre (%)
(Facultatif) | Détermine le pourcentage d'entités d'entraînement en entrée (Input Training Features) utilisées pour chaque arbre décisionnel. La valeur par défaut est 100 pour cent des données. Les échantillons de chaque arbre sont sélectionnés de manière aléatoire dans les deux tiers des données spécifiées. Chaque arbre décisionnel de la forêt est créé à partir d’un échantillon aléatoire ou d’un sous-ensemble (équivalant approximativement aux deux tiers) des données d’entraînement disponibles. Si un pourcentage plus faible de données est utilisé en entrée pour chaque arbre décisionnel, l’outil s’exécute plus rapidement sur les jeux de données très volumineux. | Long |
Nombre de variables échantillonnées de manière aléatoire
(Facultatif) | Indique le nombre de variables explicatives utilisées pour créer chaque arbre décisionnel. Chaque arbre décisionnel dans la forêt est créé à l’aide d’un sous-ensemble aléatoire des variables explicatives spécifiées. L’augmentation du nombre de variables utilisées dans chaque arbre décisionnel augmente la probabilité de sur-ajustement de votre modèle en particulier si une ou plusieurs variables dominent. Si la Variable to Predict (Variable à prévoir) est numérique, il est courant d’utiliser la racine carrée du nombre total de variables explicatives (champs, distances et rasters confondus) et, si la Variable to Predict (Variable à prévoir) est catégorielle, de diviser le nombre total de variables explicatives (champs, distances et rasters confondus) par 3. | Long |
Données d’entraînement exclues pour la validation (%) (Facultatif) | Détermine le pourcentage (entre 10 pour cent et 50 pour cent) des Input Training Features (Entités d’entraînement en entrée)) à réserver en guise de jeu de données de test pour la validation. Le modèle sera formé sans ce sous-ensemble aléatoire de données et les valeurs observées pour ces entités seront comparées aux valeurs prévues. La valeur par défaut est 10 pour cent. | Double |
Table des performances de classification en sortie (Matrice de confusion) (Facultatif) | Si cela est spécifié, crée une matrice de confusion pour la classification qui récapitule les performances du modèle créé. Cette table permet de calculer d’autres diagnostics au-delà des mesures d’exactitude et de sensibilité que l’outil calcule dans les messages en sortie. | Table |
Table de validation en sortie (Facultatif) | Si la valeur Number of Runs for Validation (Nombre d’exécutions pour la validation) spécifiée est supérieure à 2, cette table crée un diagramme de la distribution de R2 pour chaque modèle. Cette distribution permet d’évaluer la stabilité de votre modèle. | Table |
Compenser les catégories creuses
(Facultatif) | Si certaines catégories de votre jeu de données ne se produisent pas aussi souvent que d’autres, ce paramètre permet de s’assurer que chaque catégorie est représentée dans chaque arbre.
| Boolean |
Nombre d’exécutions pour la validation
(Facultatif) | L’outil s’exécute pour le nombre d’itérations spécifié. La distribution de R2 pour chaque exécution s’affiche à l’aide du paramètre Output Validation Table (Table de validation en sortie). Une fois ce paramètre défini et les prévisions en cours de génération, seul le modèle qui a produit la valeur R2 la plus élevée est utilisé pour les prévisions. | Long |
Calculer l’incertitude
(Facultatif) | Spécifie si l’incertitude de prévision sera calculée lorsque vous effectuez l’entraînement, une prévision sur des entités, une prévision sur un raster.
| Boolean |
Sortie obtenue
Étiquette | Explication | Type de données |
Couches de raster d’incertitude en sortie | Lorsque le Calculate Uncertainty (Calculer l’incertitude) est sélectionné, l’outil calcule un intervalle de prévision de 90 pour cent autour de chaque valeur prévue de la Variable to Predict (Variable à prévoir). | Couche raster |