Étiquette | Explication | Type de données |
Type de prévision | Spécifie le mode opératoire de l’outil. Vous pouvez exécuter l’outil pour entraîner un modèle dédié à l’évaluation des performances, à la prévision d'entités ou à la création d'une surface de prévision,
| String |
Entités d’entraînement en entrée | La couche contenant le paramètre Variable to Predict (Variable à prévoir) et les champs de variables d’entraînement explicatives. | Record Set |
Nom des entités en sortie (Facultatif) | Nom de la couche d’entités en sortie. | String |
Variable à prévoir (Facultatif) | Variable du paramètre Input Training Features (Entités d’entraînement en entrée) contenant les valeurs à utiliser pour entraîner le modèle. Ce champ contient des valeurs (d'entraînement) connues de la variable qui sera utilisée pour réaliser des prévisions à des emplacements inconnus. | Field |
Traiter les variables comme catégorielles (Facultatif) | Indique si la variable à prévoir (Variable to Predict) est une variable catégorielle.
| Boolean |
Variables explicatives (Facultatif) | Liste des champs qui représentent les variables explicatives utilisées pour prévoir la valeur ou la catégorie de la variable à prévoir (Variable to Predict). Cochez la case Categorical (Catégoriel) des variables qui représentent des classes ou des catégories (comme l’occupation du sol, la présence ou l'absence). | Value Table |
Créer une table de l’importance des variable (Facultatif) | Indique si la table en sortie contient des informations décrivant l’importance de chaque variable explicative utilisée dans le modèle.
| Boolean |
Entités de prévision en entrée (Facultatif) | Couche d’entités représentant les emplacements où se produisent les prévisions. Cette couche d’entités doit également comporter toutes les variables explicatives fournies en tant que champs et correspondant aux champs utilisés issus des données d’entraînement. | Record Set |
Apparier les variables explicatives (Facultatif) | Liste des variables explicatives (Explanatory Variables) spécifiées dans les entités d’entraînement en entrée (Input Training Features) à droite et de leurs champs correspondants dans les entités de prévision en entrée (Input Prediction Features) à gauche. | Value Table |
Nombre d’arbres (Facultatif) | Nombre d'arbres à créer dans le modèle de forêt. Un grand nombre d’arbres produit habituellement des résultats plus précis, mais le calcul du modèle prend davantage de temps. Le nombre d’arbres par défaut est défini sur 100. | Long |
Taille minimale des feuilles (Facultatif) | Nombre minimal d’observations requises pour conserver une feuille (c’est-à-dire le nœud terminal d’un arbre sans fractionnements supplémentaires). La valeur minimale par défaut pour une régression est 5 ; la valeur par défaut est 1 pour une classification. Pour les jeux de données très volumineux, l’augmentation de ces nombres aura pour effet de réduire le temps d’exécution de l’outil. | Long |
Profondeur d’arbre maximale (Facultatif) | Nombre maximum de fractionnements pouvant être effectués pour un arbre. Si la profondeur maximum est élevée, le nombre de fractionnements créés augmente, ce qui accroît les risques de sur-ajustement du modèle. La valeur par défaut est dynamique ; elle dépend du nombre d'arbres créés et du nombre de variables incluses. | Long |
Données disponibles par arbre (%) (Facultatif) | Pourcentage d’entités d’entraînement en entrée (Input Training Features) utilisées pour chaque arbre décisionnel. La valeur par défaut est 100 pour cent des données. Les échantillons de chaque arbre sont sélectionnés de manière aléatoire dans les deux tiers des données spécifiées. Chaque arbre décisionnel de la forêt est créé à partir d’un échantillon aléatoire ou d’un sous-ensemble (équivalant approximativement aux deux tiers) des données d’entraînement disponibles. Si un pourcentage plus faible de données est utilisé en entrée pour chaque arbre décisionnel, l’outil s’exécute plus rapidement sur les jeux de données très volumineux. | Long |
Nombre de variables échantillonnées de manière aléatoire (Facultatif) | Nombre de variables explicatives utilisées pour créer chaque arbre décisionnel. Chaque arbre décisionnel de la forêt est créé à l'aide d’un sous-ensemble aléatoire des variables explicatives spécifiées. Une augmentation du nombre de variables utilisées dans chaque arbre décisionnel accroît les risques de sur-ajustement de votre modèle, notamment s’il comporte au moins une variable dominante. Si Variable to Predict (Variable à prévoir) est numérique, il est courant d’utiliser la racine carrée du nombre total de variables explicatives ou, si Variable to Predict (Variable à prévoir) est catégorielle, de diviser le nombre total de variables explicatives par 3. | Long |
Données d’entraînement exclues pour la validation (%) (Facultatif) | Pourcentage (entre 10 pour cent et 50 pour cent) des Input Training Features (Entités d’entraînement en entrée) à réserver en guise de jeu de données de test pour la validation. Le modèle sera formé sans ce sous-ensemble aléatoire de données et les valeurs observées pour ces entités seront comparées aux valeurs prévues. La valeur par défaut est 10 pour cent. | Long |
Data store (Facultatif) | Indique le ArcGIS Data Store où la sortie sera stockée. Tous les résultats stockés dans un répertoire de données Big Data spatio-temporelles seront stockés en WGS84. Les résultats stockés dans un répertoire de données relationnelles conservent leur système de coordonnées.
| String |
Sortie obtenue
Étiquette | Explication | Type de données |
Entités entraînées en sortie | La sortie contenant les variables en entrée utilisées pour l’entraînement, ainsi que la variable observée pour prévoir le paramètre, et les prévisions associées pouvant être utilisées pour évaluer davantage les performances du modèle. | Record Set |
Table de l’importance des variables | Table contenant des informations décrivant l’importance de chaque variable explicative à utiliser dans le modèle créé. | Record Set |
Entités prévues en sortie | Couche qui recevra les prévisions du modèle. | Record Set |