Étiquette | Explication | Type de données |
Entités de variable dépendante en entrée | Entités ponctuelles en entrée contenant le champ à interpoler. | Feature Layer |
Champ de variable dépendante | Champ des valeurs Entités de variable dépendante en entrée contenant les valeurs de la variable dépendante. Il s’agit du champ qui sera interpolé. | Field |
Rasters de variable explicative en entrée | Rasters en entrée représentant les variables explicatives à utiliser pour concevoir le modèle de régression. Ces rasters doivent représenter les variables connues pour influer sur les valeurs de la variable dépendante. Par exemple, lorsque vous interpolez des données de température, un raster d’élévation doit être utilisé comme variable explicative car la température est influencée par l’élévation. Vous pouvez utiliser jusqu’à 62 rasters explicatifs. | Raster Layer; Mosaic Layer |
Output geostatistical layer | Couche géostatistique en sortie qui affiche le résultat de l’interpolation. | Geostatistical Layer |
Raster de prédiction en sortie (Facultatif) | Raster en sortie qui affiche le résultat de l’interpolation. La taille de cellule par défaut correspondra au maximum des tailles de cellule des valeurs Rasters de variable explicative en entrée. Pour utiliser une taille de cellule différente, utilisez le paramètre d’environnement Taille de cellule. | Raster Dataset |
Classe d’entités de diagnostic en sortie (Facultatif) | Classe d’entités surfaciques en sortie qui affiche les régions de chaque modèle local et contient des champs avec des informations de diagnostic pour les modèles locaux. Pour chaque sous-ensemble, un polygone entourant les points du sous-ensemble est créé afin de faciliter l’identification des points qui ont été utilisés dans chaque sous-ensemble. Par exemple, si 10 modèles locaux sont présents, cette sortie comportera dix polygones. La classe d’entités contiendra les champs suivants :
| Feature Class |
Champ d’erreur de mesure de la variable dépendante (Facultatif) | Champ qui spécifie l’erreur de mesure pour chaque point dans les entités de variable dépendante. Pour chaque point, la valeur de ce champ doit correspondre à un écart type de la valeur mesurée du point. Utilisez ce champ si les valeurs d’erreur de mesure ne sont pas identiques pour chaque point. Des données mesurées à l’aide de différents appareils sont fréquemment à l’origine d’erreurs de mesure non constantes. Un appareil peut être plus précis qu’un autre, ce qui implique qu’il génère des erreurs de mesure plus faibles. Par exemple, un thermomètre arrondit au degré le plus proche tandis qu’un autre arrondit au dixième de degré le plus proche. La variabilité des mesures est généralement fournie par le fabricant de l’appareil de mesure ou déterminée de manière empirique. Laissez ce paramètre vide en l’absence de valeurs d’erreur de mesure ou si ces dernières sont inconnues. | Field |
Pourcentage cumulé minimal de la variance (Facultatif) | Définit le pourcentage cumulé minimal de la variance à partir des composantes principales des rasters de variable explicative. Avant de créer le modèle de régression, les composantes principales des variables explicatives sont calculées et ces composantes principales sont utilisées comme variables explicatives dans la régression. Chaque composante principale capture un certain pourcentage de la variance des variables explicatives et ce paramètre contrôle le pourcentage minimal de la variance à capturer par les composantes principales de chaque modèle local. Par exemple, si la valeur 75 est fournie, le logiciel utilise le nombre minimal de composantes principales qui sont nécessaires pour capturer au moins 75 pour cent de la variance des variables explicatives. Les composantes principales n’étant pas mutuellement corrélées les unes aux autres, leur utilisation résout le problème de multicolinéarité (variables explicatives corrélées les unes aux autres). La plupart des informations contenues dans toutes les variables explicatives peuvent fréquemment être capturées dans seulement quelques composantes principales. En ignorant les composantes principales les moins utiles, le calcul du modèle gagne en stabilité et en efficacité sans une perte de précision conséquente. Pour calculer les composantes principales, les variables explicatives doivent présenter une variabilité. Ainsi, si l’un de vos Rasters de variable explicative en entrée contient des valeurs constantes dans un sous-ensemble, ces rasters constants ne sont pas utilisés pour calculer les composantes principales de ce sous-ensemble. Si tous les rasters de variable explicative dans un sous-ensemble contiennent des valeurs constantes, la Classe d’entités de diagnostic en sortie signale qu’aucune des composantes principales n’a été utilisée et qu’elles ont capturé zéro pour cent de la variabilité. | Double |
Sous-ensemble d’entités surfaciques (Facultatif) | Entités surfaciques définissant où les modèles locaux seront calculés. Les points à l’intérieur de chaque polygone seront utilisés pour les modèles locaux. Ce paramètre est utile si vous savez que la valeur de la variable dépendante change en fonction de régions connues. Par exemple, ces polygones peuvent représenter des régions administratives en matière de santé, où la politique sanitaire change pour chacune. Vous pouvez également utiliser l’outil Générer des sous-ensembles de polygones pour créer des sous-ensembles de polygones. Les polygones créés par cet outil ne se superposent pas et sont compacts. | Feature Layer |
Type de transformation de la variable dépendante (Facultatif) | Type de transformation à appliquer aux données en entrée.
| String |
Type de modèle de semi-variogramme (Facultatif) | Le modèle de semi-variogramme qui sera utilisé pour l’interpolation.
| String |
Maximum number of points in each local model (Facultatif) | Les données en entrée seront automatiquement divisées en sous-ensembles ne contenant pas plus que ce nombre de points. Si le paramètre Sous-ensemble d’entités surfaciques est fourni, sa valeur est ignorée. | Long |
Local model area overlap factor (Facultatif) | Facteur représentant le degré de superposition entre les modèles locaux (également appelés sous-ensembles). Chaque point en entrée peut être compris dans plusieurs sous-ensembles. Le facteur de superposition indique le nombre moyen des sous-ensembles dans lesquels chaque point sera compris. Une valeur élevée du facteur de superposition rend la surface en sortie plus lisse, mais augmente également le temps de traitement. Les valeurs doivent être comprises entre 1 et 5. Si le paramètre Sous-ensemble d’entités surfaciques est fourni, sa valeur est ignorée. | Double |
Nombre de simulations (Facultatif) | Nombre de semi-variogrammes simulés de chaque modèle local. En augmentant le nombre de simulations, les calculs du modèle seront plus stables, mais le temps de calcul sera plus long. | Long |
Search neighborhood (Facultatif) | Définit les points de voisinage qui seront utilisés pour contrôler la sortie. Standard est la valeur par défaut. Circulaire standard
Circulaire lissé
| Geostatistical Search Neighborhood |
Disponible avec une licence Geostatistical Analyst.
Synthèse
Prévision de la régression EBK est une méthode d'interpolation géostatistique qui utilise l’outil Krigeage bayésien empirique avec des rasters de variable explicative qui sont connus pour affecter la valeur des données que vous interpolez. Cette approche associe le krigeage à l'analyse de régression pour réaliser des prévisions qui sont plus précises que ce qu'il est possible d'obtenir avec chaque méthode de régression ou de krigeage.
Utilisation
Cet outil prend uniquement en charge les cartes de prédiction en sortie. Pour créer des cartes d’erreurs standard, de quantiles ou de probabilités, générez une couche géostatistique et convertissez-la en un raster (ou en plusieurs rasters) avec l’outil Couche GA vers rasters.
Cette méthode de krigeage peut gérer les données en entrée modérément non stationnaires.
Seules les types de Voisinages de recherche Circulaire standard et Circulaire lissé sont autorisés pour cette méthode d’interpolation.
Si l’une des valeurs Rasters de variable explicative en entrée comporte plusieurs cellules NoData, il est possible que Couche géostatistique en sortie ne puisse être visualisée sur la carte. Cela n’est pas un problème et les calculs ont été effectués correctement. Pour visualiser la sortie, convertissez votre couche géostatistique en raster avec Couche GA vers rasters ou Couche GA vers grille. Vous pouvez également choisir de générer un raster directement à partir de cet outil à l’aide du paramètre Raster de prédiction en sortie.
Si les valeurs Entités de variable dépendante en entrée se trouvent dans un système de coordonnées géographiques, toutes les distances seront calculées à l’aide de distances de corde. Pour plus d’informations sur les distances de corde, reportez-vous à la section Calculs de distance pour les données de coordonnées géographiques de la rubrique d’aide Présentation du krigeage bayésien empirique.
Paramètres
arcpy.ga.EBKRegressionPrediction(in_features, dependent_field, in_explanatory_rasters, out_ga_layer, {out_raster}, {out_diagnostic_feature_class}, {measurement_error_field}, {min_cumulative_variance}, {in_subset_features}, {transformation_type}, {semivariogram_model_type}, {max_local_points}, {overlap_factor}, {number_simulations}, {search_neighborhood})
Nom | Explication | Type de données |
in_features | Entités ponctuelles en entrée contenant le champ à interpoler. | Feature Layer |
dependent_field | Champ des valeurs Entités de variable dépendante en entrée contenant les valeurs de la variable dépendante. Il s’agit du champ qui sera interpolé. | Field |
in_explanatory_rasters [[in_explanatory_raster,…],...] | Rasters en entrée représentant les variables explicatives à utiliser pour concevoir le modèle de régression. Ces rasters doivent représenter les variables connues pour influer sur les valeurs de la variable dépendante. Par exemple, lorsque vous interpolez des données de température, un raster d’élévation doit être utilisé comme variable explicative car la température est influencée par l’élévation. Vous pouvez utiliser jusqu’à 62 rasters explicatifs. | Raster Layer; Mosaic Layer |
out_ga_layer | Couche géostatistique en sortie qui affiche le résultat de l’interpolation. | Geostatistical Layer |
out_raster (Facultatif) | Raster en sortie qui affiche le résultat de l’interpolation. La taille de cellule par défaut correspondra au maximum des tailles de cellule des valeurs Rasters de variable explicative en entrée. Pour utiliser une taille de cellule différente, utilisez le paramètre d’environnement Taille de cellule. | Raster Dataset |
out_diagnostic_feature_class (Facultatif) | Classe d’entités surfaciques en sortie qui affiche les régions de chaque modèle local et contient des champs avec des informations de diagnostic pour les modèles locaux. Pour chaque sous-ensemble, un polygone entourant les points du sous-ensemble est créé afin de faciliter l’identification des points qui ont été utilisés dans chaque sous-ensemble. Par exemple, si 10 modèles locaux sont présents, cette sortie comportera dix polygones. La classe d’entités contiendra les champs suivants :
| Feature Class |
measurement_error_field (Facultatif) | Champ qui spécifie l’erreur de mesure pour chaque point dans les entités de variable dépendante. Pour chaque point, la valeur de ce champ doit correspondre à un écart type de la valeur mesurée du point. Utilisez ce champ si les valeurs d’erreur de mesure ne sont pas identiques pour chaque point. Des données mesurées à l’aide de différents appareils sont fréquemment à l’origine d’erreurs de mesure non constantes. Un appareil peut être plus précis qu’un autre, ce qui implique qu’il génère des erreurs de mesure plus faibles. Par exemple, un thermomètre arrondit au degré le plus proche tandis qu’un autre arrondit au dixième de degré le plus proche. La variabilité des mesures est généralement fournie par le fabricant de l’appareil de mesure ou déterminée de manière empirique. Laissez ce paramètre vide en l’absence de valeurs d’erreur de mesure ou si ces dernières sont inconnues. | Field |
min_cumulative_variance (Facultatif) | Définit le pourcentage cumulé minimal de la variance à partir des composantes principales des rasters de variable explicative. Avant de créer le modèle de régression, les composantes principales des variables explicatives sont calculées et ces composantes principales sont utilisées comme variables explicatives dans la régression. Chaque composante principale capture un certain pourcentage de la variance des variables explicatives et ce paramètre contrôle le pourcentage minimal de la variance à capturer par les composantes principales de chaque modèle local. Par exemple, si la valeur 75 est fournie, le logiciel utilise le nombre minimal de composantes principales qui sont nécessaires pour capturer au moins 75 pour cent de la variance des variables explicatives. Les composantes principales n’étant pas mutuellement corrélées les unes aux autres, leur utilisation résout le problème de multicolinéarité (variables explicatives corrélées les unes aux autres). La plupart des informations contenues dans toutes les variables explicatives peuvent fréquemment être capturées dans seulement quelques composantes principales. En ignorant les composantes principales les moins utiles, le calcul du modèle gagne en stabilité et en efficacité sans une perte de précision conséquente. Pour calculer les composantes principales, les variables explicatives doivent présenter une variabilité. Ainsi, si l’un de vos Rasters de variable explicative en entrée contient des valeurs constantes dans un sous-ensemble, ces rasters constants ne sont pas utilisés pour calculer les composantes principales de ce sous-ensemble. Si tous les rasters de variable explicative dans un sous-ensemble contiennent des valeurs constantes, la Classe d’entités de diagnostic en sortie signale qu’aucune des composantes principales n’a été utilisée et qu’elles ont capturé zéro pour cent de la variabilité. | Double |
in_subset_features (Facultatif) | Entités surfaciques définissant où les modèles locaux seront calculés. Les points à l’intérieur de chaque polygone seront utilisés pour les modèles locaux. Ce paramètre est utile si vous savez que la valeur de la variable dépendante change en fonction de régions connues. Par exemple, ces polygones peuvent représenter des régions administratives en matière de santé, où la politique sanitaire change pour chacune. Vous pouvez également utiliser l’outil Générer des sous-ensembles de polygones pour créer des sous-ensembles de polygones. Les polygones créés par cet outil ne se superposent pas et sont compacts. | Feature Layer |
transformation_type (Facultatif) | Type de transformation à appliquer aux données en entrée.
| String |
semivariogram_model_type (Facultatif) | Le modèle de semi-variogramme qui sera utilisé pour l’interpolation. En savoir plus sur les modèles de semi-variogramme dans l’outil Prévision de la régression EBK
| String |
max_local_points (Facultatif) | Les données en entrée seront automatiquement divisées en sous-ensembles ne contenant pas plus que ce nombre de points. Si le paramètre Sous-ensemble d’entités surfaciques est fourni, sa valeur est ignorée. | Long |
overlap_factor (Facultatif) | Facteur représentant le degré de superposition entre les modèles locaux (également appelés sous-ensembles). Chaque point en entrée peut être compris dans plusieurs sous-ensembles. Le facteur de superposition indique le nombre moyen des sous-ensembles dans lesquels chaque point sera compris. Une valeur élevée du facteur de superposition rend la surface en sortie plus lisse, mais augmente également le temps de traitement. Les valeurs doivent être comprises entre 1 et 5. Si le paramètre Sous-ensemble d’entités surfaciques est fourni, sa valeur est ignorée. | Double |
number_simulations (Facultatif) | Nombre de semi-variogrammes simulés de chaque modèle local. En augmentant le nombre de simulations, les calculs du modèle seront plus stables, mais le temps de calcul sera plus long. | Long |
search_neighborhood (Facultatif) | Définit les points de voisinage qui seront utilisés pour contrôler la sortie. Standard est la valeur par défaut. Les classes de voisinage de recherche sont les suivantes : SearchNeighborhoodStandardCircular et SearchNeighborhoodSmoothCircular. Circulaire standard
Circulaire lissé
| Geostatistical Search Neighborhood |
Exemple de code
Interpole une classe d’entités ponctuelles à l’aide de rasters de variable explicative.
import arcpy
arcpy.EBKRegressionPrediction_ga("HousingSales_Points", "SalePrice",
["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"],
"out_ga_layer", None, None, None, 95, None, "LOGEMPIRICAL",
"EXPONENTIAL", 100, 1, 100, None)
Interpole une classe d’entités ponctuelles à l’aide de rasters de variable explicative.
# Name: EBKRegressionPrediction_Example_02.py
# Description: Interpolates housing prices using EBK Regression Prediction
# Requirements: Geostatistical Analyst Extension
# Author: Esri
# Import system modules
import arcpy
# Set environment settings
arcpy.env.workspace = "C:/gaexamples/data.gdb"
# Set local variables
inDepFeatures = "HousingSales_Points"
inDepField = "SalePrice"
inExplanRasters = ["AREASQFEET", "NUMBATHROOMS", "NUMBEDROOMS","TOTALROOMS"]
outLayer = "outEBKRP_layer"
outRaster = "outEBKRP_raster"
outDiagFeatures = "outEBKRP_features"
inDepMeField = ""
minCumVariance = 97.5
outSubsetFeatures = ""
depTransform = ""
semiVariogram= "K_BESSEL"
maxLocalPoints = 50
overlapFactor = 1
numberSinulations = 200
radius = 100000
searchNeighbourhood = arcpy.SearchNeighborhoodStandardCircular(radius)
# Check out the ArcGIS Geostatistical Analyst extension license
arcpy.CheckOutExtension("GeoStats")
# Execute EBKRegressionPrediction
arcpy.EBKRegressionPrediction_ga(inDepFeatures, inDepField, inExplanRasters,
outLayer, outRaster, outDiagFeatures, inDepMeField, minCumVariance,
outSubsetFeatures, depTransform, semiVariogram, maxLocalPoints,
overlapFactor, numberSinulations, searchNeighbourhood)
Environnements
Informations de licence
- Basic: Nécessite Geostatistical Analyst
- Standard: Nécessite Geostatistical Analyst
- Advanced: Nécessite Geostatistical Analyst
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?