Create Spatial Component Explanatory Variables (Créer des variables explicatives de composant spatial) (Statistiques spatiales)

Synthèse

Crée un ensemble de champs de composants spatiaux qui décrivent le mieux les modèles spatiaux d’un ou de plusieurs champs numériques et qui font office de variables explicatives utiles dans un modèle de prévision ou de régression.

Les champs en entrée doivent correspondre aux variables explicatives et dépendantes utilisées dans un modèle de prévision. Les champs de composants spatiaux résultants (appelés vecteurs propres de Moran) peuvent être utilisés comme variables explicatives (en plus des variables explicatives d’origine) qui améliorent souvent la puissance de prévision du modèle en prenant en compte les modèles spatiaux des autres variables.

En savoir plus sur les vecteurs propres de Moran

Illustration

Illustration de l’outil Create Spatial Component Explanatory Variables (Créer des variables explicatives de composant spatial)

Utilisation

  • Cet outil crée des composants spatiaux qui peuvent prévoir avec une grande précision les valeurs des champs en entrée. Chaque composant représente un modèle spatial et les composants sélectionnés sont ceux dont les modèles ressemblent le plus aux modèles des champs en entrée. Par exemple, si un champ possède une vaste tendance d’Ouest en Est, mais qu’il contient également de petits agrégats de valeurs faibles et élevées, le modèle peut être représenté en combinant deux composants : l’un représentant la tendance d’Ouest en Est et l’autre, les agrégats. En incluant des variables explicatives qui ressemblent aux modèles spatiaux des variables explicatives et dépendantes, les effets spatiaux sont pris en compte dans les outils de prévision et de régression, tels que Generalized Linear Regression (Régression linéaire généralisée) et Forest-based and Boosted Classification and Regression (Classification et régression boostées basées sur une forêt). En prenant en compte les effets spatiaux, ces modèles de prévision non spatiaux parviennent généralement à des prévisions plus précises et les déformations spatiales (telles que les modèles spatiaux dans les valeurs résiduelles) sont souvent réduites. Cela est important afin que les prévisions de certaines zones ne soient pas systématiquement sous-estimées ou surestimées par le modèle. En outre, les coefficients des variables explicatives peuvent être plus facilement interprétés car ils estiment la relation directe entre la variable explicative et la variable dépendante tout en filtrant le bruit introduit par les effets spatiaux.

  • Cet outil est destiné à créer des variables explicatives qui peuvent être utilisées dans des modèles de prévison, mais l’outil Filter Spatial Autocorrelation From Field (Filtrer l’autocorrélation spatiale à partir d’un champ) peut également être utilisé à cette fin en supprimant l’autocorrélation spatiale du champ normalisé des valeurs résiduelles d’un modèle de prévision. Les composants spatiaux qui filtrent l’auto-corrélation résiduelle de manière efficace sont souvent des variables explicatives utiles et peuvent souvent offrir une amélioration du modèle équivalente à cet outil en utilisant moins de composants comme variables explicatives. Il est recommandé d’essayer les deux outils et de comparer les résultats de l’inclusion des composants spatiaux de chacun dans le modèle de prévision d’origine (par exemple, en comparant les valeurs R carré ajusté ou AIC).

  • Les composants sont renvoyés sous forme de champs dans la classe d’entités en sortie et, si l’outil est exécuté dans une carte active, la couche d’entités en sortie est dessinée en fonction du premier composant spatial. Les champs en entrée sont également inclus dans la classe d’entités en sortie pour que les variables explicatives d’origine et les variables explicatives des composants spatiaux puissent être utilisées pour prévoir la variable dépendante dans les outils de prévision sans qu’il ne soit nécessaire de fusionner les classes d’entités en entrée et en sortie.

  • Les messages de géotraitement incluent les deux tables suivantes, qui récapitulent la sélection des composants spatiaux utilisés pour filtrer spatialement le champ en entrée :

    • Neighborhood Search History (Historique de recherche de voisinage) : pour chacune des 28 matrices de pondérations spatiales (SWM) testées, les détails de la matrice de pondérations spatiales (tels que le nombre de voisins et la structure de pondération), la valeur p et la valeur R-carré ajusté si tous les composants sont utilisés, la valeur R-carré ajusté si seuls les composants sélectionnés sont utilisés et le nombre de composants sélectionnés sont affichés. La matrice de pondérations spatiales dont la valeur R carré ajusté est la plus élevée avec les composants sélectionnés est utilisée pour créer les composants et est indiquée par un texte en gras et un astérisque.
    • Spatial Component Search History (Historique de recherche des composants spatiaux) : pour la matrice de pondérations spatiales sélectionnée, l’ID de chaque composant (par exemple, l’ID 4 indique qu’il s’agit du quatrième composant spatial), la valeur I de Moran et la valeur p du composant, ainsi que la valeur R-carré ajusté du composant (et de tous les composants déjà sélectionnés) sont affichés. Les lignes sont classées en fonction des composants qui prévoient individuellement les champs en entrée de la manière la plus efficace (Valeur R carré la plus élevée).

  • L’outil sélectionne une matrice de pondérations spatiales pour les entités en entrée (à moins qu’une telle matrice soit fournie dans le paramètre Input Spatial Weights Matrix File (Fichier de matrice de pondérations spatiales en entrée)) et sélectionne les variables explicatives des composants à l’aide de la procédure suivante :

    1. Pour chacune des 28 matrices de pondérations spatiales candidates, la signification statistique de la matrice de pondérations spatiales est testée en prévoyant les champs en entrée à l’aide de tous les composants spatiaux comme variables explicatives. Le test de signification utilise le R-carré combiné de tous les champs en entrée et effectue une correction Šidák de la valeur p pour prendre en compte le nombre de matrices de pondérations spatiales testées. Toute matrice de pondérations spatiales non statistiquement significative est supprimée de la liste des candidats.
    2. Pour chacune des matrices de pondérations spatiales candidates restantes, les composants spatiaux sont ajoutés de manière séquentielle comme variables explicatives jusqu’à ce que le prochain composant ne soit pas statistiquement significatif seul (la valeur p est supérieure à 0,05) ou que la valeur R-carré ajusté du composant (et de tous les composants déjà sélectionnés) dépasse la valeur R-carré ajusté obtenue si tous les composants de la matrice de pondérations spatiales sont utilisés. Chaque nouveau composant est sélectionné en recherchant celui dont la signification statistique est la plus élevée (valeur p la plus faible) s’il est utilisé pour prévoir les champs en entrée.
    3. Le fichier SWM dont la valeur R carré ajusté résultante est la plus élevée est sélectionné comme matrice de pondérations spatiales finale et le jeu associé de composants spatiaux sélectionnés est renvoyé comme champs dans la classe d’entités en sortie.

    Cette procédure est appelée méthode de sélection FWD (Avant). Elle est entièrement décrite dans la référence suivante :

    • Blanchet, F. Guillaume, Pierre Legendre, and Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.

    .

Paramètres

ÉtiquetteExplicationType de données
Input Features (Entités en entrée)

Entités en entrée contenant les champs des variables explicatives et dépendantes utilisées dans un modèle de prévision.

Feature Layer
Champs en entrée

Champs en entrée des variables explicatives et dépendantes utilisées dans un modèle de prévision.

Field
Entités en sortie

Entités en sortie contenant les champs des composants spatiaux pouvant être utilisés comme variables explicatives supplémentaires dans un modèle de prévision.

Feature Class
Append All Fields From Input Features (Ajouter tous les champs des entités en entrée)
(Facultatif)

Indique si tous les champs sont copiés des entités en entrée dans la classe d’entités en sortie.

  • Activé : tous les champs des entités en entrée sont copiés dans la classe d’entités en sortie. Il s’agit de l’option par défaut.
  • Désactivé : seuls les champs en entrée sont copiés dans la classe d’entités en sortie.
Boolean
Fichier de matrice de pondérations spatiales en entrée
(Facultatif)

Fichier SWM en entrée (.swm). Si une valeur est spécifiée, ce fichier permet de définir les voisins et pondérations des entités en entrée. Si aucune valeur n’est spécifiée, l’outil teste 28 voisinages différents et utilise celui qui crée les composants les plus efficaces comme variables explicatives.

File
Fichier matrice de pondérations spatiales en sortie
(Facultatif)

Fichier SWM en sortie (.swm) des voisins et pondérations sélectionnés par l’outil. Ce paramètre ne s’applique pas si vous spécifiez un fichier .swm en entrée.

File
Champ d’ID unique
(Facultatif)

Champ d’ID unique du fichier .swm en sortie. Ce champ doit être un entier et doit posséder une valeur unique par entité en entrée.

Field

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field})
NomExplicationType de données
in_features

Entités en entrée contenant les champs des variables explicatives et dépendantes utilisées dans un modèle de prévision.

Feature Layer
input_fields
[input_fields,...]

Champs en entrée des variables explicatives et dépendantes utilisées dans un modèle de prévision.

Field
out_features

Entités en sortie contenant les champs des composants spatiaux pouvant être utilisés comme variables explicatives supplémentaires dans un modèle de prévision.

Feature Class
append_all_fields
(Facultatif)

Indique si tous les champs sont copiés des entités en entrée dans la classe d’entités en sortie.

  • ALLTous les champs des entités en entrée sont copiés dans la classe d’entités en sortie. Il s’agit de l’option par défaut.
  • NO_FIELDSSeuls les champs en entrée sont copiés dans la classe d’entités en sortie.
Boolean
in_swm
(Facultatif)

Fichier SWM en entrée (.swm). Si une valeur est spécifiée, ce fichier permet de définir les voisins et pondérations des entités en entrée. Si aucune valeur n’est spécifiée, l’outil teste 28 voisinages différents et utilise celui qui crée les composants les plus efficaces comme variables explicatives.

File
out_swm
(Facultatif)

Fichier SWM en sortie (.swm) des voisins et pondérations sélectionnés par l’outil. Ce paramètre ne s’applique pas si vous spécifiez un fichier .swm en entrée.

File
id_field
(Facultatif)

Champ d’ID unique du fichier .swm en sortie. Ce champ doit être un entier et doit posséder une valeur unique par entité en entrée.

Field

Exemple de code

Exemple 1 d’utilisation de l’outil CreateSpatialComponentExplanatoryVariables (fenêtre Python)

Le script de fenêtre Python suivant illustre l’utilisation de la fonction CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)
Exemple 2 d’utilisation de l’outil CreateSpatialComponentExplanatoryVariables (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes