Créer des variables explicatives des composants spatiaux (Statistiques spatiales)—ArcGIS Pro

Synthèse

Crée un ensemble de champs de composantes spatiales qui décrivent le mieux les modèles spatiaux d’un ou de plusieurs champs numériques et qui servent de variables explicatives utiles dans un modèle de prévision ou de régression.

Les champs en entrée doivent être les variables explicatives et dépendantes qui sont utilisées dans un modèle de prévision. Les champs de composantes spatiales obtenus (appelés vecteurs propres de Moran) peuvent être utilisés comme variables explicatives (en plus des variables explicatives d’origine) pour améliorer la puissance de prévision du modèle en tenant compte des modèles spatiaux des autres variables.

En savoir plus sur les vecteurs propres de Moran

Illustration

Utilisation

L’outil crée des composantes spatiales capables de prévoir avec le plus d’exactitude les valeurs des champs en entrée. Chaque composante représente un modèle spatial et les composantes sélectionnées sont celles dont les modèles ressemblent le plus aux modèles des champs en entrée. Par exemple, si un champ comporte une tendance générale de l’ouest vers l’est, mais qu’il contient également de petits agrégats de valeurs faibles et élevées, le modèle peut être représenté par la combinaison de deux composantes : une pour la tendance de l’ouest vers l’est et l’autre pour les agrégats. Si vous incluez des variables explicatives qui ressemblent aux modèles spatiaux des variables explicatives et dépendantes, les effets spatiaux sont pris en compte dans les outils de prévision et de régression, tels que Régression linéaire généralisée et Classification et régression basées sur une forêt et boostées. En tenant compte des effets spatiaux, ces modèles de prévision non spatiaux sont plus précis dans leurs prévisions et les déformations spatiales (comme les modèles spatiaux dans les résidus) sont souvent atténuées. Cet aspect est essentiel pour que certaines zones ne soient pas systématiquement sous-estimées ou surestimées par le modèle. En outre, les coefficients des variables explicatives peuvent être plus facilement interprétés, car ils estiment la relation directe entre la variable explicative et la variable dépendante tout en excluant le bruit introduit par les effets spatiaux.
Cet outil a été conçu pour créer des explicatives pouvant être utilisées dans des modèles de prévision. Toutefois, il est également possible d’utiliser l’outil Filtrer l’autocorrélation spatiale à partir d’un champ dans ce but en supprimant l’autocorrélation spatiale du champ des résidus ou des résidus standardisés d’un modèle de prévision. Les composantes spatiales qui filtrent efficacement l’autocorrélation résiduelle sont souvent des variables explicatives utiles et peuvent souvent offrir une amélioration équivalente à cet outil en utilisant moins de composantes spatiales comme variables explicatives. Il est recommandé d’essayer les deux outils et de comparer les résultats de l’inclusion des composantes spatiales à partir de chacun d’entre eux dans le modèle de prévision d’origine (par exemple, en comparant les valeurs AIC ou de R-carré ajusté).
Les composantes spatiales sont renvoyées en tant que champs dans la classe d’entités en sortie et lorsque l’outil est exécuté dans une carte active, la couche d’entités en sortie est dessinée en fonction de la première composante spatiale. Les champs en entrée sont également inclus dans la classe d’entités en sortie de telle sorte que les variables explicatives d’origine et les variables explicatives des composantes spatiales puissent être utilisées pour prévoir la variable dépendante dans les outils de prévision sans qu’il soit nécessaire de fusionner les classes d’entités en entrée et en sortie.
Les messages de géotraitement incluent les deux tables suivantes, qui récapitulent la sélection des composantes spatiales utilisées pour filtrer spatialement le champ en entrée :
- Historique de recherche de voisinage : pour chacune des matrices de pondérations spatiales (SWM) qui ont été testées, les informations détaillées de la matrice de pondérations spatiales (telles que le nombre de voisins et la structure de pondération), la valeur p et la valeur R-carré ajusté lorsque toutes les composantes sont utilisées, la valeur R-carré ajusté lorsque seules les composantes sélectionnées sont utilisées, ainsi que le nombre de composantes sélectionnées, sont affichés. La matrice de pondérations spatiales dotée de la valeur R-carré ajusté la plus élevée avec les composantes sélectionnées est utilisée pour créer les composantes. Elle est indiquée en gras et signalée par un astérisque.
- Historique de recherche des composantes spatiales : pour la matrice de pondérations spatiales sélectionnée, la valeur d’ID de chaque composante (par exemple, ID 4 désigne la quatrième composante spatiale), la valeur de l’indice de Moran et la valeur p de la composante, ainsi que la valeur R-carré ajusté de la composante (y compris toutes les composantes précédemment sélectionnées) s’affichent. Les lignes sont triées en fonction des composantes qui, individuellement, ont prévu les champs en entrée le plus efficacement (valeur R-carré la plus élevée).
Afin de sélectionner la matrice de pondérations spatiales à utiliser pour créer les composantes spatiales, l’outil génère une liste de matrices de pondérations spatiales candidates et effectue des tests pour identifier celle qui crée les composantes spatiales prévoyant le plus précisément les valeurs des champs en entrée. Si aucun fichier de matrice de pondérations spatiales n’est fourni dans le paramètre Fichiers de matrice de pondérations spatiales en entrée, 28 matrices de pondérations spatiales sont créées et incluses dans la liste des candidats (reportez-vous à la rubrique Comprendre les vecteurs propres de Moran pour une description de chaque matrice de pondérations spatiales). Si des matrices de pondérations spatiales en entrée sont fournies, vous pouvez utiliser le paramètre Comparer uniquement les matrices de pondérations spatiales en entrée pour indiquer si la liste des candidats inclut uniquement les matrices de pondérations spatiales fournies ou si elle inclut les matrices de pondérations spatiales fournies et les 28 matrices de pondérations spatiales créées par l’outil. Par exemple, pour utiliser une seule matrice de pondérations spatiales spécifiée, indiquez la matrice de pondérations spatiales dans le paramètre Fichiers de matrice de pondérations spatiales en entrée et laissez le paramètre Comparer uniquement les matrices de pondérations spatiales en entrée coché.
L’outil sélectionne une matrice de pondérations spatiales parmi les candidats comme suit :
1. Pour chacune des 28 matrices de pondérations spatiales candidates, la signification statistique de la matrice de pondérations spatiales est testée en prévoyant les champs en entrée, en utilisant toutes les composantes spatiales comme variables explicatives. Le test de signification utilise les valeurs R-carré combinées de tous les champs en entrée et effectue une correction Šidák sur la valeur p pour tenir compte du nombre de matrices de pondérations spatiales testées. Toute matrice de pondérations spatiales non statistiquement significative est supprimée de la liste des candidats.
2. Pour chaque matrice de pondérations spatiales candidate restante, des composantes spatiales sont ajoutées de manière séquentielle en tant que variables explicatives, jusqu’à ce que la composante suivante ne soit pas statistiquement significative seule (la valeur p est supérieure à 0,05) ou que la valeur R-carré ajusté de la composante (et de toutes les composantes précédemment sélectionnées) dépasse la valeur R-carré ajusté obtenue lorsque toutes les composantes de la matrice de pondérations spatiales sont utilisées. Chaque nouvelle composante est sélectionnée en recherchant celle qui présente la signification statistique la plus élevée (valeur p la plus faible) lorsqu’elle est utilisée pour prévoir les champs en entrée.
3. La matrice de pondérations spatiales dont la valeur R-carré ajusté résultante est la plus élevée est sélectionnée comme matrice de pondérations spatiales finale et le jeu associé de composantes spatiales sélectionnées est renvoyé en tant que champs dans la classe d’entités en sortie.
Cette procédure, appelée méthode de sélection ascendante (FWD), est décrite en détail dans la référence suivante :
- Blanchet, F. Guillaume, Pierre Legendre et Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.
.

Paramètres

Étiquette	Explication	Type de données
Entités en entrée	Entités en entrée contenant les champs des variables explicatives et dépendantes qui sont utilisées dans un modèle de prévision.	Feature Layer
Champs en entrée	Champs en entrée des variables explicatives et dépendantes qui sont utilisées dans un modèle de prévision.	Field
Entités en sortie	Entités en sortie qui contiennent les champs des composantes spatiales pouvant être utilisées comme variables explicatives supplémentaires dans un modèle de prévision.	Feature Class
Ajouter tous les champs des entités en entrée (Facultatif)	Indique si tous les champs sont copiés depuis les entités en entrée vers la classe d’entités en sortie. Activé : tous les champs des entités en entrée sont copiés dans la classe d’entités en sortie. Il s’agit de l’option par défaut. Désactivé – Seuls les champs en entrée sont copiés dans la classe d’entités en sortie.	Boolean
Fichiers de matrice de pondérations spatiales en entrée (Facultatif)	Liste des fichiers de matrice de pondérations spatiales en entrée (.swm) à utiliser comme candidats pour la matrice de pondérations spatiales qui sera utilisée afin de créer les variables explicatives des composantes spatiales. Si aucun fichier n’est indiqué, l’outil teste les 28 voisinages différents.	File
Fichier matrice de pondérations spatiales en sortie (Facultatif)	Fichier SWM en sortie (.swm) des voisins et des pondérations sélectionnés par l’outil. Ce paramètre n’est pas appliqué si vous indiquez un fichier .swm en entrée.	File
Champ d’ID unique (Facultatif)	Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.	Field
Comparer uniquement les matrices de pondérations spatiales en entrée (Facultatif)	Indique si seuls les fichiers .swm fournis dans le paramètre Fichiers de matrice de pondérations spatiales en entrée doivent être testés ou s’il convient également de tester les 28 voisinages supplémentaires. L’outil utilisera la matrice de pondérations spatiales qui crée les composantes spatiales prévoyant le plus précisément les valeurs des champs en entrée. Ce paramètre s’applique uniquement si au moins une matrice de pondérations spatiales en entrée est fournie. Activé : seules les matrices de pondérations spatiales en entrée indiquées dans le paramètre Fichiers de matrice de pondérations spatiales en entrée seront testées. Il s’agit de l’option par défaut. Désactivé : les matrices de pondérations spatiales en entrée indiquées dans le paramètre Fichiers de matrice de pondérations spatiales en entrée et les 28 voisinages supplémentaires seront testés.	Boolean

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field}, {compare_only_inputs})

Nom	Explication	Type de données
in_features	Entités en entrée contenant les champs des variables explicatives et dépendantes qui sont utilisées dans un modèle de prévision.	Feature Layer
input_fields [input_fields,...]	Champs en entrée des variables explicatives et dépendantes qui sont utilisées dans un modèle de prévision.	Field
out_features	Entités en sortie qui contiennent les champs des composantes spatiales pouvant être utilisées comme variables explicatives supplémentaires dans un modèle de prévision.	Feature Class
append_all_fields (Facultatif)	Indique si tous les champs sont copiés depuis les entités en entrée vers la classe d’entités en sortie. ALL—Tous les champs des entités en entrée seront copiés dans la classe d’entités en sortie. Il s’agit de l’option par défaut. NO_FIELDS—Seuls les champs en entrée sont copiés dans la classe d’entités en sortie.	Boolean
in_swm [in_swm,...] (Facultatif)	Liste des fichiers de matrice de pondérations spatiales en entrée (.swm) à utiliser comme candidats pour la matrice de pondérations spatiales qui sera utilisée afin de créer les variables explicatives des composantes spatiales. Si aucun fichier n’est indiqué, l’outil teste les 28 voisinages différents.	File
out_swm (Facultatif)	Fichier SWM en sortie (.swm) des voisins et des pondérations sélectionnés par l’outil. Ce paramètre n’est pas appliqué si vous indiquez un fichier .swm en entrée.	File
id_field (Facultatif)	Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.	Field
compare_only_inputs (Facultatif)	Indique si seuls les fichiers .swm fournis dans le paramètre in_swm doivent être testés ou s’il convient également de tester les 28 voisinages supplémentaires. L’outil utilisera la matrice de pondérations spatiales qui crée les composantes spatiales prévoyant le plus précisément les valeurs des champs en entrée. Ce paramètre s’applique uniquement si au moins une matrice de pondérations spatiales en entrée est fournie. COMPARE_INPUTS—Seuls les fichiers .swm en entrée indiqués dans le paramètre in_swm seront testés. Il s’agit de l’option par défaut. COMPARE_ALL—Les fichiers .swm en entrée indiqués dans le paramètre in_swm ainsi que les 28 voisinages supplémentaires seront testés.	Boolean

Exemple de code

Exemple 1 d’utilisation de la fonction CreateSpatialComponentExplanatoryVariables (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

Exemple 2 d’utilisation de la fonction CreateSpatialComponentExplanatoryVariables (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction CreateSpatialComponentExplanatoryVariables.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Environnements

Transformations géographiques, Système de coordonnées en sortie, Facteur de traitement parallèle, Générateur de nombres aléatoires

Informations de licence

Basic: Oui
Standard: Oui
Advanced: Oui

Rubriques connexes

Vous avez un commentaire à formuler concernant cette rubrique ?