Calculer l’index composite (Statistiques spatiales)

Synthèse

Combine plusieurs variables numériques pour un créer un seul index.

Les index composites sont utilisés dans les domaines sociaux et environnementaux pour représenter des informations complexes à partir de plusieurs indicateurs, sous la forme d’une seule métrique qui peut mesurer les progrès réalisés par rapport à un objectif et faciliter la prise de décision. Cet outil prend en charge les trois principales étapes du processus de création d’index : standardiser les variables en entrée à une échelle commune (prétraitement), combiner les variables en une seule variable d’index (combinaison), puis mettre à l’échelle et classer l’index généré selon des valeurs significatives (post-traitement).

En savoir plus sur le fonctionnement de l’outil Calculer l’index composite

Illustration

Illustration de l’outil Calculer l’index composite

Utilisation

  • La création d’un index pertinent suppose de bien réfléchir à la question à laquelle l’index tente de répondre, au choix des variables et aux méthodes appliquées. Les spécialistes du domaine et les utilisateurs finaux devraient prendre part à cette réflexion.

    En savoir plus sur les pratiques conseillées lors de la création d’index composites

  • Utilisez le paramètre Variables en entrée pour définir les champs numériques à utiliser dans l’index. L’outil omet les enregistrements avec des valeurs manquantes dans toutes les variables en entrée.

  • Vous pouvez utiliser le paramètre Méthode prédéfinie de mise à l’échelle et combinaison des variables pour sélectionner la méthode selon laquelle créer un index. Par exemple, l’option Combiner les valeurs (Moyenne des valeurs à l’échelle) proportionne les variables en entrée entre 0 et 1 puis utilise la moyenne des variables en entrée remises à l’échelle comme index.

    • Le paramètre Méthode prédéfinie de mise à l’échelle et combinaison des variables va changer les valeurs des paramètres Méthode de mise à l’échelle des variables en entrée et Méthode de combinaison des variables mises à l’échelle. Pour définir manuellement des valeurs plus personnalisées, sélectionnez l’option Personnalisée.

  • Le paramètre Méthode de mise à l’échelle des variables en entrée applique alors la méthode sélectionnée à toutes les variables en entrée.

    • L’option Minimum-maximum est la plus simple puisqu’elle maintient la distribution des variables en entrée et applique une mise à l’échelle de 0 à 1 qui est facile à interpréter.
    • Si les variables ont des distributions asymétriques ou des points aberrants, utilisez la méthode Centile ou Classement, qui prend en compte le classement des données, ou utilisez l’option Signaler par seuil (binaire), qui convertit les variables en valeurs binaires (0 ou 1).
    • Pour créer un index qui sera reconstitué au fur et à mesure que de nouvelles données seront disponibles, comme un index de performance annuelle, utilisez l’option Minimum-maximum (plages de données personnalisées) ou Score z (personnalisé). Avec l’une ou l’autre de ces options, vous pouvez définir des références stables qui permettent de comparer des données avec différentes plages et distributions.
    • Il est intéressant d’utiliser l’option Valeurs brutes lorsque les variables sont comparables par leur échelle, notamment en cas d’utilisation des pourcentages ou de prétraitement des variables à l’aide d’autres outils.

  • Utilisez les outils Transformer un champ, Standardiser un champ ou Reclasser un champ si vous avez besoin d’appliquer des méthodes de prétraitement qui ne sont pas proposées par l’outil ou lorsque des méthodes de prétraitement différentes sont nécessaires pour chaque variable en entrée.

    • Pour un prétraitement, assurez-vous que les variables en entrée se situent sur une échelle comparable.
    • Utilisez l’option Valeurs brutes du paramètre Méthode de mise à l’échelle des variables en entrée lorsque vous effectuez votre propre prétraitement.

  • Si toutes les variables en entrée se situent sur une échelle de mesure commune, comme les pourcentages, utilisez l’option Valeurs brutes du paramètre Méthode de mise à l’échelle des variables en entrée.

  • Il est possible d’utiliser l’option Signaler par seuil (binaire) du paramètre Méthode de mise à l’échelle des variables en entrée pour convertir les variables en entrée en valeurs 0 et 1 selon des seuils. Utilisez le paramètre Méthode de mise à l’échelle pour seuils si vous souhaitez appliquer une étape de prétraitement à toutes les variables avant de définir le seuil. Par exemple, les étapes suivantes comptent le nombre de variables en entrée qui sont supérieures au 90e centile pour chaque emplacement :

    1. Définissez le paramètre Méthode de mise à l’échelle des variables en entrée sur Signaler par seuil (binaire).
    2. Définissez le paramètre Méthode de mise à l’échelle pour seuils sur Centile.
    3. Définissez le paramètre Seuils sur Supérieur à 0,9 pour chaque variable.
    4. Définissez le paramètre Méthode de combinaison des variables mises à l’échelle sur Somme.

  • Le paramètre Méthode de combinaison des variables mises à l’échelle comprend des méthodes additives (somme et moyenne) ainsi que des méthodes multiplicatives (multiplication et moyenne géométrique).

    • Les méthodes additives permettent à une variable avec une valeur élevée de compenser les variables avec des valeurs faibles.
    • Les méthodes multiplicatives ne permettent pas aux valeurs élevées de compenser les valeurs faibles. Des valeurs d’index élevées apparaissent uniquement lorsqu’il y a des valeurs élevées dans plusieurs variables.

  • Vous pouvez utiliser le paramètre Pondérations (de la catégorie de paramètre Pondérations de variable) pour indiquer l’importance relative de chaque variable en entrée. Toutes les pondérations sont fixées à 1 par défaut, chaque variable étant ainsi pondérée de façon égale.

    • Dans le cas où une variable doit être deux fois plus importante qu’une autre, attribuez une pondération de 2 à cette variable et une pondération de 1 à l’autre variable.
    • Vous pouvez également définir des pondérations dont la somme est égale à 1. Par exemple, si une des trois variables choisies est jugée deux fois plus importante que les deux autres, vous pouvez utiliser des valeurs de pondération de 0,5, 0,25 et 0,25.

  • Les pondérations sont déterminantes pour l’index obtenu. Définir l’importance relative des variables est une composante subjective de l’analyse qui doit s’appuyer sur une connaissance du domaine et des recherches sérieuses.

  • L’outil se charge de créer un champ d’index, un champ de classement et un champ de centile. Un champ brut d’index est également créé en cas d’inversion ou lorsque l’index est mis à l’échelle avec de nouvelles valeurs minimale et maximale. Des champs supplémentaires sont ajoutés pour chacune des options de classification définies du paramètre Sorties classées supplémentaires. Si l’entrée est une classe d’entités, et que la valeur du paramètre Entités ou table en sortie est une classe d’entités, l’outil met à disposition un groupe de couches qui affiche une couche pour le champ d’index, le champ de centile et chacune des options de classification sélectionnées.

  • La couche d’index en sortie comprend des diagrammes utiles pour visualiser la distribution de l’index, déterminer si les étapes de prétraitement ont abouti au résultat escompté et rechercher les corrélations entre les variables en entrée et l’index.

  • Le concept selon lequel l’index mesure peut être représenté par plusieurs dimensions. Par exemple, un index de vulnérabilité peut englober les domaines du logement, des transports et du revenu, comprenant chacun plusieurs variables. Il est envisageable de créer des sous-index pour représenter chaque dimension. Pour cela, il convient d’exécuter l’outil autant de fois qu’il y a de dimensions, puis d’utiliser les résultats comme variables en entrée pour l’index final.

  • Au moment de construire un index comportant des sous-index, envisagez d’utiliser ModelBuilder ou un bloc-notes dans ArcGIS Pro pour simplifier ce processus. Si vous utilisez ModelBuilder, créez une entité pour chaque sous-index en désactivant le paramètre Ajouter des champs à la table en entrée. Une sortie distincte sera ainsi créée pour chaque sous-index, qui devront être jointes avant de créer l’index final. L’outil ne prend pas en charge l’enchaînement de plusieurs index dans ModelBuilder lorsque le paramètre Ajouter des champs aux données en entrée est activé.

  • Il est recommandé de réduire le nombre de variables en entrée, mais d’en conserver un nombre suffisant pour capturer les informations essentielles nécessaires à l’index. Un nombre élevé de variables en entrée peut poser des problèmes d’interprétation de l’index. En outre, si plusieurs variables relèvent du même domaine (revenu médian et pauvreté, par exemple), l’influence de ce domaine peut être surreprésentée dans l’index.

  • Pour l’heure, l’outil ne prend pas en charge les entités en sortie situées dans des enterprise geodatabases utilisant Microsoft SQL Server ou Oracle, des bases de données SQLite ou des mobile geodatabases. Lorsque le paramètre Ajouter des champs aux entités en entrée est activé, la table en entrée ne peut pas être située dans une enterprise geodatabase utilisant Microsoft SQL Server ou Oracle, une base de données SQLite ou des fichiers GeoPackage.

Paramètres

ÉtiquetteExplicationType de données
Table en entrée

Table ou entités contenant les variables à combiner dans l’index.

Table View
Variables en entrée

Liste des champs numériques représentant les variables à combiner en un index. Cochez la case Inverser le sens pour intervertir les valeurs des variables. Cela signifie que l’entité ou l’enregistrement qui avait initialement la valeur la plus élevée se retrouve avec la valeur la plus faible, et inversement.

Value Table
Ajouter des champs à la table en entrée
(Facultatif)

Détermine si les résultats sont ajoutés aux données en entrée ou fournis sous forme de classe d’entités ou table en sortie.

  • Case cochée - Les résultats sont ajoutés aux données en entrée. Cette option modifie les données en entrée.
  • Case décochée - Une classe d’entités ou table en sortie contenant les résultats est créée. Il s’agit de l’option par défaut.

Boolean
Entités ou table en sortie
(Facultatif)

Entités ou table en sortie contenant les résultats.

Table; Feature Class
Méthode prédéfinie de mise à l’échelle et combinaison des variables
(Facultatif)

Indique le processus à suivre pour créer un index. Les options représentent les processus courants de création d’index ; chaque option définit les valeurs par défaut des paramètres Méthode de mise à l’échelle des variables en entrée et Méthode de combinaison des variables mises à l’échelle.

  • Combiner les valeurs (Moyenne des valeurs à l’échelle)Un index est créé par mise à l’échelle des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne des valeurs mises à l’échelle. Cette méthode est utile pour créer un index facile à interpréter. La forme de la distribution et les points aberrants des variables en entrée ont une incidence sur l’index. Il s’agit de l’option par défaut.
  • Combiner les classements (Moyenne des centiles)Un index est créé par mise à l’échelle des classements des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne des classements mise à l’échelle. Le choix de cette option est pertinent lorsque les classements des valeurs de variable sont plus importants que les différences entre les valeurs. La forme de la distribution et les points aberrants des variables en entrée n’ont pas d’incidence sur l’index.
  • Combiner les différences (Moyenne géométrique des valeurs à l’échelle)Un index est créé par mise à l’échelle des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne géométrique des valeurs mises à l’échelle. Dans la mesure où les valeurs élevées ne compensent pas entièrement les valeurs faibles, cette option est utile pour créer un index dans lequel les valeurs d’index élevées apparaissent uniquement lorsqu’il existe des valeurs élevées dans plusieurs variables.
  • Faire ressortir les extrêmes (Nombre de valeurs supérieures au 90e centile)Un index, qui compte le nombre de variables en entrée dont les valeurs sont supérieures ou égales au 90e centile, est créé. Cette méthode est utile pour identifier les endroits qui peuvent être considérés comme les plus extrêmes ou les plus défavorisés.
  • PersonnaliséeUn index est créé à l’aide d’options personnalisées de mise à l’échelle et combinaison des variables.
String
Méthode de mise à l’échelle des variables en entrée
(Facultatif)

Indique la méthode utilisée pour convertir les variables en entrée dans une échelle commune.

  • Minimum-maximumLes variables sont mises à l’échelle à des valeurs comprises entre 0 et 1 selon les valeurs minimale et maximale de chaque variable. Il s’agit de l’option par défaut.
  • Minimum-maximum (plages de données personnalisées)Les variables sont mises à l’échelle à des valeurs comprises entre 0 et 1 selon la valeur minimale possible et la valeur maximale possible pour chaque variable, définies par le paramètre Plages de données personnalisées. Cette méthode aux applications multiples permet notamment de définir le minimum et le maximum sur la base d’un repère, d’une statistique de référence ou de valeurs théoriques. Par exemple, si les mesures d’ozone relevées pour une même journée sont comprises entre 5 et 27 parties par million (ppm), vous pouvez utiliser les valeurs minimale et maximale théoriques, sur la base d’une observation préalable et de la connaissance du domaine, pour définir les valeurs maximale et minimale possibles du paramètre. L’index pourra ainsi être comparé sur plusieurs jours.
  • CentileLes variables seront converties en centiles compris entre 0 et 1 en mettant à l’échelle le classement des valeurs de données. Le choix de cette option est pertinent lorsque vous souhaitez ignorer les différences absolues entre les valeurs de données, comme pour les points aberrants et les distributions asymétriques.
  • ClassementLes variables sont classées. La plus petite valeur se voit attribuer la valeur de classement 1, la valeur suivante se voit attribuer la valeur de classement 2, et ainsi de suite. Les égalités se voient attribuer la moyenne de leurs classements.
  • Z-score (Score z)Chaque variable est standardisée par soustraction de la valeur moyenne et division par l’écart type (appelé un score z). Le score z est le nombre d’écarts types au-dessus ou au-dessous de la valeur moyenne. Le choix de cette option est pertinent lorsque les moyennes des variables sont des points de comparaison importants. Les valeurs au-dessus de la moyenne se voient attribuer des scores z positifs, et les valeurs au-dessous de la moyenne se voient attribuer des scores z négatifs.
  • Score z (personnalisé)Chaque variable est standardisée par soustraction d’une valeur moyenne personnalisée et division par un écart type personnalisé. Indiquez les valeurs personnalisées dans le champ du paramètre Standardisation personnalisée. Le choix de cette option est pertinent lorsque les moyennes et les écarts types des variables ont été démontrés par des études antérieures.
  • Signaler par seuil (binaire)Les variables sont identifiées lorsqu’elles sont supérieures ou inférieures à un seuil défini. Le champ généré contient des valeurs binaires (0 ou 1) indiquant si le seuil a été dépassé. Vous pouvez également utiliser le paramètre Méthode de mise à l’échelle pour seuils pour mettre à l’échelle les valeurs de variable en entrée avant de définir le seuil, et utiliser le paramètre Seuils pour spécifier les valeurs de seuil. Il est intéressant d’utiliser cette méthode lorsque les valeurs mêmes des variables importent moins que le fait qu’elles dépassent ou non un certain seuil, par exemple la limite de sécurité d’un polluant.
  • Valeurs brutesLes valeurs d’origine des variables sont utilisées. Utilisez cette méthode uniquement lorsque toutes les variables sont mesurées sur une échelle comparable (pourcentages ou taux, par exemple) ou lorsque les variables ont été standardisées avant l’utilisation de cet outil.
String
Méthode de mise à l’échelle pour seuils
(Facultatif)

Indique la méthode à utiliser pour convertir les variables en entrée à une échelle commune avant de définir les seuils.

  • Minimum-maximumLes variables comprises entre 0 et 1 sont mises à l’échelle selon les valeurs minimale et maximale de chaque variable.
  • Minimum-maximum (plages de données personnalisées)Les variables comprises entre 0 et 1 sont mises à l’échelle selon la valeur minimale possible et la valeur maximale possible pour chaque variable.
  • CentileLes variables sont converties en centiles compris entre 0 et 1.
  • Z-score (Score z)Chaque variable est standardisée par soustraction de la valeur moyenne et division par l’écart type.
  • Score z (personnalisé)Chaque variable est standardisée par soustraction d’une valeur moyenne personnalisée et division par un écart type personnalisé.
  • Valeurs brutesLes valeurs des variables sont utilisées telles quelles. Il s’agit de l’option par défaut.
String
Standardisation personnalisée
(Facultatif)

Valeur moyenne personnalisée et écart type personnalisé à utiliser pour la standardisation de chaque variable. Pour chaque variable, indiquez la moyenne personnalisée dans la colonne Moyenne et l’écart type personnalisé dans la colonne Écart type.

Value Table
Plages de données personnalisées
(Facultatif)

Valeurs minimale et maximale possibles à utiliser dans les unités des variables. Chaque variable est mise à l’échelle à une valeur comprise entre 0 et 1 en fonction des valeurs minimale et maximale possibles.

Value Table
Seuils
(Facultatif)

Seuil qui détermine le signalement d’une entité. Indiquez la valeur dans les unités des variables mises à l’échelle et spécifiez si les valeurs supérieures ou inférieures à la valeur de seuil doivent être signalées.

Value Table
Méthode de combinaison des variables mises à l’échelle
(Facultatif)

Indique la méthode à utiliser pour combiner les variables mises à l’échelle en une seule valeur.

Vous ne pouvez pas multiplier ou calculer une moyenne géométrique lorsque des variables sont mises à l’échelle selon des scores z du fait que ceux-ci contiennent toujours des valeurs négatives.

  • SommeLes valeurs sont ajoutées.
  • MoyenneLa moyenne (additive) arithmétique des valeurs est calculée. Il s’agit de l’option par défaut.
  • MultiplicationLes valeurs sont multipliées. Toutes les valeurs mises à l’échelle doivent être supérieures ou égales à zéro.
  • Moyenne géométriqueLa moyenne (multiplicative) géométrique des valeurs est calculée. Toutes les valeurs mises à l’échelle doivent être supérieures ou égales à zéro.
String
Pondérations
(Facultatif)

Pondérations qui expriment l’influence relative de chaque variable en entrée sur l’index. Chaque pondération a une valeur par défaut de 1, ce qui signifie que chaque variable a une contribution égale. Ajustez les pondérations à la hausse ou à la baisse en fonction de l’importance relative des variables. Par exemple, pour une variable deux fois plus importante qu’une autre, utilisez une valeur de pondération de 2. Si vous utilisez des valeurs de pondération supérieures à 1 et que vous procédez à une multiplication pour combiner des valeurs mises à l’échelle, les index générés peuvent comporter de très grandes valeurs.

Value Table
Nom de l’index en sortie
(Facultatif)

Nom de l'index. La valeur est utilisée pour la visualisation des sorties, comme les alias de champ et les étiquettes de diagramme. La valeur n’est pas utilisée lorsque la sortie (ou l’entrée ajoutée) est un shapefile.

String
Inverser les valeurs d’index en sortie
(Facultatif)

Détermine l’inversion ou non du sens des valeurs d’index en sortie (par exemple, pour traiter les valeurs d’index élevées comme des valeurs faibles).

  • Case cochée - Le sens des valeurs d’index est inversé.
  • Case décochée - Le sens des valeurs d’index n’est pas inversé. Il s’agit de l’option par défaut.

Boolean
Valeurs minimale et maximale d’index en sortie
(Facultatif)

Minimum et maximum des valeurs d’index en sortie. Cette mise à l’échelle est appliquée après la combinaison des variables mises à l’échelle. Si aucune valeur n’est indiquée, l’index en sortie n’est pas mis à l’échelle.

Value Table
Sorties classées supplémentaires
(Facultatif)

Indique la méthode à utiliser pour classer l’index en sortie. Un champ en sortie supplémentaire est proposé pour chaque option sélectionnée.

  • Intervalle égalLes classes sont créées par subdivision de la plage de valeurs en intervalles de taille égale.
  • QuantileLes classes sont créées, chacune comprenant un nombre égal d’enregistrements.
  • Écart typeLes classes sont créées conformément au nombre d’écarts types au-dessus et au-dessous de la moyenne de l’index. Les valeurs obtenues sont comprises entre -3 et 3.
  • PersonnaliséeLes interruptions de classe et les valeurs de classe sont définies à l’aide du paramètre Classes personnalisées de l’index en sortie.
String
Nombre de classes de l’index en sortie
(Facultatif)

Nombre de classes à utiliser pour les méthodes de classification par intervalles égaux et par quantile.

Long
Classes personnalisées de l’index en sortie
(Facultatif)

Limites supérieures et valeurs de classe pour la méthode de classification personnalisée. Par exemple, vous pouvez utiliser cette variable pour classer un index contenant des valeurs comprises entre 0 et 100 en classes représentant des valeurs faibles, moyennes et élevées en fonction de valeurs d’interruption personnalisées.

Value Table

Sortie obtenue

ÉtiquetteExplicationType de données
Table en entrée mise à jour

Table en entrée mise à jour.

Feature Layer; Table View
Groupe de couches en sortie

Si l’entrée était une classe d’entités, et que la valeur du paramètre Entités ou table en sortie est une classe d’entités, le groupe de couches qui est proposé affiche une couche pour le champ d’index, le champ de centile et chacune des options de classification sélectionnées.

Group Layer

arcpy.stats.CalculateCompositeIndex(in_table, in_variables, {append_to_input}, {out_table}, {index_preset}, {preprocessing}, {pre_threshold_scaling}, {pre_custom_zscore}, {pre_min_max}, {pre_thresholds}, {index_method}, {index_weights}, {out_index_name}, {out_index_reverse}, {post_min_max}, {post_reclass}, {post_num_classes}, {post_custom_classes})
NomExplicationType de données
in_table

Table ou entités contenant les variables à combiner dans l’index.

Table View
in_variables
[[var1, reverse1],[var2, reverse2],...]

Liste des champs numériques représentant les variables à combiner en un index. La colonne Inverser le sens intervertit les valeurs des variables. Cela signifie que l’entité ou l’enregistrement qui avait initialement la valeur la plus élevée se retrouve avec la valeur la plus faible, et inversement. Les valeurs sont inversées après la mise à l’échelle.

Value Table
append_to_input
(Facultatif)

Détermine si les résultats sont ajoutés aux données en entrée ou fournis sous forme de classe d’entités ou table en sortie.

  • APPEND_TO_INPUTLes résultats sont ajoutés aux données en entrée. Cette option modifie les données en entrée.
  • NEW_FEATURESUne classe d’entités ou table en sortie contenant les résultats est créée. Il s’agit de l’option par défaut.
Boolean
out_table
(Facultatif)

Entités ou table en sortie contenant les résultats.

Table; Feature Class
index_preset
(Facultatif)

Indique le processus à suivre pour créer un index. Les options représentent les processus courants de création d’index ; chaque option définit les valeurs par défaut des paramètres preprocessing et index_method.

  • MEAN_SCALEDUn index est créé par mise à l’échelle des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne des valeurs mises à l’échelle. Cette méthode est utile pour créer un index facile à interpréter. La forme de la distribution et les points aberrants des variables en entrée ont une incidence sur l’index. Il s’agit de l’option par défaut.
  • MEAN_PCTLUn index est créé par mise à l’échelle des classements des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne des classements mise à l’échelle. Le choix de cette option est pertinent lorsque les classements des valeurs de variable sont plus importants que les différences entre les valeurs. La forme de la distribution et les points aberrants des variables en entrée n’ont pas d’incidence sur l’index.
  • GEOMEAN_SCALEDUn index est créé par mise à l’échelle des variables en entrée à une valeur comprise entre 0 et 1 et par calcul de la moyenne géométrique des valeurs mises à l’échelle. Dans la mesure où les valeurs élevées n’annulent pas les valeurs faibles, cette option est utile pour créer un index dans lequel des valeurs d’index plus élevées apparaissent uniquement lorsqu’il y a des valeurs élevées dans plusieurs variables.
  • SUM_FLAGSPCTLUn index, qui compte le nombre de variables en entrée dont les valeurs sont supérieures ou égales au 90e centile, est créé. Cette méthode est utile pour identifier les endroits qui peuvent être considérés comme les plus extrêmes ou les plus défavorisés.
  • CUSTOMUn index est créé à l’aide d’options personnalisées de mise à l’échelle et combinaison des variables.
String
preprocessing
(Facultatif)

Indique la méthode utilisée pour convertir les variables en entrée dans une échelle commune.

  • MINMAXLes variables sont mises à l’échelle à des valeurs comprises entre 0 et 1 selon les valeurs minimale et maximale de chaque variable. Il s’agit de l’option par défaut.
  • CUST_MINMAXLes variables sont mises à l’échelle à des valeurs comprises entre 0 et 1 selon la valeur minimale possible et la valeur maximale possible pour chaque variable, définies par le paramètre pre_min_max. Cette méthode aux applications multiples permet notamment de définir le minimum et le maximum sur la base d’un repère, d’une statistique de référence ou de valeurs théoriques. Par exemple, si les mesures d’ozone relevées pour une même journée sont comprises entre 5 et 27 parties par million (ppm), vous pouvez utiliser les valeurs minimale et maximale théoriques sur la base d’une observation préalable et de la connaissance du domaine pour faire en sorte que l’index puisse être comparé sur plusieurs jours.
  • PERCENTILELes variables sont converties en centiles compris entre 0 et 1 par calcul du pourcentage des valeurs de données inférieures à la valeur de données. Le choix de cette option est pertinent lorsque vous souhaitez ignorer les différences absolues entre les valeurs de données, comme pour les points aberrants et les distributions asymétriques.
  • RANKLes variables sont classées. La plus petite valeur se voit attribuer la valeur de classement 1, la valeur suivante se voit attribuer la valeur de classement 2, et ainsi de suite. Les égalités se voient attribuer la moyenne de leurs classements.
  • ZSCOREChaque variable est standardisée par soustraction de la valeur moyenne et division par l’écart type (appelé un score z). Le score z est le nombre d’écarts types au-dessus ou au-dessous de la valeur moyenne. Le choix de cette option est pertinent lorsque les moyennes des variables sont des points de comparaison importants. Les valeurs au-dessus de la moyenne se voient attribuer des scores z positifs, et les valeurs au-dessous de la moyenne se voient attribuer des scores z négatifs.
  • CUST_ZSCOREChaque variable est standardisée par soustraction d’une valeur moyenne personnalisée et division par un écart type personnalisé. Indiquez les valeurs personnalisées dans le champ du paramètre pre_custom_zscore. Le choix de cette option est pertinent lorsque les moyennes et les écarts types des variables ont été démontrés par des études antérieures.
  • BINARYLes variables sont identifiées lorsqu’elles sont supérieures ou inférieures à un seuil défini. Le champ généré contient des valeurs binaires (0 ou 1) indiquant si le seuil a été dépassé. Vous pouvez également utiliser le paramètre pre_threshold_scaling pour mettre à l’échelle les valeurs de variable en entrée avant de définir le seuil, et utiliser le paramètre pre_thresholds pour spécifier les valeurs de seuil. Il est intéressant d’utiliser cette méthode lorsque les valeurs mêmes des variables importent moins que le fait qu’elles dépassent ou non un certain seuil, par exemple la limite de sécurité d’un polluant.
  • RAWLes valeurs d’origine des variables sont utilisées. Utilisez cette méthode uniquement lorsque toutes les variables sont mesurées sur une échelle comparable (pourcentages ou taux, par exemple) ou lorsque les variables ont été standardisées avant l’utilisation de cet outil.
String
pre_threshold_scaling
(Facultatif)

Indique la méthode à utiliser pour convertir les variables en entrée à une échelle commune avant de définir les seuils.

  • THRESHOLD_MINMAXLes variables comprises entre 0 et 1 sont mises à l’échelle selon les valeurs minimale et maximale de chaque variable.
  • THRESHOLD_CUST_MINMAXLes variables comprises entre 0 et 1 sont mises à l’échelle selon la valeur minimale possible et la valeur maximale possible pour chaque variable.
  • THRESHOLD_PERCENTILELes variables sont converties en centiles compris entre 0 et 1.
  • THRESHOLD_ZSCOREChaque variable est standardisée par soustraction de la valeur moyenne et division par l’écart type.
  • THRESHOLD_CUST_ZSCOREChaque variable est standardisée par soustraction d’une valeur moyenne personnalisée et division par un écart type personnalisé.
  • THRESHOLD_RAWLes valeurs des variables sont utilisées telles quelles. Il s’agit de l’option par défaut.
String
pre_custom_zscore
[[field1, mean1, stdev1], [field2, mean2, stdev2],...]
(Facultatif)

Valeur moyenne personnalisée et écart type personnalisé à utiliser pour la standardisation de chaque variable. Pour chaque variable, indiquez la moyenne personnalisée dans la colonne Moyenne et l’écart type personnalisé dans la colonne Écart type.

Value Table
pre_min_max
[[field1, min1, max1], [field2, min2, max2],...]
(Facultatif)

Valeurs minimale et maximale possibles à utiliser dans les unités des variables. Chaque variable est mise à l’échelle à une valeur comprise entre 0 et 1 en fonction des valeurs minimale et maximale possibles.

Value Table
pre_thresholds
[[field1, method1, threshold1], [field2, method2, threshold2],...]
(Facultatif)

Seuil qui détermine le signalement d’une entité. Indiquez la valeur dans les unités des variables mises à l’échelle et spécifiez si les valeurs supérieures ou inférieures à la valeur de seuil doivent être signalées.

Value Table
index_method
(Facultatif)

Indique la méthode à utiliser pour combiner les variables mises à l’échelle en une seule valeur.

  • SUMLes valeurs sont ajoutées.
  • MEANLa moyenne (additive) arithmétique des valeurs est calculée. Il s’agit de l’option par défaut.
  • PRODUCTLes valeurs sont multipliées. Toutes les valeurs mises à l’échelle doivent être supérieures ou égales à zéro.
  • GEOMETRIC_MEANLa moyenne (multiplicative) géométrique des valeurs est calculée. Toutes les valeurs mises à l’échelle doivent être supérieures ou égales à zéro.

Vous ne pouvez pas multiplier ou calculer une moyenne géométrique lorsque des variables sont mises à l’échelle selon des scores z du fait que ceux-ci contiennent toujours des valeurs négatives.

String
index_weights
[[field1, weight1], [field2, weight2],...]
(Facultatif)

Pondérations qui expriment l’influence relative de chaque variable en entrée sur l’index. Chaque pondération a une valeur par défaut de 1, ce qui signifie que chaque variable a une contribution égale. Ajustez les pondérations à la hausse ou à la baisse en fonction de l’importance relative des variables. Par exemple, pour une variable deux fois plus importante qu’une autre, utilisez une valeur de pondération de 2. Si vous utilisez des valeurs de pondération supérieures à 1 et que vous procédez à une multiplication pour combiner des valeurs mises à l’échelle, les index générés peuvent comporter de très grandes valeurs.

Value Table
out_index_name
(Facultatif)

Nom de l'index. La valeur est utilisée pour la visualisation des sorties, comme les alias de champ et les étiquettes de diagramme. La valeur n’est pas utilisée lorsque la sortie (ou l’entrée ajoutée) est un shapefile.

String
out_index_reverse
(Facultatif)

Détermine l’inversion ou non du sens des valeurs d’index en sortie (par exemple, pour traiter les valeurs d’index élevées comme des valeurs faibles).

  • REVERSELe sens des valeurs d’index est inversé.
  • NO_REVERSELe sens des valeurs d’index n’est pas inversé. Il s’agit de l’option par défaut.
Boolean
post_min_max
[min1, max1], [min2, max2]
(Facultatif)

Minimum et maximum des valeurs d’index en sortie. Cette mise à l’échelle est appliquée après la combinaison des variables mises à l’échelle. Si aucune valeur n’est indiquée, l’index en sortie n’est pas mis à l’échelle.

Value Table
post_reclass
[post_reclass,...]
(Facultatif)

Indique la méthode à utiliser pour classer l’index en sortie. Un champ en sortie supplémentaire est proposé pour chaque option sélectionnée.

  • EQINTERVALLes classes sont créées par subdivision de la plage de valeurs en intervalles de taille égale.
  • QUANTILELes classes sont créées, chacune comprenant un nombre égal d’enregistrements.
  • STDDEVLes classes sont créées conformément au nombre d’écarts types au-dessus et au-dessous de la moyenne de l’index. Les valeurs obtenues sont comprises entre -3 et 3.
  • CUSTLes interruptions de classe et les valeurs de classe sont définies à l’aide du paramètre post_custom_classes.
String
post_num_classes
(Facultatif)

Nombre de classes à utiliser pour les méthodes de classification par intervalles égaux et par quantile.

Long
post_custom_classes
[[min1, max1], [min2, max2],...]
(Facultatif)

Limites supérieures et valeurs de classe pour la méthode de classification personnalisée. Par exemple, vous pouvez utiliser cette variable pour classer un index contenant des valeurs comprises entre 0 et 100 en classes représentant des valeurs faibles, moyennes et élevées en fonction de valeurs d’interruption personnalisées.

Value Table

Sortie obtenue

NomExplicationType de données
updated_table

Table en entrée mise à jour.

Feature Layer; Table View
output_layer_group

Si l’entrée était une classe d’entités, et que la valeur du paramètre out_table est une classe d’entités, le groupe de couches qui est proposé affiche une couche pour le champ d’index, le champ de centile et chacune des options de classification sélectionnées.

Group Layer

Exemple de code

Exemple 1 d’utilisation de la fonction CalculateCompositeIndex (fenêtre Python)

Le script Python ci-dessous montre comment utiliser la fonction CalculateCompositeIndex.


import arcpy
arcpy.stats.CalculateCompositeIndex(
    in_table=r"C:\MyData.gdb\CommunityCharacteristics", 
    out_table=r"C:\MyData.gdb\CommunityCharacteristicsIndex",
    in_variables=["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                    "BelowPovertyLine_Percent"],
    index_preset="MEAN_SCALED")
Exemple 2 d’utilisation de la fonction CalculateCompositeIndex (script autonome)

Le script Python ci-dessous montre comment utiliser la fonction CalculateCompositeIndex.


# Import system modules 
import arcpy 
import os 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\temp\temp.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    input_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristics")

    # Set a list of variables that will be combined into an index
    input_variables = ["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                       "BelowPovertyLine_Percent"]

    # Set the output name that will contain the index values.
    output_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristicsIndex")

    # Set the method to scale the input variables
    preprocessing_method = "PERCENTILE"

    # Set the method to combine the input variables
    combination_method = "MEAN"
    variable_weights = [["ASTHMA_Prevalence_Percent", 2],
                        ["Health_NoInsurance_Percent", 1],
                        ["BelowPovertyLine_Percent", 1]]

    # Set the output settings
    output_index_name = "Asthma_Needs_Index"
    output_index_range = "0 100"
    output_classification = "QUANTILE"
    output_classification_num_classes = 5

    # Call the tool using the parameters defined above.
    arcpy.stats.CalculateCompositeIndex(
        in_table=input_features,
        in_variables=input_variables, 
        out_table=output_features,
        index_preset="CUSTOM",
        preprocessing=preprocessing_method,
        index_method=combination_method,
        index_weights=variable_weights,
        out_index_name=output_index_name,
        post_min_max=output_index_range,
        post_reclass=output_classification,
        post_num_classes=output_classification_num_classes)

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes