Fonctionnement de l’outil Calculer des taux

L’outil Calculer des taux calcule différents taux. Vous pouvez l’utiliser pour calculer des pourcentages, des ratios, des taux d’incidence et des taux lissés. Vous pouvez calculer des taux lissés à l’aide des méthodes suivantes : estimation bayésienne empirique globale, estimation bayésienne empirique locale, moyenne pondérée locale ou médiane pondérée locale.

La méthode du taux brut peut être utilisée pour calculer des pourcentages, des ratios et des taux d’incidence. Toutefois, si les entités présentent un nombre ou une population faible, une méthode de lissage sera plus appropriée. Les méthodes de lissage utilisent les informations des voisins spatiaux d’une entité ou d’un taux de référence pour ajuster le taux brut de chaque entité. L’outil inclut les méthodes de lissage suivantes :

  • Estimation bayésienne empirique globale : ajuste l’estimation du taux brut de chaque entité par rapport à un taux de référence global. La taille de la population de l’entité a un impact sur le degré d’ajustement. Utilisez cette option si vous pensez qu’un risque sous-jacent constant existe dans toutes les entités.
  • Estimation bayésienne empirique locale : ajuste l’estimation du taux brut de chaque entité par rapport à un taux de référence local. Utilisez cette option si vous pensez qu’il existe une variabilité spatiale du risque.
  • Moyenne pondérée locale : détermine le taux de chaque entité en utilisant le taux moyen pondéré de son voisinage.
  • Médiane pondérée locale  détermine le taux de chaque entité en utilisant le taux médian pondéré de son voisinage.

Applications possibles

Des taux sont calculés dans les situations suivantes :

  • Calculez des pourcentages simples. Exemple : pourcentage des personnes dans la vie active qui sont au chômage.
  • Calculez des ratios. Par exemple, le ratio femmes/hommes dans chaque pays.
  • Calculez des taux d’incidence. Par exemple, les taux de cancer de l’œsophage chez les femmes. Ce taux est une estimation de la probabilité d’observer un événement par habitant dans la population au cours d’une période donnée. Il représente la probabilité qu’un événement se produise sur cette période, pour une personne choisie au hasard dans cette population. Dans le présent cas de figure, le taux correspond à un nombre compris entre 0 et 1 et le total est un sous-ensemble des personnes formant la population.
  • Permet de mesurer l’intensité de l’occurrence d’un événement selon une unité de référence. Par exemple, l’intensité des tweets publiés par personne au cours de l’année 2020. Dans ce cas particulier, le taux peut dépasser un étant donné que les nombres (d’événements) ne sont pas nécessairement un sous-ensemble de la population.

Concepts de contextualisation

L’outil Calculer des taux calculé un taux à l’aide des méthodes suivantes : Taux brut, Estimation bayésienne empirique globale, Estimation bayésienne empirique locale, Moyenne pondérée locale ou Médiane pondérée locale. Le taux brut est la méthode la plus simple et calcule le rapport entre les décomptes d’un événement et la population sur une période donnée.

Par exemple, pour comprendre les taux de mortalité infantile, vous pouvez commencer votre analyse en utilisant la méthode du taux brut afin de calculer un ratio simple. Le graphique ci-dessous représente la mortalité infantile de 728 entités spatiales en divisant le nombre de décès infantiles survenus en 2020 par le nombre total d’enfants nés en 2020. Les données incluent quelques grandes agglomérations éparpillées parmi de nombreux petits villages. La taille de la population et le nombre de naissances varient considérablement dans les entités spatiales.

Graphique montrant les limites de la méthode du taux brut

Le graphique se caractérise par une variabilité importante des taux lorsque le nombre de naissances est faible et une variabilité relativement faible lorsque le nombre de naissances est élevé. Dans les zones avec moins de 100 naissances par an, le taux varie entre 0 (la valeur la plus faible possible) et 0,20. Une estimation du taux de mortalité infantile de 0,20, soit 2 décès pour 10 enfants nés, est inédite même dans les régions les plus pauvres du monde. En revanche, aucun taux au-dessous de 0,02 ou au-dessus de 0,08 n’apparaît dans les zones comptant au moins 1 000 naissances. Ces chiffres suggèrent que des taux de mortalité infantile élevés sont plus probables dans les zones moins peuplées. Or, la variance importante des taux dans les petites zones explique principalement ce phénomène, ce qui aboutit à un taux moins fiable que celui calculé pour les régions plus peuplées.

La variabilité plus importante est due à une extrême sensibilité du taux à la taille de la population, plutôt qu’aux différences réelles des probabilités de décès dans les zones. Cette question est liée à ce que l’on appelle le problème des petits nombres. Le problème des petits nombres se pose à chaque fois que vous calculez des pourcentages, des ratios, des proportions ou des taux pour des zones géographiques dans lesquelles la population est faible ou l’événement est rare. Dans ces cas, de petites fluctuations aléatoires dans le décompte des événements peuvent entraîner de grandes fluctuations dans les valeurs de taux résultantes. Dans l’exemple précédent, 15 zones accueillaient moins de 30 naissances et ne déploraient aucun décès. Si un seul décès apparaissait dans de telles zones, le taux bondirait de 0 à une valeur comprise entre 0,05 et 0,42 (soit un risque de mortalité de 42 pour cent).

Lorsque vous calculez des taux, vous cherchez à comprendre comment la probabilité des événements, en l’occurrence la mortalité infantile, varie dans l’espace. Néanmoins, une partie de la variation du taux brut est provoquée par des fluctuations qui ne sont pas associées à la probabilité sous-jacente de l’événement. Cette variation est plus forte pour les entités comportant de petites populations, ce qui implique une moindre fiabilité des taux calculés par rapport aux entités avec une population nombreuse. Pour pallier cette limitation de la méthode du taux brut, vous pouvez utiliser l’une des autres méthodes de calcul de taux disponibles dans l’outil Calculer des taux.

Les méthodes d’estimation bayésienne empirique globale et locale agissent toutes les deux sur la variabilité du taux brut des entités avec une petite population en ajustant le taux brut de chaque entité selon un taux de référence. L’étendue de l’ajustement dépend de la taille de la population : la différence entre l’estimation du taux brut et celle de l’estimation bayésienne empirique d’une grande population est minime alors que les ajustements sont plus notables pour une population plus petite.

En savoir plus sur l’estimation bayésienne empirique globale

En savoir plus sur l’estimation bayésienne empirique locale

Les méthodes Moyenne pondérée locale, Médiane pondérée locale et Estimation bayésienne empirique locale appliquent un lissage spatial pour calculer les taux. Le taux relatif à chaque entité se calcule à l’aide du taux de son voisinage. Une fois les voisins et pondérations des voisins de chaque entité identifiés, le taux des entités est calculé à l’aide du paramètre Méthode de calcul des taux. Le taux relatif à chaque entité est l’un des taux suivants :

Entrées d’outils

L’outil inclut plusieurs paramètres pour définir et configurer le taux.

Champs relatifs au taux

Le paramètre Champs relatifs au taux spécifie les champs permettant de calculer le taux. Le paramètre inclut une valeur Champ de nombre qui indique le champ dans la couche en entrée comportant le total des événements et une valeur Champ de population qui indique le champ en entrée comportant les données relatives à la population correspondant au champ de nombre sélectionné.

Vous pouvez calculer un ou plusieurs taux. Pour calculer plusieurs taux, indiquez plusieurs valeurs dans Champ de nombre et Champ de population. Par exemple, dans une classe d’entités qui contient un champ comptabilisant les décès liés au cancer en 2014, 2020 et 2024 et un champ de population pour ces mêmes années, vous pouvez calculer trois taux de décès liés au cancer. Si vous calculez plusieurs taux, les valeurs des paramètres Méthode de calcul des taux et Multiplicateur de taux s’appliquent au calcul de chaque taux.

Méthode de calcul des taux

Le paramètre Méthode de calcul des taux indique la méthode utilisée pour calculer le taux.

Taux brut

Le calcul du taux brut est le suivant :

Équation de calcul du taux brut

où ri désigne le taux brut, ni la population et Yi l’effectif total de l’entité spatiale ith. Le taux brut est calculé pour chaque entité. Néanmoins, les entités avec un total inférieur à zéro ou une population inférieure ou égale à zéro se voient attribuer un taux nul. Vous pouvez évaluer la fiabilité de chaque taux brut estimé à l’aide des champs Confidence interval- upper 95%, Confidence interval- lower 95% et Reliable qui sont inclus dans la table ou la classe d’entités en sortie. Si de nombreuses entités ont des valeurs de fiabilité ou des intervalles de confiance conséquents, préférez une autre méthode de calcul des taux.

En savoir plus sur les valeurs d’intervalle de confiance

En savoir plus sur les valeurs fiables

Estimation bayésienne empirique globale

La méthode Estimation bayésienne empirique globale estime les taux en calculant la moyenne pondérée du taux brut et d’un taux de référence. La méthode est calculée comme suit :

Équation de calcul du taux par la méthode bayésienne empirique globale

où i désigne l’entité spatiale, Variable de l’estimation bayésienne empirique globale est l’estimation bayésienne empirique globale, Ci est une pondération dont la valeur est comprise entre 0 et 1, Variable de l’estimation du taux brut est l’estimation du taux brut de l’entité i et Variable du taux de référence le taux de référence.

Le taux de référence est le taux moyen de toutes les entités. Le taux de référence est calculé en divisant la somme des nombres de toutes les entités par la somme des populations de toutes les entités comme suit :

Équation de calcul du taux de référence

La variable du taux de référence désigne le taux de référence, Yi représente la population de l’entité ith et ni le nombre correspondant. La pondération, Ci varie d’une entité à une autre et est impactée par la taille de la population de l’entité. Si une entité présente une population nombreuse, la pondération s’approche considérablement de 1 et l’estimation bayésienne empirique globale d’une entité est presque identique à l’estimation de son taux brut. Si la population est petite, le taux brut diminue pour se rapprocher du taux de référence car la pondération, Ci, est inférieure à 1, et l’estimation bayésienne empirique globale du taux d’une entité est une moyenne pondérée du taux brut et du taux de référence.

Si le paramètre Méthode de calcul des taux a pour valeur Estimation bayésienne empirique globale ou Estimation bayésienne empirique locale, vous devez également spécifier une valeur pour le paramètre Distribution des probabilités. La distribution des probabilités désigne la distribution qui est censée modéliser les valeurs des nombres observés. Le paramètre Distribution des probabilités inclut deux options : Poisson et Binomiale. L’option par défaut est la distribution Poisson, une distribution largement utilisée pour la modélisation des taux. Cette option permet d’estimer l’intensité ou la probabilité de l’occurrence d’un événement. Le modèle de distribution des probabilités binomiale suppose les points suivants :

  • Le nombre d’événements (numérateur) est un sous-ensemble de la population (dénominateur).
  • Chaque événement est indépendant les uns des autres.
  • Tous les événements ont la même probabilité de se produire.

Si l’une de ces hypothèses n’est pas vérifiée, la distribution binomiale n’est pas un modèle adapté. Il est recommandé de sélectionner la distribution binomiale seulement si ces hypothèses sont satisfaites et si la probabilité de l’événement n’est pas rare.

Estimation bayésienne empirique locale

L’estimation bayésienne empirique locale du taux d’une entité est la moyenne pondérée du taux brut de l’entité focale et du taux moyen pondéré de son voisinage. L’estimation bayésienne empirique locale est calculée comme suit :

Équation de calcul du taux par la méthode bayésienne empirique locale

où i désigne l’entité d’intérêt, Variable de l’estimation bayésienne empirique locale est l’estimation de l’estimation bayésienne empirique locale, Ci est la pondération, Variable du taux moyen pondéré local de l’entité i et ses voisins et Variable de l’estimation du taux brut définit le taux brut de l’entité focale.

Le taux moyen du voisinage d’une entité, La variable du taux moyen pondéré locale i et ses voisins, est déterminé par les valeurs des paramètres Type de voisinage et Structure de pondération locale. Le paramètre Type de voisinage spécifie la méthode permettant d’identifier les voisins de chaque entité. Chaque voisin se voit attribuer une pondération basée sur la valeur du paramètre Type de voisinage ou du paramètre Structure de pondération locale. L’outil calcule ensuite le taux moyen pondéré local de chaque voisinage comme suit :

Équation de calcul de la moyenne pondérée globale

où i désigne l’entité d’intérêt, La variable du taux moyen pondéré local est le taux moyen pondéré local en i, j est le voisin, wij est la pondération du voisin j et La variable du taux brut du voisin j désigne l’estimation du taux brut du voisin j.

Moyenne pondérée locale

La méthode de calcul du taux moyen pondéré local estime le taux d’une entité en calculant le taux moyen pondéré de son voisinage. Pour estimer les taux moyens pondérés locaux, l’outil applique d’abord la valeur du paramètre Type de voisinage afin d’identifier les voisins de chaque entité. Chaque voisin reçoit ensuite une pondération basée sur la valeur du paramètre Type de voisinage ou du paramètre Structure de pondération locale. Le taux moyen pondéré local de chaque entité est ensuite calculé comme suit :

Équation de calcul du taux moyen pondéré local

où i désigne l’entité d’intérêt, La variable du taux moyen pondéré local est le taux moyen pondéré local en i, j est le voisin, wij est la pondération du voisin j et La variable du taux brut estimé du voisin j désigne l’estimation du taux brut du voisin j.

Médiane pondérée locale

La méthode de calcul du taux médian pondéré local estime le taux d’une entité en calculant le taux médian pondéré de son voisinage.

Multiplicateur de taux

Chaque taux est une valeur comprise entre 0 et 1. Si la taille de la population est grande ou si l’événement d’intérêt est rare, les taux obtenus sont bas. Les taux incluent de nombreux zéros de début, ce qui peut rendre leur interprétation difficile. Le paramètre Multiplicateur de taux est une valeur entière qui met à l’échelle les taux de sorte qu’ils soient plus parlants et plus faciles à interpréter. En règle générale, il convient d’utiliser la valeur de taux la plus faible pour déterminer le multiplicateur de taux. Par exemple, si le taux le plus faible comporte 3 zéros de début, la valeur Multiplicateur de taux doit être égale à supérieure à 10 000. Le taux le plus faible différent de 0 sera alors supérieur à 1.

Lorsque vous définissez la valeur Multiplicateur de taux, les taux correspondent au nombre attendu pour les unités de multiplicateur de taux. Par exemple, si vous calculez les taux de décès liés au cancer du pancréas et définissez la valeur 100 000 pour Multiplicateur de taux, les taux résultants correspondront au nombre attendu pour 100 000 personnes. Si le taux d’une entité est 144, cela signifie que 144 décès liés au cancer du pancréas sont attendus par an pour chaque groupe de 100 000 personnes.

Sorties de l’outil

L’outil produit une table ou une classe d’entités en sortie, un groupe de couches en sortie et des messages de géotraitement.

Entités ou table en sortie

Classe d’entités ou table en sortie qui inclut plusieurs champs.

Taux excédentaire

Le taux Excess Rate compare le taux d’une entité au taux moyen de toutes les entités. Le taux excédentaire se calcule en divisant le taux observé d’une entité par le taux moyen de toutes les entités. Le taux excédentaire peut correspondre à toute valeur positive supérieure ou égale à zéro. Les valeurs de taux excédentaire proches de un indiquent que le taux estimé est analogue au taux moyen. Si le taux excédentaire est inférieur à un, le taux estimé d’une entité est inférieur au taux moyen. Si le taux excédentaire est supérieur à un, le taux estimé d’une entité est supérieur au taux moyen. Par exemple, si le taux excédentaire d’une entité est 1,25, cela signifie que son taux est supérieur de 25 % au taux moyen. À l’inverse, si le taux excédentaire d’une entité est 0,75, cela signifie que son taux est inférieur de 25 % au taux moyen.

Taux standardisé

Le champ Standardized Rate montre dans quelle mesure le taux d’une entité s’écarte du taux moyen. Le calcul du taux standardisé est le suivant :

Équation de calcul du taux standardisé

où z désigne le taux standardisé, La variable de l’estimation du taux l’estimation du taux, La variable du taux moyen l’estimation du taux moyen et La variable de l’écart type l’écart type. Les entités avec des taux standardisés négatifs possèdent des taux inférieurs au taux moyen. Les entités avec des taux standardisés positifs possèdent des taux supérieurs au taux moyen. Plus le taux standardisé est négatif, plus il chute sous la moyenne. Plus le taux standardisé est positif, plus il s’écarte de la moyenne et "s’envole". Les entités avec des taux standardisés supérieurs à 3 ou inférieurs à -3 sont considérées comme des points aberrants.

Intervalles de confiance

Si le paramètre Méthode de calcul des taux est défini sur Taux brut, la table ou la classe d’entités en sortie inclut un champ Confidence Interval – Upper 95% et un champ Confidence Interval- Lower 95%. L’intervalle de confiance de 95 pour cent est calculé à l’aide de la méthodologie proposée par le Centre de contrôle et de prévention des maladies (CDC) des Statistiques en matière de santé du centre national des États-Unis. Si le nombre total d’une entité est supérieur ou égal à 100, une approximation gaussienne est adaptée et a pour effet de calculer l’intervalle de confiance de 95 pour cent pour le taux brut de la façon suivante :

Équation de calcul de l’intervalle de confiance de 95 pour cent lorsque le nombre est supérieur ou égal à 100

où ri représente le taux brut et Yi l’effectif total.

Si le nombre est inférieur à 100, l’intervalle de confiance de 95 pour cent est calculé à l’aide de la méthode proposée par K. Ulm dans A simple method to calculate the confidence interval of a standardized mortality ratio (SMR). Dans ce cas, l’approximation gaussienne de Poisson ne convient pas ; une identité entre les probabilités cumulatives de Poisson et la distribution du khi carré est utilisée. Considérons qgamma(p,x) représentant le quantile associé à la probabilité p d’une distribution gamma avec le paramètre de forme x et le paramètre de taux 1. L’intervalle de confiance de 95 pour cent se calcule de la manière suivante :

Équation de calcul de l’intervalle de confiance de 95 pour cent lorsqu’une entité présente un nombre inférieur à 100

Fiable

Les valeurs dans le champ Reliable reflètent la fiabilité de l’estimation du taux. Ce champ est inclus dans la table ou les entités en sortie lorsque la valeur du paramètre Méthode de calcul des taux est Taux brut. Le calcul suit la méthode décrite par le CDC (Centre de contrôle et de prévention des maladies) dans son manuel de référence. Si la valeur fiable est élevée, l’estimation du taux brut n’est pas précise et le taux brut est considéré comme non fiable. À partir de 1989, le CDC du centre national des statistiques en matière de santé a considéré qu’un taux brut reposant sur un nombre inférieur à 20 n’est pas fiable d’un point de vue statistique. Cela équivaut à une valeur fiable supérieure ou égale à 22,94.

La fiabilité est mesurée grâce à l’erreur standard relative (RSE), également appelée coefficient de variation. L’erreur standard relative (RSE) est le ratio entre l’erreur standard du taux et l’estimation du taux multiplié par 100. Le calcul de l’écart du taux est le suivant :

Équation de calcul de la variance des taux

En supposant un total différent de zéro, l’erreur standard relative est calculée comme suit :

Équation de calcul de l’erreur standard relative (RSE)

Le RSE dépend unique des nombres (Yi). Bien que la formule de l’erreur standard relative (RSE) ne dépende pas directement de la taille de la population, les populations nombreuses présentent généralement des nombres plus élevés. Il existe donc un effet indirect.

Nombre de voisins non nuls

Le champ Number of Non-Null Neighbors répertorie le nombre de voisins, entité focale comprise, qui ne comportent pas de taux nul. Les entités avec une valeur négative ou nulle dans le paramètre Champ de population ou Champ de nombre ont un taux nul. La méthode de lissage utilise le voisinage d’une entité pour déterminer le taux de cette entité. Le champ Number of Non-Null Neighbors révèle le nombre dresse le nombre de voisins utilisés pour lisser le taux de l’entité focale. Ce champ est inclus dans la table ou la classe d’entités en sortie si le paramètre Méthode de calcul des taux est défini sur Moyenne pondérée locale, Médiane pondérée locale ou Estimation bayésienne empirique locale.

Renseigner la valeur manquante

Le champ Fill Missing Value est un champ booléen indiquant si un taux a été imputé pour l’entité. Les entités avec une valeur négative ou nulle dans le paramètre Champ de nombre ou dans le paramètre Champ de population ont un taux nul. Toutefois, si la valeur Méthode de calcul du taux est Moyenne pondérée locale ou Médiane pondérée locale, un taux peut être imputé pour une entité dont le taux est nul. Si l’entité possède des voisins non nuls, le taux nul sera remplacé par l’estimation de la moyenne pondérée locale ou l’estimation de la médiane pondérée locale de son voisinage.

Groupe de couches et symbologie

L’outil ajoute un groupe de couches à la fenêtre Contents (Contenu) et une sous-couche pour chaque taux. Si plus de 10 taux sont calculés, seuls les 10 premiers seront ajoutés en tant que sous-couches.

Chaque sous-couche est une carte d’écart type. Les taux sont divisés en deux groupes en fonction de leur écart type. Chaque groupe porte une étiquette indiquant l’intervalle d’un écart type et, entre parenthèses, l’intervalle du taux correspondant. Le dégradé de couleurs se compose de trois couleurs : vert, blanc au milieu et marron. Le dégradé de couleurs est centré autour du taux moyen. Les entités en vert sont associées à des taux inférieurs au taux moyen. Les entités en marron sont associées à des taux supérieurs au taux moyen. Les entités en teintes de marron les plus foncées (+3 écarts types) et de vert les plus foncées (-3 écarts types) sont des valeurs aberrantes.

Messages de géotraitement

Les messages de géotraitement fournissent un résumé des entités et des taux. Les messages incluent une section déroulante pour chaque taux calculé. Chaque section comporte une table Résumé des taux. Si la valeur du paramètre Méthode de calcul des taux est Moyenne pondérée locale, Médiane pondérée locale ou Estimation bayésienne empirique locale, chaque section inclut également une table Résumé des taux des voisinages.

Résumé des taux

Si la valeur du paramètre Méthode de calcul des taux n’est pas Taux brut, la table Résumé des taux inclut une colonne récapitulant la méthode de taux sélectionnée et une colonne supplémentaire récapitulant les taux bruts. Utilisez ces colonnes pour comparer les résultats de la méthode de calcul des taux sélectionnée aux résultats de la méthode des taux bruts. La table Résumé des taux inclut les valeurs Minimum, Maximum, Médiane, Moyenne et Écart type des taux. Si le paramètre Méthode de calcul du taux a pour valeur Moyenne pondérée locale ou Médiane pondérée locale, la table inclut une ligne Entités avec une valeur de taux nulle ou Entités avec des valeurs renseignées. La ligne Entités avec une valeur de taux nulle recense le nombre d’entités ayant un taux est nul. La ligne Entités avec des valeurs renseignées recense le nombre d’entités dont le taux est imputé. Au départ, ces entités avaient un taux nul. Néanmoins, comme leur voisinage incluait des valeurs de taux non nulles, son taux leur a été imputé.

Table Résumé des taux

Résumé des taux des voisinages

Si la valeur du paramètre Méthode de calcul des taux est Moyenne pondérée locale, Médiane pondérée locale ou Estimation bayésienne empirique locale, chaque section inclut également une table Résumé des taux des voisinages récapitulant tous les voisinages. Le tableau inclut les valeurs Minimum, Maximum, Médiane et Moyenne du taux de voisinage, ainsi que le nombre de la valeur Entités sans voisin.

Table Résumé des taux des voisinages

Ressources supplémentaires

Consultez les ressources supplémentaires suivantes :