Les boîtes à moustaches permettent de visualiser et de comparer la distribution et la tendance centrale des valeurs numériques via leurs quartiles. Les quartiles servent à fractionner les valeurs numériques en quatre groupes égaux en fonction de cinq valeurs clés : minimum, premier quartile, médiane, troisième quartile et maximum.
La partie boîte du diagramme illustre les 50 pour cent centraux des valeurs de données, également connus sous le nom d'écart interquartile ou IQR. La médiane des valeurs est représentée sous forme de ligne qui fractionne la boîte en deux. L'IQR illustre la variabilité dans un jeu de valeurs. Un IQR important indique une vaste dispersion des valeurs, tandis qu'un IQR plus petit indique que la plupart des valeurs se trouvent proches du centre. Les boîtes à moustaches illustrent également les valeurs de données minimum et maximum via des moustaches qui partent de la boîte et, parfois, de points aberrants représentés par des points au-delà des moustaches.
Variables
Les boîtes à moustaches se composent d'un axe des x et d'un axe des y. L'axe des x attribue une boîte à chaque Category (Catégorie) ou Numeric field (Champ numérique). L'axe des y permet de mesurer la valeur minimum, le premier quartile, la médiane, le troisième quartile et la valeur maximum dans un ensemble de nombres.
Les boîtes à moustaches peuvent servir à visualiser une ou plusieurs distributions. Pour visualiser une seule distribution, ajoutez un Numeric field (Champ numérique). Cette opération entraîne la création d'un diagramme avec une boîte à moustaches qui permet de visualiser la distribution de l'attribut numérique choisi.
Vous pouvez ajouter d'autres Numeric fields (Champs numériques) pour comparer plusieurs distributions de différents champs attributaires dans une table. Par exemple, dans un jeu de données de comtés, Population2010 et Population2015 sont ajoutés comme Numeric fields (Champs numériques). Le diagramme généré affiche deux boîtes à moustaches : une pour visualiser la distribution de Population2010 et l’autre pour visualiser la distribution de Population2015 pour tous les comtés de l’ensemble de données.
Si un seul Numeric field (Champ numérique) est ajouté, l’option d’ajout d’une variable Category (Catégorie) est disponible pour comparer les distributions dans les catégories. Par exemple, l’attribut Population2010 est défini comme Numeric field (Champ numérique) et StateName comme Category (Catégorie) d’un jeu de données de comtés. Le diagramme généré affiche une boîte à moustaches pour chaque Etat, qui permet de visualiser la distribution de Population2010 pour tous les comtés appartenant à chaque Etat.
Série multiple
Les boîtes à moustaches Série multiple permettent de comparer des distributions de différents types ou de différentes catégories.
Il est possible de créer des boîtes à moustaches Série multiple en spécifiant un champ Category (Catégorie) et plusieurs Numeric fields (Champs numériques) ou en spécifiant un champ de catégorie Split by (Fractionner en).
Si une variable Category (Catégorie) est utilisée avec plusieurs Numeric fields (Champs numériques), chaque Numeric field (Champ numérique) ajouté à la table Series (Série) crée une série. Par exemple, dans un jeu de données de comtés, StateName , est défini comme Category (Catégorie) et Population2010, Population2015 et Population2020, comme Numeric fields (Champs numériques). Le diagramme généré comportera des Etats comme catégories le long de l’axe des X, avec trois séries chacune (Population2010, Population2015 et Population2020).
Vous pouvez également ajouter une variable Split by (Fractionner en) afin de diviser davantage les données et de créer plusieurs séries. Par exemple, Population2010 est défini comme Numeric field (Champ numérique), StateName, comme Category (Catégorie) et ElectionWinner, comme champ Split by (Fractionner en) pour un jeu de données de comtés. La table Series (Série) est renseignée avec chaque valeur ElectionWinner unique (Démocrate ou Républicain). Le diagramme généré présente deux boîtes à moustaches côte à côte pour chaque État (100 boîtes à moustaches au total) ; une qui permet de visualiser la distribution de Population2010 pour tous les comtés de chaque État dont la valeur ElectionWinner est définie sur Démocrate et une autre pour tous les comtés de chaque État dont la valeur ElectionWinner est définie sur Républicain.
Vous pouvez également faire appel aux champs Split by (Fractionner en) lorsque plusieurs Numeric fields (Champs numériques) sont utilisés au lieu d'une variable Category (Catégorie). Par exemple, Population2010, Population2015 et Population2020 sont définis comme Numeric fields (Champs numériques) et ElectionWinner, comme champ Split by (Fractionner en) pour un jeu de données de comtés. Le diagramme généré présente les trois Numeric fields (Champs numériques) le long de l’axe des X (Population2010, Population2015 et Population2020), chacun avec deux boîtes à moustaches côte à côte ; une illustrant la distribution pour tous les comtés dont la valeur ElectionWinner est définie sur Démocrate et l’autre pour tous les comtés dont la valeur ElectionWinner est définie sur Républicain.
Afficher plusieurs séries
Lorsqu'un champ Fractionner en est utilisé pour créer plusieurs séries, deux options permettent de visualiser les résultats.
- Show as multiple box plots (Afficher sous forme de plusieurs diagrammes à surfaces) : crée des boîtes à moustaches côte à côte ; une par série.
- Show as mean lines (Afficher sous forme de lignes moyennes) : crée une boîte à moustaches par valeur Category (Catégorie) ou Numeric field (Champ numérique) et utilise des lignes pour afficher la moyenne de chaque valeur unique dans le champ Split by (Fractionner en).
Par exemple, Population2010 est défini comme Numeric field (Champ numérique), StateName, comme Category (Catégorie) et ElectionWinner, comme champ Split by (Fractionner en) pour un jeu de données de comtés. La table Series (Série) est renseignée avec chaque valeur ElectionWinner unique (Démocrate ou Républicain), mais au lieu de fractionner chaque État en une boîte à moustaches pour chaque valeur ElectionWinner, le diagramme généré présente une boîte à moustaches pour chaque État, qui permet de visualiser la distribution de l’attribut Population2010 pour les comtés compris dans cet État et la valeur moyenne de chaque série Split by (Fractionner en) (Démocrate ou Républicain) est superposée aux boîtes à moustaches qui illustrent l’endroit où se situe la valeur moyenne de chaque série par rapport à la distribution totale.
Standardisation
Lorsqu’une boîte à moustaches est créée à partir de plusieurs Numéric Fields (Champs numériques), une standardisation de score Z est appliquée par défaut. La standardisation permet de comparer les variables numériques dans différentes unités.
Ainsi, une boîte à moustaches comparant les répartitions de revenus (avec des valeurs en dizaines de milliers) et le taux de chômage (valeurs comprises entre 0 et 1,0) serait difficile à lire sans la standardisation car les valeurs du taux de chômage sont beaucoup plus faibles que celles des revenus.
La standardisation des valeurs attributaires implique une transformation z dans laquelle la moyenne de toutes les valeurs est soustraite de chaque valeur et divisée par l'écart type pour toutes les valeurs. La standardisation de score Z place tous les attributs sur la même échelle, ce qui permet de visualiser plusieurs répartitions sur le même diagramme. Pour visualiser des valeurs brutes à la place, désélectionnez la case Standardize values (z-score) (Normaliser les valeurs (score z)) dans la fenêtre Chart Properties (Propriétés du diagramme).
Axes
Limite de caractères des étiquettes sur l’axe x
Par défaut, les étiquettes de catégorie sont tronquées à 11 caractères. Lorsque les étiquettes sont tronquées, il est possible de voir leur texte complet en les survolant. Pour afficher le texte complet de l’étiquette dans le diagramme, augmentez la limite de caractères des étiquettes.
Limites de l'axe des Y
Les limites par défaut de l’axe des Y sont basées sur la plage des valeurs de date représentées sur l’axe des Y. Vous pouvez personnaliser ces valeurs en indiquant une nouvelle valeur limite pour l’axe. Il est possible de définir des limites d’axe de façon à conserver une échelle cohérente de votre diagramme pour la comparaison. Il suffit de cliquer sur le bouton de réinitialisation pour revenir à la valeur par défaut de la limite de l’axe.
Format numérique
Vous pouvez indiquer le format dans lequel un axe affiche les valeurs numériques en précisant une catégorie de format numérique ou en définissant une chaîne de format personnalisé. Par exemple, $#,### peut être utilisé comme chaîne de format personnalisé pour afficher les valeurs de devises.
Apparence
Titres et description
Des titres par défaut sont attribués aux diagrammes et axes en fonction du nom des variables et du type de diagramme. Ces valeurs peuvent être mises à jour sur l’onglet General (Général) dans la fenêtre Properties (Propriétés). Vous pouvez également attribuer une description au diagramme. Il s'agit d'un bloc de texte qui apparaît au bas de la fenêtre du diagramme.
Mise en forme visuelle
Vous pouvez configurer la présentation d’un diagramme en mettant en forme le texte et les éléments de symboles ou en appliquant un thème au diagramme. Les propriétés du format peuvent être configurées dans l’onglet Format (Format) de la fenêtre Chart Properties (Propriétés du diagramme) ou via le ruban contextuel Chart Format (Format du diagramme). Les options de mise en forme du diagramme sont notamment :
- La taille, la couleur et le style de la police utilisés pour les titres des axes, les étiquettes des axes, le texte de description, le texte de légende et les étiquettes de guide
- La couleur, l’épaisseur et le type de ligne des lignes d’axe et de grille
- La couleur d’arrière-plan du diagramme
En savoir plus sur la modification de l’apparence d’un diagramme
Couleur
Les boîtes à moustaches reflètent les couleurs de contour et de remplissage définies dans la symbologie de la couche, lorsque cela est possible. Lorsqu'une série est fractionnée d'une manière qui ne correspond pas à la symbologie de la couche, une palette de couleurs standard est appliquée. Les couleurs de série peuvent être modifiées dans l’onglet Series (Série) de la fenêtre Chart Properties (Propriétés du diagramme) en cliquant sur le correctif de couleur Symbol (Symbole) de la table Series (Série), puis en sélectionnant une nouvelle couleur.
Trier
Les boîtes à moustaches sont automatiquement triées alphabétiquement selon leurs catégories (croissant sur l’axe des X). Ceci peut être modifié à l’aide des options Sort (Trier) de la fenêtre Chart Properties (Propriétés du diagramme). Les options de tri suivantes sont disponibles pour les boîtes à moustaches :
- X-axis Ascending (Croissant sur l'axe des X) : les catégories sont organisées alphabétiquement de gauche à droite.
- X-axis Descending (Décroissant sur l'axe des X) : les catégories sont organisées dans l'ordre alphabétique inverse.
- Custom (Personnalisé) : les catégories peuvent être classées manuellement dans la table Custom sort (Tri personnalisé).
Orientation
Les boîtes peuvent être tracées horizontalement à l’aide du bouton Rotate chart (Faire pivoter le diagramme) de la fenêtre de diagramme.
Guides
Les lignes ou plages des guides peuvent être ajoutées aux diagrammes pour servir de référence ou mettre en évidence des valeurs importantes. Pour ajouter un nouveau guide, cliquez sur Add guide (Ajouter un guide) sous l’onglet Guides de la fenêtre Chart Properties (Propriétés du diagramme). Pour tracer une ligne, entrez une Value (Valeur) à l’endroit où vous souhaitez que la ligne soit tracée. Pour créer une plage, saisissez une valeur to (Jusqu’à) value. Vous avez également la possibilité d’ajouter du texte à votre guide en spécifiant une Label (Étiquette).
Exemple
Créez une boîte à moustaches visant à comparer les distributions et la variabilité de maladies chroniques par État.
- Numeric fields (Champs numériques) : % de diabète, % d'asthme, % d'insuffisance cardiaque
- Catégorie : État
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?