Diagramme de densité matriciel

Les diagrammes de densité matriciels analysent les relations entre deux champs catégoriels, qui peuvent être visualisés selon le décompte ou agrégés selon un champ numérique. Chaque cellule du diagramme de densité matriciel correspond à l’intersection des catégories issues des champs Column (Colonne) et Row (Ligne) ; tous les enregistrements partageant les valeurs de ces deux catégories seront agrégés dans la même cellule. Par exemple, dans le diagramme suivant, tous les enregistrements de valeur C dans le champ Row (Ligne) et une valeur X dans le champ Column (Colonne) seront agrégés dans la même cellule.

Diagramme de densité matriciel

Variables

Les diagrammes de densité matriciels agrègent les appariements entre les champs Column (Colonne) et Row (Ligne) en une grille de cellules.

Remarque :

Les champs Column (Colonne) et Row (Ligne) doivent être de type date, entier ou texte.

Par défaut, un diagramme de densité matriciel affiche le nombre d’occurrences entre les catégories des champs Column (Colonne) et Row (Ligne). Vous pouvez également agréger une variable numérique en sélectionnant un champ Number (Numérique) et une méthode Aggregation (Agrégation). Appliquer une variable numérique est utile si vous souhaitez étudier les caractéristiques d’un champ secondaire lorsque deux catégories présentent une intersection. La méthode d'agrégation peut être l'une des suivantes :

  • Count (Décompte) : nombre d’enregistrements dans chaque cellule
  • Somme
  • Moyenne
  • Médiane
  • Minimum
  • Maximum

Options d'agrégation temporelle

Lorsqu’un champ de date est utilisé pour les propriétés Column (Colonne) ou Row (Ligne), des options d’agrégation temporelle peuvent être configurées en activant le bouton bascule Enable temporal binning for columns (Activer le groupement temporel pour les colonnes) ou Enable temporal binning for rows (Activer le groupement temporel pour les lignes). Lorsque le groupement temporel est activé, plusieurs options contrôlent la taille d’intervalle et les paramètres associés qui sont appliqués au regroupement.

Taille d’intervalle

Les données temporelles sont regroupées en intervalles temporels. Une taille d’intervalle par défaut est choisie en fonction de l’étendue temporelle du jeu de données et peut être modifiée manuellement à l’aide de l’option Interval size (Taille d’intervalle).

Alignement des intervalles

Les intervalles temporels peuvent s’aligner sur le premier ou le dernier point de données, ou sur une référence temporelle spécifique.

Exemple de données

L’option Snap to first data point (Capturer sur le premier point de données) initie un regroupement avec la date la plus ancienne et continue vers l’avant.

Regroupement avec alignement au début du jeu de données

L’option Snap to the last data point (Capturer sur le dernier point de données) initie un regroupement avec la date la plus récente et retourne en arrière.

Regroupement avec alignement à la fin du jeu de données

L’option Reference time (Référence temporelle) initie un regroupement à une date spécifique, définie par l’utilisateur. Lorsque la valeur de la référence temporelle se situe avant l’étendue du jeu de données, elle est traitée comme le premier point de données d’un intervalle temporel. À l’inverse, lorsque la valeur de la référence temporelle se situe après l’étendue du jeu de données, elle est traitée comme le dernier point de données d’un intervalle temporel.

Il est important de prendre en compte l’alignement des intervalles car, selon la configuration, des groupes partiellement vides peuvent être créés. Des groupes partiellement vides peuvent donner la trompeuse impression d’un fléchissement de la valeur ou du nombre au cours de cette période, alors qu’en réalité la collecte de données a commencé ou s’est terminée pendant la durée de ce groupe. Pour éviter la déformation des groupes, sélectionnez l'option Tronquer l'intervalle incomplet. Cette opération supprime le groupe rempli partiellement de la visualisation.

Tronquez les intervalles incomplets.

Axes

Plusieurs options contrôlent les axes et les paramètres associés.

Nombre maximal de caractères

Par défaut, les étiquettes de catégorie sont tronquées à 11 caractères. Lorsqu’une étiquette est tronquée, il est possible d’afficher le texte intégral en survolant l’étiquette. Pour afficher le texte complet de l’étiquette dans le diagramme, augmentez la limite de caractères des étiquettes.

Orientation des étiquettes

Les étiquettes des axes peuvent être configurées de sorte à être affichées selon l’une des orientations suivantes : Horizontal, Diagonal ou Vertical.

Apparence

Plusieurs options contrôlent l’apparence du diagramme et les paramètres associés.

Titres et description

Des titres par défaut sont attribués aux diagrammes et axes en fonction du nom des variables et du type de diagramme. Ces valeurs peuvent être mises à jour sur l’onglet General (Général) dans la fenêtre Properties (Propriétés). Vous pouvez également attribuer une Description (Description) au diagramme. Il s'agit d'un bloc de texte qui apparaît au bas de la fenêtre du diagramme.

Couleur

Les cellules de la grille sont symbolisées à l’aide de couleurs graduées correspondant à un décompte ou une valeur agrégée de tous les appariements de catégorie entre les champs Column (Colonne) et Row (Ligne). Vous pouvez ajuster la méthode de classification des couleurs, le nombre de classes et la combinaison de couleurs dans l’onglet Data (Données) de la fenêtre Chart Properties (Propriétés du diagramme).

Trier

Les diagrammes de densité matriciels sont triés automatiquement par ordre alphabétique de catégorie. Le tri des axes peut être modifié à l’aide des options Sort columns (Trier les colonnes) et Sort rows (Trier les lignes) de la fenêtre Chart Properties (Propriétés du diagramme). Les options de tri suivantes sont disponibles pour les diagrammes de densité matriciels :

  • Ascending (Croissant) : les catégories sont triées par ordre alphabétique.
  • Descending (Décroissant) : les catégories sont triées dans l’ordre alphabétique inverse.
  • Custom (Personnalisé) : les catégories peuvent être classées manuellement dans la table Custom sort (Tri personnalisé).

Exemples

Créez un diagramme de densité matriciel pour identifier les vols dont l’heure d’arrivée est la plus en retard en moyenne entre une ville de départ et une ville d’arrivée, en définissant les propriétés suivantes :

  • Column (Colonne) :DestCity
  • Row (Ligne) :OrigCity
  • Aggregation (Agrégation) : Mean (Moyenne)
  • Number (Nombre) :DelayTime

Diagramme de densité matriciel affichant les modèles des vols en retard entre deux villes

Créez un diagramme de densité matriciel pour identifier les villes comptant le plus grand nombre de vols entre une ville de départ et une ville d’arrivée, en définissant les propriétés suivantes :

  • Column (Colonne) : DestCity.
  • Row (Ligne) : OrigCity.
  • Aggregation (Agrégation) : Count (Décompte).
  • Number (Nombre) : laissez cette propriété non définie.

Diagramme de densité matriciel affichant le nombre de vols entre deux villes

Rubriques connexes