Calculer des scores de centralité pour mesurer l’importance des entités

Calculez des scores de centralité pour déterminer l’importance d’une entité dans un diagramme de liens basé sur un graphe de connaissances. Les scores de centralité permettent de classer les entités en fonction de leur position dans le graphe représenté par le diagramme de liens. Ces scores identifient les entités de diagramme de liens qui jouent un rôle critique dans le diagramme de liens. Par exemple, les scores peuvent identifier la personne la plus influente sur un réseau social, les événements impliqués dans la propagation d’une maladie, le nœud d’infrastructure critique dans un réseau urbain, etc.

Les scores de centralité sont calculés pour le contenu d’un diagramme de liens spécifique. Le score pour chaque entité dépend de sa position dans le graphe par rapport aux autres entités et relations présentes dans le diagramme de liens. Si vous ajoutez ou supprimez du contenu d’un diagramme de liens, les scores changent. De même, lorsque les mêmes entités sont incluses dans un autre diagramme de liens qui représente un autre ensemble de relations, les entités ont des scores différents. Les scores de centralité d’un diagramme de liens sont présentés dans la vue de la table Centrality (Centralité) Centralité.

Les sections ci-dessous décrivent les scores de centralité calculés, et expliquent comment les visualiser et les mettre à jour lorsque vous utilisez le diagramme de liens.

Mesures de centralité

Pour les diagrammes de liens basés sur un graphe de connaissances, six mesures différentes de la centralité sont calculées : degré, vecteur propre, PageRank, intermédiarité, proximité et harmonique. Ces calculs sont tous présentés dans des champs différents de la table Centrality (Centralité) du diagramme de liens.

Les scores de degré, de vecteur propre et PageRank sont calculés sur la base du nombre de relations dont une entité est membre. Les scores d’intermédiarité, de proximité et harmonique sont calculés sur la base de la longueur du chemin entre une entité et toutes les autres entités du diagramme de liens.

Toutes les relations d’un graphe de connaissances ont une direction inhérente selon la manière dont elles sont définies, de l’entité d’origine à l’entité de destination. Par défaut, les scores de centralité d’un diagramme de liens sont cependant calculés de manière à ignorer la direction d’une relation. Vous pouvez calculer les scores de manière à prendre en compte la direction de la relation, mais également en inversant la direction inhérente aux relations. Le score de centralité d’une entité peut être différent selon si les directions des relations sont prises ou non en compte.

Les groupes d’entités sont représentés par une seule ligne dans la table Centrality (Centralité), et le score de centralité est calculé pour le groupe. À l’inverse, les relations sont prises en compte individuellement, même lorsqu’elles sont regroupées comme déterminé par l’option Cumulate weights (Cumuler les pondérations).

Centralité de degré

Le score de centralité de degré est défini comme le nombre total de relations de diagramme de liens dont une entité est membre. Le score de centralité de degré permet de déterminer quelles entités sont primordiales pour le graphe. Par exemple, lorsque le diagramme de liens représente un réseau social, une entité de personne avec un score de centralité de degré élevé correspond à une personne qui est connectée à de nombreuses autres personnes, ce qui la rend centrale pour le réseau.

Si la direction de la relation est prise en compte, le score global de centralité de degré peut être divisé afin de représenter la mesure en degré entrant et en degré sortant. Le score en degré entrant correspond au nombre de relations entrantes (c’est-à-dire lorsque l’entité est la destination d’une relation). Le score en degré sortant correspond au nombre de relations sortantes (c’est-à-dire lorsque l’entité est l’origine de la relation). Lorsqu’une personne présente un score en degré sortant élevé, elle peut être plus importante pour la transmission d’informations. Lorsqu’une personne présente un score en degré entrant élevé, elle est davantage susceptible de recevoir des informations de plusieurs sources.

Les relations sont dites récursives lorsqu’une entité est à la fois l’origine et la destination de la relation. Ces relations sont prises en compte lors du calcul du degré d’une entité. Si une entité est uniquement membre d’une relation récursive, sa mesure est de deux en degré, de un en degré entrant et de un en degré sortant.

Ces scores de centralité sont affichés dans les champs Degree, Indegree et Outdegree de la table Centrality (Centralité).

En savoir plus sur le degré d’une entité

Centralité de vecteur propre

Le score de centralité de vecteur propre représente non seulement le nombre de connexions dont dispose une entité, mais également l’importance de ces connexions dans le graphe. Par exemple, si l’entité de personne A d’un graphe représentant un réseau social a plusieurs connexions et que certaines entités connectées ont une forte influence dans le graphe, le score de vecteur propre de la personne A est plus élevé. Néanmoins, si une personne B a le même nombre de connexions que la personne A, mais que les entités auxquelles la personne B est connectée ont moins de connexions supplémentaires, le score de la personne B est moins élevé.

Ce score est calculé de manière récursive. Chaque entité démarre avec le même score. À chaque passage, le score de l’entité est mis à jour, afin de tenir compte du score de ses voisins immédiats. Cette mesure de la centralité ne tient pas compte du fait que la personne A et la personne C peuvent être connectées de nombreuses manières. Elles ont toutes deux un score de vecteur propre élevé, en raison des nombreuses connexions qui existent entre elles.

Lorsque la direction de la relation est prise en compte, cette méthode de calcul de la centralité peut avoir un effet lorsque les scores sont récupérés à partir de certaines zones du graphe et renvoyés dans d’autres zones, appelé effet de privation. Certaines entités peuvent finir avec un score nul.

Ce score apparaît dans le champ Eigenvector de la table Centrality (Centralité).

Centralité PageRank

Le score de centralité PageRank est calculé d’une manière similaire au score de centralité de vecteur propre. Comme pour le vecteur propre, le score PageRank d’une entité représente non seulement le nombre de connexions dont elle dispose, mais également le nombre de connexions de ses entités voisines au sein du graphe. Le score d’une entité est plus élevée lorsqu’elle a de nombreuses entités connectées, qui ont elles aussi de nombreuses connexions.

Cependant, le calcul de la centralité PageRank normalise la façon dont les scores sont propagés entre une entité et ses voisins à chaque passage. Le score d’une entité est divisé par le nombre d’entités voisines qu’elle a. Lorsque la direction de la relation est prise en compte, utilisez le score de centralité PageRank au lieu du score de centralité de vecteur propre pour identifier les entités les plus importantes dans le diagramme car le score PageRank limite l’effet de privation.

Ce score apparaît dans le champ PageRank de la table Centrality (Centralité).

Centralité d’intermédiarité

Le score de centralité d’intermédiarité est calculé sur la base du chemin le plus court entre une entité et les autres entités du graphe. Les chemins les plus courts sont calculés entre toutes les entités du diagramme de liens. Si de nombreux chemins les plus courts passent par une entité, son score de centralité d’intermédiarité est élevé. Par exemple, dans un diagramme de liens représentant un réseau social, ce score peut déterminer à quel point une entité de personne est efficace pour transmettre des informations à toutes les autres entités de personnes du diagramme.

Les chemins les plus courts peuvent être nettement différents lorsque la direction d’une relation est prise en compte. Par exemple, les informations peuvent être émises et reçues de manière différente par une même personne.

Ce score apparaît dans le champ Betweenness de la table Centrality (Centralité).

Centralité de proximité

Le score de centralité de proximité est également calculé sur la base du chemin le plus court entre une entité et les autres entités du graphe. Il considère la longueur des chemins les plus courts. Le score d’une entité est déterminé par la longueur moyenne du chemin le plus court de cette entité jusqu’aux autres entités du graphe. Dans un diagramme de liens représentant un réseau social, si une entité de personne a un score de proximité élevé, cela signifie que cette entité peut communiquer plus directement avec les autres entités de personnes du diagramme.

Ce score apparaît dans le champ Closeness de la table Centrality (Centralité).

Centralité harmonique

Le score de centralité harmonique est calculé d’une manière similaire au score de centralité de proximité. Néanmoins, au lieu de déterminer le chemin le plus court entre une entité et les autres entités du diagramme de liens, le score de centralité harmonique est calculé en tenant compte de l’inverse de la distance du chemin le plus court. La centralité harmonique offre de meilleurs résultats lorsque le diagramme comporte des sous-diagrammes disjoints car certaines portions du diagramme, représentées sur le lien, sont inatteignables.

Ce score apparaît dans le champ Harmonic de la table Centrality (Centralité).

Ouvrir la table Centrality (Centralité)

Les scores de centralité des entités d’un diagramme de liens sont fournis dans une table Centrality (Centralité) Centralité. La table comporte une ligne par entité. Les champs de la table indiquent le nom complet d’une entité, son type et le score calculé pour chaque mesure de la centralité.

Dans un champ qui contient un score de centralité, chaque cellule de la table inclut un histogramme bleu dynamique représentant le score de l’entité par rapport aux autres entités du diagramme de liens. La longueur de la barre est proportionnelle au score maximum dans ce champ.

Vous pouvez interagir avec la table Centrality (Centralité) de la même manière que vous interagissez avec les tables attributaires associées aux couches d’entités d’une carte. Par exemple, vous pouvez cliquer sur l’en-tête d’un champ afin de trier les lignes de la table à l’aide des valeurs de ce champ. Trier la table Centrality (Centralité) à l’aide d’un champ contenant les scores de centralité vous permet de visualiser l’histogramme des valeurs pour cette mesure de centralité.

Vous pouvez cliquer sur une ou plusieurs lignes de la table Centrality (Centralité) afin de les sélectionner. Les entités correspondantes sur le diagramme de liens sont alors sélectionnées. De même, sélectionner des entités sur le diagramme de liens sélectionnera les lignes correspondantes dans la table.

Ouvrez la table Centrality (Centralité) d’un diagramme de liens pour afficher les scores de centralité des entités de ce diagramme, et explorez le contenu de la table en procédant comme suit :

  1. Sous l’onglet Link Chart (Diagramme de liens) du ruban, dans le groupe Analyze (Analyser), cliquez sur Centrality (Centralité). Centralité

    La table Centrality (Centralité) Centralité s’ouvre. Le nom qui apparaît dans l’onglet pour l’affichage de la table Centrality (Centralité) identifie le diagramme de liens pour lequel les scores de centralité ont été calculés. Par défaut, les lignes de la table sont triées à l’aide de la valeur du champ Degree.

    La table Centrality (Centralité) d’un diagramme de liens décrit quelles entités sont les plus importantes pour le graphe représenté par le diagramme de liens.

  2. Cliquez sur une ligne de la table Centrality (Centralité) pour la sélectionner.

    L’entité ou le groupe d’entités correspondant est sélectionné dans le diagramme de liens.

    Sélectionnez une ligne de la table Centrality (Centralité) pour voir l’entité correspondante dans le diagramme de liens.

  3. Cliquez sur l’en-tête d’un autre champ de la table Centrality (Centralité) pour trier les lignes selon ce champ.

Modifier la méthode de calcul des scores de centralité

Vous pouvez modifier la méthode de calcul des scores de centralité à l’aide des options qui apparaissent dans la barre d’outils en haut de la vue de la table Centrality (Centralité).

Inclure des documents

Par défaut, les entités Document et les relations HasDocument ne sont pas prises en compte lors du calcul des scores de centralité, même si elles sont présentes dans le diagramme de liens. Si vous préférez, vous pouvez inclure les entités Document dans les calculs. Par exemple, cela peut vous permettre de déterminer l’influence d’une source donnée sur les entités ou sur votre enquête lorsque le document source est présent dans le diagramme de liens.

  1. Cochez ou décochez l’option Include documents (Inclure des documents) dans la barre d’outils en haut de la table Centrality (Centralité).
    • Cochée : inclut les entités Document lors du calcul des scores de centralité. Les scores de centralité sont calculés pour chaque entité Document du diagramme de liens, et chaque relation HasDocument influence les scores de centralité des entités associées à un document.
    • Décochée : exclut les entités Document lors du calcul des scores de centralité. Les relations HasDocument d’une entité n’influencent pas ses scores de centralité. Il s'agit de l'option par défaut.

Les lignes de la table Centrality (Centralité) sont mises à jour automatiquement pour refléter les modifications apportées à ce paramètre. Les lignes qui représentent les entités Document sont ajoutées ou supprimées de la table et les scores de centralité sont automatiquement recalculés.

Examiner la direction des relations

Les relations ont une direction inhérente qui est représentée sur un diagramme de liens, de l’entité d’origine à l’entité de destination. Par défaut, la direction d’une relation n’est pas prise en compte lors du calcul des scores de centralité pour le diagramme de liens. Cependant, les scores de centralité peuvent être calculés de manière à prendre en compte la direction des relations lorsque la direction est pertinente pour votre enquête.

  1. Cliquez sur la liste déroulante Relationships (Relations) dans la barre d’outils en haut de la table Centrality (Centralité).
  2. Cliquez sur une option pour déterminer comment la direction d’une relation est prise en compte lors du calcul des scores de centralité.
    • Two-way (Bidirectionnel) Bidirectionnel : ignore la direction des relations lors du calcul des scores de centralité. Il s'agit de l'option par défaut.
    • One-way (Monodirectionnel) Monodirectionnel : utilise la direction d’une relation lors du calcul des scores de centralité.
    • One-way Reversed (Inversion monodirectionnelle) Inversion monodirectionnelle : utilise l’inverse de la direction d’une relation lors du calcul des scores de centralité. Les scores sont calculés comme si la destination de la relation était l’origine et comme si l’origine était la destination.

Les scores de la table Centrality (Centralité) sont mis à jour automatiquement afin de refléter les modifications apportées à ce paramètre.

Examiner de nombreuses relations entre deux entités

L’option Cumulate weights (Cumuler les pondérations) détermine la manière dont les relations sont prises en compte lorsqu’il existe plusieurs relations entre deux entités. Chaque relation peut être prise en compte individuellement ou l’ensemble de relations peut être pris en compte comme s’il s’agissait d’une seule relation. Ce paramètre n’a aucun impact sur les scores de centralité lorsqu’une seule relation existe entre deux entités.

Lorsque toutes les relations entre deux entités sont considérées comme une seule relation, le résultat est le même que si une seule relation existait entre les deux entités. Lorsque la direction d’une relation est prise en compte, la direction s’applique à la manière dont l’ensemble de relations est géré. Toutes les relations allant dans la même direction entre deux entités sont considérées comme une seule relation.

Si certaines relations sont regroupées dans le diagramme de liens, le groupe n’a aucune incidence sur la manière dont les scores de centralité sont calculés. Chaque relation du groupe est prise en compte ou non en fonction du paramètre Cumulate weights (Cumuler les pondérations).

  1. Cochez ou décochez l’option Cumulate weights (Cumuler les pondérations) dans la barre d’outils en haut de la table Centrality (Centralité).
    • Cochée : lorsqu’il existe plusieurs relations entre deux entités, chaque relation est prise en compte séparément et toutes les relations contribuent aux scores de centralité des deux entités. Il s'agit de l'option par défaut.
    • Décochée : lorsqu’il existe plusieurs relations entre deux entités, toutes les relations entre les entités sont prises en compte ensemble, comme s’il existait une seule relation. L’existence de plusieurs relations n’a aucun impact sur les scores de centralité des deux entités.

Les scores de la table Centrality (Centralité) sont mis à jour automatiquement afin de refléter les modifications apportées à ce paramètre.

Normaliser les scores de centralité

Les scores de centralité sont calculés pour le diagramme de liens dans son ensemble et par défaut, les scores bruts sont affichés dans la table.

Cependant, l’option Normalize globally (Normaliser globalement) vous permet de normaliser les scores de centralité pour l’intégralité du diagramme de liens en les représentant sous la forme d’un ratio du score maximum. Par exemple, si la valeur de degré maximum est de six, l’entité ayant le score de six affichera la valeur 1.0 dans le champ Degree de la table Centrality (Centralité), et les autres entités auront des scores inférieurs à un.

Parfois, lorsque vous créez un diagramme de liens, il inclut des sous-graphes disjoints : deux réseaux non connectés d’entités et de relations. Les scores globaux de centralité d’un diagramme de liens de ce type seront moins élevés, car les entités d’un sous-graphe ne peuvent pas atteindre les entités de l’autre sous-graphe et ne peuvent donc pas être plus centrales pour le diagramme de liens dans son ensemble. Dans ce cas, vous pouvez utiliser l’option Normalize by component (Normaliser par composant) pour calculer les scores de centralité normalisés dans chaque sous-graphe. Ce paramètre fournit le même résultat que le paramètre Normalize globally (Normaliser globalement) si un seul graphe est représenté sur le diagramme de liens.

  1. Cliquez sur la liste déroulante Scores dans la barre d’outils en haut de la table Centrality (Centralité).
  2. Cliquez sur une option pour déterminer comment le score de centralité d’une relation est normalisée.
    • Raw (Brut) : les scores de centralité ne sont pas normalisés. Il s'agit de l'option par défaut.
    • Normalize globally (Normaliser globalement) : les scores de centalité sont normalisés par rapport aux scores calculés pour toutes les entités et relations du diagramme de liens.
    • Normalize by component (Normaliser par composant) : les scores de centalité sont normalisés par rapport aux entités et relations membres de chaque sous-graphe disjoint.

Les scores de la table Centrality (Centralité) sont mis à jour automatiquement afin de refléter les modifications apportées à ce paramètre.

Afficher les scores pour des types d’entité spécifiques

Par défaut, la table Centrality (Centralité) inclut une ligne pour chaque entité présente dans le diagramme de liens. Pour les diagrammes de liens volumineux, la table peut afficher trop d’informations à traiter. Vous pouvez filtrer les lignes affichées dans la table afin d’afficher uniquement les scores pour des types d’entité spécifiques.

Par défaut, toutes les entités du diagramme de liens s’affichent avec leur score dans la table de centralité.

  1. Cliquez sur le bouton Types Filtres de type dans la barre d’outils en haut de la table Centrality (Centralité).

    Une liste déroulante apparaît. Elle inclut tous les types d’entité du graphe de connaissances, même si les entités de ce type ne sont pas présentes dans le diagramme de liens. Tous les types d’entité sont cochés par défaut.

  2. Dans la liste déroulante, cochez les types d’entité que vous voulez afficher dans la table Centrality (Centralité). Décochez les types d’entité que vous ne voulez pas afficher dans la table. Commencez à saisir le nom d’un type d’entité ou d’un type de relation que vous ne voyez pas dans la liste ; la liste des types d’entité est automatiquement filtrée et vous pouvez cocher ou décocher les types d’entité dans la liste filtrée.

    Le nombre total de types d’entité sélectionnés apparaît dans la barre d’outils, en regard du bouton Types Filtres de type.

Les lignes de la table Centrality (Centralité) sont mises à jour automatiquement. Les lignes qui représentent les entités des types d’entité non cochés sont supprimées. Les lignes qui représentent les entités des types d’entité cochés sont ajoutées.

Mettre à jour les scores dans la table Centrality (Centralité)

Vous pouvez ajouter du contenu à un diagramme de liens ou en supprimer à tout moment. Vous pouvez ajouter un sous-graphe disjoint à un nouveau diagramme de liens et le supprimer du diagramme existant. Vous pouvez également mettre à jour les données du graphe de connaissances associé au diagramme de liens en créant une relation ou en fusionnant deux entités. Vous pouvez en outre regrouper des entités sur le diagramme de liens.

Si vous avez ouvert la table Centrality (Centralité) pour le diagramme de liens avant de modifier son contenu, les scores de centralité dans la table ne sont pas mis à jour automatiquement pour inclure les lignes des entités ajoutées depuis l’ouverture de la table. De même, les lignes correspondant aux entités supprimées du diagramme de liens ou regroupées ne sont pas supprimées automatiquement de la table. Un message d’avertissement affiché en bas de la table Centrality (Centralité) indique que les scores sont obsolètes.

Lorsque vous avez terminé d’apporter des modifications au diagramme de liens, procédez comme suit pour mettre à jour les scores dans la table Centrality (Centralité) afin de refléter le graphe actuellement représenté par le diagramme de liens :

  1. Ouvrez la table Centrality (Centralité).
  2. Faites du diagramme de liens associé à la table Centrality (Centralité) la vue active.
  3. Ajoutez ou supprimez du contenu du diagramme de liens.

    L’avertissement Scores are out of date (Les scores sont obsolètes) apparaît en bas de la table Centrality (Centralité).

  4. Faites de la table Centrality (Centralité) Centralité la vue active.
  5. Cliquez sur le bouton Update Centrality Scores (Mettre à jour les scores de centralité) Mettre à jour les scores de centralité en bas de la table, à côté du message.

Les scores de la table Centrality (Centralité) sont recalculés.

Rubriques connexes