计算中心性得分以确定实体在基于知识图谱的链接图表中的重要性。 中心性得分根据实体在链接图表描绘的图谱中的位置提供实体的排名。 得分可确定在链接图表中发挥关键作用的链接图表实体。 例如,得分可以标识社交网络中最有影响力的人、传播疾病所涉及的事件、城市网络中的关键基础设施节点等。
将针对特定链接图表的内容来计算中心性得分。 每个实体的得分取决于其在图谱中相对于链接图表上存在的其他实体和关系的位置。 如果在链接图表中添加或移除内容,则得分将发生变化。 类似地,当相同实体包含在描述不同关系集的另一个链接图表中时,实体将具有不同的得分。 链接图表的中心性得分显示在 Centrality 表视图 中。
以下部分将介绍计算的中心性得分,以及如何在使用链接图表时可视化并更新这些得分。
中心性测量
对于基于知识图谱的链接图表,将计算 6 种不同的中心性测量:点度、特征向量、网页排名、中介、接近和调和。 这些计算都会显示在链接图表 Centrality 表的不同字段中。
将根据实体参与的关系数量来计算点度、特征向量和网页排名得分。 将根据一个实体到链接图表中其他所有实体的路径长度来计算中介、接近和调和得分。
知识图谱中的所有关系在定义方式上都具有一个固有方向:从源实体到目标实体。 但是,默认情况下,将以忽略关系方向的方式来计算链接图表的中心性得分。 可以按照考虑关系方向以及反转关系的固有方向的方式计算得分。 当考虑关系方向时,实体的中心性得分可能不同。
实体组在 Centrality 表中表示为单行,并将针对该组计算中心性得分。 相比之下,即使按照累积权重选项对关系进行分组,也会单独考虑关系。
点度中心性
点度中心性得分定义为实体参与的链接图表关系的总数。 点度得分可用于确定对图谱非常重要的实体。 例如,当链接图表描绘一个社交网络时,具有较高点度得分的 Person 实体是与其他 Person 实体具有很多连接的实体,因此对网络来说更加重要。
当考虑关系方向时,可以分解整体点度得分以反映实体的入度和出度。 入度得分将反映传入关系的数量 - 实体位于关系的终点。 出度得分将反映传出关系的数量 - 实体位于关系的起点。 当一个 Person 实体的出度得分较高时,其在传播信息方面可能更加重要。 当一个 Person 实体的入度得分较高时,其更有可能从不同源接收信息。
当实体既是关系的起点又是终点时,将会出现递归关系;在计算实体的点度时,将会考虑这些关系。 如果实体仅参与一个递归关系,则该实体的点度为 2,入度为 1,出度为 1。
这些中心性得分将显示在 Centrality 表的 Degree、Indegree 和 Outdegree 字段中。
特征向量中心性
特征向量中心性得分不仅反映了实体具有的连接数量,还反映了这些连接在图谱中的重要性。 例如,在表示社交网络的图谱中,如果 Person A 实体具有多个连接,并且某些连接的实体在图谱中非常有影响力,则 Person A 的特征向量得分较高。 但是,如果 Person B 与 Person A 具有相同数量的连接,但 Person B 连接到的实体具有较少的附加连接,则 Person B 的得分较低。
将递归计算此得分。 每个实体都以相同的得分开始。 每次通过时,将更新实体的得分以考虑其直接相邻实体的得分。 此中心性测量未考虑 Person A 和 Person C 可能以多种方式相互连接的事实。 由于它们之间存在许多连接,因此它们都具有较高的特征向量得分。
当考虑关系方向时,这种计算中心性的特征向量方法可以产生一种效果,即得分将从图谱中的某些部分有效地流出,并在其他区域汇集,这就是所谓的饥饿效应。 某些实体可能以得分零结束。
此得分将显示在 Centrality 表的 Eigenvector 字段中。
网页排名中心性
网页排名中心性得分的计算方式与特征向量得分类似。 与特征向量一样,实体的得分不仅反映了该实体具有的连接数量,还反映了这些相邻实体在图谱中具有的连接数量。 当一个实体具有许多连接的实体,而这些连接的实体又具有许多连接时,该实体将具有较高的得分。
然而,网页排名计算会在每次通过时对得分从实体传播到其相邻实体的方式进行归一化。 将实体的得分除以它拥有的相邻实体的数量。 在考虑关系方向时,由于网页排名得分可规避饥饿效应,因此请使用网页排名得分,而非特征向量得分来确定图谱中最重要的实体。
此得分将显示在 Centrality 表的 PageRank 字段中。
中介中心性
将根据图谱中一个实体和其他实体之间的最短路径来计算中介中心性得分。 将计算链接图表中所有实体之间的最短路径。 如果许多最短路径经过一个实体,则其将具有较高的中介得分。 例如,在一个表示社交网络的链接图表中,此得分可以确定 Person 实体在将信息传递给图表上其他所有 Person 实体方面的有效性。
当考虑关系的方向时,最短路径可能会显著不同。 例如,信息可能会以不同于信息流回同一个 Person 的方式从某些 Person 实体中流出。
此得分将显示在 Centrality 表的 Betweenness 字段中。
接近中心性
同样,将根据图谱中一个实体和其他实体之间的最短路径来计算接近中心性得分。 它会考虑最短路径的长度。 实体的得分由该实体到图谱中其他实体的最短路径的平均长度决定。 在一个表示社交网络的链接图表中,如果 Person 实体具有较高的接近中心性得分,则该实体可以更直接地与该图表上的其他 Person 实体进行通信。
此得分将显示在 Centrality 表的 Closeness 字段中。
调和中心性
调和中心性得分的计算方式与接近中心性得分类似。 然而,将通过考虑最短路径的反距离来计算调和中心性得分,而非确定一个实体和链接图表上其他实体之间的最短路径。 当图谱具有不相交的子图时,由于链接图表上表示的图谱部分无法到达,因此调和中心性可以提供更好的结果。
此得分将显示在 Centrality 表的 Harmonic 字段中。
打开 Centrality 表
Centrality 表 中提供了链接图表中实体的中心性得分。 在该表中,每个实体具有一行。 表中的字段将显示实体的显示名称、其实体类型以及针对每个中心性测量计算的得分。
在显示中心性得分的字段中,表格中的每个单元格都具有一个蓝色的动态直方图条柱,表示该实体相对于链接图表中其他实体的得分。 条柱的长度与该字段中的最高得分成正比。
与 Centrality 表进行交互的方式与地图中要素图层关联的属性表进行交互的方式相同。 例如,可以单击字段的标题以使用该字段中的值对表中的行进行排序。 可以使用包含中心性得分的字段对 Centrality 表进行排序,由此可视化该中心性测量值的直方图。
可以单击 Centrality 表中的一行或多行以将其选中,然后选择链接图表上的相应实体。 同样,在链接图表上选择实体将选择表中的相应行。
通过打开其 Centrality 表来查看链接图表中实体的中心性得分,然后按照以下步骤浏览该表的内容:
- 在功能区链接图表选项卡的分析组中,单击中心性。
Centrality 表 随即打开。 Centrality 表视图选项卡上显示的名称将标识为其计算了中心性得分的链接图表。 默认情况下,将使用 Degree 字段中的值对表中的行进行排序。
- 单击 Centrality 表中的一行以将其选中。
将在链接图表上选择相应的实体或实体组。
- 单击 Centrality 表中另一个字段的标题以使用该字段对行进行排序。
更改中心性得分的计算方式
可以使用出现在 Centrality 表视图顶部工具栏中的选项来调整计算中心性得分的方式。
包含文档
默认情况下,计算中心性得分时不考虑 Document 实体和 HasDocument 关系,即使其存在于链接图表上也是如此。 如果需要,可以在计算中包含 Document 实体。 例如,当源 Document 出现在链接图表上时,可以确定特定源对实体或调查的影响。
- 选中或取消选中 Centrality 表顶部工具栏中的包含文档选项。
- 选中 - 在计算中心性得分时包含 Document 实体。 将为链接图表上的每个 Document 实体计算中心性得分,任何 HasDocument 关系都将影响与 Document 关联的实体的中心性得分。
- 取消选中 - 在计算中心性得分时不包含 Document 实体。 实体的 HasDocument 关系不会影响其中心性得分。 这是默认设置。
Centrality 表中的行将自动更新,以反映对此设置进行的更改。 可以将表示 Document 实体的行添加至表中或从表中将其移除,并且将自动重新计算中心性得分。
考虑关系的方向
关系具有在链接图表上描绘的固有方向:从初始实体到目标实体。 默认情况下,为链接图表计算中心性得分时将不考虑关系的方向。 但是,当方向与您的调查相关时,可以通过考虑关系方向的方式来计算中心性得分。
- 单击 Centrality 表顶部工具栏中的关系下拉列表。
- 单击一个选项以确定在计算中心性得分时如何考虑关系的方向。
- 双向 - 在计算中心性得分时,忽略关系的方向。 这是默认设置。
- 单向 - 在计算中心性得分时,将使用关系的方向。
- 单向反转 - 在计算中心性得分时,将使用关系方向的反转。 得分的计算方式就好像关系的终点是起点,起点是终点。
Centrality 表中的得分将自动更新,以反映对此设置进行的更改。
考虑两个实体之间的许多关系
累积权重选项用于确定当两个实体之间存在许多关系时,应考虑关系的方式。 可以单独考虑每个关系,也可以将一组关系视为一个关系。 当两个实体之间仅存在一种关系时,此设置对中心性得分没有任何影响。
将两个实体之间的一组关系视为一个关系时,结果将与两个实体之间仅存在一个关系相同。 当考虑关系的方向时,方向适用于处理关系集的方式。 两个实体之间同一方向上的所有关系都被视为一个关系。
如果在链接图表上对多个关系进行分组,则该组与中心性得分的计算方式无关。 将根据累积权重设置来确定与否考虑组中的每个关系。
- 选中或取消选中 Centrality 表顶部工具栏中的累积权重选项。
- 选中 - 当两个实体之间存在许多关系时,将单独考虑每个关系,并且所有关系都对两个实体的中心性得分有贡献。 这是默认设置。
- 取消选中 - 当两个实体之间存在许多关系时,实体之间的所有关系都被视为仅存在一个关系。 存在许多关系不会对两个实体的中心性得分产生影响。
Centrality 表中的得分将自动更新,以反映对此设置进行的更改。
归一化中心性得分
在计算中心性得分时,会将链接图表作为一个整体来进行计算,默认情况下,会将原始得分显示在表中。
但是,借助全局归一化选项,可以通过将整个链接图表的中心性得分表示为最高得分的比率来对其进行归一化。 例如,如果最大点度得分为 6,则得分为 6 的实体在 Centrality 表的 Degree 字段中的值为 1.0,其他实体的得分将小于 1。
有时,在构建链接图表时,它将具有不相交的子图 - 两个未连接的实体和关系网络。 此类链接图表将具有较低的整体中心性得分,由于一个子图中的实体无法到达另一个子图中的实体,因此无法成为整个链接图表重要部分。 对于这种情况,可以使用按组件归一化选项来计算在每个子图内归一化的中心性得分。 如果链接图表上仅显示一个图形,则此设置与全局归一化设置具有相同的结果。
- 单击 Centrality 表顶部工具栏中的得分下拉列表。
- 单击一个选项以确定归一化关系的中心性得分的方式。
- 原始 - 未归一化中心性得分。 这是默认设置。
- 全局归一化 - 相对于为链接图表中所有实体和关系计算的得分归一化中心性得分。
- 按组件归一化 - 相对于参与每个不相交子图内的实体和关系对中心性得分进行归一化。
Centrality 表中的得分将自动更新,以反映对此设置进行的更改。
查看特定实体类型的得分
默认情况下,对于链接图表上存在的每个实体,Centrality 表将包含一行。 对于大型链接图表,该表可能会显示过多信息,无法进行处理。 可以过滤表中显示的行以仅显示特定实体类型的得分。
默认情况下,所有链接图表实体都会在 Centrality 表中显示其得分。
- 单击 Centrality 表顶部工具栏中的类型按钮 。
随即显示一个下拉列表,其中包含知识图谱中的所有实体类型,即使链接图表上不存在该类型的实体。 将默认选中所有实体类型。
- 在下拉列表中,选中要在 Centrality 表中查看的实体类型。 取消选中您不想在该表中看到的实体类型。 如果未在列表中看到,请开始键入实体类型或关系类型的名称;将自动过滤实体类型列表,可以在已过滤的列表中选中或取消选中相应实体类型。
所选实体类型的总数将显示在工具栏上的类型按钮 旁边。
Centrality 表中的行将自动更新。 将移除表示未选中实体类型的实体的行。 将添加表示选中实体类型的实体的行。
更新 Centrality 表中的得分
可以随时向链接图表添加内容,或者从链接图表中移除内容。 可以将不相交子图添加至新的链接图表,并将其从现有链接图表中移除。 您还可以通过创建关系或合并两个实体来编辑与链接图表相关联的知识图谱中的数据。 您还可以对链接图表上的实体进行分组。
如果在修改其内容之前打开了链接图表的 Centrality 表,则不会自动更新表中的中心性得分,以包含自打开了该表以来已添加的实体的行。 同样,不会自动从表中移除从链接图表中移除或分组在一起的实体的行。 Centrality 表底部的警告消息将指示其得分已过期。
完成对链接图表进行更改后,请按照以下步骤更新 Centrality 表中的得分以反映链接图表当前描绘的图谱:
- 打开 Centrality 表。
- 确保与 Centrality 表相关联的链接图表为活动视图。
- 在链接图表中添加或移除一些内容。
得分已过期警告将显示在 Centrality 表的底部。
- 确保 Centrality 表 为活动视图。
- 单击该消息旁边表格底部的更新中心性得分按钮 。
将重新计算 Centrality 表中的得分。