Detectar comunidades en un gráfico de vínculos

Puede usar un gráfico de vínculos basado en un gráfico de conocimiento para detectar comunidades con el fin de encontrar entidades que estén estrechamente conectadas entre sí y poco conectadas con las entidades de otras comunidades. Las comunidades se detectan en función de las entidades que están presentes actualmente en el gráfico de vínculos, no en el contenido del gráfico de conocimiento en su conjunto.

Los algoritmos de detección de comunidades pueden ayudarle a visualizar grupos de entidades estrechamente relacionadas que puede que no se puedan descubrir utilizando otros métodos de análisis. Las comunidades pueden presentar grupos influyentes en una red social, colaboraciones científicas y patrones de investigación, personas con mayor probabilidad de conocerse a través de conexiones compartidas, etc.

Una comunidad puede tener una entidad como miembro. Su análisis también puede identificar entidades aisladas del resto de la red.

A continuación, se describen los métodos para calcular comunidades, personalizar parámetros de método y explorar los resultados.

Métodos de detección de la comunidad

Hay seis métodos de detección de la comunidad disponibles para gráficos de vínculos basados en un gráfico de conocimiento: Lovaina, Girvan-Newman, Biconectado, Débilmente conectado, Fuertemente conectado y Propagación de etiquetas. Seleccione el método en la lista desplegable Método de detección de la vista de tabla de la comunidad Detección de comunidad. Solo se puede usar un método a la vez.

Lovaina

El método de detección de la comunidad Lovaina es un algoritmo de clustering jerárquico que detecta comunidades en grandes redes. El método evalúa cómo de densamente conectadas están las entidades de una comunidad y compara el resultado con cómo de conectadas estarían las entidades en una red aleatoria. Este método es el predeterminado cuando se abre la tabla Comunidad.

Si las relaciones dentro de una comunidad son más densas que en una red aleatoria, la modularidad es positiva. La modularidad aumenta a medida que las relaciones son más densas en las comunidades.

Este método detecta primero las comunidades pequeñas optimizando la modularidad. La modularidad es una medida de la calidad de la división de los nodos en comunidades. Si las relaciones de una comunidad son más densas de lo que serían en una red aleatoria, la modularidad es positiva y las entidades se colocan en una comunidad. Cuanto más densas sean las relacionesen una comunidad, más alta será la puntuación de modularidad.

El proceso se repite de forma iterativa y evalúa comunidades de tamaño creciente con asignaciones aleatorias de comunidades.

Girvan Newman

El método de detección de la comunidad Girvan-Newman identifica comunidades teniendo en cuenta el nivel de intermediación de las relaciones que conectan a las comunidades entre sí. Las rutas más cortas se calculan entre todas las entidades del gráfico y la centralidad de intermediación se calcula para todas las relaciones atravesadas. Las relaciones que conectan comunidades separadas tienen la centralidad de intermediación más alta porque deben atravesarse con mayor frecuencia para llegar de una comunidad a otra.

La relación con la centralidad de intermediación más alta se elimina y el proceso se repite. A medida que se eliminan las relaciones centrales, las comunidades se vuelven más claras. Las relaciones se eliminan iterativamente hasta que todas las relaciones restantes tengan la misma centralidad de intermediación.

Este proceso puede tardar mucho tiempo en gráficos de vínculos muy grandes.

Biconectado

El método Biconectado encuentra comunidades de la red que están conectadas entre sí. Dos entidades conectadas por una relación forman parte de la misma comunidad. Otras entidades pertenecen a la misma comunidad si las relaciones permiten ir de una entidad a otra, y si esto sigue siendo verdadero después de eliminar una de las relaciones de la comunidad. Cada entidad puede pertenecer a muchas comunidades.

Gráfico de vínculos con tres comunidades interconectadas

En este ejemplo, C forma parte de las tres comunidades ya que tiene una relación con las entidades de cada comunidad. Las entidades A, B y C forman una comunidad porque están conectadas entre sí y permanecen conectadas entre sí cuando una de las relaciones entre ellas se elimina. Cuando se elimina la relación entre C y D o C y E, o C y F, D, E y F, respectivamente, ya no están conectados a A y B, de modo que no forman parte de la comunidad A, B y C.

Débilmente conectado

Una comunidad conectada débilmente es aquella en la que todas las entidades están conectadas entre sí mediante una ruta. No se tiene en cuenta la dirección de las relaciones entre las entidades en el gráfico de vínculos; es decir, el gráfico de vínculos se evalúa como un gráfico no direccionado.

Gráfico de vínculos con dos comunidades débilmente conectadas

En este ejemplo, hay dos comunidades conectadas débilmente. A, B, C, D, E y F forman una comunidad y X, Y y Z forman otra comunidad. Cada una de estas comunidades tiene relaciones que conectan todas las entidades. No hay relaciones que conecten la comunidad X, Y, Z con la comunidad A, B, C, D, E, F.

Si todas las entidades del gráfico están conectadas con todas las demás entidades de alguna manera, todo el gráfico estará débilmente conectado.

Fuertemente conectado

Una comunidad fuertemente conectada es aquella en la que todas las entidades de la comunidad están conectadas entre sí cuando se tiene en cuenta la dirección de una relación. Es decir, el gráfico de vínculos se evalúa como un gráfico direccionado.

Esto significa que, si comienza en cualquier lugar de la comunidad y realiza un seguimiento de una ruta que respeta la dirección de cada relación, puede llegar a todas las entidades de la comunidad.

Gráfico de vínculos con algunas comunidades fuertemente conectadas

En este ejemplo, la comunidad X, Y, Z y la comunidad A, B, C, D están fuertemente conectadas porque puede empezar por cualquier entidad de cualquiera de las comunidades y seguir las relaciones dirigidas para llegar a cualquier otra entidad.

E y F son sus propias comunidades, ya que no están estrechamente conectadas con ninguna otra entidad. Puede llegar a F desde la comunidad A, B, C, D, pero no puede llegar a la comunidad más grande desde F. Del mismo modo, puede llegar a la comunidad A, B, C, D desde E, pero no puede llegar a E desde la comunidad más grande.

Propagación de etiquetas

El método Propagación de etiquetas es un algoritmo que determina comunidades en función del modo en que la información se mueve por el gráfico. Primero, se asigna una etiqueta a las entidades. A continuación, una entidad seleccionada al azar evalúa sus vecinos y determina qué etiqueta utiliza la mayoría de ellos. La entidad actualiza su etiqueta para que coincida con la que tienen la mayoría de sus vecinos. El proceso de una entidad que evalúa sus vecinos y actualiza su etiqueta se repite una y otra vez.

Después de varias iteraciones, las etiquetas tienden a ser dominantes en comunidades muy conectadas y tienen problemas para cruzar a otras regiones del gráfico que estén menos conectadas. Cuantas más iteraciones se utilicen, mayor será la probabilidad de que las etiquetas tengan que cruzar desde una comunidad conectada densamente hasta una comunidad débilmente conectada. Cuando cada nodo tiene una etiqueta que la mayoría de sus vecinos tienen, el algoritmo termina incluso si el número especificado de iteraciones no se ha completado.

El método Propagación de etiquetas puede producir distintos conjuntos de comunidades cada vez que se utiliza, dependiendo de las opciones que se utilicen para realizar el análisis. Puede cambiar el número de inicialización que se utiliza para inicializar un generador de números aleatorios que usa el algoritmo, cuántas soluciones se generan y cuántas iteraciones del algoritmo se utilizan para producir cada solución.

La tabla de la comunidad presenta un agregado de todas las soluciones producidas por varias ejecuciones. Puede ver los resultados de cada ejecución ordenando la tabla Comunidad con el campo Solution. Se producen 20 soluciones de manera predeterminada. Los resultados de la primera ejecución están asociados con la partición cero, y los resultados de la vigésima ejecución se asocian con la partición 19 en la tabla.

Hay ajustes disponibles que permiten determinar algunos parámetros del método Propagación de etiquetas. Haga clic en el botón Opciones de la barra de herramientas de la parte superior de la tabla Comunidad y en el encabezado Propagación de etiquetas.

Abrir la tabla Comunidad

De forma predeterminada, las comunidades de las entidades de un gráfico de vínculos se determinan con el método Lovaina y se describen en la tabla Comunidad Detección de comunidad. En su lugar, utilice la lista desplegable Método de detección para evaluar comunidades utilizando otro método. Todas las filas de la tabla se actualizarán para mostrar las propiedades de los nuevos resultados de la comunidad.

La tabla tiene una fila para cada comunidad. Las propiedades de cada comunidad se muestran en diferentes campos de la tabla:

  • Solution—Se muestra para el método Propagación de etiquetad solo cuando la opción Mostrar columna de solución está activada; la opción está activada de forma predeterminada. Este campo proporciona un identificador para cada solución producida por el método Propagación de etiquetas.
  • Community—Para todos los métodos de detección de la comunidad, excepto Propagación de etiquetas, este campo muestra un identificador de la comunidad y se utiliza de forma predeterminada para ordenar filas en la tabla. Para el método Propagación de etiquetas, esta columna muestra un valor que identifica a una comunidad en una solución producida por este método.
  • Count—Número de entidades de la comunidad.
  • Entity—Nombre de visualización de cada entidad de la comunidad. Las primeras cinco entidades se enumeran de forma predeterminada. Si la comunidad incluye más de cinco entidades, puede mostrar entidades adicionales haciendo clic en + Más en la parte inferior de la lista. Haga clic en - Menos para que se muestren menos entidades.
  • Type—Tipo de entidad de cada entidad de la comunidad. Los tipos de las primeras cinco entidades se enumeran de forma predeterminada. Cuando se muestran más entidades en la lista, sus tipos de entidad correspondientes también se enumeran en la columna Type. Haga clic en +Más al final de la lista Tipo para mostrar tipos de entidad adicionales. Haga clic en -Menos para mostrar menos tipos de entidad.

Para ver comunidades de las entidades en un gráfico de vínculos, siga estos pasos:

  1. En la pestaña Gráfico de vínculos de la cinta, en el grupo Analizar, haga clic en ComunidadDetección de comunidad.

    Se abre la tabla Comunidad Detección de comunidad . El nombre que aparece en la pestaña de la vista de tabla Comunidad identifica el gráfico de vínculos para el que se calcularon las comunidades. El método Lovaina se utiliza de forma predeterminada. Las filas de la tabla se ordenan utilizando el campo Community de forma predeterminada.

    La tabla Comunidad describe los grupos de entidades estrechamente relacionadas en el gráfico de vínculos.

  2. Haga clic en la lista desplegable Método de detección y en otro método para evaluar comunidades.

    Las comunidades del gráfico de vínculos se reevalúan y las filas de la tabla se actualizan para representar los resultados.

Incluir documentos

De forma predeterminada, las entidades de documento no se tienen en cuenta cuando se detectan comunidades, aunque estén presentes en el gráfico de vínculos; sin embargo, puede incluir entidades de documento en los cálculos. Por ejemplo, puede determinar si los documentos conectados a ciertas entidades también pertenecen a esas comunidades.

  1. Active o desactive la opción Incluir documentos en la barra de herramientas de la parte superior de la tabla Comunidad.
    • Activado: se incluyen las entidades de documento al detectar comunidades. Los documentos se tendrán en cuenta e incluirán en sus respectivas comunidades en función del método elegido.

    • Desactivado: se excluyen entidades de documento al detectar comunidades. Los documentos no se tendrán en cuenta ni se incluirán en las comunidades. Esta es la configuración predeterminada.

La tabla Comunidad se actualiza automáticamente para reflejar los cambios realizados en este ajuste. Las entidades de documento se agregan o eliminan de la tabla y las comunidades se vuelven a calcular automáticamente.

Identificar comunidades en el gráfico de vínculos

Cuando selecciona una o varias filas en la tabla Comunidad, todas las entidades de las comunidades definidas por esas filas se seleccionan en el campo Entity de la tabla y en el gráfico de vínculos asociado. Haga clic en el número de fila o en los valores de los campos Community, Count o Solution para seleccionar una fila de la tabla.

Puede hacer clic en una o varias entidades individuales en el campo Entity para seleccionarla. Del mismo modo, si selecciona una entidad en el gráfico de vínculos, se selecciona en el campo Entity de la tabla Comunidad correspondiente. Con el método de detección Propagación de etiquetas, una entidad puede aparecer en más de una fila en la tabla Comunidad y está seleccionada en todas las filas en las que aparece.

Puede hacer clic en un tipo de entidad en el campo Type para seleccionar todas las entidades de ese tipo en la comunidad.

  1. Haga clic en una fila de la tabla Comunidad para seleccionar las entidades de esa comunidad.

    Las entidades correspondientes se seleccionan en el campo Entity y en el gráfico de vínculos.

    Las entidades de la comunidad se seleccionan en la tabla Comunidad y en el gráfico de vínculos.

  2. Haga clic en un tipo en el campo Type para seleccionar todas las entidades de ese tipo en una comunidad.

    Las entidades correspondientes se seleccionan en el campo Entity y en el gráfico de vínculos.

    Las entidades de la comunidad del tipo especificado se seleccionan en la tabla Comunidad y en el gráfico de vínculos.

  3. Haga clic en una entidad en el campo Entity para seleccionarla.

    La entidad se selecciona en el campo Entity y en el gráfico de vínculos.

    La entidad específica se selecciona en la tabla Comunidad y en el gráfico de vínculos.

  4. Haga clic en +Más al final de la lista de entidades en el campo Entity o en la parte inferior de la lista de tipos en el campo Type para ver todas las entidades y tipos de una comunidad.
  5. Haga clic en -Menos al final de la lista de entidades del campo Entity o en la parte inferior de la lista de tipos en el campo Type para ver menos entidades y tipos en una comunidad.

Buscar una entidad en la tabla Comunidad

Puede que no sea obvio qué comunidad incluye una entidad de interés. Puede buscar una entidad para seleccionarla en la vista de tabla Comunidad.

  1. Haga clic en el cuadro de texto de búsqueda de la barra de herramientas situada en la parte superior de la tabla Comunidad.
  2. Escriba el nombre de visualización de una entidad en el gráfico de vínculos.

    Las filas de la tabla Comunidad se filtran automáticamente para mostrar solo las entidades cuyo nombre de visualización coincide con el nombre que ha escrito. En la tabla solo se muestran las filas que representan las entidades filtradas.

    Escriba el nombre de visualización de una entidad en el cuadro de texto de búsqueda para buscar la entidad en la tabla Comunidad.

  3. Seleccione la comunidad que contiene la entidad de su interés.
  4. Haga clic en el botón Eliminar Eliminar en el cuadro de texto de búsqueda para borrar la búsqueda y ver todas las filas de la tabla Comunidad.

    Todas las entidades de la comunidad son visibles y permanecen seleccionadas. Todas las comunidades están visibles en la tabla.

Filtrar los tipos de entidad que se muestran en la tabla Comunidad

De forma predeterminada, la tabla Comunidad incluye todos los tipos de entidad del gráfico de vínculos. En el caso de los gráficos de vínculos grandes, la tabla puede mostrar demasiada información para procesar. Puede filtrar los tipos mostrados en la tabla para solo aparezcan tipos de entidad específicos en sus respectivas comunidades.

  1. Haga clic en el botón Tipo Tipos de filtro de la barra de herramientas situada en la parte superior de la tabla Comunidad.

    Aparece una lista desplegable que incluye todos los tipos de entidad del gráfico de conocimiento, aunque no haya entidades de ese tipo en el gráfico de vínculos. De manera predeterminada se activan todos los tipos de entidad.

  2. En la lista desplegable, active los tipos de entidad que desea ver en la tabla Comunidad. Desactive los tipos de entidad que no desee que estén en la tabla. Escriba el nombre de un tipo de entidad si no lo ve en la lista; la lista de tipos de entidad se filtra automáticamente y puede activar o desactivar los tipos de entidad en la lista filtrada.

    El número total de tipos de entidad seleccionados aparece en la barra de herramientas situada junto al botón Tipos.

Las entidades de la tabla Comunidad se actualizan automáticamente. Las entidades asociadas con los tipos de entidad activados aparecen en la tabla. Las entidades asociadas con los tipos de entidad desactivados se quitan de la tabla.

Recalcular comunidades

Cuando abre inicialmente la tabla Comunidad para un gráfico de vínculos, se detectan comunidades y aparece un mensaje en la parte inferior de la tabla que indica que las comunidades están actualizadas.

Después de agregar o eliminar entidades y relaciones en un gráfico de vínculos, es posible que las comunidades detectadas anteriormente ya no reflejen el contenido del gráfico de vínculos. La tabla Comunidad mostrará un mensaje en la parte inferior que indica que las comunidades están obsoletas.

  1. En la parte inferior de la vista de la tabla Comunidad, haga clic en el botón Refrescar Refrescar.

    Todas las filas se eliminan de la tabla Comunidad y se recalculan nuevas comunidades.

El mensaje que aparece en la parte inferior de la tabla indica que las comunidades están actualizadas.

Establecer opciones de propagación de etiquetas

El método Propagación de etiquetas permite controlar el proceso de detección de comunidades en el gráfico de vínculos.

Puede determinar cuántas soluciones produce este método y cuántas iteraciones se utilizan para desarrollar cada solución. Además, se puede proporcionar un número de inicialización para inicializar un generador de números aleatorios que se utiliza en el algoritmo. Con diferentes valores de inicialización se pueden producir diferentes soluciones.

Después de elegir los ajustes en el panel Opciones, actualice la tabla Comunidad para recalcular las comunidades.

  1. Haga clic en el botón Opciones Opciones de la barra de herramientas situada en la parte superior de la tabla Comunidad.

    Aparece el panel Opciones.

  2. En el panel Opciones, haga clic en el encabezado Propagación de etiquetas para ver la configuración disponible.
  3. En el cuadro de texto Valor de inicialización para generador de números aleatorios, escriba un valor.

    El ajuste predeterminado es cero.

  4. En el cuadro de texto Número de soluciones, escriba el número de veces que se ejecutará el algoritmo para generar un conjunto de comunidades para el gráfico de vínculos.

    El ajuste predeterminado es 1.

    Si Número de soluciones es 1, se genera un conjunto de comunidades para el gráfico de vínculos. Estas comunidades están asociadas al valor cero en el campo Solution. Si Número de soluciones es 10, se generan 10 conjuntos de comunidades para el gráfico de vínculos y las comunidades correspondientes a la décima ejecución se asocian al valor nueve en el campo Solution.

  5. En el cuadro de texto Número de iteraciones, escriba el número máximo de iteraciones que se utilizarán para determinar el conjunto final de comunidades para una solución producida por el algoritmo de Propagación de etiquetas.

    El ajuste predeterminado es 1.000.

  6. La casilla de verificación Mostrar columna de solución permite elegir si las comunidades encontradas se pueden ordenar para evaluar la solución producida por cada ejecución o por el algoritmo.
    • Activado: se muestra el campo Solution. Esta es la opción predeterminada.
    • Desactivado: no se muestra el campo Solution.
  7. En la esquina inferior derecha de la vista de tabla Comunidad, haga clic en el botón Refrescar Refrescar para ver los resultados actualizados.

Temas relacionados