Coeficiente de agrupamiento

En teoría de grafos , un coeficiente de agrupamiento es una medida del grado en que los nodos de un grafo tienden a agruparse. La evidencia sugiere que en la mayoría de las redes del mundo real, y en particular en las redes sociales , los nodos tienden a crear grupos muy unidos que se caracterizan por una densidad relativamente alta de vínculos; esta probabilidad tiende a ser mayor que la probabilidad promedio de un vínculo establecido aleatoriamente entre dos nodos (Holland y Leinhardt, 1971; ^[1] Watts y Strogatz, 1998 ^[2] ).

Existen dos versiones de esta medida: la global y la local. La versión global fue diseñada para dar una indicación general de la agrupación en la red, mientras que la local da una indicación del grado de "agrupación" de un solo nodo.

Coeficiente de agrupamiento local

El coeficiente de agrupamiento local de un vértice (nodo) en un grafo cuantifica qué tan cerca están sus vecinos de ser una camarilla (grafo completo). Duncan J. Watts y Steven Strogatz introdujeron la medida en 1998 para determinar si un grafo es una red de mundo pequeño .

Un grafo consta formalmente de un conjunto de vértices y un conjunto de aristas entre ellos. Una arista conecta vértice con vértice . $G=(V,E)$ ${\estilo de visualización V}$ ${\estilo de visualización E}$ $estilo de visualización e_ {ij}}$ $estilo de visualización v_{i}}$ $v_{j}$

La vecindad de un vértice se define como sus vecinos inmediatamente conectados de la siguiente manera: $Estilo de visualización N_{i}}$ $estilo de visualización v_{i}}$

N_{i}=\{v_{j}:e_{ij}\in E\lor e_{ji}\in E\}.

Definimos como el número de vértices, , en el entorno, , del vértice . $estilo de visualización k_{i}}$ $|N_{i}|$ $Estilo de visualización N_{i}}$ $estilo de visualización v_{i}}$

El coeficiente de agrupamiento local para un vértice se da entonces como una proporción del número de vínculos entre los vértices dentro de su vecindad dividido por el número de vínculos que podrían existir entre ellos. Para un grafo dirigido, es distinto de , y por lo tanto para cada vecindad hay vínculos que podrían existir entre los vértices dentro de la vecindad ( es el número de vecinos de un vértice). Por lo tanto, el coeficiente de agrupamiento local para grafos dirigidos se da como ^[2] $Estilo de visualización C_{i}$ $estilo de visualización v_{i}}$ $estilo de visualización e_ {ij}}$ $estilo de visualización e_ {ji}}$ $Estilo de visualización N_{i}}$ $k_{i}(k_{i}-1)$ $estilo de visualización k_{i}}$

C_{i}={\frac {|\{e_{jk}:v_{j},v_{k}\en N_{i},e_{jk}\en E\}|}{k_{i}(k_{i}-1)}}.

Un grafo no dirigido tiene la propiedad de que y se consideran idénticos. Por lo tanto, si un vértice tiene vecinos, podrían existir aristas entre los vértices dentro del vecindario. Por lo tanto, el coeficiente de agrupamiento local para grafos no dirigidos se puede definir como $estilo de visualización e_ {ij}}$ $estilo de visualización e_ {ji}}$ $estilo de visualización v_{i}}$ $estilo de visualización k_{i}}$ ${\frac {k_{i}(k_{i}-1)}{2}}$

C_{i}={\frac {2|\{e_{jk}:v_{j},v_{k}\en N_{i},e_{jk}\en E\}|}{k_{i}(k_{i}-1)}}.

Sea el número de triángulos en para un grafo no dirigido . Es decir, es el número de subgrafos de con 3 aristas y 3 vértices, uno de los cuales es . Sea el número de triples en . Es decir, es el número de subgrafos (no necesariamente inducidos) con 2 aristas y 3 vértices, uno de los cuales es y tal que es incidente en ambas aristas. Entonces también podemos definir el coeficiente de agrupamiento como $\lambda _ {G}(v)$ $v\en V(G)$ ${\estilo de visualización G}$ $\lambda _ {G}(v)$ ${\estilo de visualización G}$ ${\estilo de visualización v}$ $\tau_{G}(v)$ $v\en G$ $\tau_{G}(v)$ ${\estilo de visualización v}$ ${\estilo de visualización v}$

C_{i}={\frac {\lambda _{G}(v)}{\tau _{G}(v)}}.

Es sencillo demostrar que las dos definiciones anteriores son las mismas, ya que

\tau_{G}(v)=C({k_{i}},2)={\frac {1}{2}}k_{i}(k_{i}-1).

Estas medidas son 1 si cada vecino conectado a también está conectado a cada otro vértice dentro del vecindario, y 0 si ningún vértice que está conectado a se conecta a ningún otro vértice que esté conectado a . $estilo de visualización v_{i}}$ $estilo de visualización v_{i}}$ $estilo de visualización v_{i}}$

Dado que cualquier gráfico está completamente especificado por su matriz de adyacencia A , el coeficiente de agrupamiento local para un gráfico simple no dirigido se puede expresar en términos de A como: ^[3]

C_{i}={\frac {1}{k_{i}(k_{i}-1)}}\sum _{j,k}A_{ij}A_{jk}A_{ki}

dónde:

k_{i}=\sum _{j}A_{ij}

y C _i = 0 cuando k _i es cero o uno. En la expresión anterior, el numerador cuenta el doble del número de triángulos completos en los que está involucrado el vértice i . En el denominador, k _i² cuenta el número de pares de aristas en los que está involucrado el vértice i más el número de aristas simples atravesadas dos veces. k _i es el número de aristas conectadas al vértice i, y al restar k _i se elimina este último, dejando solo un conjunto de pares de aristas que podrían concebirse para formar triángulos. Por cada par de aristas de este tipo, habrá otro par de aristas que podría formar el mismo triángulo, por lo que el denominador cuenta el doble del número de triángulos concebibles en los que podría estar involucrado el vértice i .

Coeficiente de agrupamiento global

El coeficiente de agrupamiento global se basa en tripletes de nodos. Un triplete son tres nodos que están conectados por dos (triplete abierto) o tres (triplete cerrado) vínculos no dirigidos. Por lo tanto, un grafo triangular incluye tres tripletes cerrados, uno centrado en cada uno de los nodos ( nota: esto significa que los tres tripletes en un triángulo provienen de selecciones superpuestas de nodos). El coeficiente de agrupamiento global es el número de tripletes cerrados (o 3 x triángulos) sobre el número total de tripletes (tanto abiertos como cerrados). El primer intento de medirlo fue realizado por Luce y Perry (1949). ^[4] Esta medida da una indicación del agrupamiento en toda la red (global), y se puede aplicar tanto a redes dirigidas como no dirigidas (a menudo llamada transitividad, consulte Wasserman y Faust, 1994, página 243 ^[5] ).

El coeficiente de agrupamiento global se define como:

C={\frac {\mbox{número de tripletes cerrados}}{\mbox{número de todos los tripletes (abiertos y cerrados)}}}

En la literatura también se ha hecho referencia al número de tripletes cerrados como 3 × triángulos, por lo que:

C={\frac {3\times {\mbox{número de triángulos}}}{\mbox{número de todos los tripletes}}}

Opsahl y Panzarasa (2009) propusieron una generalización a redes ponderadas ^[6] y Opsahl (2009) una redefinición a redes de dos modos (tanto binarias como ponderadas) ^{[7] .}

Dado que cualquier gráfico simple está completamente especificado por su matriz de adyacencia A , el coeficiente de agrupamiento global para un gráfico no dirigido se puede expresar en términos de A como:

C={\frac {\suma _{i,j,k}A_{ij}A_{jk}A_{ki}}{{\frac {1}{2}}\suma _{i}k_{i}(k_{i}-1)}}

dónde:

k_{i}=\sum _{j}A_{ij}

y C = 0 cuando el denominador es cero.

Coeficiente de agrupamiento promedio de la red

^{Como alternativa al coeficiente de agrupamiento global, Watts y Strogatz [2]} miden el nivel general de agrupamiento en una red como el promedio de los coeficientes de agrupamiento local de todos los vértices : ^[8] ${\estilo de visualización n}$

{\bar {C}}={\frac {1}{n}}\sum _{i=1}^{n}C_{i}.

Vale la pena señalar que esta métrica coloca más peso en los nodos de bajo grado, mientras que el índice de transitividad coloca más peso en los nodos de alto grado.

^{Barrat et al. (2004) [9]} propusieron una generalización a redes ponderadas y Latapy et al. (2008) ^[10] y Opsahl (2009) ^[7] una redefinición a gráficos bipartitos (también llamados redes de dos modos).

^{Fagiolo (2007) [11]} y Clemente y Grassi (2018) ^[12] han proporcionado generalizaciones alternativas a los gráficos ponderados y dirigidos .

Esta fórmula no está definida, por defecto, para gráficos con vértices aislados; véase Kaiser (2008) ^[13] y Barmpoutis et al. ^[14]. Se ha descubierto que las redes con el coeficiente de agrupamiento promedio más grande posible tienen una estructura modular y, al mismo tiempo, tienen la distancia promedio más pequeña posible entre los diferentes nodos. ^[14]

Percolación de redes agrupadas

Para una red aleatoria tipo árbol sin correlación grado-grado, se puede demostrar que dicha red puede tener un componente gigante , y el umbral de percolación (probabilidad de transmisión) está dado por , donde es la función generadora correspondiente a la distribución de grado en exceso . $p_{c}={\frac {1}{g_{1}'(1)}}$ $Estilo de visualización g_{1}(z)$

En redes con baja agrupación, el punto crítico se escala de tal manera que: $0<C\ll 1$ $(1-C)^{-1}$

$p_{c}={\frac {1}{1-C}}{\frac {1}{g_{1}'(1)}}.$ ^[15]

Esto indica que, para una distribución de grados dada, la agrupación conduce a un umbral de percolación mayor, principalmente porque, para un número fijo de enlaces, la estructura de agrupación refuerza el núcleo de la red con el precio de diluir las conexiones globales. Para redes con una alta agrupación, una agrupación fuerte podría inducir la estructura núcleo-periferia, en la que el núcleo y la periferia podrían percolar en diferentes puntos críticos, y el tratamiento aproximado anterior no es aplicable. ^[16]

Para estudiar la robustez de las redes agrupadas se desarrolló un enfoque de percolación. ^[17]^[18]

Véase también

Referencias

^ PW Holland y S. Leinhardt (1971). "Transitividad en modelos estructurales de grupos pequeños". Estudios comparativos de grupos . 2 (2): 107–124. doi :10.1177/104649647100200201. S2CID 145544488.
^ abc DJ Watts y Steven Strogatz (junio de 1998). «Dinámica colectiva de redes de «mundo pequeño»». Nature . 393 (6684): 440–442. Bibcode :1998Natur.393..440W. doi :10.1038/30918. PMID 9623998. S2CID 4429113.
^ Wang, Yu; Ghumare, Eshwar; Vandenberghe, Rik; Dupont, Patrick (2017). "Comparación de diferentes generalizaciones del coeficiente de agrupamiento y la eficiencia local para gráficos no dirigidos ponderados". Neural Computation . 29 (2): 313–331. doi : 10.1162/NECO_a_00914 . PMID 27870616. S2CID 11000115. Archivado desde el original el 10 de agosto de 2020 . Consultado el 8 de agosto de 2020 .
^ RD Luce y AD Perry (1949). "Un método de análisis matricial de la estructura de grupo". Psychometrika . 14 (1): 95–116. doi :10.1007/BF02289146. hdl : 10.1007/BF02289146 . PMID 18152948. S2CID 16186758.
^ Stanley Wasserman , Katherine Faust, 1994. Análisis de redes sociales: métodos y aplicaciones. Cambridge: Cambridge University Press.
^ Tore Opsahl y Pietro Panzarasa (2009). "Clustering in Weighted Networks". Redes sociales . 31 (2): 155–163. doi :10.1016/j.socnet.2009.02.002. Archivado desde el original el 1 de julio de 2019 . Consultado el 11 de junio de 2009 .
^ ab Tore Opsahl (2009). "Clustering in Two-mode Networks". Conferencia y taller sobre análisis social bimodal (30 de septiembre-2 de octubre de 2009) . Archivado desde el original el 21 de marzo de 2016. Consultado el 11 de septiembre de 2009 .
^ Kemper, Andreas (2009). Valoración de los efectos de red en los mercados de software: un enfoque de redes complejas. Springer. p. 142. ISBN 9783790823660.
^ Barrat, A.; Barthelemy, M.; Pastor-Satorras, R.; Vespignani, A. (2004). "La arquitectura de redes ponderadas complejas". Actas de la Academia Nacional de Ciencias . 101 (11): 3747–3752. arXiv : cond-mat/0311416 . Bibcode :2004PNAS..101.3747B. doi : 10.1073/pnas.0400087101 . PMC 374315. PMID 15007165 .
^ Latapy, M.; Magnien, C.; Del Vecchio, N. (2008). "Nociones básicas para el análisis de grandes redes bimodales" (PDF) . Redes sociales . 30 (1): 31–48. doi :10.1016/j.socnet.2007.04.006.
^ Fagiolo, G. (2007). "Agrupamiento en redes complejas dirigidas". Physical Review E . 76 (2 Pt 2): 026107. arXiv : physics/0612169 . CiteSeerX 10.1.1.262.1006 . doi :10.1103/PhysRevE.76.026107. PMID 17930104. S2CID 2317676.
^ Clemente, GP; Grassi, R. (2018). "Agrupamiento dirigido en redes ponderadas: una nueva perspectiva". Caos, solitones y fractales . 107 : 26–38. arXiv : 1706.07322 . Código Bibliográfico :2018CSF...107...26C. doi :10.1016/j.chaos.2017.12.007. S2CID 21919524.
^ Kaiser, Marcus (2008). "Coeficientes de agrupamiento medios: el papel de los nodos y hojas aislados en las medidas de agrupamiento para redes de mundo pequeño". New Journal of Physics . 10 (8): 083042. arXiv : 0802.2512 . Bibcode :2008NJPh...10h3042K. doi :10.1088/1367-2630/10/8/083042. S2CID 16480565.
^ ab Barmpoutis, D.; Murray, RM (2010). "Redes con la distancia promedio más pequeña y el agrupamiento promedio más grande". arXiv : 1007.4031 [q-bio.MN].
^ Berchenko, Yakir; Artzy-Randrup, Yael; Teicher, Mina; Stone, Lewi (30 de marzo de 2009). "Aparición y tamaño del componente gigante en gráficos aleatorios agrupados con una distribución de grados dada". Physical Review Letters . 102 (13): 138701. doi :10.1103/PhysRevLett.102.138701. ISSN 0031-9007. PMID 19392410. Archivado desde el original el 4 de febrero de 2023 . Consultado el 24 de febrero de 2022 .
^ Berchenko, Yakir; Artzy-Randrup, Yael; Teicher, Mina; Stone, Lewi (30 de marzo de 2009). "Aparición y tamaño del componente gigante en gráficos aleatorios agrupados con una distribución de grados dada". Physical Review Letters . 102 (13): 138701. doi :10.1103/PhysRevLett.102.138701. ISSN 0031-9007. PMID 19392410. Archivado desde el original el 4 de febrero de 2023 . Consultado el 24 de febrero de 2022 .
^ MEJ Newman (2009). "Gráficos aleatorios con agrupamiento". Phys. Rev. Lett . 103 (5): 058701. arXiv : 0903.4009 . doi :10.1103/PhysRevLett.103.058701. PMID 19792540. S2CID 28214709.
^ A. Hackett; S. Melnik y JP Gleeson (2011). "Cascadas en una clase de redes aleatorias agrupadas". Phys. Rev. E . 83 (5 Pt 2): 056107. arXiv : 1012.3651 . doi :10.1103/PhysRevE.83.056107. PMID 21728605. S2CID 18071422.

Enlaces externos

Medios relacionados con Coeficiente de agrupamiento en Wikimedia Commons