stringtranslate.com

Estructura comunitaria

En el estudio de redes complejas , se dice que una red tiene estructura comunitaria si los nodos de la red se pueden agrupar fácilmente en conjuntos de nodos (potencialmente superpuestos) de modo que cada conjunto de nodos esté densamente conectado internamente. En el caso particular del hallazgo de comunidades no superpuestas , esto implica que la red se divide naturalmente en grupos de nodos con conexiones densas internamente y conexiones más escasas entre grupos. Pero también se permiten comunidades superpuestas . La definición más general se basa en el principio de que es más probable que pares de nodos estén conectados si ambos son miembros de la misma(s) comunidad(es), y menos probable que estén conectados si no comparten comunidades. Un problema relacionado pero diferente es la búsqueda de comunidades , donde el objetivo es encontrar una comunidad a la que pertenece un determinado vértice.

Propiedades

Fig. 1: Un boceto de una pequeña red que muestra la estructura comunitaria , con tres grupos de nodos con conexiones internas densas y conexiones más escasas entre grupos.

En el estudio de redes , como redes informáticas y de información, redes sociales y redes biológicas, se ha descubierto que ocurren comúnmente una serie de características diferentes, incluida la propiedad de mundo pequeño , distribuciones de grados de cola pesada y agrupamiento , entre otras. Otra característica común es la estructura comunitaria. [1] [2] [3] [4] [5] En el contexto de las redes, la estructura comunitaria se refiere a la aparición de grupos de nodos en una red que están más densamente conectados internamente que con el resto de la red, como se muestra. en la imagen de ejemplo a la derecha. Esta falta de homogeneidad de las conexiones sugiere que la red tiene ciertas divisiones naturales dentro de ella.

Las comunidades a menudo se definen en términos de la partición del conjunto de vértices, es decir, cada nodo se coloca en una y sólo una comunidad, tal como se muestra en la figura. Esta es una simplificación útil y la mayoría de los métodos de detección de comunidades encuentran este tipo de estructura comunitaria. Sin embargo, en algunos casos una mejor representación podría ser aquella en la que los vértices estén en más de una comunidad. Esto podría suceder en una red social donde cada vértice representa a una persona y las comunidades representan los diferentes grupos de amigos: una comunidad para la familia, otra comunidad para los compañeros de trabajo, otra para los amigos del mismo club deportivo, etc. El uso de camarillas para la detección de comunidades que se analiza a continuación es sólo un ejemplo de cómo se puede encontrar una estructura comunitaria superpuesta.

Es posible que algunas redes no tengan ninguna estructura comunitaria significativa. Muchos modelos de redes básicos, por ejemplo, como el gráfico aleatorio y el modelo Barabási-Albert , no muestran una estructura comunitaria.

Importancia

Las estructuras comunitarias son bastante comunes en las redes reales. Las redes sociales incluyen grupos comunitarios (el origen del término, de hecho) basados ​​en una ubicación común, intereses, ocupación, etc. [5] [6]

Encontrar una estructura comunitaria subyacente en una red, si existe, es importante por varias razones. Las comunidades nos permiten crear un mapa a gran escala de una red, ya que las comunidades individuales actúan como metanodos en la red, lo que facilita su estudio. [7]

Las comunidades individuales también arrojan luz sobre la función del sistema representado por la red, ya que las comunidades a menudo corresponden a unidades funcionales del sistema. En las redes metabólicas, dichos grupos funcionales corresponden a ciclos o vías, mientras que en la red de interacción de proteínas , las comunidades corresponden a proteínas con funcionalidad similar dentro de una célula biológica. De manera similar, las redes de citas forman comunidades por tema de investigación. [1] Ser capaz de identificar estas subestructuras dentro de una red puede proporcionar información sobre cómo la función y la topología de la red se afectan entre sí. Esta información puede resultar útil para mejorar algunos algoritmos en gráficos, como la agrupación espectral . [8]

Es importante destacar que las comunidades suelen tener propiedades muy diferentes a las propiedades promedio de las redes. Por lo tanto, concentrarse únicamente en las propiedades promedio generalmente pasa por alto muchas características importantes e interesantes dentro de las redes. Por ejemplo, en una red social determinada, pueden existir simultáneamente grupos gregarios y reticentes. [7]

La existencia de comunidades también afecta generalmente a diversos procesos, como la difusión de rumores o la propagación de epidemias que ocurren en una red. Por lo tanto, para comprender adecuadamente dichos procesos, es importante detectar comunidades y también estudiar cómo afectan los procesos de propagación en diversos entornos.

Finalmente, una aplicación importante que la detección de comunidades ha encontrado en la ciencia de redes es la predicción de enlaces perdidos y la identificación de enlaces falsos en la red. Durante el proceso de medición, es posible que algunos enlaces no se observen por varios motivos. De igual forma, algunos enlaces podrían ingresar falsamente en los datos debido a los errores en la medición. Ambos casos son bien manejados por el algoritmo de detección comunitaria, ya que permite asignar la probabilidad de existencia de un borde entre un par de nodos determinado. [9]

Algoritmos para encontrar comunidades.

Encontrar comunidades dentro de una red arbitraria puede ser una tarea computacionalmente difícil. Generalmente se desconoce el número de comunidades, si las hay, dentro de la red y las comunidades suelen ser de tamaño y/o densidad desiguales. Sin embargo, a pesar de estas dificultades, se han desarrollado y empleado varios métodos para encontrar comunidades con distintos niveles de éxito. [4]

Método de corte mínimo

Uno de los algoritmos más antiguos para dividir redes en partes es el método de corte mínimo (y variantes como el corte de proporción y el corte normalizado). Este método se utiliza, por ejemplo, en el equilibrio de carga para computación paralela con el fin de minimizar la comunicación entre los nodos del procesador.

En el método de corte mínimo, la red se divide en un número predeterminado de partes, generalmente de aproximadamente el mismo tamaño, elegidas de manera que se minimice el número de bordes entre grupos. El método funciona bien en muchas de las aplicaciones para las que fue diseñado originalmente, pero no es ideal para encontrar estructuras comunitarias en redes generales, ya que encontrará comunidades independientemente de si están implícitas en la estructura y solo encontrará un número fijo. de ellos. [10]

Agrupación jerárquica

Otro método para encontrar estructuras comunitarias en redes es la agrupación jerárquica . En este método se define una medida de similitud que cuantifica algún tipo (generalmente topológico) de similitud entre pares de nodos. Las medidas comúnmente utilizadas incluyen la similitud del coseno , el índice de Jaccard y la distancia de Hamming entre filas de la matriz de adyacencia . Luego se agrupan nodos similares en comunidades de acuerdo con esta medida. Hay varios esquemas comunes para realizar la agrupación, los dos más simples son la agrupación de enlace único , en la que dos grupos se consideran comunidades separadas si y sólo si todos los pares de nodos en diferentes grupos tienen una similitud inferior a un umbral determinado, y la agrupación de enlace completo. , en el que todos los nodos dentro de cada grupo tienen una similitud mayor que un umbral. Un paso importante es cómo determinar el umbral para detener la agrupación aglomerativa, lo que indica una estructura comunitaria cercana a la óptima. Una estrategia común consiste en construir una o varias métricas que monitoreen las propiedades globales de la red, que alcanzan su punto máximo en un paso determinado de la agrupación. Un enfoque interesante en esta dirección es el uso de varias medidas de similitud o disimilitud, combinadas mediante sumas convexas . [11] Otra aproximación es el cálculo de una cantidad que monitorea la densidad de los bordes dentro de los grupos con respecto a la densidad entre los grupos, como la densidad de partición, que se ha propuesto cuando la métrica de similitud se define entre los bordes (lo que permite la definición de comunidades superpuestas), [12] y se extiende cuando la similitud se define entre nodos, lo que permite considerar definiciones alternativas de comunidades como gremios (es decir, grupos de nodos que comparten un número similar de enlaces con respecto a los mismos vecinos pero no necesariamente conectados entre sí). ). [13] Estos métodos pueden ampliarse para considerar redes multidimensionales, por ejemplo cuando se trata de redes que tienen nodos con diferentes tipos de enlaces. [13]

Algoritmo de Girvan-Newman

Otro algoritmo comúnmente utilizado para encontrar comunidades es el algoritmo de Girvan-Newman . [1] Este algoritmo identifica los bordes de una red que se encuentran entre comunidades y luego los elimina, dejando atrás solo las propias comunidades. La identificación se realiza empleando la medida teórica de grafos centralidad de intermediación , que asigna un número a cada borde que es grande si el borde se encuentra "entre" muchos pares de nodos.

El algoritmo de Girvan-Newman arroja resultados de calidad razonable y es popular porque se ha implementado en varios paquetes de software estándar. Pero también se ejecuta lentamente, tomando un tiempo O( m 2 n ) en una red de n vértices ym aristas, lo que lo hace poco práctico para redes de más de unos pocos miles de nodos. [14]

Maximización de la modularidad

A pesar de sus conocidos inconvenientes, uno de los métodos más utilizados para la detección de comunidades es la maximización de la modularidad. [14] La modularidad es una función de beneficio que mide la calidad de una división particular de una red en comunidades. El método de maximización de la modularidad detecta comunidades buscando en posibles divisiones de una red una o más que tengan una modularidad particularmente alta. Dado que la búsqueda exhaustiva de todas las divisiones posibles suele ser intratable, los algoritmos prácticos se basan en métodos de optimización aproximada, como algoritmos codiciosos, recocido simulado u optimización espectral, con diferentes enfoques que ofrecen diferentes equilibrios entre velocidad y precisión. [15] [16] Un enfoque popular de maximización de la modularidad es el método Louvain , que optimiza iterativamente las comunidades locales hasta que la modularidad global ya no se puede mejorar dadas las perturbaciones en el estado actual de la comunidad. [17] [18] Un algoritmo que utiliza el esquema RenEEL, que es un ejemplo del paradigma Extremal Ensemble Learning (EEL), es actualmente el mejor algoritmo de maximización de modularidad. [19] [20]

La utilidad de la optimización de la modularidad es cuestionable, ya que se ha demostrado que la optimización de la modularidad a menudo no detecta clústeres más pequeños que cierta escala, dependiendo del tamaño de la red ( límite de resolución [21] ); por otro lado, el panorama de los valores de modularidad se caracteriza por una enorme degeneración de particiones con alta modularidad, cercanas al máximo absoluto, que pueden ser muy diferentes entre sí. [22]

Inferencia estadística

Los métodos basados ​​en la inferencia estadística intentan ajustar un modelo generativo a los datos de la red, que codifica la estructura de la comunidad. La ventaja general de este enfoque en comparación con las alternativas es su naturaleza más basada en principios y la capacidad de abordar inherentemente cuestiones de importancia estadística . La mayoría de los métodos en la literatura se basan en el modelo de bloques estocásticos [23] , así como en variantes que incluyen membresía mixta, [24] [25] corrección de grados, [26] y estructuras jerárquicas. [27] La ​​selección del modelo se puede realizar utilizando enfoques basados ​​en principios como la longitud mínima de la descripción [28] [29] (o de manera equivalente, la selección del modelo bayesiano [30] ) y la prueba de índice de verosimilitud . [31] Actualmente existen muchos algoritmos para realizar inferencia eficiente de modelos de bloques estocásticos, incluida la propagación de creencias [32] [33] y el Monte Carlo aglomerativo . [34]

A diferencia de los enfoques que intentan agrupar una red dada una función objetivo, esta clase de métodos se basa en modelos generativos, que no sólo sirven como una descripción de la estructura a gran escala de la red, sino que también pueden usarse para generalizar la datos y predecir la aparición de enlaces faltantes o espurios en la red. [35] [36]

Métodos basados ​​en camarillas

Las camarillas son subgrafos en los que cada nodo está conectado a todos los demás nodos de la camarilla. Como los nodos no pueden estar más estrechamente conectados que esto, no es sorprendente que existan muchos enfoques para la detección de comunidades en redes basados ​​en la detección de camarillas en un gráfico y el análisis de cómo se superponen. Tenga en cuenta que, como un nodo puede ser miembro de más de una camarilla, un nodo puede ser miembro de más de una comunidad en estos métodos, lo que genera una " estructura comunitaria superpuesta ".

Un enfoque consiste en encontrar las " camarillas máximas ". Eso es encontrar las camarillas que no son el subgrafo de ninguna otra camarilla. El algoritmo clásico para encontrarlos es el algoritmo de Bron-Kerbosch . La superposición de estos se puede utilizar para definir comunidades de varias maneras. La más sencilla es considerar sólo camarillas máximas mayores que un tamaño mínimo (número de nodos). La unión de estas camarillas define entonces un subgrafo cuyos componentes (partes desconectadas) definen comunidades. [37] Estos enfoques a menudo se implementan en software de análisis de redes sociales como UCInet.

El enfoque alternativo es utilizar camarillas de tamaño fijo . La superposición de estos se puede utilizar para definir un tipo de hipergráfico regular o una estructura que es una generalización del gráfico lineal (el caso en el que ) se conoce como " gráfico de camarilla ". [38] Los gráficos de camarilla tienen vértices que representan las camarillas en el gráfico original, mientras que los bordes del gráfico de camarilla registran la superposición de la camarilla en el gráfico original. Al aplicar cualquiera de los métodos de detección de comunidades anteriores (que asignan cada nodo a una comunidad) al gráfico de camarilla, se asigna cada camarilla a una comunidad. Esto luego se puede utilizar para determinar la pertenencia a la comunidad de los nodos de las camarillas. Nuevamente, como un nodo puede estar en varias camarillas, puede ser miembro de varias comunidades. Por ejemplo, el método de percolación de camarillas [39] define las comunidades como grupos de percolación de camarillas . Para hacer esto, encuentra todas las camarillas en una red, es decir, todos los subgrafos completos de los nodos. Luego define dos camarillas para que sean adyacentes si comparten nodos, es decir, esto se usa para definir bordes en un gráfico de camarillas. Entonces, una comunidad se define como la unión máxima de -cliques en la que podemos llegar a cualquier -clique de cualquier otro -clique a través de una serie de adyacencias de -clique. Es decir, las comunidades son solo los componentes conectados en el gráfico de camarillas. Dado que un nodo puede pertenecer a varios grupos de percolación de camarillas diferentes al mismo tiempo, las comunidades pueden superponerse entre sí.

Detección de comunidades en espacios de características latentes.

Una red se puede representar o proyectar en un espacio latente mediante métodos de aprendizaje de representación para representar eficientemente un sistema. Luego, se pueden emplear varios métodos de agrupación para detectar estructuras comunitarias. Para espacios euclidianos, se pueden utilizar métodos como la detección de comunidad Silhouette basada en incrustación [40] . Para espacios latentes hipergeométricos, se pueden utilizar el método de espacio crítico o métodos de agrupamiento basados ​​en densidad, jerárquicos o basados ​​en particiones modificados. [41]

Métodos de prueba para encontrar algoritmos de comunidades.

La evaluación de algoritmos, para detectar cuáles son mejores para detectar la estructura comunitaria, sigue siendo una cuestión abierta. Debe basarse en análisis de redes de estructura conocida. Un ejemplo típico es la prueba de los "cuatro grupos", en la que una red se divide en cuatro grupos del mismo tamaño (normalmente de 32 nodos cada uno) y las probabilidades de conexión dentro y entre los grupos varían para crear estructuras más o menos desafiantes para la detección. algoritmo. Dichos gráficos de referencia son un caso especial del modelo de partición l plantada [42] de Condon y Karp , o más generalmente de " modelos de bloques estocásticos ", una clase general de modelos de redes aleatorias que contienen estructura comunitaria. Se han propuesto otros puntos de referencia más flexibles que permiten variar los tamaños de grupo y distribuciones de grados no triviales, como el punto de referencia LFR [43] [44], que es una extensión del punto de referencia de cuatro grupos que incluye distribuciones heterogéneas de grado de nodo y tamaño de comunidad, lo que lo convierte en una prueba más severa de los métodos de detección comunitarios. [45] [46]

Los puntos de referencia generados por computadora de uso común comienzan con una red de comunidades bien definidas. Luego, esta estructura se degrada al volver a cablear o eliminar enlaces y a los algoritmos les resulta cada vez más difícil detectar la partición original. Al final, la red llega a un punto en el que es esencialmente aleatoria. Este tipo de punto de referencia puede denominarse "abierto". El desempeño en estos puntos de referencia se evalúa mediante medidas como la información mutua normalizada o la variación de la información . Comparan la solución obtenida por un algoritmo [44] con la estructura comunitaria original, evaluando la similitud de ambas particiones.

Detectabilidad

Durante los últimos años, varios grupos han obtenido un resultado bastante sorprendente que muestra que existe una transición de fase en el problema de detección de comunidades, mostrando que a medida que la densidad de conexiones dentro de las comunidades y entre comunidades se vuelven cada vez más iguales o ambas se vuelven más pequeñas (equivalentemente , a medida que la estructura de la comunidad se vuelve demasiado débil o la red se vuelve demasiado escasa), de repente las comunidades se vuelven indetectables. En cierto sentido, las comunidades mismas todavía existen, ya que la presencia y ausencia de bordes todavía está correlacionada con las membresías comunitarias de sus puntos finales; pero resulta teóricamente imposible etiquetar los nodos mejor que el azar, o incluso distinguir el gráfico de uno generado por un modelo nulo como el modelo Erdos-Renyi sin estructura comunitaria. Esta transición es independiente del tipo de algoritmo que se utiliza para detectar comunidades, lo que implica que existe un límite fundamental en nuestra capacidad para detectar comunidades en redes, incluso con una inferencia bayesiana óptima (es decir, independientemente de nuestros recursos computacionales). [47] [48] [49]

Considere un modelo de bloques estocástico con nodos totales, grupos de igual tamaño, y sean y las probabilidades de conexión dentro y entre los grupos, respectivamente. Si , la red poseería una estructura comunitaria ya que la densidad de vínculos dentro de los grupos sería mayor que la densidad de vínculos entre los grupos. En el caso disperso, escale de manera que el grado promedio sea constante:

y

Entonces resulta imposible detectar las comunidades cuando: [48]

Ver también

Referencias

  1. ^ a b C M. Girvan ; MEJ Newman (2002). "Estructura comunitaria en redes sociales y biológicas". Proc. Nacional. Acad. Ciencia. EE.UU . 99 (12): 7821–7826. arXiv : cond-mat/0112110 . Código bibliográfico : 2002PNAS...99.7821G. doi : 10.1073/pnas.122653799 . PMC 122977 . PMID  12060727. 
  2. ^ S. Fortunato (2010). "Detección de comunidades en gráficos". Física. Representante . 486 (3–5): 75–174. arXiv : 0906.0612 . Código Bib : 2010PhR...486...75F. doi :10.1016/j.physrep.2009.11.002. S2CID  10211629.
  3. ^ FD Malliaros; M. Vazirgiannis (2013). "Agrupación y detección de comunidades en redes dirigidas: una encuesta". Física. Representante . 533 (4): 95-142. arXiv : 1308.0971 . Código bibliográfico : 2013PhR...533...95M. doi :10.1016/j.physrep.2013.08.002. S2CID  15006738.
  4. ^ ab MA Portero; J.-P. Onnela; PJ Mucha (2009). «Comunidades en Redes» (PDF) . Avisos de la Sociedad Matemática Estadounidense . 56 : 1082–1097, 1164–1166. Archivado (PDF) desde el original el 13 de junio de 2021 . Consultado el 28 de abril de 2021 .
  5. ^ ab Fani, Hossein; Bagheri, Ebrahim (2017). "Detección de comunidades en redes sociales". Enciclopedia con Computación Semántica e Inteligencia Robótica . vol. 1. págs. 1630001 [8]. doi :10.1142/S2425038416300019. S2CID  52471002.
  6. ^ Hamdaqa, Mahoma; Tahvildari, Ladan; LaChapelle, Neil; Campbell, Brian (2014). "Detección de escenas culturales mediante optimización de Lovaina inversa". Ciencia de la programación informática . 95 : 44–72. doi : 10.1016/j.scico.2014.01.006 . Archivado desde el original el 7 de agosto de 2020 . Consultado el 29 de agosto de 2019 .
  7. ^ ab MEJNeman (2006). "Encontrar estructura comunitaria en redes utilizando los vectores propios de matrices". Física. Rev. E. 74 (3): 1–19. arXiv : física/0605087 . Código bibliográfico : 2006PhRvE..74c6104N. doi :10.1103/PhysRevE.74.036104. PMID  17025705. S2CID  138996.
  8. ^ Zare, Habil; P. Shooshtari; A. Gupta; R. Brinkman (2010). "Reducción de datos para agrupación espectral para analizar datos de citometría de flujo de alto rendimiento". Bioinformática BMC . 11 (1): 403. doi : 10.1186/1471-2105-11-403 . PMC 2923634 . PMID  20667133. 
  9. ^ Aarón Clauset; Cristopher Moore; MEJ Newman (2008). "Estructura jerárquica y predicción de enlaces perdidos en redes". Naturaleza . 453 (7191): 98-101. arXiv : 0811.0484 . Código Bib :2008Natur.453...98C. doi : 10.1038/naturaleza06830. PMID  18451861. S2CID  278058.
  10. ^ MEJ Newman (2004). "Detección de estructura comunitaria en redes". euros. Física. J.B.38 (2): 321–330. Código Bib : 2004EPJB...38..321N. doi :10.1140/epjb/e2004-00124-y. hdl : 2027.42/43867 . S2CID  15412738.
  11. ^ Álvarez, Alejandro J.; Sanz-Rodríguez, Carlos E.; Cabrera, Juan Luis (13 de diciembre de 2015). "Ponderación de diferencias para detectar comunidades en redes". Fil. Trans. R. Soc. A . 373 (2056): 20150108. Código bibliográfico : 2015RSPTA.37350108A. doi : 10.1098/rsta.2015.0108 . ISSN  1364-503X. PMID  26527808.
  12. ^ Ahn, YY; Bagrow, JP; Lehmann, S. (2010). "Las comunidades de enlaces revelan una complejidad de múltiples escalas en las redes". Naturaleza . 466 (7307): 761–764. arXiv : 0903.3178 . Código Bib :2010Natur.466..761A. doi : 10.1038/naturaleza09182. PMID  20562860. S2CID  4404822.
  13. ^ ab Pascual-García, Alberto; Campana, Thomas (2020). "functionInk: un método eficaz para detectar grupos funcionales en redes multidimensionales revela la estructura oculta de las comunidades ecológicas". Métodos Ecol Evol . 11 (7): 804–817. doi :10.1111/2041-210X.13377. S2CID  214033410.
  14. ^ ab MEJ Newman (2004). "Algoritmo rápido para detectar estructura comunitaria en redes". Física. Rev. E. 69 (6): 066133. arXiv : cond-mat/0309508 . Código bibliográfico : 2004PhRvE..69f6133N. doi : 10.1103/PhysRevE.69.066133. PMID  15244693. S2CID  301750.
  15. ^ L. Danón; J. Duch; A. Díaz-Guilera; A. Arenas (2005). "Comparación de la identificación de la estructura comunitaria". J. estadística. Mec . 2005 (9): P09008. arXiv : cond-mat/0505245 . Código Bib : 2005JSMTE..09..008D. doi :10.1088/1742-5468/2005/09/P09008. S2CID  14798969.
  16. ^ R. Guimerá; LAN Amaral (2005). "Cartografía funcional de redes metabólicas complejas". Naturaleza . 433 (7028): 895–900. arXiv : q-bio/0502035 . Código Bib :2005Natur.433..895G. doi : 10.1038/naturaleza03288. PMC 2175124 . PMID  15729348. 
  17. ^ VD Blondel; J.-L. Guillaume; R. Lambiotte; E. Lefebvre (2008). "Rápido desarrollo de jerarquías comunitarias en grandes redes". J. estadística. Mec . 2008 (10): P10008. arXiv : 0803.0476 . Código Bib : 2008JSMTE..10..008B. doi :10.1088/1742-5468/2008/10/P10008. S2CID  334423.
  18. ^ "Detección de comunidades ultrarrápida en las redes sociales: una implementación escalable del algoritmo de Lovaina" (PDF) . Universidad de Auburn . 2013. S2CID  16164925.[ enlace muerto ]
  19. ^ J. Guo; P. Singh; KE Bassler (2019). "Esquema de aprendizaje de conjunto extremo de red reducido (RenEEL) para la detección de comunidades en redes complejas". Informes científicos . 9 (14234): 14234. arXiv : 1909.10491 . Código Bib : 2019NatSR...914234G. doi : 10.1038/s41598-019-50739-3 . PMC 6775136 . PMID  31578406. 
  20. ^ "RenEEL-Modularidad". GitHub . 31 de octubre de 2019. Archivado desde el original el 1 de enero de 2021 . Consultado el 4 de noviembre de 2019 .
  21. ^ S. Fortunato; M. Barthelemy (2007). "Límite de resolución en detección comunitaria". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 104 (1): 36–41. arXiv : física/0607100 . Código Bib : 2007PNAS..104...36F. doi : 10.1073/pnas.0605965104 . PMC 1765466 . PMID  17190818. 
  22. ^ BH Bueno; Y.-A. de Montjoye; A. Clauset (2010). "El desempeño de la maximización de la modularidad en contextos prácticos". Física. Rev. E. 81 (4): 046106. arXiv : 0910.0165 . Código bibliográfico : 2010PhRvE..81d6106G. doi : 10.1103/PhysRevE.81.046106. PMID  20481785. S2CID  16564204.
  23. ^ Holanda, Paul W.; Kathryn Blackmond Laskey; Samuel Leinhardt (junio de 1983). "Modelos de bloques estocásticos: primeros pasos". Redes Sociales . 5 (2): 109-137. doi :10.1016/0378-8733(83)90021-7. ISSN  0378-8733. S2CID  34098453.
  24. ^ Airoldi, Edoardo M .; David M. Blei; Stephen E. Fienberg; Eric P. Xing (junio de 2008). "Modelos de bloques estocásticos de membresía mixta". J. Mach. Aprender. Res . 9 : 1981-2014. ISSN  1532-4435. PMC 3119541 . PMID  21701698. Archivado desde el original el 21 de noviembre de 2018 . Consultado el 9 de octubre de 2013 . 
  25. ^ Bola, Brian; Brian Karrer; MEJ Newman (2011). "Método eficiente y basado en principios para detectar comunidades en redes". Revisión física E. 84 (3): 036103. arXiv : 1104.3590 . Código bibliográfico : 2011PhRvE..84c6103B. doi :10.1103/PhysRevE.84.036103. PMID  22060452. S2CID  14204351.
  26. ^ Karrer, Brian; MEJ Newman (21 de enero de 2011). "Modelos de bloques estocásticos y estructura comunitaria en redes". Revisión física E. 83 (1): 016107. arXiv : 1008.3926 . Código bibliográfico : 2011PhRvE..83a6107K. doi : 10.1103/PhysRevE.83.016107. PMID  21405744. S2CID  9068097.
  27. ^ Peixoto, Tiago P. (24 de marzo de 2014). "Estructuras de bloques jerárquicos y selección de modelos de alta resolución en grandes redes". Revisión física X. 4 (1): 011047. arXiv : 1310.4377 . Código Bib : 2014PhRvX...4a1047P. doi : 10.1103/PhysRevX.4.011047. S2CID  5841379.
  28. ^ Martín Rosvall; Carl T. Bergstrom (2007). "Un marco teórico de la información para resolver la estructura comunitaria en redes complejas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 104 (18): 7327–7331. arXiv : física/0612035 . Código Bib : 2007PNAS..104.7327R. doi : 10.1073/pnas.0611034104 . PMC 1855072 . PMID  17452639. 
  29. ^ P. Peixoto, T. (2013). "Inferencia de módulos parsimoniosos en grandes redes". Física. Rev. Lett . 110 (14): 148701. arXiv : 1212.4794 . Código bibliográfico : 2013PhRvL.110n8701P. doi : 10.1103/PhysRevLett.110.148701. PMID  25167049. S2CID  2668815.
  30. ^ P. Peixoto, T. (2019). "Modelado de bloques estocástico bayesiano". Avances en agrupación de redes y modelado de bloques . págs. 289–332. arXiv : 1705.10225 . doi :10.1002/9781119483298.ch11. ISBN 978-1-119-22470-9. S2CID  62900189.
  31. ^ Yan, Xiaoran; Jacob E. Jensen; Florent Krzakala; Cristopher Moore; Cosma Rohilla Shalizi; Lenka Zdeborová ; Pan Zhang; Yaojia Zhu (17 de julio de 2012). "Selección de modelo para modelos de bloques con corrección de grado". Revista de Mecánica Estadística: Teoría y Experimento . 2014 (5): P05007. arXiv : 1207.3994 . Código Bib : 2014JSMTE..05..007Y. doi :10.1088/1742-5468/2014/05/P05007. PMC 4498413 . PMID  26167197. 
  32. ^ Gopalan, Prem K.; David M. Blei (3 de septiembre de 2013). "Descubrimiento eficiente de comunidades superpuestas en redes masivas". Actas de la Academia Nacional de Ciencias . 110 (36): 14534–14539. Código Bib : 2013PNAS..11014534G. doi : 10.1073/pnas.1221839110 . ISSN  0027-8424. PMC 3767539 . PMID  23950224. 
  33. ^ Decelle, Aurelien; Florent Krzakala; Cristopher Moore; Lenka Zdeborová (12 de diciembre de 2011). "Análisis asintótico del modelo de bloques estocástico para redes modulares y sus aplicaciones algorítmicas". Revisión física E. 84 (6): 066106. arXiv : 1109.3041 . Código bibliográfico : 2011PhRvE..84f6106D. doi : 10.1103/PhysRevE.84.066106. PMID  22304154. S2CID  15788070.
  34. ^ Peixoto, Tiago P. (13 de enero de 2014). "Monte Carlo eficiente y heurística codiciosa para la inferencia de modelos de bloques estocásticos". Revisión física E. 89 (1): 012804. arXiv : 1310.4378 . Código bibliográfico : 2014PhRvE..89a2804P. doi : 10.1103/PhysRevE.89.012804. PMID  24580278. S2CID  2674083.
  35. ^ Guimerá, Roger; Marta Sales-Pardo (29-12-2009). "Interacciones perdidas y espurias y reconstrucción de redes complejas". Actas de la Academia Nacional de Ciencias . 106 (52): 22073–22078. arXiv : 1004.4791 . Código Bib : 2009PNAS..10622073G. doi : 10.1073/pnas.0908366106 . PMC 2799723 . PMID  20018705. 
  36. ^ Clauset, Aarón; Cristopher Moore; MEJ Newman (1 de mayo de 2008). "Estructura jerárquica y predicción de enlaces perdidos en redes". Naturaleza . 453 (7191): 98-101. arXiv : 0811.0484 . Código Bib :2008Natur.453...98C. doi : 10.1038/naturaleza06830. ISSN  0028-0836. PMID  18451861. S2CID  278058.
  37. ^ MG Everett; SP Borgatti (1998). "Análisis de conexiones superpuestas de camarillas". Conexiones . 21 : 49.
  38. ^ TS Evans (2010). "Gráficos de camarilla y comunidades superpuestas". J. estadística. Mec . 2010 (12): P12037. arXiv : 1009.0638 . Código Bib : 2010JSMTE..12..037E. doi :10.1088/1742-5468/2010/12/P12037. S2CID  2783670.
  39. ^ G. Pala; I. Derényi; I. Farkas; T. Vicsek (2005). "Descubriendo la estructura comunitaria superpuesta de redes complejas en la naturaleza y la sociedad". Naturaleza . 435 (7043): 814–818. arXiv : física/0506133 . Código Bib :2005Natur.435..814P. doi : 10.1038/naturaleza03607. PMID  15944704. S2CID  3250746.
  40. ^ Škrlj, Blaž; Kralj, enero; Lavrač, Nada (1 de noviembre de 2020). "Detección de comunidad Silhouette basada en incrustación". Aprendizaje automático . 109 (11): 2161–2193. doi :10.1007/s10994-020-05882-8. ISSN  1573-0565. PMC 7652809 . PMID  33191975. 
  41. ^ Bruno, Matteo (21 de junio de 2019). "Detección de comunidades en el espacio hiperbólico". arXiv : 1906.09082 [física.soc-ph].
  42. ^ Condón, A .; Karp, RM (2001). "Algoritmos para la partición de gráficos en el modelo de partición plantada". Estructura aleatoria. Algor . 18 (2): 116-140. CiteSeerX 10.1.1.22.4340 . doi :10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2. 
  43. ^ A. Lancichinetti; S. Fortunato; F. Radicchi (2008). "Gráficos de referencia para probar algoritmos de detección comunitaria". Física. Rev. E. 78 (4): 046110. arXiv : 0805.4770 . Código bibliográfico : 2008PhRvE..78d6110L. doi : 10.1103/PhysRevE.78.046110. PMID  18999496. S2CID  18481617.
  44. ^ ab Fathi, Reza (abril de 2019). "Detección comunitaria distribuida eficiente en el modelo de bloques estocásticos". arXiv : 1904.07494 [cs.DC].
  45. ^ Pasta MQ; F. Zaidi (2017). "Aprovechando la dinámica de la evolución para generar redes complejas de referencia con estructuras comunitarias". arXiv : 1606.01169 [cs.SI].
  46. ^ Pastas, MQ; Zaidi, F. (2017). "Topología de redes complejas y limitaciones de rendimiento de algoritmos de detección comunitaria". Acceso IEEE . 5 : 10901–10914. doi : 10.1109/ACCESS.2017.2714018 .
  47. ^ Reichardt, J.; Leona, M. (2008). "Estructura de clúster (in)detectable en redes dispersas". Física. Rev. Lett . 101 (78701): 1–4. arXiv : 0711.1452 . Código bibliográfico : 2008PhRvL.101g8701R. doi : 10.1103/PhysRevLett.101.078701. PMID  18764586. S2CID  41197281.
  48. ^ ab Decelle, A.; Krzakala, F.; Moore, C.; Zdeborová, L. (2011). "Inferencia y transiciones de fase en la detección de módulos en redes dispersas". Física. Rev. Lett . 107 (65701): 1–5. arXiv : 1102.1182 . Código bibliográfico : 2011PhRvL.107f5701D. doi : 10.1103/PhysRevLett.107.065701. PMID  21902340. S2CID  18399723.
  49. ^ Nadakuditi, RR; Newman, MEJ (2012). "Graficar espectros y la detectabilidad de la estructura comunitaria en redes". Física. Rev. Lett . 108 (188701): 1–5. arXiv : 1205.1813 . Código Bib : 2012PhRvL.108r8701N. doi : 10.1103/PhysRevLett.108.188701. PMID  22681123. S2CID  11820036.

Enlaces externos