En ciencia de redes, el coeficiente de agrupamiento (clustering coefficient, en inglés) de un vértice en un grafo cuantifica qué tanto está de agrupado (o interconectado) con sus vecinos.
Si el vértice está agrupado como un clique (subgrafo completo), entonces su valor es máximo, mientras que un valor pequeño indica un vértice poco agrupado en la red.
Duncan J. Watts y Steven Strogatz fueron los primeros en idear este coeficiente en 1998,[1] para determinar si un grafo es una red de mundo pequeño.
Se suele representar formalmente como
En el análisis de redes sociales, en ocasiones a este coeficiente se le conoce también como transitividad.
formalmente consiste en un conjunto de vértices
y en un conjunto de enlaces
se define como aquellos vértices inmediatamente conectados de tal forma que: El grado, que se representa como
de un vértice, es definido como el número de vértices enlazados con uno dado.
En esta expresión además se tiene que
El coeficiente de agrupamiento
está dado por la proporción entre los enlaces conectados con sus vecinos dividido entre el número de enlaces existentes en un clique en el que la conectividad es máxima.
, y por lo tanto para cada vecino
enlaces que podrían existir entre los vértices de la vecindad (
es el grado del vértice i para el total (entrantes + salientes)).
De esta forma el grado de agrupamiento en los grafos dirigidos está dado por: Un grafo no dirigido tiene la propiedad de que tanto los enlaces
son considerados idénticos.
enlaces entre los vértices de su vecindad.
De esta forma el coeficiente de agrupamiento de grafos no dirigidos pueden ser definidos como: Sea
el número de triángulos en
para un grafo no dirigido
el número de tripletes en
es número de sub-grafos (no necesariamente inducidos) con dos enlaces y 3 vértices, uno de los cuales es
y tal que
es incidente a ambos enlaces.
De esta forma se puede definir también el coeficiente de agrupamiento como Es muy simple mostar que de las dos definiciones precedentes son similares, ya que: Esta medida es igual a 1 si cada vecino está conectado a
está conectada igualmente a cada uno de los otros vértices en la vecindad, y 0 si no hay vértices que están conectados a
que conectan a otro vértice que es conectado a
es significantemente mayor que el que pueda ofrecer un grafo aleatorio construido con el mismo conjunto de vértices, y si al mismo tiempo posee una distancia media de pequeño valor.
Se suele emplear el coeficiente de agrupamiento en la detección automática de tópicos.