El modelo Barabási-Albert (BA) es un algoritmo para generar redes aleatorias sin escala utilizando un mecanismo de conexión preferencial . Se cree que varios sistemas naturales y creados por el hombre, incluidos Internet , la World Wide Web , las redes de citas y algunas redes sociales , tienen una escala aproximadamente libre y ciertamente contienen pocos nodos (llamados centros) con un grado inusualmente alto en comparación con los demás. nodos de la red. El modelo BA intenta explicar la existencia de este tipo de nodos en redes reales. El algoritmo lleva el nombre de sus inventores Albert-László Barabási y Réka Albert .
Muchas redes observadas (al menos aproximadamente) entran en la clase de redes sin escala , lo que significa que tienen distribuciones de grados de ley de potencia (o sin escala), mientras que los modelos de gráficos aleatorios como el modelo Erdős-Rényi (ER) y el El modelo Watts-Strogatz (WS) no exhibe leyes de potencia. El modelo Barabási-Albert es uno de varios modelos propuestos que generan redes sin escala. Incorpora dos conceptos generales importantes: crecimiento y apego preferencial . Tanto el crecimiento como el apego preferencial existen ampliamente en las redes reales.
El crecimiento significa que la cantidad de nodos en la red aumenta con el tiempo.
El vínculo preferencial significa que cuanto más conectado esté un nodo, más probabilidades tendrá de recibir nuevos enlaces. Los nodos con un grado más alto tienen una mayor capacidad para capturar enlaces agregados a la red. Intuitivamente, el vínculo preferencial puede entenderse si pensamos en términos de redes sociales que conectan a las personas. Aquí, un vínculo de A a B significa que la persona A "conoce" o "está familiarizada con" la persona B. Los nodos fuertemente vinculados representan personas conocidas con muchas relaciones. Cuando un recién llegado ingresa a la comunidad, es más probable que conozca a una de esas personas más visibles que a un relativamente desconocido. El modelo BA se propuso suponiendo que en la World Wide Web las nuevas páginas enlazan preferentemente con hubs, es decir, sitios muy conocidos como Google , en lugar de páginas que casi nadie conoce. Si alguien selecciona una nueva página para vincularla eligiendo aleatoriamente un enlace existente, la probabilidad de seleccionar una página en particular sería proporcional a su grado. El modelo BA afirma que esto explica la regla de probabilidad de vinculación preferencial.
Posteriormente, el modelo Bianconi-Barabási trabaja para abordar este problema introduciendo un parámetro de "aptitud". El vínculo preferencial es un ejemplo de un ciclo de retroalimentación positiva en el que las variaciones inicialmente aleatorias (un nodo que inicialmente tiene más enlaces o ha comenzado a acumular enlaces antes que otro) se refuerzan automáticamente, magnificando así enormemente las diferencias. A esto también se le llama a veces efecto Matthew , "los ricos se hacen más ricos ". Véase también autocatálisis .
El único parámetro en el modelo BA es , un número entero positivo. La red se inicializa con una red de nodos.
En cada paso, agregue un nuevo nodo, luego muestree los vértices existentes de la red, con una probabilidad proporcional al número de enlaces que los nodos existentes ya tienen (los documentos originales no especificaban cómo manejar los casos en los que el mismo nodo existente se elige varias veces). Formalmente, la probabilidad de que el nuevo nodo esté conectado al nodo es [1]
donde es el grado del nodo y la suma se realiza sobre todos los nodos preexistentes (es decir, el denominador da como resultado el doble del número actual de aristas en la red). Este paso se puede realizar muestreando primero de manera uniforme un borde y luego muestreando uno de los dos vértices del borde.
Los nodos muy vinculados ("hubs") tienden a acumular rápidamente aún más vínculos, mientras que los nodos con sólo unos pocos vínculos probablemente no sean elegidos como destino para un nuevo vínculo. Los nuevos nodos tienen una "preferencia" de unirse a los nodos que ya están fuertemente vinculados.
La distribución de grados resultante del modelo BA no tiene escala; en particular, es una ley de potencia de la forma
Se demostró que la distribución del índice h o índice de Hirsch también estaba libre de escala y se propuso como índice de lobby, para ser utilizado como medida de centralidad [2]
Además, se puede obtener un resultado analítico para la densidad de nodos con índice h 1 en el caso de que
Las correlaciones entre los grados de nodos conectados se desarrollan espontáneamente en el modelo BA debido a la forma en que evoluciona la red. La probabilidad, de encontrar un vínculo que conecte un nodo de grado con un nodo ancestro de grado en el modelo BA para el caso especial de (árbol BA) está dada por
Esto confirma la existencia de correlaciones de grado, porque si las distribuciones no estuvieran correlacionadas, obtendríamos . [1]
En general , la fracción de enlaces que conectan un nodo de grado con un nodo de grado es [3]
Además, la distribución de grados del vecino más cercano , es decir, la distribución de grados de los vecinos de un nodo con grado , viene dada por [3]
En otras palabras, si seleccionamos un nodo con grado y luego seleccionamos uno de sus vecinos al azar, la probabilidad de que este vecino seleccionado al azar tenga grado viene dada por la expresión anterior.
Klemm y Eguíluz [4] obtuvieron un resultado analítico para el coeficiente de agrupamiento del modelo BA y lo demostró Bollobás. [5] Fronczak, Fronczak y Holyst aplicaron un enfoque de campo medio para estudiar el coeficiente de agrupamiento. [6]
Este comportamiento aún es distinto del comportamiento de las redes de mundos pequeños donde la agrupación es independiente del tamaño del sistema. En el caso de redes jerárquicas, la agrupación en función del grado de nodo también sigue una ley de potencia,
Este resultado fue obtenido analíticamente por Dorogovtsev, Goltsev y Mendes. [7]
La densidad espectral del modelo BA tiene una forma diferente a la densidad espectral semicircular del gráfico aleatorio. Tiene forma de triángulo con la parte superior muy por encima del semicírculo y los bordes decayendo como una ley de potencia. [8] En [9] (Sección 5.1), se demostró que la forma de esta densidad espectral no es una función triangular exacta analizando los momentos de la densidad espectral en función del exponente de la ley potencial.
Por definición, el modelo BA describe un fenómeno que se desarrolla en el tiempo y, por lo tanto, además de su propiedad libre de escala, también se podría buscar su propiedad de escala dinámica. En la red BA, los nodos también se pueden caracterizar por el grado generalizado , el producto de la raíz cuadrada del tiempo de nacimiento de cada nodo y su grado correspondiente , en lugar del grado solo, ya que el tiempo de nacimiento importa en la red BA. Encontramos que la distribución de grados generalizada tiene algunas características no triviales y exhibe una escala dinámica.
Implica que las distintas gráficas de vs colapsarían en una curva universal si trazamos vs. [10]
El modelo A conserva el crecimiento pero no incluye el apego preferencial. La probabilidad de que un nuevo nodo se conecte a cualquier nodo preexistente es igual. La distribución de grados resultante en este límite es geométrica, [11] lo que indica que el crecimiento por sí solo no es suficiente para producir una estructura sin escala.
El modelo B conserva el apego preferencial pero elimina el crecimiento. El modelo comienza con un número fijo de nodos desconectados y agrega enlaces, eligiendo preferentemente nodos de alto grado como destinos de enlace. Aunque la distribución de grados al principio de la simulación parece libre de escala, la distribución no es estable y eventualmente se vuelve casi gaussiana a medida que la red se acerca a la saturación. De modo que el apego preferencial por sí solo no es suficiente para producir una estructura libre de escala.
El hecho de que los modelos A y B no conduzcan a una distribución sin escala indica que se necesitan crecimiento y conexión preferencial simultáneamente para reproducir la distribución estacionaria de la ley de potencias observada en redes reales. [1]
El modelo BA puede considerarse como un caso específico del modelo más general de vinculación preferencial no lineal (NLPA). [12] El algoritmo NLPA es idéntico al modelo BA con la probabilidad de vinculación reemplazada por la forma más general.
donde es un exponente positivo constante. Si , NLPA se reduce al modelo BA y se denomina "lineal". Si , NLPA se denomina "sublineal" y la distribución de grados de la red tiende a una distribución exponencial extendida . Si , NLPA se denomina "superlineal" y una pequeña cantidad de nodos se conectan a casi todos los demás nodos de la red. Para ambos y , la propiedad libre de escala de la red se rompe en el límite del tamaño infinito del sistema. Sin embargo, si es sólo ligeramente mayor que , NLPA puede dar como resultado distribuciones de grados que parecen estar transitoriamente libres de escala. [13]
El apego preferencial hizo su primera aparición en 1923 en el célebre modelo de urna del matemático húngaro György Pólya en 1923. [14] El método de la ecuación maestra, que produce una derivación más transparente, fue aplicado al problema por Herbert A. Simon en 1955 [ 15] en el curso de estudios sobre el tamaño de las ciudades y otros fenómenos. Derek de Solla Price lo aplicó por primera vez para explicar las frecuencias de citas en 1976. [16] Price estaba interesado en la acumulación de citas de artículos científicos y el modelo de Price utilizaba la "ventaja acumulativa" (su nombre para el vínculo preferencial) para generar una gran distribución de cola. En el lenguaje de las redes de citas modernas, el modelo de Price produce una red dirigida, es decir, la versión del modelo de Barabási-Albert. El nombre "apego preferencial" y la actual popularidad de los modelos de red sin escala se debe al trabajo de Albert-László Barabási y Réka Albert , quienes descubrieron que un proceso similar está presente en redes reales y aplicaron en 1999 el apego preferencial para explicar las distribuciones de grados observadas numéricamente en la web. [17]