Una red libre de escala es una red cuya distribución de grados sigue una ley de potencia , al menos asintóticamente. Es decir, la fracción P ( k ) de nodos en la red que tienen k conexiones con otros nodos es igual para valores grandes de k
donde es un parámetro cuyo valor está típicamente en el rango (donde el segundo momento ( parámetro de escala ) de es infinito pero el primer momento es finito), aunque ocasionalmente puede estar fuera de estos límites. [1] [2] El nombre "libre de escala" podría explicarse por el hecho de que algunos momentos de la distribución de grados no están definidos, de modo que la red no tiene una escala o "tamaño" característico.
Se ha informado que muchas redes son libres de escala, aunque el análisis estadístico ha refutado muchas de estas afirmaciones y ha cuestionado seriamente otras. [3] [4] Además, algunos han argumentado que simplemente saber que una distribución de grados es de cola gruesa es más importante que saber si una red es libre de escala según definiciones estadísticamente rigurosas. [5] [6] La fijación preferencial y el modelo de aptitud se han propuesto como mecanismos para explicar las distribuciones de grados de ley de potencia conjeturadas en redes reales. Modelos alternativos como la fijación preferencial superlineal y la fijación preferencial de segundo vecino pueden parecer generar redes libres de escala transitorias, pero la distribución de grados se desvía de una ley de potencia a medida que las redes se vuelven muy grandes. [7] [8]
En estudios sobre las redes de citas entre artículos científicos, Derek de Solla Price demostró en 1965 que el número de enlaces a artículos (es decir, el número de citas que reciben) tenía una distribución de cola pesada siguiendo una distribución de Pareto o ley de potencia y, por lo tanto, que la red de citas es libre de escala. Sin embargo, no utilizó el término "red libre de escala", que no se acuñó hasta algunas décadas después. En un artículo posterior de 1976, Price también propuso un mecanismo para explicar la aparición de leyes de potencia en las redes de citas, al que llamó "ventaja acumulativa", pero que hoy en día se conoce más comúnmente con el nombre de apego preferencial .
El interés reciente en las redes sin escala comenzó en 1999 con el trabajo de Albert-László Barabási y Réka Albert en la Universidad de Notre Dame, quienes mapearon la topología de una parte de la World Wide Web [9] , encontrando que algunos nodos, que ellos llamaron "centros", tenían muchas más conexiones que otros y que la red en su conjunto tenía una distribución de ley de potencia del número de enlaces que conectaban a un nodo. Después de encontrar que algunas otras redes, incluyendo algunas redes sociales y biológicas, también tenían distribuciones de grado de cola pesada, Barabási y Réka Albert acuñaron el término "red sin escala" para describir la clase de redes que exhiben una distribución de grado de ley de potencia. Sin embargo, al estudiar siete ejemplos de redes en sistemas sociales, económicos, tecnológicos, biológicos y físicos, Amaral et al. no pudieron encontrar una red sin escala entre estos siete ejemplos. Sólo uno de estos ejemplos, la red de actores de películas, tenía una distribución de grados P ( k ) que seguía un régimen de ley de potencia para un valor k moderado , aunque eventualmente este régimen de ley de potencia fue seguido por un corte abrupto que mostraba un decaimiento exponencial para un valor k grande . [10]
Barabási y Réka Albert propusieron un mecanismo generativo para explicar la aparición de distribuciones de ley de potencia, al que llamaron " adjunto preferencial " y que es esencialmente el mismo que el propuesto por Price. Las soluciones analíticas para este mecanismo (también similares a la solución de Price) fueron presentadas en 2000 por Dorogovtsev, Mendes y Samukhin [11] e independientemente por Krapivsky, Redner y Leyvraz, y luego rigurosamente demostradas por el matemático Béla Bollobás [12] . Cabe destacar, sin embargo, que este mecanismo solo produce un subconjunto específico de redes en la clase libre de escala, y desde entonces se han descubierto muchos mecanismos alternativos [13] .
La historia de las redes sin escala también incluye algunos desacuerdos. A nivel empírico, se ha puesto en tela de juicio la naturaleza sin escala de varias redes. Por ejemplo, los tres hermanos Faloutsos creían que Internet tenía una distribución de grados de ley de potencia sobre la base de los datos de traceroute ; sin embargo, se ha sugerido que se trata de una ilusión de capa 3 creada por los enrutadores, que aparecen como nodos de alto grado mientras ocultan la estructura interna de capa 2 de los AS que interconectan. [14]
En un nivel teórico, se han propuesto mejoras a la definición abstracta de escala libre. Por ejemplo, Li et al. (2005) ofrecieron una "métrica de escala libre" potencialmente más precisa. Brevemente, sea G un grafo con un conjunto de aristas E , y denotemos el grado de un vértice (es decir, el número de aristas incidentes a ) por . Definir
Esto se maximiza cuando los nodos de alto grado están conectados a otros nodos de alto grado. Ahora defina
donde s max es el valor máximo de s ( H ) para H en el conjunto de todos los grafos con distribución de grados idéntica a la de G . Esto da una métrica entre 0 y 1, donde un grafo G con S ( G ) pequeño es "rico en escala", y un grafo G con S ( G ) cercano a 1 es "libre de escala". Esta definición captura la noción de autosimilitud implícita en el nombre "libre de escala".
Cuando el concepto de "libre de escala" se introdujo inicialmente en el contexto de las redes, [9] se refería principalmente a un rasgo específico: una distribución de ley de potencia para una variable dada , expresada como . Esta propiedad mantiene su forma cuando se somete a una transformación de escala continua , lo que evoca paralelismos con las técnicas de grupo de renormalización en la teoría de campos estadísticos. [15] [16]
Sin embargo, existe una diferencia clave. En la teoría estadística de campos, el término "escala" suele referirse al tamaño del sistema. En el ámbito de las redes, la "escala" es una medida de conectividad, generalmente cuantificada por el grado de un nodo, es decir, la cantidad de enlaces conectados a él. Se considera que las redes que cuentan con una mayor cantidad de nodos de alto grado tienen mayor conectividad.
La distribución de grados de ley de potencia nos permite hacer afirmaciones "libres de escala" sobre la prevalencia de nodos de alto grado. [17] Por ejemplo, podemos decir que "los nodos con el triple de la conectividad promedio ocurren con la mitad de frecuencia que los nodos con conectividad promedio". El valor numérico específico de lo que constituye la "conectividad promedio" se vuelve irrelevante, ya sea cien o un millón. [18]
La característica más notable de una red sin escala es la relativa frecuencia de vértices con un grado que supera ampliamente el promedio. Los nodos de grado más alto suelen denominarse "centros" y se cree que cumplen funciones específicas en sus redes, aunque esto depende en gran medida del dominio.
Otra característica importante de las redes libres de escala es la distribución del coeficiente de agrupamiento , que disminuye a medida que aumenta el grado del nodo. Esta distribución también sigue una ley de potencia. Esto implica que los nodos de bajo grado pertenecen a subgrafos muy densos y esos subgrafos están conectados entre sí a través de centros. Considere una red social en la que los nodos son personas y los enlaces son relaciones de conocimiento entre personas. Es fácil ver que las personas tienden a formar comunidades, es decir, pequeños grupos en los que todos se conocen (se puede pensar en dicha comunidad como un grafo completo ). Además, los miembros de una comunidad también tienen algunas relaciones de conocimiento con personas fuera de esa comunidad. Algunas personas, sin embargo, están conectadas a un gran número de comunidades (por ejemplo, celebridades, políticos). Esas personas pueden considerarse los centros responsables del fenómeno del mundo pequeño .
En la actualidad, las características más específicas de las redes sin escala varían según el mecanismo generativo utilizado para crearlas. Por ejemplo, las redes generadas por conexión preferencial suelen colocar los vértices de alto grado en el medio de la red, conectándolos entre sí para formar un núcleo, con nodos de grado progresivamente menor que conforman las regiones entre el núcleo y la periferia. La eliminación aleatoria de incluso una gran fracción de vértices afecta muy poco la conectividad general de la red, lo que sugiere que dichas topologías podrían ser útiles para la seguridad , mientras que los ataques dirigidos destruyen la conectividad muy rápidamente. Otras redes sin escala, que colocan los vértices de alto grado en la periferia, no exhiben estas propiedades. De manera similar, el coeficiente de agrupamiento de las redes sin escala puede variar significativamente dependiendo de otros detalles topológicos.
La cuestión de cómo inmunizar de manera eficiente redes libres y escalables que representan redes realistas como Internet y las redes sociales ha sido estudiada extensamente. Una de esas estrategias es inmunizar los nodos de mayor grado, es decir, los ataques dirigidos (intencionados) ya que para este caso p es relativamente alto y se necesitan menos nodos para inmunizar. Sin embargo, en muchos casos realistas la estructura global no está disponible y no se conocen los nodos de mayor grado.
Las propiedades de un grafo aleatorio pueden cambiar o permanecer invariables bajo transformaciones de grafos. Mashaghi A. et al., por ejemplo, demostraron que una transformación que convierte grafos aleatorios en sus grafos duales de aristas (o grafos lineales) produce un conjunto de grafos con una distribución de grados casi igual, pero con correlaciones de grados y un coeficiente de agrupamiento significativamente mayor. Los grafos libres de escala, como tales, permanecen libres de escala bajo tales transformaciones. [19]
Aunque se cree que muchas redes del mundo real son libres de escala, la evidencia a menudo no es concluyente, principalmente debido a la creciente conciencia de técnicas de análisis de datos más rigurosas. [3] Por ello, la naturaleza libre de escala de muchas redes aún está siendo debatida por la comunidad científica. Algunos ejemplos de redes que se afirma que son libres de escala incluyen:
También se ha encontrado topología libre de escala en superconductores de alta temperatura. [23] Las cualidades de un superconductor de alta temperatura —un compuesto en el que los electrones obedecen las leyes de la física cuántica y fluyen en perfecta sincronía, sin fricción— parecen estar vinculadas a las disposiciones fractales de átomos de oxígeno aparentemente aleatorios y a la distorsión reticular. [24]
Recientemente se ha propuesto una estructura celular que llena el espacio, la red estocástica plana ponderada (WPSL), cuya distribución de números de coordinación sigue una ley de potencia. Esto implica que la red tiene unos pocos bloques que tienen un número sorprendentemente grande de vecinos con los que comparten bordes comunes. Su construcción comienza con un iniciador, digamos un cuadrado de área unitaria, y un generador que lo divide aleatoriamente en cuatro bloques. A partir de ahí, el generador se aplica secuencialmente una y otra vez a solo uno de los bloques disponibles elegidos preferentemente con respecto a sus áreas. El resultado es la partición del cuadrado en bloques rectangulares mutuamente excluyentes cada vez más pequeños. El dual de la WPSL (DWPSL), que se obtiene reemplazando cada bloque con un nodo en su centro y cada borde común entre bloques con una arista que une los dos vértices correspondientes, surge como una red cuya distribución de grados sigue una ley de potencia. [25] [26] La razón de ello es que crece siguiendo la regla del modelo de apego impulsado por la mediación que también incorpora la regla del apego preferencial, pero disfrazada.
Las redes libres de escala no surgen por pura casualidad. Erdős y Rényi (1960) estudiaron un modelo de crecimiento para grafos en el que, en cada paso, se eligen dos nodos de manera uniforme y aleatoria y se inserta un enlace entre ellos. Las propiedades de estos grafos aleatorios son diferentes de las propiedades que se encuentran en las redes libres de escala, por lo que se necesita un modelo para este proceso de crecimiento.
El modelo generativo más conocido para un subconjunto de redes libres de escala es el modelo generativo de enriquecimiento enriquecido de Barabási y Albert (1999) en el que cada nueva página web crea enlaces a páginas web existentes con una distribución de probabilidad que no es uniforme, sino proporcional al grado de entrada actual de las páginas web. Este modelo fue inventado originalmente por Derek J. de Solla Price en 1965 bajo el término ventaja acumulativa , pero no alcanzó popularidad hasta que Barabási redescubrió los resultados bajo su nombre actual ( modelo BA ). Según este proceso, una página con muchos enlaces entrantes atraerá más enlaces entrantes que una página normal. Esto genera una ley de potencia, pero el gráfico resultante difiere del gráfico web real en otras propiedades, como la presencia de pequeñas comunidades estrechamente conectadas. Se han propuesto y estudiado modelos y características de red más generales. Por ejemplo, Pachon et al. (2018) propusieron una variante del modelo generativo de los ricos se hacen más ricos que tiene en cuenta dos reglas de unión diferentes: un mecanismo de unión preferencial y una elección uniforme solo para los nodos más recientes. [27] Para una revisión, consulte el libro de Dorogovtsev y Mendes . [ cita requerida ] Algunos mecanismos, como la unión preferencial superlineal y la unión del segundo vecino, generan redes que son transitoriamente libres de escala, pero se desvían de una ley de potencia a medida que las redes crecen. [7] [8]
Pennock et al. (2002) propusieron un modelo generativo algo diferente para los enlaces web. Examinaron comunidades con intereses en un tema específico, como las páginas de inicio de universidades, empresas públicas, periódicos o científicos, y descartaron los principales centros de la Web. En este caso, la distribución de enlaces ya no era una ley de potencia, sino que se parecía a una distribución normal . Basándose en estas observaciones, los autores propusieron un modelo generativo que combina el apego preferencial con una probabilidad base de obtener un enlace.
Otro modelo generativo es el modelo de copia estudiado por Kumar et al. [28] (2000), en el que los nuevos nodos eligen un nodo existente al azar y copian una fracción de los enlaces del nodo existente. Esto también genera una ley de potencia.
Hay dos componentes principales que explican la aparición de la distribución de ley de potencia en el modelo de Barabási-Albert : el crecimiento y la adhesión preferencial. [29] Por "crecimiento" se entiende un proceso de crecimiento en el que, durante un período prolongado de tiempo, nuevos nodos se unen a un sistema ya existente, una red (como la World Wide Web, que ha crecido en miles de millones de páginas web en 10 años). Finalmente, por "adhesión preferencial" se entiende que los nuevos nodos prefieren conectarse a nodos que ya tienen un gran número de enlaces con otros. Por lo tanto, existe una mayor probabilidad de que cada vez más nodos se enlacen con aquel que ya tiene muchos enlaces, lo que lleva a este nodo a un nodo in fine . [9] Dependiendo de la red, los nodos pueden ser assortativos o disassortativos. La assortatividad se encontraría en redes sociales en las que las personas bien conectadas/famosas tenderían a conocerse mejor entre sí. La disassortatividad se encontraría en redes tecnológicas (Internet, World Wide Web) y biológicas (interacción de proteínas, metabolismo). [29]
Sin embargo, el crecimiento de las redes (añadir nuevos nodos) no es una condición necesaria para crear una red libre de escala (véase Dangalchev [30] ). Una posibilidad (Caldarelli et al. 2002) es considerar la estructura como estática y trazar un vínculo entre los vértices de acuerdo con una propiedad particular de los dos vértices involucrados. Una vez especificada la distribución estadística para estas propiedades de los vértices (aptitud), resulta que en algunas circunstancias también las redes estáticas desarrollan propiedades libres de escala.
Se ha producido un gran auge en el modelado de redes complejas sin escala . La receta de Barabási y Albert [31] ha sido seguida por varias variaciones y generalizaciones [32] [33] [34] [35] [27] y la renovación de trabajos matemáticos previos. [36]
En términos actuales, si una red compleja tiene una distribución de ley de potencia de cualquiera de sus métricas, generalmente se considera una red libre de escala. De manera similar, cualquier modelo con esta característica se denomina modelo libre de escala. [17]
Muchas redes reales son (aproximadamente) libres de escala y, por lo tanto, requieren modelos libres de escala para describirlas. En el esquema de Price, se necesitan dos ingredientes para construir un modelo libre de escala:
1. Agregar o quitar nodos . Normalmente nos concentramos en hacer crecer la red, es decir, agregar nodos.
2. Conexión preferencial : Es la probabilidad de que nuevos nodos se conecten al nodo “antiguo”.
Cabe señalar que algunos modelos (véase Dangalchev [30] y el modelo Fitness a continuación) también pueden funcionar de forma estática, sin cambiar el número de nodos. También debe tenerse en cuenta que el hecho de que los modelos de "fijación preferencial" den lugar a redes sin escala no demuestra que este sea el mecanismo subyacente a la evolución de las redes sin escala del mundo real, ya que podrían existir diferentes mecanismos en funcionamiento en sistemas del mundo real que, no obstante, den lugar a la escala.
Se han hecho varios intentos de generar propiedades de red sin escala. A continuación, se muestran algunos ejemplos:
El modelo de Barabási-Albert , una versión no dirigida del modelo de Price, tiene una conexión preferencial lineal y agrega un nuevo nodo en cada paso de tiempo.
(Nota: otra característica general de en redes reales es que , es decir, existe una probabilidad distinta de cero de que un nuevo nodo se una a un nodo aislado. Por lo tanto, en general tiene la forma , donde es el atractivo inicial del nodo).
Dangalchev (ver [30] ) construye un modelo 2-L considerando la importancia de cada uno de los vecinos de un nodo objetivo en la vinculación preferencial. El atractivo de un nodo en el modelo 2-L depende no solo del número de nodos vinculados a él, sino también del número de vínculos en cada uno de estos nodos.
donde C es un coeficiente entre 0 y 1.
Una variante del modelo 2-L, el modelo k2, en el que los nodos vecinos primero y segundo contribuyen por igual al atractivo de un nodo objetivo, demuestra la aparición de redes transitorias sin escala. [8] En el modelo k2, la distribución de grados parece aproximadamente sin escala mientras la red sea relativamente pequeña, pero surgen desviaciones significativas del régimen sin escala a medida que la red se hace más grande. Esto da como resultado que el atractivo relativo de los nodos con diferentes grados cambie con el tiempo, una característica que también se observa en redes reales.
En el modelo de conexión impulsado por mediación (MDA) , un nuevo nodo que viene con aristas elige un nodo conectado existente al azar y luego se conecta a sí mismo, no con ese, sino con uno de sus vecinos, también elegidos al azar. La probabilidad de que el nodo del nodo existente elegido sea
El factor es el inverso de la media armónica (IHM) de los grados de los vecinos de un nodo . Una extensa investigación numérica sugiere que, aproximadamente, el valor medio de IHM en el límite grande se convierte en una constante, lo que significa que . Esto implica que cuanto mayores sean los enlaces (grado) que tenga un nodo, mayor será su probabilidad de obtener más enlaces, ya que se puede llegar a ellos de una mayor cantidad de formas a través de mediadores, lo que esencialmente encarna la idea intuitiva del mecanismo de los ricos se hacen más ricos (o la regla de unión preferencial del modelo de Barabasi-Albert). Por lo tanto, se puede ver que la red MDA sigue la regla de PA, pero disfrazada. [37]
Sin embargo, como se describe el mecanismo del ganador se lo lleva todo, vemos que casi el total de nodos tiene grado uno y uno es súper rico en grado. A medida que el valor aumenta, la disparidad entre los súper ricos y los pobres disminuye y encontramos una transición del mecanismo de los ricos que se vuelven súper ricos al de los ricos que se vuelven más ricos.
El modelo de Barabási–Albert supone que la probabilidad de que un nodo se una a otro nodo es proporcional al grado de nodo . Esta suposición implica dos hipótesis: primero, que depende de , en contraste con los grafos aleatorios en los que , y segundo, que la forma funcional de es lineal en .
En el apego preferencial no lineal, la forma de no es lineal, y estudios recientes han demostrado que la distribución de grados depende en gran medida de la forma de la función.
Krapivsky, Redner y Leyvraz [34] demuestran que la naturaleza libre de escala de la red se destruye para la unión preferencial no lineal. El único caso en el que la topología de la red es libre de escala es aquel en el que la unión preferencial es asintóticamente lineal, es decir, como . En este caso, la ecuación de velocidad conduce a
De esta manera, el exponente de la distribución de grados se puede ajustar a cualquier valor entre 2 y . [ aclaración necesaria ]
Los modelos de redes jerárquicas son, por diseño, libres de escala y tienen una alta agrupación de nodos. [38]
La construcción iterativa conduce a una red jerárquica. Partiendo de un clúster completamente conectado de cinco nodos, creamos cuatro réplicas idénticas que conectan los nodos periféricos de cada clúster al nodo central del clúster original. A partir de esto, obtenemos una red de 25 nodos ( N = 25). Repitiendo el mismo proceso, podemos crear cuatro réplicas más del clúster original: los cuatro nodos periféricos de cada uno se conectan al nodo central de los nodos creados en el primer paso. Esto da N = 125, y el proceso puede continuar indefinidamente.
La idea es que el vínculo entre dos vértices no se asigna aleatoriamente con una probabilidad p igual para todo el par de vértices, sino que para cada vértice j hay una aptitud intrínseca x j y se crea un vínculo entre el vértice i y j con una probabilidad . [39] En el caso de World Trade Web es posible reconstruir todas las propiedades utilizando como aptitudes del país su PIB y tomando
Suponiendo que una red tiene una geometría hiperbólica subyacente, se puede utilizar el marco de las redes espaciales para generar distribuciones de grados libres de escala. Esta distribución de grados heterogénea simplemente refleja la curvatura negativa y las propiedades métricas de la geometría hiperbólica subyacente. [41]
A partir de gráficos libres de escala con correlación de grado bajo y coeficiente de agrupamiento, se pueden generar nuevos gráficos con correlaciones de grado mucho más altos y coeficientes de agrupamiento mediante la aplicación de la transformación dual de aristas. [19]
El modelo UPA es una variante del modelo de apego preferencial (propuesto por Pachon et al.) que tiene en cuenta dos reglas de apego diferentes: un mecanismo de apego preferencial (con probabilidad 1−p) que enfatiza el sistema de los ricos se hacen más ricos, y una elección uniforme (con probabilidad p) para los nodos más recientes. Esta modificación es interesante para estudiar la robustez del comportamiento libre de escala de la distribución de grados. Se demuestra analíticamente que la distribución de grados asintóticamente de ley de potencia se conserva. [27]
En el contexto de la teoría de redes, una red ideal libre de escala es una red aleatoria con una distribución de grados que sigue la distribución de densidad de gas ideal libre de escala . Estas redes son capaces de reproducir distribuciones de tamaño de ciudad y resultados electorales desentrañando la distribución de tamaño de los grupos sociales con la teoría de la información sobre redes complejas cuando se aplica un proceso de crecimiento de clúster competitivo a la red. [42] [43] En modelos de redes ideales libres de escala es posible demostrar que el número de Dunbar es la causa del fenómeno conocido como los ' seis grados de separación '.
Para una red libre de escala con nodos y exponente de ley de potencia , el subgrafo inducido construido por vértices con grados mayores que es una red libre de escala con , casi con seguridad . [44]
La estimación del exponente de la ley de potencia de una red libre de escala se realiza típicamente utilizando la estimación de máxima verosimilitud con los grados de unos pocos nodos muestreados uniformemente. [3] Sin embargo, dado que el muestreo uniforme no obtiene suficientes muestras de la importante cola pesada de la distribución de grados de la ley de potencia, este método puede producir un sesgo grande y una varianza. Recientemente se ha propuesto muestrear amigos aleatorios (es decir, extremos aleatorios de enlaces aleatorios) que tienen más probabilidades de provenir de la cola de la distribución de grados como resultado de la paradoja de la amistad . [45] [46] Teóricamente, la estimación de máxima verosimilitud con amigos aleatorios conduce a un sesgo menor y una varianza menor en comparación con el enfoque clásico basado en el muestreo uniforme. [46]