Red de dependencia

El enfoque de redes de dependencia proporciona un análisis a nivel de sistema de la actividad y la topología de redes dirigidas . El enfoque extrae relaciones topológicas causales entre los nodos de la red (cuando se analiza la estructura de la red) y proporciona un paso importante hacia la inferencia de relaciones de actividad causal entre los nodos de la red (al analizar la actividad de la red). Esta metodología se introdujo originalmente para el estudio de datos financieros, ^[1]^[2] se ha extendido y aplicado a otros sistemas, como el sistema inmunológico , ^[3] y las redes semánticas . ^[4]

En el caso de la actividad de la red, el análisis se basa en correlaciones parciales . ^[5]^[6]^[7]^[8]^{[9] En palabras simples, la}correlación parcial (o residual) es una medida del efecto (o contribución) de un nodo dado, digamos j , sobre las correlaciones entre otro par de nodos, digamos i y k . Usando este concepto, la dependencia de un nodo sobre otro nodo se calcula para toda la red. Esto da como resultado una matriz de adyacencia ponderada dirigida de una red completamente conectada. Una vez que se ha construido la matriz de adyacencia, se pueden usar diferentes algoritmos para construir la red, como una red de umbral, un árbol de expansión mínimo (MST) , un gráfico planar de filtrado máximo (PMFG) y otros.

Red de dependencia de datos financieros para 300 de las acciones del índice S&P500, negociadas entre 2001 y 2003. Las acciones están agrupadas por sectores económicos y la flecha apunta en la dirección de influencia. El centro de la red, el sector más influyente, es el sector financiero. Reproducción de Kenett et al., PLoS ONE 5(12), e15032 (2010)

Importancia

La red de dependencia basada en correlación parcial es una clase de red de correlación, capaz de descubrir relaciones ocultas entre sus nodos.

Esta metodología original fue presentada por primera vez a finales de 2010, publicada en PLoS ONE . ^[1] Los autores descubrieron cuantitativamente información oculta sobre la estructura subyacente del mercado de valores de EE. UU ., información que no estaba presente en las redes de correlación estándar . Uno de los principales resultados de este trabajo es que para el período de tiempo investigado (2001-2003), la estructura de la red estaba dominada por empresas pertenecientes al sector financiero , que son los centros de la red de dependencia. Por lo tanto, pudieron mostrar cuantitativamente por primera vez las relaciones de dependencia entre los diferentes sectores económicos . A raíz de este trabajo, la metodología de la red de dependencia se ha aplicado al estudio del sistema inmunológico , ^[3] y las redes semánticas . ^[4]

Red de dependencia de la actividad de anticuerpos específicos, medida para un grupo de madres. El panel (a) presenta la red de dependencia y el panel (b) la red de correlación estándar. Reproducción de Madi et al., Chaos 21, 016109 (2011)

Ejemplo de red de dependencia de asociaciones, construida a partir de una red semántica completa. Reproducción de Kenett et al., PLoS ONE 6(8): e23912 (2011)

Descripción general

Para ser más específicos, la correlación parcial del par (i, k) dado j , es la correlación entre ellos después de la sustracción adecuada de las correlaciones entre i y j y entre k y j . Definida de esta manera, la diferencia entre las correlaciones y las correlaciones parciales proporciona una medida de la influencia del nodo j en la correlación . Por lo tanto, definimos la influencia del nodo j en el nodo i , o la dependencia del nodo i en el nodo j − D ( i , j ), como la suma de la influencia del nodo j en las correlaciones del nodo i con todos los demás nodos.

En el caso de la topología de red, el análisis se basa en el efecto de la eliminación de nodos en las rutas más cortas entre los nodos de la red. Más específicamente, definimos la influencia del nodo j en cada par de nodos (i,k) como la inversa de la distancia topológica entre estos nodos en presencia de j menos la distancia inversa entre ellos en ausencia del nodo j . Luego definimos la influencia del nodo j en el nodo i , o la dependencia del nodo i en el nodo j − D ( i , j ), como la suma de la influencia del nodo j en las distancias entre el nodo i y todos los demás nodos k .

Las redes de dependencia de la actividad

Las correlaciones nodo-nodo

Las correlaciones nodo-nodo se pueden calcular mediante la fórmula de Pearson :

C_{i,j}={\frac {\left\langle (X_{i}(n)-\mu _{i})(X_{j}(n)-\mu _{j})\right\rangle }{\sigma _{i}\sigma _{j}}}

Donde y son la actividad de los nodos i y j del sujeto n, μ representa el promedio y sigma la desviación estándar de los perfiles dinámicos de los nodos i y j . Nótese que las correlaciones nodo-nodo (o para simplificar, las correlaciones de nodo) para todos los pares de nodos definen una matriz de correlación simétrica cuyo elemento es la correlación entre los nodos i y j . $Estilo de visualización X_{i}(n)}$ $Estilo de visualización X_ {j}(n)}$ ${\estilo de visualización (i,j)}$

Correlaciones parciales

A continuación, utilizamos las correlaciones de nodos resultantes para calcular las correlaciones parciales. El coeficiente de correlación parcial de primer orden es una medida estadística que indica cómo una tercera variable afecta la correlación entre otras dos variables. La correlación parcial entre los nodos i y k con respecto a un tercer nodo se define como: $j-PC(i,k\mid j)$

PC(i,k\mid j)={\frac {C(i,k)-C(i,j)C(k,j)}{\sqrt {[1-C^{2}(i,j)][1-C^{2}(k,j)]}}}

donde y son las correlaciones de nodos definidas anteriormente. $C(i,j),C(i,k)$ ${\estilo de visualización C(j,k)}$

La influencia de la correlación y la dependencia de la correlación

El efecto relativo de las correlaciones y del nodo j sobre la correlación C ( i , k ) viene dado por: $C(i,j)$ ${\estilo de visualización C(j,k)}$

d(i,k\mid j)\equiv C(i,k)-PC(i,k|j)

Esto evita el caso trivial en el que el nodo j parece afectar fuertemente la correlación , principalmente porque y tienen valores pequeños. Observamos que esta cantidad puede verse como la dependencia de la correlación de C ( i , k ) en el nodo j (el término utilizado aquí) o como la influencia de la correlación del nodo j en la correlación C ( i , k ). $C(i,k)$ $C(i,j),C(i,k)$ ${\estilo de visualización C(j,k)}$

Dependencias de la actividad del nodo

A continuación, definimos la influencia total del nodo j sobre el nodo i , o la dependencia D ( i , j ) del nodo i sobre el nodo j como:

D(i,j)={\frac {1}{N-1}}\sum _{k\neq j}^{N-1}d(i,k\mid j)

Como se define, D ( i , j ) es una medida de la influencia promedio del nodo j en las correlaciones C(i,k) sobre todos los nodos k no iguales a j . Las dependencias de actividad del nodo definen una matriz de dependencia D cuyo elemento ( i , j ) es la dependencia del nodo i en el nodo j . Es importante notar que mientras que la matriz de correlación C es una matriz simétrica, la matriz de dependencia D es asimétrica – ya que la influencia del nodo j en el nodo i no es igual a la influencia del nodo i en el nodo j . Por esta razón, algunos de los métodos usados en los análisis de la matriz de correlación (por ejemplo, el PCA) tienen que ser reemplazados o son menos eficientes. Sin embargo, hay otros métodos, como los usados aquí, que pueden explicar adecuadamente la naturaleza asimétrica de la matriz de dependencia. $D(i,j)\neq D(j,i)$

Las redes de dependencia estructural

Influencia de la ruta y dependencia de la distancia: El efecto relativo del nodo j sobre la ruta dirigida – la ruta topológica más corta con cada segmento corresponde a una distancia 1, entre los nodos i y k se da: $DP(i\rightarrow k|j)$

DP(i\rightarrow k\mid j)\equiv {\frac {1}{td(i\rightarrow k\mid j^{+})}}-{\frac {1}{td(i\rightarrow k\mid j^{-})}}

donde y son la ruta topológica dirigida más corta desde el nodo i al nodo k en presencia y ausencia del nodo j respectivamente. $td(i\rightarrow k|j^{+})$ $td(i\rightarrow k\mid j^{-})$

Dependencias estructurales de los nodos

A continuación, definimos la influencia total del nodo j sobre el nodo i , o la dependencia D ( i , j ) del nodo i sobre el nodo j como:

$D(i,j)={\frac {1}{N-1}}\sum _{k=1}^{N-1}DP(i\rightarrow k\mid j)$

Como se define, D ( i , j ) es una medida de la influencia promedio del nodo j en las rutas dirigidas desde el nodo i a todos los demás nodos k . Las dependencias estructurales de los nodos definen una matriz de dependencia D cuyo elemento ( i , j ) es la dependencia del nodo i en el nodo j , o la influencia del nodo j en el nodo i . Es importante notar que la matriz de dependencia D no es simétrica, ya que la influencia del nodo j en el nodo i no es igual a la influencia del nodo i en el nodo j . $D(i,j)\neq D(j,i)$

Visualización de la red de dependencia

La matriz de dependencia es la matriz de adyacencia ponderada, que representa la red completamente conectada. Se pueden aplicar diferentes algoritmos para filtrar la red completamente conectada para obtener la información más significativa, como usar un enfoque de umbral, ^[1] o diferentes algoritmos de poda. Un método ampliamente utilizado para construir subgrafos informativos de una red completa es el árbol de expansión mínimo (MST). ^[10]^[11]^[12]^[13]^[14] Otro subgrafo informativo, que retiene más información (en comparación con el MST) es el grafo planar de filtrado máximo (PMFG) ^[15] que se utiliza aquí. Ambos métodos se basan en la agrupación jerárquica y los subgrafos resultantes incluyen todos los N nodos en la red cuyos bordes representan las correlaciones de asociación más relevantes. El subgrafo MST contiene bordes sin bucles, mientras que el subgrafo PMFG contiene bordes. ${\estilo de visualización (N-1)}$ ${\estilo de visualización 3(N-2)}$

Véase también

Referencias

^ abc Kenett, Dror Y.; Tumminello, Michele; Madi, Asaf; Gur-Gershgoren, Gitit; Mantegna, Rosario N.; Ben-Jacob, Eshel (20 de diciembre de 2010). Scalas, Enrico (ed.). "El predominio del sector financiero revelado por el análisis de correlación parcial del mercado de valores". PLOS ONE . 5 (12): e15032. Bibcode :2010PLoSO...515032K. doi : 10.1371/journal.pone.0015032 . ISSN 1932-6203. PMC 3004792 . PMID 21188140.
^ Dror Y. Kenett, Yoash Shapira, Gitit Gur-Gershgoren y Eshel Ben-Jacob (enviado), Análisis de la fuerza cohesiva del índice del mercado de valores de EE. UU., Actas de la Conferencia internacional de 2011 sobre econofísica, Kavala, Grecia
^ ab Asaf Madi, Dror Y. Kenett, Sharron Bransburg-Zabary, Yifat Merbl, Francisco J. Quintana, Stefano Boccaletti, Alfred I. Tauber, Irun R. Cohen y Eshel Ben-Jacob (2011), Los análisis de las redes de dependencia de antígenos revelan la reorganización del sistema inmunológico entre el nacimiento y la edad adulta, Chaos 21, 016109 Archivado el 30 de marzo de 2012 en Wayback Machine.
^ ab Kenett, Yoed N.; Kenett, Dror Y.; Ben-Jacob, Eshel; Faust, Miriam (24 de agosto de 2011). Perc, Matjaz (ed.). "Características globales y locales de las redes semánticas: evidencia del léxico mental hebreo". PLOS ONE . 6 (8): e23912. Bibcode :2011PLoSO...623912K. doi : 10.1371/journal.pone.0023912 . ISSN 1932-6203. PMC 3161081 . PMID 21887343.
^ Kunihiro Baba, Ritel Shibata, Masaaki Sibuya (2004), Correlación parcial y correlación condicional como medidas de independencia condicional, Aust New Zealand J Stat 46(4): 657–774
^ Yoash Shapira, Dror Y. Kenett y Eshel Ben-Jacob (2009), El efecto cohesivo del índice en las correlaciones del mercado de valores, Journal of Physics B. vol. 72, núm. 4, págs. 657–669
^ Kenett, Dror Y.; Shapira, Yoash; Madi, Asaf; Bransburg-Zabary, Sharron; Gur-Gershgoren, Gitit; Ben-Jacob, Eshel (27 de abril de 2011). Scalas, Enrico (ed.). "El análisis de fuerza cohesiva del índice revela que el mercado estadounidense se volvió propenso a colapsos sistémicos desde 2002". PLOS ONE . 6 (4): e19378. Bibcode :2011PLoSO...619378K. doi : 10.1371/journal.pone.0019378 . ISSN 1932-6203. PMC 3083438 . PMID 21556323.
^ Dror Y. Kenett, Matthias Raddant, Thomas Lux y Eshel Ben-Jacob (enviado), Evolución de la uniformidad y la volatilidad en el mercado global estresado, PNAS
^ Eran Stark, Rotem Drori y Moshe Abeles (2006), El análisis de correlación cruzada parcial resuelve la ambigüedad en la codificación de múltiples características de movimiento, J Neurophysiol 95: 1966–1975
^ Rosario N. Mantegna, Estructura jerárquica en los mercados financieros, Eur. Phys. J. B 11 (1), 193–197 (1999) Archivado el 4 de febrero de 2023 en Wayback Machine.
^ Rosario N. Mantegna, Comunicaciones de Física Computacional 121–122, 153–156 (1999)
^ Guillermo J. Ortega, Rafael G. Sola y Jesús Pastor, Análisis de redes complejas de datos de ECoG humana, Neuroscience Letters 447 (2-3), 129–133 (2008) ^{[ enlace muerto permanente ]}
^ Michele Tumminello, Claudia Coronnello, Fabrizio Lillo, Salvatore Miccichè y Rrosario N. Mantegna, Árboles de expansión y estimaciones de confiabilidad bootstrap en redes basadas en correlación [1] Archivado el 27 de octubre de 2021 en Wayback Machine.
^ Douglas B. West, Introducción a la teoría de grafos, editado por Prentice-Hall, Englewood Cliffs, NJ, 2001
^ Michele Tumminello, Tomaso Aste, Tiziana Di Matteo y Rosario N. Mantegna, Una herramienta para filtrar información en sistemas complejos, PNAS 102 (30), 10421–10426 (2005)