Una red biológica es un método para representar sistemas como conjuntos complejos de interacciones binarias o relaciones entre varias entidades biológicas. [1] En general, las redes o gráficos se utilizan para capturar relaciones entre entidades u objetos. [1] Una representación gráfica típica consiste en un conjunto de nodos conectados por aristas .
Ya en 1736 Leonhard Euler analizó un problema del mundo real conocido como los Siete Puentes de Königsberg , que sentó las bases de la teoría de grafos . Entre los años 1930 y 1950 se desarrolló el estudio de los grafos aleatorios . A mediados de los años 1990, se descubrió que muchos tipos diferentes de redes "reales" tienen propiedades estructurales bastante diferentes de las redes aleatorias. [2] A fines de la década de 2000, las redes libres de escala y de mundo pequeño comenzaron a dar forma al surgimiento de la biología de sistemas, la biología de redes y la medicina de redes. [1] En 2014, Frank Emmert-Streib utilizó métodos teóricos de grafos para analizar redes biológicas.
En la década de 1980, los investigadores comenzaron a considerar el ADN o los genomas como el almacenamiento dinámico de un sistema de lenguaje con estados finitos computables precisos representados como una máquina de estados finitos . [3] Las investigaciones recientes sobre sistemas complejos también han sugerido algunos puntos en común de gran alcance en la organización de la información en problemas de biología, informática y física .
Las redes de interacción proteína-proteína (PIN) representan la relación física entre las proteínas presentes en una célula, donde las proteínas son nodos y sus interacciones son bordes no dirigidos . [4] Debido a su naturaleza no dirigida, es difícil identificar todas las proteínas involucradas en una interacción. Las interacciones proteína-proteína (PPI) son esenciales para los procesos celulares y también las redes más intensamente analizadas en biología. Las PPI se pueden descubrir mediante varias técnicas experimentales, entre las cuales el sistema de dos híbridos de levadura es una técnica comúnmente utilizada para el estudio de interacciones binarias. [5] Recientemente, estudios de alto rendimiento que utilizan espectrometría de masas han identificado grandes conjuntos de interacciones de proteínas. [6]
Muchos esfuerzos internacionales han dado como resultado bases de datos que catalogan interacciones proteína-proteína determinadas experimentalmente. Algunas de ellas son la Base de Datos de Referencia de Proteínas Humanas , la Base de Datos de Proteínas Interactuantes , la Base de Datos de Interacción Molecular (MINT), [7] IntAct, [8] y BioGRID . [9] Al mismo tiempo, se han propuesto múltiples enfoques computacionales para predecir interacciones. [10] FunCoup y STRING son ejemplos de dichas bases de datos, donde las interacciones proteína-proteína inferidas a partir de múltiples evidencias se recopilan y se ponen a disposición para uso público.
Estudios recientes han indicado la conservación de redes moleculares a través del tiempo evolutivo profundo. [11] Además, se ha descubierto que las proteínas con altos grados de conectividad tienen más probabilidades de ser esenciales para la supervivencia que las proteínas con grados menores. [12] Esta observación sugiere que la composición general de la red (no simplemente las interacciones entre pares de proteínas) es vital para el funcionamiento general de un organismo.
El genoma codifica miles de genes cuyos productos ( ARNm , proteínas) son cruciales para los diversos procesos de la vida, como la diferenciación celular, la supervivencia celular y el metabolismo. Los genes producen dichos productos a través de un proceso llamado transcripción, que está regulado por una clase de proteínas llamadas factores de transcripción . Por ejemplo, el genoma humano codifica casi 1.500 factores de transcripción que se unen al ADN y regulan la expresión de más de 20.000 genes humanos. [13] El conjunto completo de productos genéticos y las interacciones entre ellos constituyen las redes reguladoras de genes (GRN). Las GRN regulan los niveles de productos genéticos dentro de la célula y, a su vez, los procesos celulares.
Las GRN se representan con genes y factores de transcripción como nodos y la relación entre ellos como bordes. Estos bordes son direccionales, lo que representa la relación reguladora entre los dos extremos del borde. Por ejemplo, el borde dirigido del gen A al gen B indica que A regula la expresión de B. Por lo tanto, estos bordes direccionales no solo pueden representar la promoción de la regulación génica, sino también su inhibición.
Las GRN se construyen generalmente utilizando el conocimiento de regulación genética disponible en bases de datos como Reactome y KEGG . Las tecnologías de medición de alto rendimiento, como microarrays , RNA-Seq , ChIP-chip y ChIP-seq , permitieron la acumulación de datos transcriptómicos a gran escala, que podrían ayudar a comprender los complejos patrones de regulación genética. [14] [15]
Las redes de coexpresión génica pueden percibirse como redes de asociación entre variables que miden la abundancia de transcripción. Estas redes se han utilizado para proporcionar un análisis biológico de sistemas de datos de microarrays de ADN, datos de secuenciación de ARN, datos de miARN, etc. El análisis de redes de coexpresión génica ponderadas se utiliza ampliamente para identificar módulos de coexpresión y genes centrales intramodulares. [16] Los módulos de coexpresión pueden corresponder a tipos de células o vías, mientras que los centros intramodulares altamente conectados pueden interpretarse como representantes de sus respectivos módulos.
Las células descomponen los alimentos y nutrientes en pequeñas moléculas necesarias para el procesamiento celular a través de una serie de reacciones bioquímicas. Estas reacciones bioquímicas son catalizadas por enzimas . El conjunto completo de todas estas reacciones bioquímicas en todas las vías representa la red metabólica . Dentro de la red metabólica, las pequeñas moléculas toman el papel de nodos, y pueden ser carbohidratos, lípidos o aminoácidos. Las reacciones que convierten estas pequeñas moléculas de una forma a otra se representan como bordes. Es posible utilizar análisis de redes para inferir cómo actúa la selección en las vías metabólicas. [17]
Las señales se transducen dentro de las células o entre células y, por lo tanto, forman redes de señalización complejas que desempeñan un papel clave en la estructura del tejido. Por ejemplo, la vía MAPK/ERK se transduce desde la superficie celular hasta el núcleo celular mediante una serie de interacciones proteína-proteína, reacciones de fosforilación y otros eventos. [18] Las redes de señalización generalmente integran redes de interacción proteína-proteína , redes reguladoras de genes y redes metabólicas . [19] [20] Las tecnologías de secuenciación de células individuales permiten la extracción de señalización intercelular; un ejemplo es NicheNet, que permite modelar la comunicación intercelular vinculando ligandos a genes diana. [21]
Las complejas interacciones que se dan en el cerebro lo convierten en un candidato perfecto para aplicar la teoría de redes. Las neuronas del cerebro están profundamente conectadas entre sí, y esto da como resultado la presencia de redes complejas en los aspectos estructurales y funcionales del cerebro. [22] Por ejemplo, se han demostrado propiedades de red de mundo pequeño en las conexiones entre regiones corticales del cerebro de los primates [23] o durante la deglución en los humanos. [24] Esto sugiere que las áreas corticales del cerebro no interactúan directamente entre sí, sino que se puede llegar a la mayoría de las áreas desde todas las demás a través de solo unas pocas interacciones.
Todos los organismos están conectados a través de interacciones alimentarias. Si una especie come o es comida por otra especie, están conectados en una intrincada red alimentaria de interacciones depredador-presa. La estabilidad de estas interacciones ha sido una pregunta de larga data en ecología. [25] Es decir, si se eliminan ciertos individuos, ¿qué sucede con la red (es decir, colapsa o se adapta)? El análisis de redes se puede utilizar para explorar la estabilidad de la red alimentaria y determinar si ciertas propiedades de la red dan como resultado redes más estables. Además, el análisis de redes se puede utilizar para determinar cómo las eliminaciones selectivas de especies influirán en la red alimentaria en su conjunto. [26] Esto es especialmente importante considerando la posible pérdida de especies debido al cambio climático global.
En biología, las interacciones por pares han sido históricamente el foco de un intenso estudio. Con los recientes avances en la ciencia de redes , se ha hecho posible ampliar las interacciones por pares para incluir individuos de muchas especies involucradas en muchos conjuntos de interacciones para comprender la estructura y función de redes ecológicas más grandes . [27] El uso del análisis de redes puede permitir tanto el descubrimiento como la comprensión de cómo estas interacciones complejas se vinculan entre sí dentro de la red del sistema, una propiedad que anteriormente se ha pasado por alto. Esta poderosa herramienta permite el estudio de varios tipos de interacciones (desde competitivas hasta cooperativas ) utilizando el mismo marco general. [28] Por ejemplo, las interacciones planta- polinizador son mutuamente beneficiosas y a menudo involucran muchas especies diferentes de polinizadores, así como muchas especies diferentes de plantas. Estas interacciones son fundamentales para la reproducción de las plantas y, por lo tanto, la acumulación de recursos en la base de la cadena alimentaria para los consumidores primarios, sin embargo, estas redes de interacción están amenazadas por el cambio antropogénico . El uso del análisis de redes puede iluminar cómo funcionan las redes de polinización y puede, a su vez, informar los esfuerzos de conservación. [29] Dentro de las redes de polinización, la anidación (es decir, los especialistas interactúan con un subconjunto de especies con las que interactúan los generalistas), la redundancia (es decir, la mayoría de las plantas son polinizadas por muchos polinizadores) y la modularidad juegan un papel importante en la estabilidad de la red. [29] [30] Estas propiedades de la red pueden realmente funcionar para frenar la propagación de los efectos de perturbación a través del sistema y potencialmente amortiguar un poco la red de polinización de los cambios antropogénicos. [30] De manera más general, la estructura de las interacciones de las especies dentro de una red ecológica puede decirnos algo sobre la diversidad, la riqueza y la robustez de la red. [31] Los investigadores pueden incluso comparar las construcciones actuales de redes de interacciones de especies con reconstrucciones históricas de redes antiguas para determinar cómo han cambiado las redes con el tiempo. [32] Gran parte de la investigación sobre estas complejas redes de interacciones de especies se centra en comprender qué factores (por ejemplo, la riqueza de especies, la conectividad, la naturaleza del entorno físico) conducen a la estabilidad de la red. [33] [34]
El análisis de redes proporciona la capacidad de cuantificar asociaciones entre individuos, lo que permite inferir detalles sobre la red en su conjunto a nivel de especie y/o población. [35] Una de las características más atractivas del paradigma de redes sería que proporciona un marco conceptual único en el que se puede estudiar la organización social de los animales en todos los niveles (individual, díada, grupo, población) y para todos los tipos de interacción (agresiva, cooperativa, sexual, etc.). [36]
Los investigadores interesados en la etología en muchos taxones, desde insectos hasta primates, están comenzando a incorporar el análisis de redes en sus investigaciones. Los investigadores interesados en insectos sociales (por ejemplo, hormigas y abejas) han utilizado mejor los análisis de redes para comprender la división del trabajo, la asignación de tareas y la optimización de la búsqueda de alimento dentro de las colonias. [37] [38] [39] Otros investigadores están interesados en cómo las propiedades específicas de la red a nivel de grupo y/o población pueden explicar los comportamientos a nivel individual. Los estudios han demostrado cómo la estructura de la red social animal puede verse influenciada por factores que van desde las características del entorno hasta las características del individuo, como la experiencia de desarrollo y la personalidad. A nivel del individuo, el patrón de conexiones sociales puede ser un determinante importante de la aptitud , prediciendo tanto la supervivencia como el éxito reproductivo. A nivel de población, la estructura de la red puede influir en el patrón de los procesos ecológicos y evolutivos, como la selección dependiente de la frecuencia y la transmisión de enfermedades e información. [40] Por ejemplo, un estudio sobre los saltarines de cola de alambre (un pequeño pájaro paseriforme) encontró que el grado de un macho en la red predecía en gran medida la capacidad del macho para ascender en la jerarquía social (es decir, eventualmente obtener un territorio y apareamientos). [41] En los grupos de delfines mulares , el grado de un individuo y los valores de centralidad de intermediación pueden predecir si ese individuo exhibirá o no ciertos comportamientos, como el uso de caídas laterales y de colas caídas al revés para liderar los esfuerzos de viaje en grupo; los individuos con altos valores de centralidad de intermediación están más conectados y pueden obtener más información y, por lo tanto, son más adecuados para liderar los viajes en grupo y, por lo tanto, tienden a exhibir estos comportamientos de señalización más que otros miembros del grupo. [42]
El análisis de redes sociales también se puede utilizar para describir la organización social dentro de una especie de manera más general, lo que con frecuencia revela importantes mecanismos próximos que promueven el uso de ciertas estrategias de comportamiento. Estas descripciones se vinculan con frecuencia a propiedades ecológicas (por ejemplo, distribución de recursos). Por ejemplo, los análisis de redes revelaron diferencias sutiles en la dinámica de grupo de dos especies de fisión-fusión de équidos relacionadas, la cebra de Grevy y los onagros , que viven en entornos variables; las cebras de Grevy muestran preferencias distintas en sus elecciones de asociación cuando se fisionan en grupos más pequeños, mientras que los onagros no lo hacen. [43] De manera similar, los investigadores interesados en los primates también han utilizado análisis de redes para comparar las organizaciones sociales en los diversos órdenes de primates , lo que sugiere que el uso de medidas de red (como la centralidad , la asortatividad , la modularidad y la intermediación) puede ser útil en términos de explicar los tipos de comportamientos sociales que vemos dentro de ciertos grupos y no en otros. [44]
Finalmente, el análisis de redes sociales también puede revelar fluctuaciones importantes en los comportamientos animales en entornos cambiantes. Por ejemplo, los análisis de redes en hembras de babuinos chacma ( Papio hamadryas ursinus ) revelaron importantes cambios dinámicos a lo largo de las estaciones que antes eran desconocidos; en lugar de crear vínculos sociales estables y duraderos con amigos, se descubrió que los babuinos exhibían relaciones más variables que dependían de contingencias a corto plazo relacionadas con la dinámica a nivel de grupo, así como con la variabilidad ambiental. [45] Los cambios en el entorno de la red social de un individuo también pueden influir en características como la "personalidad": por ejemplo, las arañas sociales que se juntan con vecinos más audaces tienden a aumentar también en audacia. [46] Este es un conjunto muy pequeño de ejemplos generales de cómo los investigadores pueden usar el análisis de redes para estudiar el comportamiento animal. La investigación en esta área se está expandiendo actualmente muy rápidamente, especialmente desde que el desarrollo más amplio de etiquetas transmitidas por animales y la visión por computadora se pueden utilizar para automatizar la recopilación de asociaciones sociales. [47] El análisis de redes sociales es una herramienta valiosa para estudiar el comportamiento animal en todas las especies animales y tiene el potencial de descubrir nueva información sobre el comportamiento animal y la ecología social que anteriormente era poco comprendida.
Dentro de un núcleo, el ADN está en constante movimiento. Acciones perpetuas como el plegamiento del genoma y la extrusión de cohesinas transforman la forma de un genoma en tiempo real. La ubicación espacial de las hebras de cromatina en relación con las demás desempeña un papel importante en la activación o supresión de ciertos genes. Las redes de cromatina ADN-ADN ayudan a los biólogos a comprender estas interacciones mediante el análisis de los puntos en común entre diferentes loci . El tamaño de una red puede variar significativamente, desde unos pocos genes hasta varios miles y, por lo tanto, el análisis de redes puede proporcionar un apoyo vital para comprender las relaciones entre diferentes áreas del genoma. Como ejemplo, el análisis de loci espacialmente similares dentro de la organización en un núcleo con el mapeo de la arquitectura del genoma (GAM) se puede utilizar para construir una red de loci con bordes que representan regiones genómicas altamente vinculadas.
El primer gráfico muestra la región Hist1 del genoma del ratón mm9, donde cada nodo representa un loci genómico. Dos nodos están conectados por un borde si su desequilibrio de ligamiento es mayor que el promedio en las 81 ventanas genómicas. Las ubicaciones de los nodos dentro del gráfico se seleccionan aleatoriamente y la metodología de elección de los bordes produce una representación gráfica simple de mostrar, pero rudimentaria, de las relaciones en el conjunto de datos. El segundo gráfico ejemplifica la misma información que el anterior; sin embargo, la red comienza con cada loci colocado secuencialmente en una configuración de anillo. Luego, une los nodos mediante interpolación lineal por su ligamiento como porcentaje. La figura ilustra fuertes conexiones entre las ventanas genómicas centrales, así como los loci del borde al principio y al final de la región Hist1.
Para extraer información útil de una red biológica, es fundamental comprender las técnicas estadísticas y matemáticas para identificar relaciones dentro de una red. Los procedimientos para identificar asociaciones, comunidades y centralidad dentro de los nodos de una red biológica pueden brindar información sobre las relaciones de lo que representan los nodos, ya sean genes, especies, etc. La formulación de estos métodos trasciende las disciplinas y se basa en gran medida en la teoría de grafos , la informática y la bioinformática .
Existen muchas formas diferentes de medir las relaciones de los nodos al analizar una red. En muchos casos, la medida utilizada para encontrar nodos que comparten similitud dentro de una red es específica para la aplicación en la que se utiliza. Uno de los tipos de medidas que utilizan los biólogos es la correlación , que se centra específicamente en la relación lineal entre dos variables. [48] Como ejemplo, el análisis de redes de coexpresión génica ponderada utiliza la correlación de Pearson para analizar la expresión génica vinculada y comprender la genética a nivel de sistemas. [49] Otra medida de correlación es el desequilibrio de ligamiento . El desequilibrio de ligamiento describe la asociación no aleatoria de secuencias genéticas entre loci en un cromosoma dado. [50] Un ejemplo de su uso es la detección de relaciones en datos GAM a lo largo de intervalos genómicos basados en frecuencias de detección de ciertos loci. [51]
El concepto de centralidad puede ser extremadamente útil al analizar las estructuras de redes biológicas. Existen muchos métodos diferentes para medir la centralidad, como la centralidad de intermediación, el grado, el vector propio y la centralidad de Katz. Cada tipo de técnica de centralidad puede proporcionar diferentes perspectivas sobre los nodos de una red en particular; sin embargo, todas comparten la característica común de que miden la prominencia de un nodo en una red. [52] En 2005, los investigadores de la Facultad de Medicina de Harvard utilizaron medidas de centralidad con la red de interacción de proteínas de levadura. Descubrieron que las proteínas que exhibían una alta centralidad de intermediación eran más esenciales y se traducían de manera más cercana a la edad evolutiva de una proteína dada. [53]
El estudio de la estructura comunitaria de una red mediante la subdivisión de grupos de nodos en regiones similares puede ser una herramienta integral para la bioinformática al explorar los datos como una red. [54] Una red alimentaria de The Secaucus High School Marsh ejemplifica los beneficios de la agrupación, ya que las relaciones entre los nodos son mucho más fáciles de analizar con comunidades bien hechas. Si bien el primer gráfico es difícil de visualizar, el segundo proporciona una mejor vista de los focos de relaciones alimentarias altamente conectadas que se esperarían en una red alimentaria. El problema de la detección de comunidades sigue siendo un problema activo. Los científicos y los teóricos de grafos descubren continuamente nuevas formas de subdividir redes y, por lo tanto, existe una gran cantidad de algoritmos diferentes para crear estas relaciones. [55] Al igual que muchas otras herramientas que utilizan los biólogos para comprender los datos con modelos de red, cada algoritmo puede proporcionar su propia perspectiva única y puede variar ampliamente en aspectos como la precisión o la complejidad temporal del cálculo. En 2002, un grupo de biólogos dividió en comunidades una red alimentaria de mamíferos marinos en la bahía de Chesapeake utilizando un algoritmo de detección de comunidades basado en los vecinos de los nodos con un alto grado de centralidad. Las comunidades resultantes mostraron una división considerable entre los organismos pelágicos y bentónicos. [56] Dos algoritmos de detección de comunidades muy comunes para redes biológicas son el método de Louvain y el algoritmo de Leiden.
El método de Louvain es un algoritmo voraz que intenta maximizar la modularidad , lo que favorece los bordes pesados dentro de las comunidades y los bordes dispersos entre ellas, dentro de un conjunto de nodos. El algoritmo comienza con cada nodo estando en su propia comunidad y agregándose iterativamente a la comunidad del nodo particular que favorece una mayor modularidad. [57] [58] Una vez que no se puede producir un aumento de la modularidad uniendo nodos a una comunidad, se construye una nueva red ponderada de comunidades como nodos con bordes que representan bordes entre comunidades y bucles que representan bordes dentro de una comunidad. El proceso continúa hasta que no se produce ningún aumento en la modularidad. [59] Si bien el método de Louvain proporciona una buena detección de comunidades, hay algunas formas en las que está limitado. Al centrarse principalmente en maximizar una medida dada de modularidad, puede conducir a crear comunidades mal conectadas degradando un modelo con el fin de maximizar una métrica de modularidad; sin embargo, el método de Louvain funciona bastante bien y puede ser fácil de entender en comparación con muchos otros algoritmos de detección de comunidades. [58]
El algoritmo de Leiden amplía el método de Louvain al ofrecer una serie de mejoras. Al unir nodos a una comunidad, solo se tienen en cuenta los vecindarios que han cambiado recientemente. Esto mejora enormemente la velocidad de fusión de nodos. Otra optimización se encuentra en la fase de refinamiento, en la que el algoritmo elige aleatoriamente un nodo de un conjunto de comunidades con el que fusionarse. Esto permite una mayor profundidad en la elección de comunidades, ya que Louvain se centra únicamente en maximizar la modularidad elegida. El algoritmo de Leiden, aunque es más complejo que Louvain, funciona más rápido con una mejor detección de comunidades y puede ser una herramienta valiosa para identificar grupos. [58]
Los motivos de red , o patrones de interacción recurrente estadísticamente significativos dentro de una red, son una herramienta de uso común para comprender las redes biológicas. Un caso de uso importante de los motivos de red es en neurofisiología , donde el análisis de motivos se utiliza comúnmente para comprender las funciones neuronales interconectadas en diferentes escalas. [60] Como ejemplo, en 2017, investigadores de la Universidad Normal de Beijing analizaron motivos de red de 2 y 3 nodos altamente representados en redes cerebrales funcionales dirigidas construidas a partir de datos de fMRI en estado de reposo para estudiar los mecanismos básicos en el flujo de información cerebral. [61]