Las interacciones proteína-proteína ( PPI ) son contactos físicos de alta especificidad establecidos entre dos o más moléculas de proteínas como resultado de eventos bioquímicos dirigidos por interacciones que incluyen fuerzas electrostáticas , enlaces de hidrógeno y el efecto hidrofóbico . Muchos son contactos físicos con asociaciones moleculares entre cadenas que ocurren en una célula o en un organismo vivo en un contexto biomolecular específico.
Las proteínas rara vez actúan solas ya que sus funciones tienden a estar reguladas. Muchos procesos moleculares dentro de una célula se llevan a cabo mediante máquinas moleculares que se construyen a partir de numerosos componentes proteicos organizados por sus PPI. Estas interacciones fisiológicas constituyen la llamada interactómica del organismo, mientras que los IBP aberrantes son la base de múltiples enfermedades relacionadas con la agregación, como las enfermedades de Creutzfeldt-Jakob y Alzheimer .
Los PPI han sido estudiados con muchos métodos y desde diferentes perspectivas: bioquímica , química cuántica , dinámica molecular , transducción de señales , entre otras. [1] [2] [3] Toda esta información permite la creación de grandes redes de interacción de proteínas [4] – similares a las redes metabólicas o genéticas/epigenéticas – que potencian el conocimiento actual sobre las cascadas bioquímicas y la etiología molecular de las enfermedades, así como el descubrimiento de supuestas dianas proteicas de interés terapéutico.
En muchas reacciones metabólicas, una proteína que actúa como transportadora de electrones se une a una enzima que actúa como su reductasa . Después de recibir un electrón, se disocia y luego se une a la siguiente enzima que actúa como su oxidasa (es decir, un aceptor del electrón). Estas interacciones entre proteínas dependen de una unión altamente específica entre proteínas para garantizar una transferencia de electrones eficiente. Ejemplos: componentes del sistema de cadena de fosforilación oxidativa mitocondrial citocromo c-reductasa/ citocromo c /citocromo c oxidasa; Sistemas P450 microsomales y mitocondriales. [5]
En el caso de los sistemas mitocondriales P450, los residuos específicos implicados en la unión de la proteína de transferencia de electrones adrenodoxina a su reductasa se identificaron como dos residuos Arg básicos en la superficie de la reductasa y dos residuos ácidos Asp en la adrenodoxina. [6] Un trabajo más reciente sobre la filogenia de la reductasa ha demostrado que estos residuos implicados en las interacciones proteína-proteína se han conservado a lo largo de la evolución de esta enzima. [7]
La actividad de la célula está regulada por señales extracelulares. La propagación de señales dentro y/o a lo largo del interior de las células depende de los PPI entre las distintas moléculas de señalización. El reclutamiento de vías de señalización a través de IBP se denomina transducción de señales y desempeña un papel fundamental en muchos procesos biológicos y en muchas enfermedades, incluidas la enfermedad de Parkinson y el cáncer.
Una proteína puede transportar otra proteína (por ejemplo, del citoplasma al núcleo o viceversa en el caso de las importinas de los poros nucleares ). [ cita necesaria ]
En muchos procesos biosintéticos, las enzimas interactúan entre sí para producir pequeños compuestos u otras macromoléculas. [ cita necesaria ]
La fisiología de la contracción muscular implica varias interacciones. Los filamentos de miosina actúan como motores moleculares y, al unirse a la actina, permiten el deslizamiento de los filamentos. [8] Además, los miembros de la familia de proteínas asociadas a gotitas de lípidos del músculo esquelético se asocian con otras proteínas, como activador de la lipasa de triglicéridos adiposos y su coactivador de identificación genética comparativa-58, para regular la lipólisis en el músculo esquelético.
Para describir los tipos de interacciones proteína-proteína (IBP) es importante considerar que las proteínas pueden interactuar de forma "transitoria" (para producir algún efecto específico en poco tiempo, como la transducción de señales) o interactuar con otras proteínas en un forma "estable" de formar complejos que se convierten en máquinas moleculares dentro de los sistemas vivos. Un ensamblaje de complejo proteico puede dar como resultado la formación de complejos homooligoméricos o heterooligoméricos . Además de los complejos convencionales, como enzima-inhibidor y anticuerpo-antígeno, también se pueden establecer interacciones entre dominio-dominio y dominio-péptido. Otra distinción importante para identificar las interacciones proteína-proteína es la forma en que se han determinado, ya que existen técnicas que miden interacciones físicas directas entre pares de proteínas, denominadas métodos “binarios”, mientras que existen otras técnicas que miden interacciones físicas entre grupos de proteínas. sin determinación por pares de proteínas asociadas, denominados métodos "co-complejos".
Los homooligómeros son complejos macromoleculares constituidos por un solo tipo de subunidad proteica . El ensamblaje de las subunidades proteicas está guiado por el establecimiento de interacciones no covalentes en la estructura cuaternaria de la proteína. La alteración de los homooligómeros para volver a los monómeros individuales iniciales a menudo requiere la desnaturalización del complejo. [9] Varias enzimas , proteínas transportadoras , proteínas de andamiaje y factores reguladores de la transcripción llevan a cabo sus funciones como homooligómeros. Distintas subunidades de proteínas interactúan en heterooligómeros, que son esenciales para controlar varias funciones celulares. La importancia de la comunicación entre proteínas heterólogas es aún más evidente durante los eventos de señalización celular y dichas interacciones sólo son posibles debido a dominios estructurales dentro de las proteínas (como se describe a continuación).
Las interacciones estables involucran proteínas que interactúan durante mucho tiempo, formando parte de complejos permanentes como subunidades, para poder desempeñar funciones funcionales. Suelen ser el caso de los homooligómeros (p. ej., el citocromo c ) y algunas proteínas heterooligoméricas, como las subunidades de la ATPasa . Por otro lado, una proteína puede interactuar brevemente y de manera reversible con otras proteínas sólo en determinados contextos celulares ( tipo celular , etapa del ciclo celular , factores externos, presencia de otras proteínas de unión, etc.), como ocurre con la mayoría de las proteínas. Proteínas implicadas en cascadas bioquímicas . Éstas se denominan interacciones transitorias. Por ejemplo, algunos receptores acoplados a proteína G sólo se unen transitoriamente a proteínas G i/o cuando son activados por ligandos extracelulares, [10] mientras que algunos receptores acoplados a G q , como el receptor muscarínico M3, se preacoplan con proteínas G q . antes de la unión receptor-ligando. [11] Las interacciones entre regiones proteicas intrínsecamente desordenadas y dominios proteicos globulares (es decir, MoRF ) son interacciones transitorias. [12]
Las interacciones covalentes son aquellas de asociación más fuerte y se forman mediante enlaces disulfuro o intercambio de electrones . Si bien son raras, estas interacciones son determinantes en algunas modificaciones postraduccionales , como la ubiquitinación y la SUMOilación . Los enlaces no covalentes suelen establecerse durante interacciones transitorias mediante la combinación de enlaces más débiles, como enlaces de hidrógeno , interacciones iónicas, fuerzas de Van der Waals o enlaces hidrófobos. [13]
Las moléculas de agua juegan un papel importante en las interacciones entre proteínas. [14] [15] Las estructuras cristalinas de complejos, obtenidas en alta resolución a partir de proteínas diferentes pero homólogas, han demostrado que algunas moléculas de agua de interfaz se conservan entre complejos homólogos. La mayoría de las moléculas de agua de la interfaz forman enlaces de hidrógeno con ambos socios de cada complejo. Algunos residuos de aminoácidos de interfaz o grupos atómicos de una proteína asociada participan en interacciones tanto directas como mediadas por agua con la otra proteína asociada. Las interacciones doblemente indirectas, mediadas por dos moléculas de agua, son más numerosas en los complejos homólogos de baja afinidad. [16] Experimentos de mutagénesis cuidadosamente realizados, por ejemplo cambiando un residuo de tirosina en fenilalanina, han demostrado que las interacciones mediadas por agua pueden contribuir a la energía de interacción. [17] Por lo tanto, las moléculas de agua pueden facilitar las interacciones y el reconocimiento cruzado entre proteínas.
Las estructuras moleculares de muchos complejos proteicos se han descubierto mediante la técnica de cristalografía de rayos X. [18] [19] La primera estructura que se resolvió mediante este método fue la de la mioglobina de cachalote por Sir John Cowdery Kendrew . [20] En esta técnica, los ángulos y las intensidades de un haz de rayos X difractados por átomos cristalinos se detectan en una película, produciendo así una imagen tridimensional de la densidad de electrones dentro del cristal. [21]
Posteriormente también se empezó a aplicar la resonancia magnética nuclear con el objetivo de desentrañar la estructura molecular de complejos proteicos. Uno de los primeros ejemplos fue la estructura de los dominios de unión a calmodulina unidos a calmodulina . [19] [22] Esta técnica se basa en el estudio de las propiedades magnéticas de los núcleos atómicos, determinando así las propiedades físicas y químicas de los átomos o moléculas correspondientes. La resonancia magnética nuclear es ventajosa para caracterizar IBP débiles. [23]
Algunas proteínas tienen dominios estructurales específicos o motivos de secuencia que proporcionan unión a otras proteínas. A continuación se muestran algunos ejemplos de dichos dominios:
El estudio de la estructura molecular puede proporcionar detalles finos sobre la interfaz que permite la interacción entre proteínas. Al caracterizar las interfaces PPI es importante tener en cuenta el tipo de complejo. [9]
Los parámetros evaluados incluyen tamaño (medido en dimensiones absolutas Å 2 o en área de superficie accesible a solventes (SASA) ), forma, complementariedad entre superficies, propensiones a la interfaz de residuos, hidrofobicidad, segmentación y estructura secundaria, y cambios conformacionales en la formación de complejos. [9]
La gran mayoría de las interfaces PPI reflejan la composición de las superficies proteicas, más que los núcleos proteicos, a pesar de estar frecuentemente enriquecidas en residuos hidrofóbicos, particularmente en residuos aromáticos. [25] Las interfaces PPI son dinámicas y frecuentemente planas, aunque también pueden ser globulares y sobresalientes. [26] Basándose en tres estructuras ( dímero de insulina , tripsina -complejo inhibidor de la tripsina pancreática y oxihemoglobina ), Cyrus Chothia y Joel Janin descubrieron que entre 1.130 y 1.720 Å 2 de superficie se eliminaban del contacto con el agua, lo que indica que la hidrofobicidad es un factor importante. de estabilización de los IPP. [27] Estudios posteriores refinaron la superficie enterrada de la mayoría de las interacciones a 1.600 ± 350 Å 2 . Sin embargo, también se observaron interfaces de interacción mucho más grandes y se asociaron con cambios significativos en la conformación de uno de los socios de interacción. [18] Las interfaces PPI exhiben forma y complementariedad electrostática. [9] [11]
Existen multitud de métodos para detectarlos. [1] [28] Cada uno de los enfoques tiene sus propias fortalezas y debilidades, especialmente con respecto a la sensibilidad y especificidad del método. Los métodos de alto rendimiento más convencionales y ampliamente utilizados son el cribado de dos híbridos de levadura y la purificación por afinidad acoplados a espectrometría de masas .
Este sistema fue descrito por primera vez en 1989 por Fields y Song utilizando Saccharomyces cerevisiae como modelo biológico. [29] [30] El híbrido de dos levaduras permite la identificación de PPI por pares (método binario) in vivo , en el que se analiza la interacción biofísica directa de las dos proteínas. El Y2H se basa en la reconstitución funcional del factor de transcripción de levadura Gal4 y la posterior activación de un informador selectivo como His3. Para probar la interacción de dos proteínas, se elaboran dos construcciones de expresión de proteínas: una proteína (X) se fusiona con el dominio de unión al ADN de Gal4 (DB) y una segunda proteína (Y) se fusiona con el dominio de activación de Gal4 (AD). En el ensayo, las células de levadura se transforman con estas construcciones. La transcripción de genes indicadores no ocurre a menos que el cebo (DB-X) y la presa (AD-Y) interactúen entre sí y formen un factor de transcripción Gal4 funcional. Por tanto, la interacción entre proteínas puede inferirse por la presencia de los productos resultantes de la expresión del gen informador. [13] [31] En los casos en los que el gen indicador expresa enzimas que permiten a la levadura sintetizar aminoácidos o nucleótidos esenciales, el crecimiento de la levadura en condiciones de medios selectivos indica que las dos proteínas analizadas están interactuando. Recientemente se publicó un software para detectar y priorizar interacciones entre proteínas. [32] [33]
A pesar de su utilidad, el sistema de dos híbridos de levadura tiene limitaciones. Utiliza levadura como sistema huésped principal, lo que puede ser un problema al estudiar proteínas que contienen modificaciones postraduccionales específicas de mamíferos. El número de IBP identificados suele ser bajo debido a una alta tasa de falsos negativos; [34] y subestima las proteínas de membrana , por ejemplo. [35] [36]
En los estudios iniciales que utilizaron Y2H, con frecuencia no se realizaron controles adecuados para los falsos positivos (por ejemplo, cuando DB-X activa el gen indicador sin la presencia de AD-Y), lo que llevó a una tasa de falsos positivos más alta de lo normal. Se debe implementar un marco empírico para controlar estos falsos positivos. [37] Las limitaciones en la menor cobertura de proteínas de membrana se han superado mediante la aparición de variantes de dos híbridos de levadura, como el doble híbrido de levadura de membrana (MITO) [36] y el sistema de ubiquitina dividida, [31] que no son limitado a interacciones que ocurren en el núcleo; y, el sistema bacteriano de dos híbridos, realizado en bacterias; [38]
La purificación por afinidad acoplada a la espectrometría de masas detecta principalmente interacciones estables y, por lo tanto, indica mejor los IBP funcionales in vivo. [39] [31] Este método comienza con la purificación de la proteína marcada, que se expresa en la célula generalmente en concentraciones in vivo , y sus proteínas que interactúan (purificación por afinidad). Uno de los métodos más ventajosos y ampliamente utilizados para purificar proteínas con un fondo muy bajo de contaminación es la purificación por afinidad en tándem , desarrollada por Bertrand Seraphin y Matthias Mann y sus respectivos colegas. Luego, los IBP se pueden analizar cuantitativa y cualitativamente mediante espectrometría de masas utilizando diferentes métodos: incorporación química, incorporación biológica o metabólica (SILAC) y métodos sin etiquetas. [9] Además, la teoría de redes se ha utilizado para estudiar todo el conjunto de interacciones proteína-proteína identificadas en las células. [4]
Este sistema fue desarrollado por primera vez por LaBaer y sus colegas en 2004 mediante el uso de un sistema de transcripción y traducción in vitro. Utilizan una plantilla de ADN que codifica el gen de interés fusionado con la proteína GST y se inmoviliza en la superficie sólida. El anticuerpo anti-GST y el ADN plasmídico biotinilado se unieron en un portaobjetos recubierto con aminopropiltrietoxisilano (APTES). BSA puede mejorar la eficiencia de unión del ADN. El ADN plasmídico biotinilado estaba unido por avidina. La nueva proteína se sintetizó utilizando un sistema de expresión libre de células, es decir, lisado de reticulocitos de conejo (RRL), y luego la nueva proteína se capturó a través del anticuerpo anti-GST unido al portaobjetos. Para probar la interacción proteína-proteína, el ADNc de la proteína objetivo y el ADNc de la proteína de consulta se inmovilizaron en un mismo portaobjetos recubierto. Mediante el uso de un sistema de transcripción y traducción in vitro, el mismo extracto sintetizó la proteína específica y la proteína de consulta. La proteína objetivo se unió a la matriz mediante el anticuerpo recubierto en el portaobjetos y se usó la proteína de consulta para sondear la matriz. La proteína de consulta se etiquetó con el epítopo de hemaglutinina (HA). Así, se visualizó la interacción entre las dos proteínas con el anticuerpo contra HA. [40] [41]
Cuando varias copias de un polipéptido codificado por un gen forman un complejo, esta estructura proteica se denomina multímero. Cuando se forma un multímero a partir de polipéptidos producidos por dos alelos mutantes diferentes de un gen particular, el multímero mixto puede exhibir una mayor actividad funcional que los multímeros no mezclados formados por cada uno de los mutantes solo. En tal caso, el fenómeno se denomina complementación intragénica (también llamada complementación interalélica). La complementación intragénica se ha demostrado en muchos genes diferentes en una variedad de organismos, incluidos los hongos Neurospora crassa , Saccharomyces cerevisiae y Schizosaccharomyces pombe ; la bacteria Salmonella typhimurium ; el virus bacteriófago T4 , [42] un virus de ARN [43] y los humanos. [44] En tales estudios, numerosas mutaciones defectuosas en el mismo gen a menudo se aislaron y mapearon en un orden lineal sobre la base de frecuencias de recombinación para formar un mapa genético del gen. Por separado, los mutantes se probaron en combinaciones por pares para medir la complementación. Un análisis de los resultados de tales estudios llevó a la conclusión de que la complementación intragénica, en general, surge de la interacción de monómeros polipeptídicos con diferentes defectos para formar un multímero. [45] Los genes que codifican polipéptidos formadores de multímeros parecen ser comunes. Una interpretación de los datos es que los monómeros polipeptídicos a menudo están alineados en el multímero de tal manera que los polipéptidos mutantes defectuosos en sitios cercanos en el mapa genético tienden a formar un multímero mixto que funciona mal, mientras que los polipéptidos mutantes defectuosos en sitios distantes tienden a formar un multímero mixto que funciona más eficazmente. La interacción directa de dos proteínas nacientes que emergen de ribosomas cercanos parece ser un mecanismo general para la formación de homooligómeros (multímeros). [46] Se identificaron cientos de oligómeros de proteínas que se ensamblan en células humanas mediante dicha interacción. [46] La forma más frecuente de interacción es entre las regiones N-terminales de las proteínas que interactúan. La formación de dímeros parece poder ocurrir independientemente de las máquinas de ensamblaje dedicadas. Jehle analizó las fuerzas intermoleculares probablemente responsables del autorreconocimiento y la formación de multímeros. [47]
Han ido surgiendo diversas técnicas para identificar los PPI junto con la progresión de la tecnología. Estos incluyen co-inmunoprecipitación, microarrays de proteínas , ultracentrifugación analítica , dispersión de luz , espectroscopia de fluorescencia , mapeo de interactomas de mamíferos basado en luminiscencia (LUMIER), sistemas de transferencia de energía por resonancia, trampa de interacción proteína-proteína de mamíferos, biosuperficies electroconmutables , complementación de fragmentos de proteínas. ensayo, así como mediciones sin etiquetas en tiempo real mediante resonancia de plasmón superficial y calorimetría . [35] [36]
La detección y caracterización experimental de los IBP requiere mucha mano de obra y mucho tiempo. Sin embargo, muchos PPI también se pueden predecir computacionalmente, normalmente utilizando datos experimentales como punto de partida. Sin embargo, también se han desarrollado métodos que permiten la predicción del PPI de novo, es decir, sin evidencia previa de estas interacciones.
El método Rosetta Stone o Domain Fusion se basa en la hipótesis de que las proteínas que interactúan a veces se fusionan en una sola proteína en otro genoma. [48] Por lo tanto, podemos predecir si dos proteínas pueden estar interactuando determinando si cada una tiene similitud de secuencia no superpuesta con una región de una secuencia de proteína única en otro genoma.
El método de Vecindad Conservada se basa en la hipótesis de que si los genes que codifican dos proteínas son vecinos en un cromosoma en muchos genomas, entonces probablemente estén relacionados funcionalmente (y posiblemente interactúen físicamente). [49]
El método del perfil filogenético se basa en la hipótesis de que si dos o más proteínas están presentes o ausentes simultáneamente en varios genomas, es probable que estén relacionadas funcionalmente. [49] Por lo tanto, las proteínas que potencialmente interactúan se pueden identificar determinando la presencia o ausencia de genes en muchos genomas y seleccionando aquellos genes que siempre están presentes o ausentes juntos.
La información disponible públicamente de documentos biomédicos es fácilmente accesible a través de Internet y se está convirtiendo en un recurso poderoso para recopilar interacciones proteína-proteína (PPI) conocidas, predicción de PPI y acoplamiento de proteínas. La minería de textos es mucho menos costosa y requiere mucho menos tiempo en comparación con otras técnicas de alto rendimiento. Actualmente, los métodos de minería de textos generalmente detectan relaciones binarias entre proteínas que interactúan a partir de oraciones individuales mediante extracción de información basada en reglas/patrones y enfoques de aprendizaje automático . [50] Una amplia variedad de aplicaciones de minería de textos para la extracción y/o predicción de PPI están disponibles para uso público, así como repositorios que a menudo almacenan PPI validados manualmente y/o predichos computacionalmente. La minería de texto se puede implementar en dos etapas: recuperación de información , donde se recuperan textos que contienen nombres de una o ambas proteínas que interactúan, y extracción de información, donde se extrae información específica (proteínas que interactúan, residuos implicados, tipos de interacción, etc.).
También hay estudios que utilizan perfiles filogenéticos , basando sus funcionalidades en la teoría de que las proteínas involucradas en vías comunes coevolucionan de manera correlacionada entre especies. Algunas metodologías de minería de textos más complejas utilizan técnicas avanzadas de procesamiento del lenguaje natural (PLN) y construyen redes de conocimiento (por ejemplo, considerando los nombres de los genes como nodos y los verbos como aristas). Otros desarrollos involucran métodos de kernel para predecir interacciones de proteínas. [51]
Se han sugerido y revisado muchos métodos computacionales para predecir las interacciones proteína-proteína. [52] [53] [54] Los enfoques de predicción se pueden agrupar en categorías basadas en evidencia predictiva: secuencia de proteínas, genómica comparativa , dominios de proteínas, estructura terciaria de proteínas y topología de redes de interacción. [52] La construcción de un conjunto positivo (pares de proteínas que interactúan conocidos) y un conjunto negativo (pares de proteínas que no interactúan) es necesaria para el desarrollo de un modelo de predicción computacional. [53] Los modelos de predicción que utilizan técnicas de aprendizaje automático se pueden clasificar en términos generales en dos grupos principales: supervisados y no supervisados, según el etiquetado de las variables de entrada según el resultado esperado. [54]
En 2005, se analizaron proteínas integrales de membrana de Saccharomyces cerevisiae utilizando el sistema de ubiquitina basado en apareamiento (mbSUS). El sistema detecta interacciones de proteínas de membrana con proteínas de señalización extracelular [55] De las 705 proteínas integrales de membrana se rastrearon 1.985 interacciones diferentes que involucraban a 536 proteínas. Para ordenar y clasificar las interacciones se utilizó una máquina de vectores de soporte para definir interacciones de confianza alta, media y baja. El sistema de dos híbridos de levadura con membrana de ubiquitina dividida utiliza reporteros transcripcionales para identificar transformantes de levadura que codifican pares de proteínas que interactúan. [56] En 2006, se descubrió que el bosque aleatorio , un ejemplo de técnica supervisada, era el método de aprendizaje automático más eficaz para la predicción de la interacción de proteínas. [57] Estos métodos se han aplicado para descubrir interacciones de proteínas en el interactoma humano, específicamente el interactoma de proteínas de membrana [58] y el interactoma de proteínas asociadas a la esquizofrenia. [59]
A partir de 2020, un modelo que utiliza clases de grupos de residuos (RCC), construido a partir de las bases de datos 3DID y Negatome, dio como resultado entre un 96% y un 99% de instancias de interacciones proteína-proteína clasificadas correctamente. [60] Los RCC son un espacio vectorial computacional que imita el espacio de pliegue de proteínas e incluye todos los conjuntos de residuos contactados simultáneamente, que pueden usarse para analizar la relación estructura-función de las proteínas y su evolución. [61]
La identificación a gran escala de PPI generó cientos de miles de interacciones, que se recopilaron en bases de datos biológicas especializadas que se actualizan continuamente para proporcionar interactomas completos . La primera de estas bases de datos fue la Base de datos de proteínas que interactúan (DIP) . [62]
Las bases de datos primarias recopilan información sobre los IBP publicados que se ha demostrado que existen mediante métodos experimentales a pequeña o gran escala. Ejemplos: DIP , base de datos de la red de interacción biomolecular (BIND), repositorio general biológico para conjuntos de datos de interacción ( BioGRID ), base de datos de referencia de proteínas humanas (HPRD), base de datos de interacción molecular IntAct, base de datos de interacciones moleculares (MINT), recurso de interacción de proteínas MIPS en levadura (MIPS) -MPact) y la base de datos de interacción proteína-proteína de mamíferos MIPS (MIPS-MPPI).<
Las metabases de datos normalmente resultan de la integración de información de bases de datos primarias, pero también pueden recopilar algunos datos originales.
Las bases de datos de predicción incluyen muchos PPI que se predicen mediante varias técnicas (artículo principal). Ejemplos: Base de datos de predicción de interacciones proteína-proteína humana (PIP), [63] Base de datos de interacciones Interlogous (I2D), Interacciones proteína-proteína conocidas y previstas (STRING-db) y Unified Human Interactive (UniHI).
Todos los métodos computacionales antes mencionados dependen de bases de datos fuente cuyos datos pueden extrapolarse para predecir nuevas interacciones proteína-proteína . La cobertura difiere mucho entre las bases de datos. En general, las bases de datos primarias tienen la menor cantidad de interacciones totales de proteínas registradas, ya que no integran datos de muchas otras bases de datos, mientras que las bases de datos de predicción tienen la mayor cantidad porque incluyen otras formas de evidencia además de la experimental. Por ejemplo, la base de datos primaria IntAct tiene 572.063 interacciones, [64] la metabase de datos APID tiene 678.000 interacciones, [65] y la base de datos predictiva STRING tiene 25.914.693 interacciones. [66] Sin embargo, es importante señalar que algunas de las interacciones en la base de datos STRING solo se predicen mediante métodos computacionales como Genomic Context y no se verifican experimentalmente.
La información encontrada en las bases de datos de los PPI apoya la construcción de redes de interacción. Aunque la red PPI de una proteína de consulta determinada se puede representar en los libros de texto, los diagramas de PPI de células completas son francamente complejos y difíciles de generar. [67]
Un ejemplo de un mapa de interacción molecular producido manualmente es el mapa de control del ciclo celular de Kurt Kohn de 1999. [68] Basándose en el mapa de Kohn, Schwikowski et al. en 2000 publicó un artículo sobre IBP en levadura, vinculando 1.548 proteínas que interactúan determinadas mediante detección de dos híbridos. Utilizaron un método de dibujo de gráficos en capas para encontrar una ubicación inicial de los nodos y luego mejoraron el diseño utilizando un algoritmo basado en la fuerza. [69]
Se han desarrollado herramientas bioinformáticas para simplificar la difícil tarea de visualizar redes de interacción molecular y complementarlas con otro tipo de datos. Por ejemplo, Cytoscape es un software de código abierto ampliamente utilizado y actualmente hay muchos complementos disponibles. [70] El software Pajek es ventajoso para la visualización y análisis de redes muy grandes. [49]
La identificación de módulos funcionales en redes PPI es un desafío importante en bioinformática. Los módulos funcionales significan un conjunto de proteínas que están altamente conectadas entre sí en la red PPI. Es un problema casi similar al de la detección de comunidades en las redes sociales . Existen algunos métodos como los módulos Jactive [71] y MoBaS. [72] Los módulos Jactive integran la red PPI y los datos de expresión genética , mientras que MoBaS integra la red PPI y los estudios de asociación de todo el genoma .
Las relaciones proteína-proteína son a menudo el resultado de múltiples tipos de interacciones o se deducen de diferentes enfoques, incluida la colocalización, la interacción directa, la interacción genética supresora, la interacción genética aditiva, la asociación física y otras asociaciones. [73]
Las interacciones proteína-proteína a menudo dan como resultado que una de las proteínas que interactúan sea "activada" o "reprimida". Estos efectos pueden indicarse en una red PPI mediante "signos" (por ejemplo, "activación" o "inhibición"). Aunque estos atributos se han añadido a las redes desde hace mucho tiempo, [75] Vinayagam et al. (2014) acuñaron para ellos el término red firmada . Las redes firmadas a menudo se expresan etiquetando la interacción como positiva o negativa. Una interacción positiva es aquella en la que la interacción da como resultado la activación de una de las proteínas. Por el contrario, una interacción negativa indica que una de las proteínas está inactivada. [76]
Las redes de interacción proteína-proteína a menudo se construyen como resultado de experimentos de laboratorio, como análisis de dos híbridos de levadura o técnicas de purificación por afinidad y posteriores de espectrometría de masas. [77] Sin embargo, estos métodos no proporcionan la capa de información necesaria para determinar qué tipo de interacción está presente para poder atribuir signos a los diagramas de red.
Las pantallas de interferencia de ARN (ARNi) (represión de proteínas individuales entre la transcripción y la traducción) son un método que se puede utilizar en el proceso de proporcionar señales de las interacciones proteína-proteína. Se reprimen las proteínas individuales y se analizan los fenotipos resultantes. Una relación fenotípica correlativa (es decir, donde la inhibición de cualquiera de dos proteínas da como resultado el mismo fenotipo) indica una relación positiva o activadora. Los fenotipos que no se correlacionan (es decir, cuando la inhibición de cualquiera de dos proteínas da como resultado dos fenotipos diferentes) indican una relación negativa o inactivante. Si la proteína A depende de la proteína B para su activación, entonces la inhibición de la proteína A o B dará como resultado que una célula pierda el servicio proporcionado por la proteína A y los fenotipos serán los mismos para la inhibición de A o B. Si Sin embargo, la proteína A es inactivada por la proteína B, entonces los fenotipos diferirán dependiendo de qué proteína se inhibe (inhibe la proteína B y ya no puede inactivar la proteína A dejando A activa, sin embargo, inactiva A y B no tiene nada que activar ya que A es inactivo y el fenotipo cambia). Es necesario realizar múltiples análisis de ARNi para identificar de manera confiable un signo de una determinada interacción proteína-proteína. Vinayagam et al. Quienes idearon esta técnica afirman que se requieren un mínimo de nueve exámenes de ARNi y la confianza aumenta a medida que se realizan más exámenes. [76]
La modulación del PPI es un desafío y está recibiendo cada vez más atención por parte de la comunidad científica. [78] Varias propiedades de los PPI, como los sitios alostéricos y los puntos críticos, se han incorporado en las estrategias de diseño de fármacos. [79] [80] Sin embargo, muy pocos IBP son el objetivo directo de los inhibidores de IBP de molécula pequeña aprobados por la FDA , lo que enfatiza una enorme oportunidad sin explotar para el descubrimiento de fármacos.
En 2014, Amit Jaiswal y otros pudieron desarrollar 30 péptidos para inhibir el reclutamiento de telomerasa hacia los telómeros mediante estudios de interacción proteína-proteína. [81] [82] Arkin y otros pudieron desarrollar inhibidores basados en fragmentos de anticuerpos para regular interacciones proteína-proteína específicas. [83]
Dado que la "modulación" de los IBP no sólo incluye la inhibición, sino también la estabilización de complejos de proteínas cuaternarias , también se estudian intensamente las moléculas con este mecanismo de acción (los llamados pegamentos moleculares ). [84]
{{cite journal}}
: Mantenimiento CS1: DOI inactivo a partir de abril de 2024 ( enlace )