Las interacciones proteína-proteína ( IPP ) son contactos físicos de alta especificidad que se establecen entre dos o más moléculas de proteínas como resultado de eventos bioquímicos dirigidos por interacciones que incluyen fuerzas electrostáticas , enlaces de hidrógeno y el efecto hidrofóbico . Muchas son contactos físicos con asociaciones moleculares entre cadenas que ocurren en una célula o en un organismo vivo en un contexto biomolecular específico.
Las proteínas rara vez actúan solas, ya que sus funciones tienden a estar reguladas. Muchos procesos moleculares dentro de una célula son llevados a cabo por máquinas moleculares que están formadas por numerosos componentes proteicos organizados por sus IBP. Estas interacciones fisiológicas conforman la denominada interactómica del organismo, mientras que los IBP aberrantes son la base de múltiples enfermedades relacionadas con la agregación, como la enfermedad de Creutzfeldt-Jakob y la de Alzheimer .
Los IBP han sido estudiados con muchos métodos y desde diferentes perspectivas: bioquímica , química cuántica , dinámica molecular , transducción de señales , entre otras. [1] [2] [3] Toda esta información permite la creación de grandes redes de interacción de proteínas [4] – similares a redes metabólicas o genéticas/epigenéticas – que potencian el conocimiento actual sobre las cascadas bioquímicas y la etiología molecular de las enfermedades, así como el descubrimiento de posibles dianas proteicas de interés terapéutico.
En muchas reacciones metabólicas, una proteína que actúa como transportadora de electrones se une a una enzima que actúa como su reductasa . Después de recibir un electrón, se disocia y luego se une a la siguiente enzima que actúa como su oxidasa (es decir, un aceptor del electrón). Estas interacciones entre proteínas dependen de una unión altamente específica entre proteínas para asegurar una transferencia de electrones eficiente. Ejemplos: componentes del sistema de cadena de fosforilación oxidativa mitocondrial citocromo c-reductasa / citocromo c / citocromo c oxidasa; sistemas microsomal y mitocondrial P450. [5]
En el caso de los sistemas mitocondriales P450, los residuos específicos involucrados en la unión de la proteína de transferencia de electrones adrenodoxina a su reductasa fueron identificados como dos residuos básicos de Arg en la superficie de la reductasa y dos residuos ácidos de Asp en la adrenodoxina. [6] Trabajos más recientes sobre la filogenia de la reductasa han demostrado que estos residuos involucrados en interacciones proteína-proteína se han conservado a lo largo de la evolución de esta enzima. [7]
La actividad de la célula está regulada por señales extracelulares. La propagación de señales dentro y/o a lo largo del interior de las células depende de los IBP entre las distintas moléculas de señalización. El reclutamiento de vías de señalización a través de los IBP se denomina transducción de señales y desempeña un papel fundamental en muchos procesos biológicos y en muchas enfermedades, entre ellas la enfermedad de Parkinson y el cáncer.
Una proteína puede transportar otra proteína (por ejemplo, del citoplasma al núcleo o viceversa en el caso de las importinas del poro nuclear ). [ cita requerida ]
En muchos procesos biosintéticos las enzimas interactúan entre sí para producir pequeños compuestos u otras macromoléculas. [ cita requerida ]
La fisiología de la contracción muscular implica varias interacciones. Los filamentos de miosina actúan como motores moleculares y, al unirse a la actina, permiten el deslizamiento de los filamentos. [8] Además, los miembros de la familia de proteínas asociadas a las gotitas lipídicas del músculo esquelético se asocian con otras proteínas, como el activador de la lipasa de triglicéridos adiposos y su coactivador, comparison gene identifying-58, para regular la lipólisis en el músculo esquelético.
Para describir los tipos de interacciones proteína-proteína (IPP) es importante considerar que las proteínas pueden interactuar de manera “transitoria” (para producir algún efecto específico en un corto tiempo, como la transducción de señales) o interactuar con otras proteínas de manera “estable” para formar complejos que se convierten en máquinas moleculares dentro de los sistemas vivos. Un ensamblaje de complejos proteicos puede dar como resultado la formación de complejos homo-oligoméricos o hetero-oligoméricos . Además de los complejos convencionales, como enzima-inhibidor y anticuerpo-antígeno, también se pueden establecer interacciones entre dominio-dominio y dominio-péptido. Otra distinción importante para identificar las interacciones proteína-proteína es la forma en que se han determinado, ya que existen técnicas que miden interacciones físicas directas entre pares de proteínas, denominadas métodos “binarios”, mientras que existen otras técnicas que miden interacciones físicas entre grupos de proteínas, sin determinación por pares de proteínas asociadas, denominadas métodos “co-complejos”.
Los homooligómeros son complejos macromoleculares constituidos por un solo tipo de subunidad proteica . El ensamblaje de subunidades proteicas está guiado por el establecimiento de interacciones no covalentes en la estructura cuaternaria de la proteína. La interrupción de los homooligómeros para volver a los monómeros individuales iniciales a menudo requiere la desnaturalización del complejo. [9] Varias enzimas , proteínas transportadoras , proteínas de andamiaje y factores reguladores de la transcripción llevan a cabo sus funciones como homooligómeros. Las distintas subunidades proteicas interactúan en heterooligómeros, que son esenciales para controlar varias funciones celulares. La importancia de la comunicación entre proteínas heterólogas es aún más evidente durante los eventos de señalización celular y tales interacciones solo son posibles debido a los dominios estructurales dentro de las proteínas (como se describe a continuación).
Las interacciones estables involucran proteínas que interactúan por un largo tiempo, tomando parte de complejos permanentes como subunidades, para llevar a cabo papeles funcionales. Estos son usualmente el caso de homo-oligómeros (p.ej. citocromo c ), y algunas proteínas hetero-oligoméricas, como las subunidades de la ATPasa . Por otro lado, una proteína puede interactuar brevemente y de manera reversible con otras proteínas solo en ciertos contextos celulares – tipo de célula , etapa del ciclo celular , factores externos, presencia de otras proteínas de unión, etc. – como sucede con la mayoría de las proteínas involucradas en cascadas bioquímicas . Estas son llamadas interacciones transitorias. Por ejemplo, algunos receptores acoplados a proteína G solo se unen transitoriamente a proteínas G i/o cuando son activados por ligandos extracelulares, [10] mientras que algunos receptores acoplados a G q , como el receptor muscarínico M3, se pre-acoplan con proteínas G q antes de la unión receptor-ligando. [11] Las interacciones entre regiones proteicas intrínsecamente desordenadas y dominios proteicos globulares (es decir, MoRF ) son interacciones transitorias. [12]
Las interacciones covalentes son aquellas con la asociación más fuerte y se forman por enlaces disulfuro o por intercambio de electrones . Aunque son poco frecuentes, estas interacciones son determinantes en algunas modificaciones postraduccionales , como la ubiquitinación y la sumoilación . Los enlaces no covalentes se establecen generalmente durante interacciones transitorias por la combinación de enlaces más débiles, como los enlaces de hidrógeno , las interacciones iónicas, las fuerzas de Van der Waals o los enlaces hidrofóbicos. [13]
Las moléculas de agua desempeñan un papel importante en las interacciones entre proteínas. [14] [15] Las estructuras cristalinas de complejos, obtenidas a alta resolución a partir de proteínas diferentes pero homólogas, han demostrado que algunas moléculas de agua de la interfaz se conservan entre complejos homólogos. La mayoría de las moléculas de agua de la interfaz forman enlaces de hidrógeno con ambos socios de cada complejo. Algunos residuos de aminoácidos de la interfaz o grupos atómicos de un socio proteico participan en interacciones tanto directas como mediadas por agua con el otro socio proteico. Las interacciones doblemente indirectas, mediadas por dos moléculas de agua, son más numerosas en los complejos homólogos de baja afinidad. [16] Los experimentos de mutagénesis realizados cuidadosamente, por ejemplo, cambiando un residuo de tirosina en una fenilalanina, han demostrado que las interacciones mediadas por agua pueden contribuir a la energía de la interacción. [17] Por lo tanto, las moléculas de agua pueden facilitar las interacciones y los reconocimientos cruzados entre proteínas.
Las estructuras moleculares de muchos complejos proteicos han sido descubiertas mediante la técnica de cristalografía de rayos X. [18] [19] La primera estructura que se resolvió mediante este método fue la de la mioglobina de cachalote por Sir John Cowdery Kendrew . [20] En esta técnica, los ángulos e intensidades de un haz de rayos X difractados por átomos cristalinos se detectan en una película, produciendo así una imagen tridimensional de la densidad de electrones dentro del cristal. [21]
Posteriormente, la resonancia magnética nuclear también comenzó a aplicarse con el objetivo de desentrañar la estructura molecular de los complejos proteicos. Uno de los primeros ejemplos fue la estructura de los dominios de unión a la calmodulina unidos a la calmodulina . [19] [22] Esta técnica se basa en el estudio de las propiedades magnéticas de los núcleos atómicos, determinando así las propiedades físicas y químicas de los átomos o moléculas correspondientes. La resonancia magnética nuclear es ventajosa para caracterizar los PPI débiles. [23]
Algunas proteínas tienen dominios estructurales específicos o motivos de secuencia que les permiten unirse a otras proteínas. A continuación, se muestran algunos ejemplos de dichos dominios:
El estudio de la estructura molecular puede proporcionar detalles precisos sobre la interfaz que permite la interacción entre proteínas. Al caracterizar las interfaces de PPI es importante tener en cuenta el tipo de complejo. [9]
Los parámetros evaluados incluyen tamaño (medido en dimensiones absolutas Å 2 o en área de superficie accesible al solvente (SASA) ), forma, complementariedad entre superficies, propensiones a la interfaz de residuos, hidrofobicidad, segmentación y estructura secundaria, y cambios conformacionales en la formación de complejos. [9]
La gran mayoría de las interfaces de PPI reflejan la composición de las superficies de las proteínas, en lugar de los núcleos de las proteínas, a pesar de estar frecuentemente enriquecidas en residuos hidrofóbicos, particularmente en residuos aromáticos. [25] Las interfaces de PPI son dinámicas y frecuentemente planas, aunque también pueden ser globulares y protuberantes. [26] Basándose en tres estructuras ( dímero de insulina , complejo tripsina -inhibidor de tripsina pancreática y oxihemoglobina ), Cyrus Chothia y Joel Janin descubrieron que entre 1130 y 1720 Å 2 de área superficial se eliminaba del contacto con el agua, lo que indica que la hidrofobicidad es un factor importante de estabilización de los PPI. [27] Estudios posteriores refinaron el área superficial enterrada de la mayoría de las interacciones a 1600 ± 350 Å 2 . Sin embargo, también se observaron interfaces de interacción mucho más grandes y se asociaron con cambios significativos en la conformación de uno de los socios de interacción. [18] Las interfaces de los PPI exhiben complementariedad tanto en forma como en electrostática. [9] [11]
Existen multitud de métodos para detectarlos. [1] [28] Cada uno de los enfoques tiene sus propias fortalezas y debilidades, especialmente en lo que respecta a la sensibilidad y especificidad del método. Los métodos de alto rendimiento más convencionales y ampliamente utilizados son el cribado de dos híbridos de levadura y la purificación por afinidad acoplada a la espectrometría de masas .
Este sistema fue descrito por primera vez en 1989 por Fields y Song usando Saccharomyces cerevisiae como modelo biológico. [29] [30] El híbrido de dos levaduras permite la identificación de PPI por pares (método binario) in vivo , en el que se prueban las dos proteínas para la interacción biofísicamente directa. El Y2H se basa en la reconstitución funcional del factor de transcripción de levadura Gal4 y la activación posterior de un reportero selectivo como His3. Para probar la interacción de dos proteínas, se realizan dos construcciones de expresión de proteínas: una proteína (X) se fusiona al dominio de unión al ADN de Gal4 (DB) y una segunda proteína (Y) se fusiona al dominio de activación de Gal4 (AD). En el ensayo, las células de levadura se transforman con estas construcciones. La transcripción de genes reporteros no ocurre a menos que el cebo (DB-X) y la presa (AD-Y) interactúen entre sí y formen un factor de transcripción Gal4 funcional. Por lo tanto, la interacción entre proteínas se puede inferir por la presencia de los productos resultantes de la expresión del gen reportero. [13] [31] En los casos en que el gen reportero expresa enzimas que permiten a la levadura sintetizar aminoácidos esenciales o nucleótidos, el crecimiento de la levadura en condiciones de medios selectivos indica que las dos proteínas ensayadas están interactuando. Recientemente se publicó un software para detectar y priorizar las interacciones de proteínas. [32] [33]
A pesar de su utilidad, el sistema de doble híbrido de levadura tiene limitaciones. Utiliza la levadura como sistema huésped principal, lo que puede ser un problema al estudiar proteínas que contienen modificaciones postraduccionales específicas de mamíferos. El número de IBP identificados suele ser bajo debido a una alta tasa de falsos negativos; [34] y, por ejemplo, subestima las proteínas de membrana . [35] [36]
En los estudios iniciales que utilizaron Y2H, con frecuencia no se realizaron controles adecuados para los falsos positivos (por ejemplo, cuando DB-X activa el gen reportero sin la presencia de AD-Y), lo que conduce a una tasa de falsos positivos más alta de lo normal. Se debe implementar un marco empírico para controlar estos falsos positivos. [37] Las limitaciones en la cobertura inferior de las proteínas de membrana se han superado con la aparición de variantes de dos híbridos de levadura, como el híbrido de dos membranas de levadura (MYTH) [36] y el sistema de ubiquitina dividida, [31] que no se limitan a las interacciones que ocurren en el núcleo; y, el sistema de dos híbridos bacterianos, realizado en bacterias; [38]
La purificación por afinidad acoplada a la espectrometría de masas detecta principalmente interacciones estables y, por lo tanto, indica mejor los PPI funcionales in vivo. [39] [31] Este método comienza con la purificación de la proteína marcada, que se expresa en la célula generalmente en concentraciones in vivo , y sus proteínas interactuantes (purificación por afinidad). Uno de los métodos más ventajosos y ampliamente utilizados para purificar proteínas con un fondo contaminante muy bajo es la purificación por afinidad en tándem , desarrollada por Bertrand Seraphin y Matthias Mann y sus respectivos colegas. Los PPI pueden luego analizarse cuantitativa y cualitativamente por espectrometría de masas utilizando diferentes métodos: incorporación química, incorporación biológica o metabólica (SILAC) y métodos sin etiqueta. [9] Además, la teoría de redes se ha utilizado para estudiar todo el conjunto de interacciones proteína-proteína identificadas en las células. [4]
Este sistema fue desarrollado por primera vez por LaBaer y colegas en 2004 utilizando un sistema de transcripción y traducción in vitro. Utilizaron una plantilla de ADN que codifica el gen de interés fusionado con la proteína GST, y se inmovilizó en la superficie sólida. El anticuerpo anti-GST y el ADN plasmídico biotinilado se unieron en un portaobjetos recubierto con aminopropiltrietoxisilano (APTES). La BSA puede mejorar la eficiencia de unión del ADN. El ADN plasmídico biotinilado se unió con avidina. La nueva proteína se sintetizó utilizando un sistema de expresión libre de células, es decir, lisado de reticulocitos de conejo (RRL), y luego la nueva proteína se capturó a través del anticuerpo anti-GST unido al portaobjetos. Para probar la interacción proteína-proteína, el ADNc de la proteína objetivo y el ADNc de la proteína consulta se inmovilizaron en el mismo portaobjetos recubierto. Mediante el uso del sistema de transcripción y traducción in vitro, la proteína objetivo y la proteína consulta se sintetizaron mediante el mismo extracto. La proteína objetivo se unió a la matriz mediante el anticuerpo recubierto en el portaobjetos y la proteína consulta se utilizó para sondear la matriz. La proteína de interés fue etiquetada con el epítopo de hemaglutinina (HA). De esta manera, se visualizó la interacción entre las dos proteínas con el anticuerpo contra HA. [40] [41]
Cuando varias copias de un polipéptido codificado por un gen forman un complejo, esta estructura proteica se denomina multímero. Cuando un multímero se forma a partir de polipéptidos producidos por dos alelos mutantes diferentes de un gen particular, el multímero mixto puede exhibir una mayor actividad funcional que los multímeros no mezclados formados por cada uno de los mutantes solos. En tal caso, el fenómeno se denomina complementación intragénica (también llamada complementación interalélica). La complementación intragénica se ha demostrado en muchos genes diferentes en una variedad de organismos, incluidos los hongos Neurospora crassa , Saccharomyces cerevisiae y Schizosaccharomyces pombe ; la bacteria Salmonella typhimurium ; el virus bacteriófago T4 , [42] un virus de ARN [43] y humanos. [44] En tales estudios, numerosas mutaciones defectuosas en el mismo gen a menudo se aislaron y mapearon en un orden lineal sobre la base de frecuencias de recombinación para formar un mapa genético del gen. Por separado, los mutantes se probaron en combinaciones de pares para medir la complementación. Un análisis de los resultados de dichos estudios condujo a la conclusión de que la complementación intragénica, en general, surge de la interacción de monómeros polipeptídicos defectuosos de diferente forma para formar un multímero. [45] Los genes que codifican polipéptidos formadores de multímeros parecen ser comunes. Una interpretación de los datos es que los monómeros polipeptídicos a menudo se alinean en el multímero de tal manera que los polipéptidos mutantes defectuosos en sitios cercanos en el mapa genético tienden a formar un multímero mixto que funciona mal, mientras que los polipéptidos mutantes defectuosos en sitios distantes tienden a formar un multímero mixto que funciona de manera más efectiva. La interacción directa de dos proteínas nacientes que emergen de ribosomas cercanos parece ser un mecanismo general para la formación de homo-oligómeros (multímeros). [46] Se identificaron cientos de oligómeros proteicos que se ensamblan en células humanas mediante dicha interacción. [46] La forma de interacción más frecuente es entre las regiones N-terminales de las proteínas interactuantes. La formación de dímeros parece poder ocurrir independientemente de las máquinas de ensamblaje dedicadas. Jehle analizó las fuerzas intermoleculares probablemente responsables del autorreconocimiento y la formación de multímeros. [47]
Junto con el avance de la tecnología, han surgido diversas técnicas para identificar los IBP, entre ellas la co-inmunoprecipitación, los microarreglos de proteínas , la ultracentrifugación analítica , la dispersión de la luz , la espectroscopia de fluorescencia , el mapeo del interactoma de mamíferos basado en la luminiscencia (LUMIER), los sistemas de transferencia de energía por resonancia, la trampa de interacción proteína-proteína de mamíferos, las biosuperficies electroconmutables , el ensayo de complementación de fragmentos de proteína, así como las mediciones sin etiquetas en tiempo real mediante resonancia de plasmones de superficie y calorimetría . [35] [36]
La detección y caracterización experimental de los PPI es una tarea laboriosa y que requiere mucho tiempo. Sin embargo, muchos de ellos también se pueden predecir de forma computacional, generalmente utilizando datos experimentales como punto de partida. Sin embargo, también se han desarrollado métodos que permiten la predicción de los PPI de novo, es decir, sin evidencia previa de estas interacciones.
El método de fusión de dominios o de piedra de Rosetta se basa en la hipótesis de que las proteínas que interactúan a veces se fusionan en una sola proteína en otro genoma. [48] Por lo tanto, podemos predecir si dos proteínas pueden estar interactuando al determinar si cada una de ellas tiene una similitud de secuencia no superpuesta con una región de una sola secuencia de proteína en otro genoma.
El método de vecindad conservada se basa en la hipótesis de que si los genes que codifican dos proteínas son vecinos en un cromosoma en muchos genomas, entonces es probable que estén relacionados funcionalmente (y posiblemente interactúen físicamente). [49]
El método del perfil filogenético se basa en la hipótesis de que si dos o más proteínas están presentes o ausentes simultáneamente en varios genomas, entonces es probable que estén relacionadas funcionalmente. [49] Por lo tanto, las proteínas potencialmente interactuantes se pueden identificar determinando la presencia o ausencia de genes en muchos genomas y seleccionando aquellos genes que siempre están presentes o ausentes juntos.
La información disponible públicamente de los documentos biomédicos es fácilmente accesible a través de Internet y se está convirtiendo en un recurso poderoso para recopilar interacciones proteína-proteína (PPI) conocidas, predicción de PPI y acoplamiento de proteínas. La minería de texto es mucho menos costosa y requiere menos tiempo en comparación con otras técnicas de alto rendimiento. Actualmente, los métodos de minería de texto generalmente detectan relaciones binarias entre proteínas interactuantes a partir de oraciones individuales utilizando extracción de información basada en reglas/patrones y enfoques de aprendizaje automático . [50] Una amplia variedad de aplicaciones de minería de texto para la extracción y/o predicción de PPI están disponibles para uso público, así como repositorios que a menudo almacenan PPI validadas manualmente y/o predichas computacionalmente. La minería de texto se puede implementar en dos etapas: recuperación de información , donde se recuperan textos que contienen nombres de una o ambas proteínas interactuantes y extracción de información, donde se extrae información específica (proteínas interactuantes, residuos implicados, tipos de interacción, etc.).
También existen estudios que utilizan perfiles filogenéticos , que basan sus funcionalidades en la teoría de que las proteínas implicadas en vías comunes coevolucionan de manera correlacionada entre especies. Algunas metodologías de minería de texto más complejas utilizan técnicas avanzadas de procesamiento del lenguaje natural (PLN) y construyen redes de conocimiento (por ejemplo, considerando los nombres de los genes como nodos y los verbos como bordes). Otros desarrollos involucran métodos kernel para predecir interacciones de proteínas. [51]
Se han sugerido y revisado muchos métodos computacionales para predecir interacciones proteína-proteína. [52] [53] [54] Los enfoques de predicción se pueden agrupar en categorías basadas en evidencia predictiva: secuencia de proteínas, genómica comparativa , dominios de proteínas, estructura terciaria de proteínas y topología de red de interacción. [52] La construcción de un conjunto positivo (pares de proteínas interactuantes conocidos) y un conjunto negativo (pares de proteínas no interactuantes) es necesaria para el desarrollo de un modelo de predicción computacional. [53] Los modelos de predicción que utilizan técnicas de aprendizaje automático se pueden clasificar ampliamente en dos grupos principales: supervisados y no supervisados, basados en el etiquetado de las variables de entrada de acuerdo con el resultado esperado. [54]
En 2005, se analizaron las proteínas integrales de membrana de Saccharomyces cerevisiae utilizando el sistema de ubiquitina basado en el apareamiento (mbSUS). El sistema detecta las interacciones de las proteínas de membrana con las proteínas de señalización extracelular [55]. De las 705 proteínas integrales de membrana, se rastrearon 1.985 interacciones diferentes que involucraban a 536 proteínas. Para ordenar y clasificar las interacciones, se utilizó una máquina de vectores de soporte para definir interacciones de confianza alta, media y baja. El sistema de doble híbrido de levadura con membrana de ubiquitina dividida utiliza reporteros transcripcionales para identificar transformantes de levadura que codifican pares de proteínas interactuantes. [56] En 2006, se descubrió que el bosque aleatorio , un ejemplo de una técnica supervisada, era el método de aprendizaje automático más eficaz para la predicción de la interacción de proteínas. [57] Dichos métodos se han aplicado para descubrir interacciones de proteínas en el interactoma humano, específicamente el interactoma de las proteínas de membrana [58] y el interactoma de las proteínas asociadas a la esquizofrenia. [59]
A partir de 2020, un modelo que utiliza clases de grupos de residuos (RCC), construido a partir de las bases de datos 3DID y Negatome, dio como resultado entre el 96 y el 99 % de instancias de interacciones proteína-proteína correctamente clasificadas. [60] Las RCC son un espacio vectorial computacional que imita el espacio de plegamiento de proteínas e incluye todos los conjuntos de residuos contactados simultáneamente, que se pueden utilizar para analizar la relación y la evolución de la estructura y la función de las proteínas. [61]
La identificación a gran escala de las IPP generó cientos de miles de interacciones, que se recopilaron en bases de datos biológicas especializadas que se actualizan continuamente para proporcionar interactomas completos . La primera de estas bases de datos fue la Base de Datos de Proteínas Interactuantes (DIP) . [62]
Las bases de datos primarias recopilan información sobre los IBP publicados cuya existencia se ha demostrado mediante métodos experimentales a pequeña o gran escala. Ejemplos: DIP , Base de datos de la red de interacción biomolecular (BIND), Repositorio general biológico para conjuntos de datos de interacción ( BioGRID ), Base de datos de referencia de proteínas humanas (HPRD), Base de datos de interacción molecular IntAct, Base de datos de interacciones moleculares (MINT), Recurso de interacción de proteínas MIPS en levaduras (MIPS-MPact) y Base de datos de interacción proteína-proteína de mamíferos MIPS (MIPS-MPPI).
Las metabases de datos normalmente resultan de la integración de información de bases de datos primarias, pero también pueden recopilar algunos datos originales.
Las bases de datos de predicción incluyen muchas PPI que se predicen utilizando varias técnicas (artículo principal). Ejemplos: Base de datos de predicción de interacciones proteína-proteína humanas (PIP), [63] Base de datos de interacciones interlogas (I2D), Interacciones proteína-proteína conocidas y predichas (STRING-db) y Unified Human Interactive (UniHI).
Todos los métodos computacionales mencionados dependen de bases de datos de origen cuyos datos se pueden extrapolar para predecir nuevas interacciones proteína-proteína . La cobertura difiere mucho entre bases de datos. En general, las bases de datos primarias tienen la menor cantidad de interacciones de proteínas totales registradas, ya que no integran datos de varias otras bases de datos, mientras que las bases de datos de predicción tienen la mayor cantidad porque incluyen otras formas de evidencia además de la experimental. Por ejemplo, la base de datos primaria IntAct tiene 572.063 interacciones, [64] la metabase de datos APID tiene 678.000 interacciones, [65] y la base de datos predictiva STRING tiene 25.914.693 interacciones. [66] Sin embargo, es importante señalar que algunas de las interacciones en la base de datos STRING solo se predicen mediante métodos computacionales como Genomic Context y no se verifican experimentalmente.
La información que se encuentra en las bases de datos de PPIs permite construir redes de interacción. Aunque la red de PPIs de una proteína de consulta determinada se puede representar en libros de texto, los diagramas de PPIs de células enteras son francamente complejos y difíciles de generar. [67]
Un ejemplo de un mapa de interacción molecular producido manualmente es el mapa de control del ciclo celular de Kurt Kohn de 1999. [68] Basándose en el mapa de Kohn, Schwikowski et al. en 2000 publicaron un artículo sobre los IBP en levadura, en el que vinculaban 1.548 proteínas interactuantes determinadas mediante un cribado de dos híbridos. Utilizaron un método de dibujo de gráficos en capas para encontrar una ubicación inicial de los nodos y luego mejoraron el diseño utilizando un algoritmo basado en la fuerza. [69]
Se han desarrollado herramientas bioinformáticas para simplificar la difícil tarea de visualizar redes de interacción molecular y complementarlas con otros tipos de datos. Por ejemplo, Cytoscape es un software de código abierto ampliamente utilizado y actualmente hay muchos complementos disponibles. [70] El software Pajek es ventajoso para la visualización y el análisis de redes muy grandes. [49]
La identificación de módulos funcionales en redes PPI es un desafío importante en bioinformática. Los módulos funcionales significan un conjunto de proteínas que están altamente conectadas entre sí en la red PPI. Es un problema casi similar a la detección de comunidades en redes sociales . Existen algunos métodos como los módulos Jactive [71] y MoBaS. [72] Los módulos Jactive integran la red PPI y los datos de expresión genética , mientras que MoBaS integra la red PPI y los estudios de asociación de todo el genoma .
Las relaciones proteína-proteína a menudo son el resultado de múltiples tipos de interacciones o se deducen de diferentes enfoques, incluida la colocalización, la interacción directa, la interacción genética supresora, la interacción genética aditiva, la asociación física y otras asociaciones. [73]
Las interacciones proteína-proteína a menudo resultan en que una de las proteínas interactuantes sea "activada" o "reprimida". Dichos efectos pueden indicarse en una red PPI mediante "signos" (por ejemplo, "activación" o "inhibición"). Aunque estos atributos se han agregado a las redes durante mucho tiempo, [75] Vinayagam et al. (2014) acuñó el término "red con signo" para ellos. Las redes con signo a menudo se expresan etiquetando la interacción como positiva o negativa. Una interacción positiva es aquella en la que la interacción da como resultado la activación de una de las proteínas. Por el contrario, una interacción negativa indica que una de las proteínas se inactiva. [76]
Las redes de interacción proteína-proteína a menudo se construyen como resultado de experimentos de laboratorio, como pruebas de doble híbrido de levadura o técnicas de purificación por afinidad y espectrometría de masas posteriores. [77] Sin embargo, estos métodos no proporcionan la capa de información necesaria para determinar qué tipo de interacción está presente para poder atribuir signos a los diagramas de red.
Los métodos de detección de interferencia de ARN (RNAi) (represión de proteínas individuales entre la transcripción y la traducción) son un método que se puede utilizar en el proceso de proporcionar señales de las interacciones proteína-proteína. Se reprimen proteínas individuales y se analizan los fenotipos resultantes. Una relación fenotípica correlacionada (es decir, cuando la inhibición de cualquiera de las dos proteínas da como resultado el mismo fenotipo) indica una relación positiva o activadora. Los fenotipos que no se correlacionan (es decir, cuando la inhibición de cualquiera de las dos proteínas da como resultado dos fenotipos diferentes) indican una relación negativa o inactivadora. Si la proteína A depende de la proteína B para su activación, entonces la inhibición de la proteína A o de la B dará como resultado que la célula pierda el servicio que proporciona la proteína A y los fenotipos serán los mismos para la inhibición de A o de B. Sin embargo, si la proteína A es inactivada por la proteína B, entonces los fenotipos diferirán dependiendo de qué proteína sea inhibida (si se inhibe la proteína B, ya no puede inactivar la proteína A, dejando A activa, pero si se inactiva A, no hay nada que B pueda activar, ya que A está inactiva y el fenotipo cambia). Se deben realizar múltiples pruebas de RNAi para asignar de manera confiable una señal a una interacción proteína-proteína dada. Vinayagam et al., quienes idearon esta técnica, afirman que se requieren un mínimo de nueve pruebas de RNAi y la confianza aumenta a medida que se realizan más pruebas. [76]
La modulación de la PPI es un desafío y está recibiendo cada vez más atención por parte de la comunidad científica. [78] Varias propiedades de la PPI, como los sitios alostéricos y los puntos críticos, se han incorporado a las estrategias de diseño de fármacos. [79] [80] Sin embargo, muy pocos PPI son el objetivo directo de los inhibidores de la PPI de molécula pequeña aprobados por la FDA , lo que pone de relieve una enorme oportunidad sin explotar para el descubrimiento de fármacos.
En 2014, Amit Jaiswal y otros pudieron desarrollar 30 péptidos para inhibir el reclutamiento de la telomerasa hacia los telómeros mediante el uso de estudios de interacción proteína-proteína. [81] [82] Arkin y otros pudieron desarrollar inhibidores basados en fragmentos de anticuerpos para regular interacciones proteína-proteína específicas. [83]
Como la "modulación" de los IBP no sólo incluye la inhibición, sino también la estabilización de los complejos proteicos cuaternarios , las moléculas con este mecanismo de acción (los llamados pegamentos moleculares ) también se estudian intensamente. [84]
{{cite journal}}
: CS1 maint: DOI inactivo a partir de abril de 2024 ( enlace )