interactoma humano

El interactoma humano es el conjunto de interacciones proteína-proteína (el interactoma ) que ocurren en las células humanas. ^[1]^[2] La secuenciación de genomas de referencia, en particular el Proyecto Genoma Humano , ha revolucionado la genética humana , la biología molecular y la medicina clínica . Los resultados de los estudios de asociación de todo el genoma han llevado a la asociación de genes con la mayoría de los trastornos mendelianos , ^[3] y más de 140.000 mutaciones de la línea germinal se han asociado con al menos una enfermedad genética. ^[4] Sin embargo, se hizo evidente que inherente a estos estudios es un énfasis en los resultados clínicos en lugar de una comprensión integral de las enfermedades humanas; de hecho, hasta la fecha, las contribuciones más significativas de GWAS se han restringido a la "fruta madura" de los trastornos de mutación única directa, lo que impulsó un enfoque de biología de sistemas para el análisis genómico. ^[5]^[6] La conexión entre genotipo y fenotipo (cómo la variación en el genotipo afecta la enfermedad o el funcionamiento normal de la célula y el cuerpo humano) sigue siendo difícil de alcanzar, especialmente en el contexto de los rasgos complejos multigénicos y el cáncer. ^[7] Para asignar un contexto funcional a los cambios genotípicos, gran parte de los esfuerzos de investigación recientes se han dedicado al mapeo de las redes formadas por las interacciones de componentes celulares y genéticos en humanos, así como a cómo estas redes se alteran por enfermedades genéticas y somáticas.

Fondo

Con la secuenciación de los genomas de una diversa variedad de organismos modelo, quedó claro que el número de genes no se correlaciona con la percepción humana de la complejidad relativa de los organismos: el proteoma humano contiene unos 20.000 genes, ^[8] que es más pequeño que algunas especies como el maíz. Un enfoque estadístico para calcular el número de interacciones en humanos arroja una estimación de alrededor de 650.000, un orden de magnitud mayor que Drosophila y 3 veces mayor que C. Elegans . ^[2] En 2008, solo se había identificado alrededor del <0,3 % de todas las interacciones estimadas entre proteínas humanas, ^[9] aunque en los últimos años ha habido un crecimiento exponencial en descubrimientos: en 2015, ^[10] más de 210 000 interacciones humanas únicas Las interacciones positivas entre proteínas están catalogadas actualmente, y la base de datos bioGRID contiene casi 750 000 PPI seleccionados en la literatura para 30 organismos modelo, 300 000 de los cuales son interacciones proteína-proteína físicas o genéticas humanas verificadas o predichas, un aumento del 50% desde 2013 ^{. 11]} La información actualmente disponible sobre la red del interactoma humano se origina a partir de interacciones seleccionadas en la literatura, ^[12] experimentos de alto rendimiento , ^[10] o de interacciones potenciales predichas a partir de datos del interactoma, ya sea a través de perfiles filogenéticos (similitud evolutiva), red estadística inferencia, ^[13] o métodos de extracción de texto/literatura. ^[14]

Las interacciones proteína-proteína son sólo la materia prima de las redes. Para formar bases de datos de interactomas útiles y crear redes integradas, otros tipos de datos que se pueden combinar con interacciones proteína-proteína incluyen información sobre expresión y coexpresión genética , colocalización celular de proteínas (basada en microscopía ), información genética, metabólica y vías de señalización y más. ^[15] El objetivo final de desentrañar los interactomas de proteínas humanas es, en última instancia, comprender los mecanismos de las enfermedades y descubrir genes de enfermedades previamente desconocidos. Se ha descubierto que las proteínas con un gran número de interacciones (bordes exteriores) tienen significativamente más probabilidades de ser centros en módulos que se correlacionan con la enfermedad, ^[10]^[16] probablemente porque las proteínas con más interacciones están involucradas en más funciones biológicas. Al mapear las alteraciones de las enfermedades en el interactoma humano, podemos obtener una comprensión mucho mejor de las vías y los procesos biológicos de las enfermedades. ^[17]

Estudiando el interactoma humano.

El análisis de las redes metabólicas de proteínas se remonta a la década de 1940, pero no fue hasta finales de la década de 1990 y principios de la de 2000 que aparecieron en serio los análisis genómicos basados en datos computacionales para predecir el contexto funcional y las redes de asociaciones genéticas. ^[8] Desde entonces, se considera que los interactomas de muchos organismos modelo han sido bien caracterizados, en particular el interactoma de Saccharomyces cerevisiae ^[18] y el interactoma de Drosophila . ^[19]

Los enfoques experimentales de alto rendimiento para descubrir interacciones proteína-proteína generalmente realizan una versión del enfoque de detección de dos híbridos o purificación por afinidad en tándem seguida de espectrometría de masas . ^[12] La información de experimentos y la curación de la literatura se compilan en bases de datos de interacciones de proteínas, como DIP, ^[20] y BioGRID . ^[11] Un esfuerzo más reciente, HINT-KB, ^[10] intenta fusionar la mayoría de las bases de datos actuales de PPI, pero filtrando interacciones sistemáticamente erróneas y tratando de corregir los sesgos de muestreo sociológicos inherentes en conjuntos de datos seleccionados por la literatura.

Se han descrito redes de interactomas humanos más pequeñas en el contexto específico de importantes impulsores de muchos trastornos diferentes, incluidos los trastornos neurodegenerativos , ^[21] el autismo y otros trastornos psiquiátricos, ^[22] y el cáncer. Las redes de genes del cáncer se han estudiado particularmente bien, debido en parte a grandes iniciativas genómicas como el Atlas del Genoma del Cáncer (TCGA). ^[23] Se ha mapeado una gran parte del panorama mutacional, incluida la heterogeneidad intratumoral, para los tipos de cánceres más comunes ^[24] (por ejemplo, el cáncer de mama ha sido bien estudiado), ^[25] y muchos estudios también han investigado la diferencia. entre genes conductores activos y mutaciones pasajeras pasivas en el contexto de las redes de interacción del cáncer. ^[dieciséis]

Los primeros intentos de mapeo integrador del interactoma humano a gran escala ocurrieron alrededor de 2005. Stetzl et al. ^[26] utilizaron una matriz proteica de 4500 cebos y 5600 presas en un sistema híbrido de dos levaduras para reconstruir el interactoma, y Rual et al. realizó un estudio similar de dos híbridos de levadura verificado con purificación de coafinidad y correlación con otros atributos biológicos, revelando más de 300 conexiones con 100 proteínas asociadas a enfermedades. ^[12] Desde esos esfuerzos pioneros, se han realizado cientos de estudios similares. Las bases de datos compiladas como UniHI ^[27] proporcionan una plataforma para una entrada única. Futchik et al. ^[28] realizaron un metanálisis de ocho mapas de interactomas y descubrieron que de 57 000 proteínas que interactúan en total, había una pequeña superposición (aunque estadísticamente significativa) entre las diferentes bases de datos, lo que indica sesgos considerables de selección y detección.

En 2010, se describieron alrededor de 130.000 interacciones binarias en el interactoma en las bases de datos más populares, pero muchas fueron verificadas con una sola fuente. ^[15] Con el rápido desarrollo de métodos de alto rendimiento, los conjuntos de datos todavía sufren de altas tasas de falsos positivos y baja cobertura del interactoma. Tyagi et al. ^[29] describieron un marco novedoso para incorporar complejos estructurales e interfaces vinculantes para la verificación. Esto fue parte de esfuerzos mucho mayores para la verificación del IPP; Las redes de interacción generalmente se validan aún más mediante el uso de una combinación de perfiles de coexpresión , información estructural de proteínas, términos de ontología genética , consideraciones topológicas y colocalización ^[26]^[30] antes de ser consideradas de "alta confianza".

Un artículo de recursos reciente (noviembre de 2014) ^[17] intenta proporcionar un mapa más completo a nivel de proteoma del interactoma humano. Encontró un vasto territorio inexplorado en el interactoma humano y utilizó diversos métodos para construir un nuevo mapa del interactoma que corrigiera el sesgo de curación, incluido el sondeo de todas las combinaciones por pares de 13 000 productos proteicos para la interacción utilizando dos híbridos de levadura y purificación por coafinidad, en un experimento masivo. esfuerzo coordinado entre laboratorios de investigación en Canadá y Estados Unidos. Sin embargo, esto todavía representa la confirmación de sólo una fracción de las interacciones esperadas: alrededor de 30 000 de confianza alta. A pesar de los esfuerzos coordinados de muchos, el interactoma humano es todavía un trabajo en progreso. ^[17]^[30]

Ver también

Referencias

^ Bonetta L (diciembre de 2010). "Interacciones proteína-proteína: Interactome en construcción". Naturaleza . 468 (7325): 851–4. Código Bib : 2010Natur.468..851B. doi : 10.1038/468851a . PMID 21150998. S2CID 205060874.
^ ab Stumpf MP, Thorne T, de Silva E, Stewart R, An HJ, Lappe M, Wiuf C (mayo de 2008). "Estimación del tamaño del interactoma humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 (19): 6959–64. doi : 10.1073/pnas.0708078105 . PMC 2383957 . PMID 18474861.
^ Hamosh A, Scott AF, Amberger JS, Bocchini CA, McKusick VA (enero de 2005). "Herencia mendeliana en el hombre en línea (OMIM), una base de conocimientos sobre genes humanos y trastornos genéticos". Investigación de ácidos nucleicos . 33 (Problema de la base de datos): D514–7. doi : 10.1093/nar/gki033. PMC 539987 . PMID 15608251.
^ Stenson PD, Mort M, Ball EV, Shaw K, Phillips A, Cooper DN (enero de 2014). "La base de datos de mutaciones genéticas humanas: creación de un repositorio integral de mutaciones para genética clínica y molecular, pruebas de diagnóstico y medicina genómica personalizada". Genética Humana . 133 (1): 1–9. doi :10.1007/s00439-013-1358-4. PMC 3898141 . PMID 24077912.
^ Chuang HY, Hofree M, Ideker T (2010). "Una década de biología de sistemas". Revisión anual de biología celular y del desarrollo . 26 : 721–44. doi : 10.1146/annurev-cellbio-100109-104122. PMC 3371392 . PMID 20604711.
^ Golpe N (julio de 2009). "Biología de sistemas: desenredando la red de proteínas". Naturaleza . 460 (7253): 415–8. Código Bib :2009Natur.460..415B. doi : 10.1038/460415a . PMID 19606149.
^ Vidal M, Cusick ME, Barabási AL (marzo de 2011). "Redes Interactome y enfermedades humanas". Celúla . 144 (6): 986–98. doi :10.1016/j.cell.2011.02.016. PMC 3102045 . PMID 21414488.
^ ab Amaral LA (mayo de 2008). "Una medida más verdadera de nuestra ignorancia". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 (19): 6795–6. Código Bib : 2008PNAS..105.6795A. doi : 10.1073/pnas.0802459105 . PMC 2383987 . PMID 18474865.
^ Bork P, Jensen LJ, von Mering C, Ramani AK, Lee I, Marcotte EM (junio de 2004). "Redes de interacción de proteínas de levadura a humano". Opinión actual en biología estructural . 14 (3): 292–9. doi :10.1016/j.sbi.2004.05.003. PMID 15193308.
^ abcd Konstantinos T, Dimitrakopoulos C, Kleftogiannis D, Charalampos M, Stergios P, Likothanassis S, Seferina M (2014). "HINT-KB: la base de conocimientos de Human Interactome". Revisión de inteligencia artificial . 42 (3): 427–443. doi :10.1007/s10462-013-9409-8. S2CID 16376962.
^ ab Chatr-Aryamontri A, Breitkreutz BJ, Oughtred R, Boucher L, Heinicke S, Chen D, Stark C, Breitkreutz A, Kolas N, O'Donnell L, Reguly T, Nixon J, Ramage L, Winter A, Sellam A , Chang C, Hirschman J, Theesfeld C, Rust J, Livstone MS, Dolinski K, Tyers M (enero de 2015). "La base de datos de interacción BioGRID: actualización de 2015". Investigación de ácidos nucleicos . 43 (Problema de la base de datos): D470–8. doi : 10.1093/nar/gku1204. PMC 4383984 . PMID 25428363.
^ abc Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, et al. (octubre de 2005). "Hacia un mapa a escala de proteoma de la red de interacción proteína-proteína humana". Naturaleza . 437 (7062): 1173–8. Código Bib : 2005Natur.437.1173R. doi : 10.1038/naturaleza04209. PMID 16189514. S2CID 4427026.
^ Margolin AA, Nemenman I, Basso K, Wiggins C, Stolovitzky G, Dalla Favera R, Califano A (marzo de 2006). "ARACNE: un algoritmo para la reconstrucción de redes reguladoras de genes en un contexto celular de mamíferos". Bioinformática BMC . 7 (Suplemento 1): T7. arXiv : q-bio/0410037 . doi : 10.1186/1471-2105-7-S1-S7 . PMC 1810318 . PMID 16723010. ^{[ enlace muerto ]}
^ Jaeger S, Gaudan S, Leser U, Rebholz-Schuhmann D (julio de 2008). "Integración de interacciones proteína-proteína y minería de texto para la predicción de la función de las proteínas". Bioinformática BMC . 9 (Suplemento 8): T2. doi : 10.1186/1471-2105-9-S8-S2 . PMC 2500093 . PMID 18673526. ^{[ enlace muerto ]}
^ ab Bonetta L (diciembre de 2010). "Interacciones proteína-proteína: Interactome en construcción". Naturaleza . 468 (7325): 851–4. Código Bib : 2010Natur.468..851B. doi : 10.1038/468851a . PMID 21150998. S2CID 205060874.
^ ab Reimand J, Bader GD (2013). "El análisis sistemático de mutaciones somáticas en la señalización de la fosforilación predice nuevos impulsores del cáncer". Biología de sistemas moleculares . 9 : 637. doi : 10.1038/msb.2012.68. PMC 3564258 . PMID 23340843.
^ abc Rolland T, Taşan M, Charloteaux B, Pevzner SJ, Zhong Q, Sahni N, et al. (noviembre de 2014). "Un mapa a escala de proteoma de la red del interactoma humano". Celúla . 159 (5): 1212-1226. doi :10.1016/j.cell.2014.10.050. PMC 4266588 . PMID 25416956.
^ Yu H, Braun P, Yildirim MA, Lemmens I, Venkatesan K, Sahalie J, et al. (octubre de 2008). "Mapa de interacción de proteínas binarias de alta calidad de la red del interactoma de levadura". Ciencia . 322 (5898): 104–10. Código Bib : 2008 Ciencia... 322.. 104Y. doi : 10.1126/ciencia.1158684. PMC 2746753 . PMID 18719252.
^ Giot L, Bader JS, Brouwer C, Chaudhuri A, Kuang B, Li Y, et al. (Diciembre de 2003). "Un mapa de interacción de proteínas de Drosophila melanogaster". Ciencia . 302 (5651): 1727–36. Código Bib : 2003 Ciencia... 302.1727G. doi : 10.1126/ciencia.1090289 . PMID 14605208. S2CID 1642026.
^ Xenarios I, Salwínski L, Duan XJ, Higney P, Kim SM, Eisenberg D (enero de 2002). "DIP, la base de datos de proteínas que interactúan: una herramienta de investigación para estudiar redes celulares de interacciones de proteínas". Investigación de ácidos nucleicos . 30 (1): 303–5. doi :10.1093/nar/30.1.303. PMC 99070 . PMID 11752321.
^ Lim J, Hao T, Shaw C, Patel AJ, Szabó G, Rual JF, Fisk CJ, Li N, Smolyar A, Hill DE, Barabási AL, Vidal M, Zoghbi HY (mayo de 2006). "Una red de interacción proteína-proteína para ataxias hereditarias humanas y trastornos de la degeneración de las células de Purkinje". Celúla . 125 (4): 801–14. doi : 10.1016/j.cell.2006.03.032 . PMID 16713569.
^ Chang J, Gilman SR, Chiang AH, Sanders SJ, Vitkup D (febrero de 2015). "Relaciones entre genotipo y fenotipo en los trastornos del espectro autista". Neurociencia de la Naturaleza . 18 (2): 191–8. doi :10.1038/nn.3907. PMC 4397214 . PMID 25531569.
^ Red de investigación del Atlas del genoma del cáncer (septiembre de 2012). "Caracterización genómica integral de cánceres de pulmón de células escamosas". Naturaleza . 489 (7417): 519–25. Código Bib :2012Natur.489..519T. doi : 10.1038/naturaleza11404. PMC 3466113 . PMID 22960745.
^ Gulati S, Cheng TM, Bates PA (agosto de 2013). "Redes de cáncer y más allá: interpretación de mutaciones utilizando el interactoma humano y la estructura de las proteínas". Seminarios de Biología del Cáncer . 23 (4): 219–26. doi :10.1016/j.semcancer.2013.05.002. PMID 23680723.
^ Taylor IW, Linding R, Warde-Farley D, Liu Y, Pesquita C, Faria D, Bull S, Pawson T, Morris Q, Wrana JL (febrero de 2009). "La modularidad dinámica en las redes de interacción de proteínas predice el resultado del cáncer de mama". Biotecnología de la Naturaleza . 27 (2): 199–204. doi :10.1038/nbt.1522. PMID 19182785. S2CID 11594017.
^ ab Stelzl U, Worm U, Lalowski M, Haenig C, Brembeck FH, Goehler H, Stroedicke M, Zenkner M, Schoenherr A, Koeppen S, Timm J, Mintzlaff S, Abraham C, Bock N, Kietzmann S, Goedde A, Toksöz E, Droege A, Krobitsch S, Korn B, Birchmeier W, Lehrach H, Wanker EE (septiembre de 2005). "Una red de interacción proteína-proteína humana: un recurso para anotar el proteoma". Celúla . 122 (6): 957–68. doi :10.1016/j.cell.2005.08.029. hdl : 11858/00-001M-0000-0010-8592-0 . PMID 16169070. S2CID 8235923.
^ Chaurasia G, Iqbal Y, Hänig C, Herzel H, Wanker EE, Futchik ME (enero de 2007). "UniHI: una puerta de entrada al interactoma de proteínas humanas". Investigación de ácidos nucleicos . 35 (Problema de la base de datos): D590–4. doi : 10.1093/nar/gkl817. PMC 1781159 . PMID 17158159.
^ Futchik ME, Chaurasia G, Herzel H (marzo de 2007). "Comparación de mapas de interacción proteína-proteína humana". Bioinformática . 23 (5): 605–11. doi : 10.1093/bioinformática/btl683 . PMID 17237052.
^ Tyagi M, Hashimoto K, Shoemaker BA, Wuchty S, Panchenko AR (marzo de 2012). "Mapeo a gran escala del interactoma de proteínas humanas mediante complejos estructurales". Informes EMBO . 13 (3): 266–71. doi :10.1038/embor.2011.261. PMC 3296913 . PMID 22261719.
^ ab De Las Rivas J, Fontanillo C (junio de 2010). "Conceptos básicos de las interacciones proteína-proteína: conceptos clave para construir y analizar redes de interactomas". PLOS Biología Computacional . 6 (6): e1000807. Código Bib : 2010PLSCB...6E0807D. doi : 10.1371/journal.pcbi.1000807 . PMC 2891586 . PMID 20589078.