stringtranslate.com

Interactoma humano

El interactoma humano es el conjunto de interacciones proteína-proteína (el interactoma ) que ocurren en las células humanas. [1] [2] La secuenciación de genomas de referencia, en particular el Proyecto Genoma Humano , ha revolucionado la genética humana , la biología molecular y la medicina clínica . Los resultados del estudio de asociación de todo el genoma han llevado a la asociación de genes con la mayoría de los trastornos mendelianos , [3] y más de 140 000 mutaciones de la línea germinal se han asociado con al menos una enfermedad genética. [4] Sin embargo, se hizo evidente que inherente a estos estudios hay un énfasis en el resultado clínico en lugar de una comprensión integral de la enfermedad humana; de hecho, hasta la fecha, las contribuciones más significativas de GWAS se han restringido a los "frutos al alcance de la mano" de los trastornos de mutación única directa, lo que impulsa un enfoque de biología de sistemas para el análisis genómico. [5] [6] La conexión entre genotipo y fenotipo (cómo la variación en el genotipo afecta la enfermedad o el funcionamiento normal de la célula y el cuerpo humano) sigue siendo esquiva, especialmente en el contexto de los rasgos complejos multigénicos y el cáncer. [7] Para asignar un contexto funcional a los cambios genotípicos, gran parte de los esfuerzos de investigación recientes se han dedicado al mapeo de las redes formadas por interacciones de componentes celulares y genéticos en humanos, así como también a cómo estas redes son alteradas por enfermedades genéticas y somáticas.

Fondo

Con la secuenciación de los genomas de una gran variedad de organismos modelo, se hizo evidente que el número de genes no se correlaciona con la percepción humana de la complejidad relativa de los organismos: el proteoma humano contiene unos 20 000 genes, [8] lo que es menor que el de algunas especies como el maíz. Un enfoque estadístico para calcular el número de interacciones en humanos arroja una estimación de alrededor de 650 000, un orden de magnitud mayor que Drosophila y tres veces mayor que C. elegans . [2] A partir de 2008, solo alrededor de <0,3% de todas las interacciones estimadas entre proteínas humanas se han identificado, [9] aunque en los últimos años ha habido un crecimiento exponencial en el descubrimiento: a partir de 2015, [10] actualmente se han catalogado más de 210 000 interacciones proteína-proteína positivas humanas únicas, y la base de datos bioGRID contiene casi 750 000 PPI seleccionados de la literatura para 30 organismos modelo, 300 000 de los cuales son interacciones proteína-proteína físicas o genéticas humanas verificadas o predichas, un aumento del 50% desde 2013. [11] La información actualmente disponible sobre la red del interactoma humano se origina a partir de interacciones seleccionadas de la literatura, [12] experimentos de alto rendimiento , [10] o de interacciones potenciales predichas a partir de datos del interactoma, ya sea a través de perfiles filogenéticos (similitud evolutiva), inferencia de red estadística, [13] o métodos de minería de texto/literatura. [14]

Las interacciones proteína-proteína son sólo la materia prima para las redes. Para formar bases de datos útiles de interactomas y crear redes integradas, otros tipos de datos que se pueden combinar con las interacciones proteína-proteína incluyen información sobre la expresión y coexpresión génica , la co-localización celular de proteínas (basada en microscopía ), información genética, vías metabólicas y de señalización , y más. [15] El objetivo final de desentrañar los interactomas de proteínas humanas es, en última instancia, comprender los mecanismos de la enfermedad y descubrir genes de enfermedades previamente desconocidos. Se ha descubierto que las proteínas con un alto número de interacciones (bordes externos) tienen significativamente más probabilidades de ser centros en módulos que se correlacionan con la enfermedad, [10] [16] probablemente porque las proteínas con más interacciones están involucradas en más funciones biológicas. Al mapear las alteraciones de la enfermedad al interactoma humano, podemos obtener una comprensión mucho mejor de las vías y los procesos biológicos de la enfermedad. [17]

Estudiando el interactoma humano

El análisis de las redes metabólicas de las proteínas se remonta a la década de 1940, pero no fue hasta finales de la década de 1990 y principios de la década de 2000 que los análisis genómicos basados ​​en datos computacionales para predecir el contexto funcional y las redes de asociaciones genéticas aparecieron en serio. [8] Desde entonces, se considera que los interactomas de muchos organismos modelo han sido bien caracterizados, en particular el interactoma de Saccharomyces cerevisiae [18] y el interactoma de Drosophila . [19]

Los enfoques experimentales de alto rendimiento para descubrir interacciones proteína-proteína generalmente realizan una versión del enfoque de detección de dos híbridos o purificación por afinidad en tándem seguida de espectrometría de masas . [12] La información de los experimentos y la curación de la literatura se compilan en bases de datos de interacciones de proteínas, como DIP, [20] y BioGRID . [11] Un esfuerzo más reciente, HINT-KB, [10] intenta amalgamar la mayoría de las bases de datos PPI actuales, pero filtrando sistemáticamente las interacciones erróneas y tratando de corregir los sesgos de muestreo sociológico inherentes en los conjuntos de datos curados de la literatura.

Se han descrito redes interactómicas humanas más pequeñas en el contexto específico de impulsores importantes de muchos trastornos diferentes, incluidos los trastornos neurodegenerativos , [21] el autismo y otros trastornos psiquiátricos, [22] y el cáncer. Las redes de genes del cáncer se han estudiado particularmente bien, debido en parte a grandes iniciativas genómicas como el Atlas del Genoma del Cáncer (TCGA). [23] Se ha cartografiado una gran parte del panorama mutacional, incluida la heterogeneidad intratumoral, para los tipos de cáncer más comunes [24] (por ejemplo, el cáncer de mama ha sido bien estudiado), [25] y muchos estudios también han investigado la diferencia entre genes impulsores activos y mutaciones pasajeras pasivas en el contexto de las redes de interacción del cáncer. [16]

Los primeros intentos de mapeo humano integrador a gran escala ocurrieron alrededor de 2005. Stetzl et al. [26] utilizaron una matriz de proteínas de 4500 cebos y 5600 presas en un sistema híbrido de levadura dos para reconstruir el interactoma, y ​​Rual et al. realizaron un estudio similar de híbrido de levadura dos verificado con purificación de coafinidad y correlación con otros atributos biológicos, revelando más de 300 conexiones a 100 proteínas asociadas a enfermedades. [12] Desde esos esfuerzos pioneros, se han realizado cientos de estudios similares. Las bases de datos compiladas como UniHI [27] brindan una plataforma para una sola entrada. Futschik et al. [28] realizaron un metaanálisis de ocho mapas de interactomas y encontraron que de 57 000 proteínas interactuantes en total, había una pequeña superposición (aunque estadísticamente significativa) entre las diferentes bases de datos, lo que indica sesgos considerables de selección y detección.

En 2010, se describieron alrededor de 130 000 interacciones binarias en el interactoma en las bases de datos más populares, pero muchas se verificaron con una sola fuente. [15] Con el rápido desarrollo de métodos de alto rendimiento, los conjuntos de datos aún sufren altas tasas de falsos positivos y baja cobertura del interactoma. Tyagi et al. [29] describieron un nuevo marco para incorporar complejos estructurales e interfaces de unión para la verificación. Esto fue parte de esfuerzos mucho más grandes para la verificación de PPI; las redes de interacción generalmente se validan aún más mediante el uso de una combinación de perfiles de coexpresión , información estructural de proteínas, términos de ontología genética , consideraciones topológicas y colocalización [26] [30] antes de considerarse de "alta confianza".

Un artículo de referencia reciente (noviembre de 2014) [17] intenta proporcionar un mapa a nivel de proteoma más completo del interactoma humano. Encontró un vasto territorio inexplorado en el interactoma humano y utilizó diversos métodos para construir un nuevo mapa del interactoma que corrige el sesgo de curación, incluido el sondeo de todas las combinaciones por pares de 13 000 productos proteínicos para la interacción utilizando híbridos de levadura dos y purificación por coafinidad, en un esfuerzo coordinado masivo entre laboratorios de investigación en Canadá y Estados Unidos. Sin embargo, esto todavía representa la confirmación de solo una fracción de las interacciones esperadas: alrededor de 30 000 de alto nivel de confianza. A pesar de los esfuerzos coordinados de muchos, el interactoma humano todavía es en gran medida un trabajo en progreso. [17] [30]

Véase también

Referencias

  1. ^ Bonetta L (diciembre de 2010). «Interacciones proteína-proteína: interactoma en construcción». Nature . 468 (7325): 851–4. Bibcode :2010Natur.468..851B. doi : 10.1038/468851a . PMID  21150998. S2CID  205060874.
  2. ^ ab Stumpf MP, Thorne T, de Silva E, Stewart R, An HJ, Lappe M, Wiuf C (mayo de 2008). "Estimación del tamaño del interactoma humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 (19): 6959–64. doi : 10.1073/pnas.0708078105 . PMC 2383957 . PMID  18474861. 
  3. ^ Hamosh A, Scott AF, Amberger JS, Bocchini CA, McKusick VA (enero de 2005). "Online Mendelian Inheritance in Man (OMIM), una base de conocimiento de genes humanos y trastornos genéticos". Nucleic Acids Research . 33 (número de base de datos): D514–7. doi :10.1093/nar/gki033. PMC 539987 . PMID  15608251. 
  4. ^ Stenson PD, Mort M, Ball EV, Shaw K, Phillips A, Cooper DN (enero de 2014). "La base de datos de mutaciones genéticas humanas: creación de un repositorio de mutaciones integral para genética clínica y molecular, pruebas diagnósticas y medicina genómica personalizada". Genética humana . 133 (1): 1–9. doi :10.1007/s00439-013-1358-4. PMC 3898141 . PMID  24077912. 
  5. ^ Chuang HY, Hofree M, Ideker T (2010). "Una década de biología de sistemas". Revisión anual de biología celular y del desarrollo . 26 : 721–44. doi :10.1146/annurev-cellbio-100109-104122. PMC 3371392. PMID  20604711 . 
  6. ^ Blow N (julio de 2009). "Biología de sistemas: desenredando la red proteica". Nature . 460 (7253): 415–8. Bibcode :2009Natur.460..415B. doi : 10.1038/460415a . PMID  19606149.
  7. ^ Vidal M, Cusick ME, Barabási AL (marzo de 2011). "Redes interactómicas y enfermedades humanas". Cell . 144 (6): 986–98. doi :10.1016/j.cell.2011.02.016. PMC 3102045 . PMID  21414488. 
  8. ^ ab Amaral LA (mayo de 2008). "Una medida más verdadera de nuestra ignorancia". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 (19): 6795–6. Bibcode :2008PNAS..105.6795A. doi : 10.1073/pnas.0802459105 . PMC 2383987 . PMID  18474865. 
  9. ^ Bork P, Jensen LJ, von Mering C, Ramani AK, Lee I, Marcotte EM (junio de 2004). "Redes de interacción de proteínas desde la levadura hasta los seres humanos". Current Opinion in Structural Biology . 14 (3): 292–9. doi :10.1016/j.sbi.2004.05.003. PMID  15193308.
  10. ^ abcd Konstantinos T, Dimitrakopoulos C, Kleftogiannis D, Charalampos M, Stergios P, Likothanassis S, Seferina M (2014). "HINT-KB: la base de conocimientos de Human Interactome". Revisión de inteligencia artificial . 42 (3): 427–443. doi :10.1007/s10462-013-9409-8. S2CID  16376962.
  11. ^ ab Chatr-Aryamontri A, Breitkreutz BJ, Oughtred R, Boucher L, Heinicke S, Chen D, Stark C, Breitkreutz A, Kolas N, O'Donnell L, Reguly T, Nixon J, Ramage L, Winter A, Sellam A , Chang C, Hirschman J, Theesfeld C, Rust J, Livstone MS, Dolinski K, Tyers M (enero 2015). "La base de datos de interacción BioGRID: actualización de 2015". Investigación de ácidos nucleicos . 43 (Problema de la base de datos): D470–8. doi : 10.1093/nar/gku1204. PMC 4383984 . PMID  25428363. 
  12. ^ abc Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, et al. (octubre de 2005). "Hacia un mapa a escala del proteoma de la red de interacción proteína-proteína humana". Nature . 437 (7062): 1173–8. Bibcode :2005Natur.437.1173R. doi :10.1038/nature04209. PMID  16189514. S2CID  4427026.
  13. ^ Margolin AA, Nemenman I, Basso K, Wiggins C, Stolovitzky G, Dalla Favera R, Califano A (marzo de 2006). "ARACNE: un algoritmo para la reconstrucción de redes reguladoras de genes en un contexto celular de mamíferos". BMC Bioinformatics . 7 (Supl 1): S7. arXiv : q-bio/0410037 . doi : 10.1186/1471-2105-7-S1-S7 . PMC 1810318 . PMID  16723010. [ enlace muerto ]
  14. ^ Jaeger S, Gaudan S, Leser U, Rebholz-Schuhmann D (julio de 2008). "Integración de interacciones proteína-proteína y minería de texto para la predicción de la función de las proteínas". BMC Bioinformatics . 9 (Supl 8): S2. doi : 10.1186/1471-2105-9-S8-S2 . PMC 2500093 . PMID  18673526. [ enlace muerto ]
  15. ^ ab Bonetta L (diciembre de 2010). "Interacciones proteína-proteína: interactoma en construcción". Nature . 468 (7325): 851–4. Bibcode :2010Natur.468..851B. doi : 10.1038/468851a . PMID  21150998. S2CID  205060874.
  16. ^ ab Reimand J, Bader GD (2013). "El análisis sistemático de mutaciones somáticas en la señalización de fosforilación predice nuevos factores desencadenantes del cáncer". Biología de sistemas moleculares . 9 : 637. doi :10.1038/msb.2012.68. PMC 3564258 . PMID  23340843. 
  17. ^ abc Rolland T, Taşan M, Charloteaux B, Pevzner SJ, Zhong Q, Sahni N, et al. (noviembre de 2014). "Un mapa a escala del proteoma de la red del interactoma humano". Cell . 159 (5): 1212–1226. doi :10.1016/j.cell.2014.10.050. PMC 4266588 . PMID  25416956. 
  18. ^ Yu H, Braun P, Yildirim MA, Lemmens I, Venkatesan K, Sahalie J, et al. (octubre de 2008). "Mapa de interacción de proteínas binarias de alta calidad de la red interactómica de levadura". Science . 322 (5898): 104–10. Bibcode :2008Sci...322..104Y. doi :10.1126/science.1158684. PMC 2746753 . PMID  18719252. 
  19. ^ Giot L, Bader JS, Brouwer C, Chaudhuri A, Kuang B, Li Y, et al. (Diciembre de 2003). "Un mapa de interacción de proteínas de Drosophila melanogaster". Ciencia . 302 (5651): 1727–36. Código Bib : 2003 Ciencia... 302.1727G. doi : 10.1126/ciencia.1090289 . PMID  14605208. S2CID  1642026.
  20. ^ Xenarios I, Salwínski L, Duan XJ, Higney P, Kim SM, Eisenberg D (enero de 2002). "DIP, la base de datos de proteínas interactuantes: una herramienta de investigación para estudiar redes celulares de interacciones proteínicas". Nucleic Acids Research . 30 (1): 303–5. doi :10.1093/nar/30.1.303. PMC 99070 . PMID  11752321. 
  21. ^ Lim J, Hao T, Shaw C, Patel AJ, Szabó G, Rual JF, Fisk CJ, Li N, Smolyar A, Hill DE, Barabási AL, Vidal M, Zoghbi HY (mayo de 2006). "Una red de interacción proteína-proteína para las ataxias hereditarias humanas y los trastornos de la degeneración de las células de Purkinje". Cell . 125 (4): 801–14. doi : 10.1016/j.cell.2006.03.032 . PMID  16713569.
  22. ^ Chang J, Gilman SR, Chiang AH, Sanders SJ, Vitkup D (febrero de 2015). "Relaciones entre genotipo y fenotipo en los trastornos del espectro autista". Nature Neuroscience . 18 (2): 191–8. doi :10.1038/nn.3907. PMC 4397214 . PMID  25531569. 
  23. ^ Cancer Genome Atlas Research Network (septiembre de 2012). "Caracterización genómica integral de los cánceres de pulmón de células escamosas". Nature . 489 (7417): 519–25. Bibcode :2012Natur.489..519T. doi :10.1038/nature11404. PMC 3466113 . PMID  22960745. 
  24. ^ Gulati S, Cheng TM, Bates PA (agosto de 2013). "Redes de cáncer y más allá: interpretación de mutaciones utilizando el interactoma humano y la estructura proteica". Seminarios en biología del cáncer . 23 (4): 219–26. doi :10.1016/j.semcancer.2013.05.002. PMID  23680723.
  25. ^ Taylor IW, Linding R, Warde-Farley D, Liu Y, Pesquita C, Faria D, Bull S, Pawson T, Morris Q, Wrana JL (febrero de 2009). "La modularidad dinámica en las redes de interacción de proteínas predice el resultado del cáncer de mama". Nature Biotechnology . 27 (2): 199–204. doi :10.1038/nbt.1522. PMID  19182785. S2CID  11594017.
  26. ^ ab Stelzl U, Worm U, Lalowski M, Haenig C, Brembeck FH, Goehler H, Stroedicke M, Zenkner M, Schoenherr A, Koeppen S, Timm J, Mintzlaff S, Abraham C, Bock N, Kietzmann S, Goedde A, Toksöz E, Droege A, Krobitsch S, Korn B, Birchmeier W, Lehrach H, Wanker EE (septiembre de 2005). "Una red de interacción proteína-proteína humana: un recurso para anotar el proteoma". Celúla . 122 (6): 957–68. doi :10.1016/j.cell.2005.08.029. hdl : 11858/00-001M-0000-0010-8592-0 . Número de modelo: PMID  16169070. Número de modelo: S2CID  8235923.
  27. ^ Chaurasia G, Iqbal Y, Hänig C, Herzel H, Wanker EE, Futschik ME (enero de 2007). "UniHI: una puerta de entrada al interactoma proteico humano". Nucleic Acids Research . 35 (número de la base de datos): D590–4. doi :10.1093/nar/gkl817. PMC 1781159 . PMID  17158159. 
  28. ^ Futschik ME, Chaurasia G, Herzel H (marzo de 2007). "Comparación de mapas de interacción proteína-proteína humana". Bioinformática . 23 (5): 605–11. doi : 10.1093/bioinformatics/btl683 . PMID  17237052.
  29. ^ Tyagi M, Hashimoto K, Shoemaker BA, Wuchty S, Panchenko AR (marzo de 2012). "Mapeo a gran escala del interactoma de proteínas humanas utilizando complejos estructurales". EMBO Reports . 13 (3): 266–71. doi :10.1038/embor.2011.261. PMC 3296913 . PMID  22261719. 
  30. ^ ab De Las Rivas J, Fontanillo C (junio de 2010). "Aspectos esenciales de las interacciones proteína-proteína: conceptos clave para construir y analizar redes interactómicas". PLOS Computational Biology . 6 (6): e1000807. Bibcode :2010PLSCB...6E0807D. doi : 10.1371/journal.pcbi.1000807 . PMC 2891586 . PMID  20589078.