stringtranslate.com

ARN quimérico

El ARN quimérico , a veces denominado transcripción de fusión , está compuesto de exones de dos o más genes diferentes que tienen el potencial de codificar proteínas nuevas. [1] Estos ARNm son diferentes de los producidos por empalme convencional , ya que son producidos por dos o más loci genéticos.

Revisión de la producción de ARN

La vía desde el ADN hasta la expresión de proteínas es fundamental para el dogma central de la biología. [2]

En 1956, Francis Crick propuso lo que ahora se conoce como el " dogma central " de la biología: [3]

El ADN codifica la información genética necesaria para que un organismo lleve a cabo su ciclo de vida. En efecto, el ADN sirve como el "disco duro" que almacena los datos genéticos. El ADN se replica y sirve como su propia plantilla para la replicación. El ADN forma una estructura de doble hélice y está compuesto por una cadena principal de azúcar-fosfato y bases nitrogenadas; esto puede considerarse como una estructura de escalera donde los lados de la escalera están construidos de azúcar desoxirribosa y fosfato, mientras que los peldaños de la escalera están compuestos de bases nitrogenadas pareadas . [4] Hay cuatro bases en una molécula de ADN: adenina (A), citosina (C), timina (T) y guanina (G). Los nucleótidos son un componente estructural del ADN y el ARN, y están hechos de una molécula de azúcar y una molécula de ácido fosfórico. La estructura de doble hélice del ADN está compuesta por dos hebras antiparalelas que están orientadas en direcciones opuestas. El ADN está compuesto de pares de bases en los que la adenina se empareja con la timina y la guanina se empareja con la citosina. Mientras que el ADN sirve como plantilla para la producción de ácido ribonucleico (ARN), el ARN es generalmente responsable de la fabricación de proteínas. El proceso de fabricación de ARN a partir del ADN se llama transcripción. El ARN utiliza un conjunto similar de bases, excepto que la timina se reemplaza por uracilo . Un grupo de enzimas llamadas ARN polimerasas (aisladas por los bioquímicos Jerard Hurwitz y Samuel B. Weiss) funcionan en presencia de ADN. Estas enzimas producen ARN utilizando segmentos de ADN cromosómico como plantilla. A diferencia de la replicación, donde se hace una copia completa del ADN, la transcripción copia solo el gen que se va a expresar como proteína. [5]

Inicialmente, se pensó que el ARN servía como plantilla estructural para la síntesis de proteínas , ordenando esencialmente los aminoácidos mediante una serie de cavidades diseñadas específicamente para que solo encajaran aminoácidos específicos. Crick no estaba satisfecho con esta hipótesis dado que las cuatro bases del ARN son hidrófilas y que muchos aminoácidos prefieren interacciones con grupos hidrófobos. Además, algunos aminoácidos son muy similares estructuralmente y Crick consideró que no sería posible una discriminación precisa dadas las similitudes. Luego Crick propuso que antes de la incorporación a las proteínas, los aminoácidos se unen primero a moléculas adaptadoras que tienen características superficiales únicas que pueden unirse a bases específicas en las plantillas de ARN. [5] Estas moléculas adaptadoras se denominan ARN de transferencia (ARNt).

Mediante una serie de experimentos con E. coli y el fago T4 en 1960, [5] se demostró que el ARN mensajero (ARNm) transporta información desde el ADN hasta los sitios ribosómicos de síntesis de proteínas. Los precursores de aminoácidos del ARNt son colocados en posición por los ribosomas , donde pueden leer la información proporcionada por las plantillas de ARNm para sintetizar proteínas.

Empalme de ARN

La creación de una proteína consta de dos pasos principales: la transcripción del ADN en ARN y la traducción del ARN en proteína. Una vez que el ADN se transcribe en ARN, la molécula se conoce como ARN premensajero (ARNm) y consta de exones e intrones que se pueden separar y reorganizar de muchas formas diferentes. Históricamente, los exones se consideran la secuencia codificante y los intrones se consideran el ADN "basura". Aunque se ha demostrado que esto es falso, es cierto que los exones a menudo se fusionan. Dependiendo de las necesidades de la célula, los mecanismos reguladores eligen qué exones, y a veces intrones, unir. Este proceso de eliminar fragmentos de una transcripción de pre-ARNm y combinarlos con otros fragmentos se llama empalme. El genoma humano codifica aproximadamente 25.000 genes, pero se producen significativamente más proteínas. Esto se logra mediante el empalme del ARN. Los exones de estos 25.000 genes se pueden unir de muchas formas diferentes para crear innumerables combinaciones de transcripciones de ARN y, en última instancia, innumerables proteínas. Normalmente, los exones de la misma transcripción de pre-ARNm se unen. Sin embargo, en ocasiones, los productos genéticos o las transcripciones de pre-ARNm se unen de modo que los exones de diferentes transcripciones se mezclan en un producto de fusión conocido como ARN quimérico. El ARN quimérico a menudo incorpora exones de genes altamente expresados, [1] pero la transcripción quimérica en sí misma suele expresarse en niveles bajos.

Este ARN quimérico puede luego traducirse en una proteína de fusión. Las proteínas de fusión son muy específicas de cada tejido [1] y se asocian frecuentemente con cánceres como el cáncer colorrectal, el cáncer de próstata [6] y el mesotelioma [7] . Explotan significativamente los péptidos señal y las proteínas transmembrana que pueden alterar la localización de las proteínas, posiblemente contribuyendo al fenotipo de la enfermedad.

Descubrimiento del ARN quimérico

Uno de los primeros estudios que investigaron la generación de ARN quimérico examinó la fusión de los tres primeros exones de un gen conocido como JAZF1 con los últimos 15 exones de un gen conocido como JJAZ1. [8] Esta transcripción exacta, y la proteína resultante, se encontraron específicamente en el tejido endometrial. Si bien se encuentran a menudo en cánceres de endometrio, estas transcripciones también se expresan en tejido normal. Originalmente se pensó que eran el resultado de fusiones cromosómicas, un grupo investigó si esto era correcto. Utilizando Southern blotting e hibridación in situ con fluorescencia (FISH) en el genoma, los investigadores no encontraron evidencia de reordenamiento del ADN. Decidieron investigar más combinando células endometriales humanas con fibroblastos rhesus y encontraron productos quiméricos que contenían secuencias de ambas especies. Estos datos sugirieron que el ARN quimérico se genera empalmando partes de genes juntos en lugar de reordenamientos cromosómicos. También realizaron espectrometría de masas en la proteína traducida para verificar que el ARN quimérico se traduzca en proteína.

Recientemente, los avances en la secuenciación de próxima generación han reducido significativamente el costo de la secuenciación, lo que ha permitido que se realicen más proyectos de secuenciación de ARN . Estos proyectos de secuenciación de ARN pueden detectar nuevas transcripciones de ARN en lugar de la micromatriz tradicional en la que solo se pueden detectar transcripciones conocidas. La secuenciación profunda permite la detección de transcripciones incluso en niveles muy bajos. Esto ha permitido a los investigadores detectar muchos más ARN quiméricos y proteínas de fusión y ha facilitado la comprensión de su papel en la salud y la enfermedad.

Productos proteicos quiméricos

Se han identificado numerosos supuestos transcritos quiméricos entre las etiquetas de secuencia expresadas utilizando tecnología de secuenciación de ARN de alto rendimiento . En los seres humanos, los transcritos quiméricos se pueden generar de varias maneras, como el empalme trans de pre-ARNm, el desbordamiento de la transcripción del ARN, a partir de otros errores en la transcripción del ARN o también pueden ser el resultado de la fusión de genes después de translocaciones o reordenamientos intercromosómicos . Entre los pocos productos proteicos correspondientes que se han caracterizado hasta ahora, la mayoría resultan de translocaciones cromosómicas y están asociados con el cáncer. Por ejemplo, la fusión de genes en la leucemia mielógena crónica (LMC) conduce a un transcrito de ARNm que abarca el extremo 5' del gen de la proteína de la región del grupo de puntos de ruptura (BCR) y el extremo 3' del gen homólogo 1 del oncogén viral de la leucemia murina de Abelson (ABL). La traducción de este transcrito da como resultado una proteína BCR-ABL quimérica que posee una mayor actividad de la tirosina quinasa . Las transcripciones quiméricas caracterizan fenotipos celulares específicos y se sospecha que funcionan no solo en el cáncer, sino también en células normales. Un ejemplo de una quimera en células humanas normales se genera mediante el transempalme de los exones 5' del gen JAZF1 en el cromosoma 7p15 y los exones 3' de JJAZ1 ( SUZ12 ) en el cromosoma 17q1. Este ARN quimérico se traduce en células del estroma endometrial y codifica una proteína antiapoptótica. Ejemplos notables de genes quiméricos en el cáncer son los genes fusionados BCR-ABL, FUS - ERG , MLL -AF6 y MOZ-CBP expresados ​​en la leucemia mieloide aguda (LMA) y la quimera TMPRSS2-ETS asociada con la sobreexpresión del oncogén en el cáncer de próstata. [1]

Características de las proteínas quiméricas

Frenkel-Morgenstern et al. han definido dos características principales de las proteínas quiméricas. Han informado que las quimeras explotan péptidos señal y dominios transmembrana para alterar la localización celular de las actividades asociadas. En segundo lugar, las quimeras incorporan genes parentales que se expresan a un alto nivel. [1] Un estudio de todos los dominios funcionales en proteínas codificadas por transcripciones quiméricas demostró que las quimeras contienen dominios proteicos completos con mucha más frecuencia que en conjuntos de datos aleatorios. [9]

Bases de datos de transcripciones quiméricas

Se han construido varias bases de datos para incorporar transcripciones quiméricas de diferentes recursos utilizando una variedad de procedimientos computacionales:

Herramientas computacionales para detectar ARN quimérico

Los recientes avances en la secuenciación de transcriptomas de alto rendimiento han allanado el camino para nuevos métodos computacionales para el descubrimiento de fusiones. Las siguientes son herramientas computacionales disponibles para la detección de transcripciones de fusión a partir de datos de ARN-Seq:

Se debe tener cierta precaución en la interpretación de los eventos de trans-splicing detectados en experimentos de secuenciación de alto rendimiento, ya que las enzimas transcriptasas inversas que se usan de manera ubicua para determinar secuencias de ARN son capaces de introducir eventos de trans-splicing aparentes que no estaban presentes en el ARN original. [26] [27] Sin embargo, algunos ARN quiméricos han sido confirmados por otros métodos. [28]

ARN quimérico en eucariotas inferiores

Aunque es poco común en eucariotas superiores, varios eucariotas inferiores, incluidos los nematodos y los tripanosomas, hacen un uso extensivo del trans-splicing para generar ARN quiméricos. [29] [30] En estos organismos, las reacciones de empalme entre un ARN codificador de proteínas y una secuencia universal dan como resultado la unión de un líder de empalme al extremo 5' del ARN, generando un ARN mensajero funcional . Este sistema permite el uso de operones : colecciones de genes codificadores de proteínas con una función compartida que se transcriben simultáneamente en un solo ARN y luego se empalman en ARN mensajeros individuales, cada uno de los cuales codifica una sola proteína.

Referencias

  1. ^ abcde Frenkel-Morgenstern, M.; Lacroix, V.; Ezkurdia, I.; Levin, Y.; Gabashvili, A.; Prilusky, J.; del Pozo, A.; Tress, M.; Johnson, R.; Guigo, R.; Valencia, A. (15 de mayo de 2012). "Quimeras tomando forma: Funciones potenciales de las proteínas codificadas por transcripciones de ARN quimérico". Genome Research . 22 (7): 1231–1242. doi :10.1101/gr.130062.111. PMC  3396365 . PMID  22588898.
  2. ^ Horspool, Daniel (28 de noviembre de 2008). "Dogma central de la bioquímica molecular con enzimas" . Consultado el 22 de julio de 2013 .
  3. ^ CRICK, FRANCIS (agosto de 1970). "Dogma central de la biología molecular". Nature . 227 (5258): 561–563. Bibcode :1970Natur.227..561C. doi :10.1038/227561a0. PMID  4913914. S2CID  4164029.
  4. ^ Geer, RC "Introducción a los recursos de biología molecular" . Consultado el 22 de julio de 2013 .
  5. ^ abc James D. Watson; et al. (2007). Biología molecular del gen (6.ª ed.). San Francisco, California: Benjamin Cummings. ISBN 9780805395921.
  6. ^ Tomlins, SA; Mehra, R; Rhodes, DR; Smith, LR; Roulston, D; Helgeson, BE; Cao, X; Wei, JT; Rubin, MA; Shah, RB; Chinnaiyan, AM (1 de abril de 2006). "Las fusiones de genes TMPRSS2:ETV4 definen un tercer subtipo molecular de cáncer de próstata". Cancer Research . 66 (7): 3396–400. doi : 10.1158/0008-5472.CAN-06-0168 . PMID  16585160.
  7. ^ Panagopoulos, Ioannis; Thorsen, Jim; Gorunova, Ludmila; Micci, Francesca; Haugom, Lisbeth; Davidson, Ben; Heim, Sverre (1 de agosto de 2013). "La secuenciación de ARN identifica la fusión de los genes EWSR1 e YY1 en el mesotelioma con t(14;22)(q32;q12)". Genes, cromosomas y cáncer . 52 (8): 733–740. doi :10.1002/gcc.22068. PMID  23630070. S2CID  28377909.
  8. ^ Koontz, JI; Soreng, AL; Nucci, M.; Kuo, FC; Pauwels, P.; van den Berghe, H.; Cin, PD; Fletcher, JA; Sklar, J. (22 de mayo de 2001). "Fusión frecuente de los genes JAZF1 y JJAZ1 en tumores del estroma endometrial". Actas de la Academia Nacional de Ciencias . 98 (11): 6348–6353. Bibcode :2001PNAS...98.6348K. doi : 10.1073/pnas.101132598 . PMC 33471 . PMID  11371647. 
  9. ^ Frenkel-Morgenstern, M.; Valencia, A. (11 de junio de 2012). "Nuevas combinaciones de dominios en proteínas codificadas por transcripciones quiméricas". Bioinformática . 28 (12): i67–i74. doi :10.1093/bioinformatics/bts216. PMC 3371848 . PMID  22689780. 
  10. ^ Gorohovski, A.; Tagore, S.; Palande, V.; Malka, A.; Raviv-Shay, D.; Frenkel-Morgenstern, M. (4 de enero de 2017). "ChiTaRS-3.1: la base de datos de transcripciones quiméricas mejoradas y secuencias de ARN que coinciden con las interacciones proteína-proteína". Investigación de ácidos nucleicos . 45 (D1): D790–D795. doi :10.1093/nar/gkw1127. PMC 5210585 . PMID  27899596. 
  11. ^ Frenkel-Morgenstern, M.; Gorohovski, A.; Vucenovic, D.; Maestre, L.; Valencia, A. (28 de enero de 2015). "ChiTaRS 2.1: una base de datos mejorada de las transcripciones quiméricas y datos de secuenciación de ARN con nuevas transcripciones de ARN quimérico sentido-antisentido". Investigación de ácidos nucleicos . 43 (D1): D68–D75. doi :10.1093/nar/gku1199. PMC 4383979 . PMID  25414346. 
  12. ^ Frenkel-Morgenstern, M.; Gorohovski, A.; Lacroix, V.; Rogers, M.; Ibanez, K.; Boullosa, C.; Andres Leon, E.; Ben-Hur, A.; Valencia, A. (9 de noviembre de 2012). "ChiTaRS: una base de datos de transcripciones quiméricas y datos de secuenciación de ARN de humanos, ratones y moscas de la fruta". Nucleic Acids Research . 41 (D1): D142–D151. doi :10.1093/nar/gks1041. PMC 3531201 . PMID  23143107. 
  13. ^ Kim, P.; Yoon, S.; Kim, N.; Lee, S.; Ko, M.; Lee, H.; Kang, H.; Kim, J.; Lee, S. (11 de noviembre de 2009). "ChimerDB 2.0: una base de conocimiento para genes de fusión actualizada". Nucleic Acids Research . 38 (Base de datos): D81–D85. doi :10.1093/nar/gkp982. PMC 2808913 . PMID  19906715. 
  14. ^ Kim, Dae-Soo; Huh, Jae-Won; Kim, Heui-Soo (1 de enero de 2007). "HYBRIDdb: una base de datos de genes híbridos en el genoma humano". BMC Genomics . 8 (1): 128. doi : 10.1186/1471-2164-8-128 . PMC 1890557 . PMID  17519042. 
  15. ^ Novo, FJ; de Mendíbil, IO; Vizmanos, JL (26 de enero de 2007). "TICdb: una colección de puntos de ruptura de translocación mapeados genéticamente en cáncer". BMC Genomics . 8 : 33. doi : 10.1186/1471-2164-8-33 . PMC 1794234 . PMID  17257420. 
  16. ^ Kong, F.; Zhu, J.; Wu, J.; Peng, J.; Wang, Y.; Wang, Q.; Fu, S.; Yuan, L.-L.; Li, T. (4 de noviembre de 2010). "dbCRID: una base de datos de reordenamientos cromosómicos en enfermedades humanas". Nucleic Acids Research . 39 (Base de datos): D895–D900. doi :10.1093/nar/gkq1038. PMC 3013658 . PMID  21051346. 
  17. ^ Bruno, Andrew; Jeffrey C Miecznikowski; Maochun Qin; Jianmin Wang; Song Liu (enero de 2013). "FUSIM: una herramienta de software para simular transcripciones de fusión". BMC Bioinformatics . 14 (13): 13. doi : 10.1186/1471-2105-14-13 . PMC 3637076 . PMID  23323884. 
  18. ^ Philippe, Nicolas; Salson, Mikaël; Commes, Thérèse; Rivals, Eric (1 de enero de 2013). "CRAC: un enfoque integrado para el análisis de lecturas de ARN-seq". Genome Biology . 14 (3): R30. doi : 10.1186/gb-2013-14-3-r30 . PMC 4053775 . PMID  23537109. 
  19. ^ Kim, Daehwan; Salzberg, Steven L (1 de enero de 2011). "TopHat-Fusion: un algoritmo para el descubrimiento de nuevas transcripciones de fusión". Genome Biology . 12 (8): R72. doi : 10.1186/gb-2011-12-8-r72 . PMC 3245612 . PMID  21835007. 
  20. ^ Piazza, R.; Pirola, A.; Spinelli, R.; Valletta, S.; Redaelli, S.; Magistroni, V.; Gambacorti-Passerini, C. (8 de mayo de 2012). "FusionAnalyser: una nueva herramienta gráfica basada en eventos para el descubrimiento de reordenamientos de fusión". Nucleic Acids Research . 40 (16): e123. doi :10.1093/nar/gks394. PMC 3439881 . PMID  22570408. 
  21. ^ Iyer, MK; Chinnaiyan, AM; Maher, CA (11 de agosto de 2011). "ChimeraScan: una herramienta para identificar la transcripción quimérica en datos de secuenciación". Bioinformática . 27 (20): 2903–2904. doi :10.1093/bioinformatics/btr467. PMC 3187648 . PMID  21840877. 
  22. ^ Li, Y.; Chien, J.; Smith, DI; Ma, J. (5 de mayo de 2011). "FusionHunter: identificación de transcripciones de fusión en cáncer mediante secuenciación de ARN de extremos emparejados". Bioinformática . 27 (12): 1708–1710. doi : 10.1093/bioinformatics/btr265 . PMID  21546395.
  23. ^ Ameur, Adam; Wetterbom, Anna; Feuk, Lars; Gyllensten, Ulf (1 de enero de 2010). "Detección global e imparcial de uniones de empalme a partir de datos de ARN-seq". Genome Biology . 11 (3): R34. doi : 10.1186/gb-2010-11-3-r34 . PMC 2864574 . PMID  20236510. 
  24. ^ Robertson, Gordon; Schein, Jacqueline; Chiu, Readman; Corbett, Richard; Field, Matthew; Jackman, Shaun D; Mungall, Karen; Lee, Sam; Okada, Hisanaga Mark; Qian, Jenny Q; Griffith, Malachi; Raymond, Anthony; Thiessen, Nina; Cezard, Timothee; Butterfield, Yaron S; Newsome, Richard; Chan, Simon K; She, Rong; Varhol, Richard; Kamoh, Baljit; Prabhu, Anna-Liisa; Tam, Angela; Zhao, YongJun; Moore, Richard A; Hirst, Martin; Marra, Marco A; Jones, Steven JM; Hoodless, Pamela A; Birol, Inanc (10 de octubre de 2010). "Ensamblaje y análisis de novo de datos de secuenciación de ARN". Nature Methods . 7 (11): 909–912. doi :10.1038/nmeth.1517. Número de modelo: PMID  20935650. Número de modelo: S2CID  1034682.
  25. ^ Sboner, Andrea; Habegger, Lukas; Pflueger, Dorothee; Terry, Stephane; Chen, David Z; Rozowsky, Joel S; Tewari, Ashutosh K; Kitabayashi, Naoki; Moss, Benjamin J; Chee, Mark S; Demichelis, Francesca; Rubin, Mark A; Gerstein, Mark B (1 de enero de 2010). "FusionSeq: un marco modular para encontrar fusiones de genes mediante el análisis de datos de secuenciación de ARN de extremos emparejados". Genome Biology . 11 (10): R104. doi : 10.1186/gb-2010-11-10-r104 . PMC 3218660 . PMID  20964841. 
  26. ^ Houseley, J; Tollervey, D (18 de agosto de 2010). "La transcriptasa inversa genera un empalme trans aparentemente no canónico in vitro". PLOS ONE . ​​5 (8): e12271. Bibcode :2010PLoSO...512271H. doi : 10.1371/journal.pone.0012271 . PMC 2923612 . PMID  20805885. 
  27. ^ McManus, CJ; Duff, MO; Eipper-Mains, J; Graveley, BR (20 de julio de 2010). "Análisis global del trans-splicing en Drosophila". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (29): 12975–9. Bibcode :2010PNAS..10712975M. doi : 10.1073/pnas.1007586107 . PMC 2919919 . PMID  20615941. 
  28. ^ Djebali, S; Lagarde, J; Kapranov, P; Lacroix, V; Borel, C; Mudge, JM; Howald, C; Foissac, S; Ucla, C; Chrast, J; Ribeca, P; Martín, D; Murray, RR; Yang, X; Ghamsari, L; Lin, C; Campana, yo; Dumais, E; Drenkow, J; Tress, ML; Gelpi, JL; Orozco, M; Valencia, A; van Berkum, Países Bajos; Lajoie, BR; Vidal, M; Stamatoyannopoulos, J ; Batut, P; Dobin, A; Grada, J; Hubbard, T; Dekker, J; Franco, A; Salehi-Ashtiani, K; Reymond, A; Antonarakis, SE; Guigó, R; Gingeras, TR (2012). "Evidencia de redes de transcripción compuestas de ARN quiméricos en células humanas". PLOS ONE . ​​7 (1): e28213. Código Bibliográfico :2012PLoSO...728213D. doi : 10.1371/journal.pone.0028213 . PMC 3251577 . PMID  22238572. 
  29. ^ Blumenthal, T (25 de junio de 2005). "Trans-splicing y operones". WormBook : 1–9. doi : 10.1895/wormbook.1.5.1 . PMID:  18050426.
  30. ^ Michaeli, S (abril de 2011). "Trans-splicing en tripanosomas: maquinaria y su impacto en el transcriptoma del parásito". Future Microbiology . 6 (4): 459–74. doi :10.2217/fmb.11.20. PMID  21526946.