El ARN quimérico , a veces denominado transcripción de fusión , está compuesto de exones de dos o más genes diferentes que tienen el potencial de codificar proteínas nuevas. [1] Estos ARNm son diferentes de los producidos por empalme convencional , ya que son producidos por dos o más loci genéticos.
El ADN codifica la información genética necesaria para que un organismo lleve a cabo su ciclo de vida. En efecto, el ADN sirve como el "disco duro" que almacena los datos genéticos. El ADN se replica y sirve como su propia plantilla para la replicación. El ADN forma una estructura de doble hélice y está compuesto por una cadena principal de azúcar-fosfato y bases nitrogenadas; esto puede considerarse como una estructura de escalera donde los lados de la escalera están construidos de azúcar desoxirribosa y fosfato, mientras que los peldaños de la escalera están compuestos de bases nitrogenadas pareadas . [4] Hay cuatro bases en una molécula de ADN: adenina (A), citosina (C), timina (T) y guanina (G). Los nucleótidos son un componente estructural del ADN y el ARN, y están hechos de una molécula de azúcar y una molécula de ácido fosfórico. La estructura de doble hélice del ADN está compuesta por dos hebras antiparalelas que están orientadas en direcciones opuestas. El ADN está compuesto de pares de bases en los que la adenina se empareja con la timina y la guanina se empareja con la citosina. Mientras que el ADN sirve como plantilla para la producción de ácido ribonucleico (ARN), el ARN es generalmente responsable de la fabricación de proteínas. El proceso de fabricación de ARN a partir del ADN se llama transcripción. El ARN utiliza un conjunto similar de bases, excepto que la timina se reemplaza por uracilo . Un grupo de enzimas llamadas ARN polimerasas (aisladas por los bioquímicos Jerard Hurwitz y Samuel B. Weiss) funcionan en presencia de ADN. Estas enzimas producen ARN utilizando segmentos de ADN cromosómico como plantilla. A diferencia de la replicación, donde se hace una copia completa del ADN, la transcripción copia solo el gen que se va a expresar como proteína. [5]
Inicialmente, se pensó que el ARN servía como plantilla estructural para la síntesis de proteínas , ordenando esencialmente los aminoácidos mediante una serie de cavidades diseñadas específicamente para que solo encajaran aminoácidos específicos. Crick no estaba satisfecho con esta hipótesis dado que las cuatro bases del ARN son hidrófilas y que muchos aminoácidos prefieren interacciones con grupos hidrófobos. Además, algunos aminoácidos son muy similares estructuralmente y Crick consideró que no sería posible una discriminación precisa dadas las similitudes. Luego Crick propuso que antes de la incorporación a las proteínas, los aminoácidos se unen primero a moléculas adaptadoras que tienen características superficiales únicas que pueden unirse a bases específicas en las plantillas de ARN. [5] Estas moléculas adaptadoras se denominan ARN de transferencia (ARNt).
Mediante una serie de experimentos con E. coli y el fago T4 en 1960, [5] se demostró que el ARN mensajero (ARNm) transporta información desde el ADN hasta los sitios ribosómicos de síntesis de proteínas. Los precursores de aminoácidos del ARNt son colocados en posición por los ribosomas , donde pueden leer la información proporcionada por las plantillas de ARNm para sintetizar proteínas.
Empalme de ARN
La creación de una proteína consta de dos pasos principales: la transcripción del ADN en ARN y la traducción del ARN en proteína. Una vez que el ADN se transcribe en ARN, la molécula se conoce como ARN premensajero (ARNm) y consta de exones e intrones que se pueden separar y reorganizar de muchas formas diferentes. Históricamente, los exones se consideran la secuencia codificante y los intrones se consideran el ADN "basura". Aunque se ha demostrado que esto es falso, es cierto que los exones a menudo se fusionan. Dependiendo de las necesidades de la célula, los mecanismos reguladores eligen qué exones, y a veces intrones, unir. Este proceso de eliminar fragmentos de una transcripción de pre-ARNm y combinarlos con otros fragmentos se llama empalme. El genoma humano codifica aproximadamente 25.000 genes, pero se producen significativamente más proteínas. Esto se logra mediante el empalme del ARN. Los exones de estos 25.000 genes se pueden unir de muchas formas diferentes para crear innumerables combinaciones de transcripciones de ARN y, en última instancia, innumerables proteínas. Normalmente, los exones de la misma transcripción de pre-ARNm se unen. Sin embargo, en ocasiones, los productos genéticos o las transcripciones de pre-ARNm se unen de modo que los exones de diferentes transcripciones se mezclan en un producto de fusión conocido como ARN quimérico. El ARN quimérico a menudo incorpora exones de genes altamente expresados, [1] pero la transcripción quimérica en sí misma suele expresarse en niveles bajos.
Este ARN quimérico puede luego traducirse en una proteína de fusión. Las proteínas de fusión son muy específicas de cada tejido [1] y se asocian frecuentemente con cánceres como el cáncer colorrectal, el cáncer de próstata [6] y el mesotelioma [7] . Explotan significativamente los péptidos señal y las proteínas transmembrana que pueden alterar la localización de las proteínas, posiblemente contribuyendo al fenotipo de la enfermedad.
Descubrimiento del ARN quimérico
Uno de los primeros estudios que investigaron la generación de ARN quimérico examinó la fusión de los tres primeros exones de un gen conocido como JAZF1 con los últimos 15 exones de un gen conocido como JJAZ1. [8] Esta transcripción exacta, y la proteína resultante, se encontraron específicamente en el tejido endometrial. Si bien se encuentran a menudo en cánceres de endometrio, estas transcripciones también se expresan en tejido normal. Originalmente se pensó que eran el resultado de fusiones cromosómicas, un grupo investigó si esto era correcto. Utilizando Southern blotting e hibridación in situ con fluorescencia (FISH) en el genoma, los investigadores no encontraron evidencia de reordenamiento del ADN. Decidieron investigar más combinando células endometriales humanas con fibroblastos rhesus y encontraron productos quiméricos que contenían secuencias de ambas especies. Estos datos sugirieron que el ARN quimérico se genera empalmando partes de genes juntos en lugar de reordenamientos cromosómicos. También realizaron espectrometría de masas en la proteína traducida para verificar que el ARN quimérico se traduzca en proteína.
Recientemente, los avances en la secuenciación de próxima generación han reducido significativamente el costo de la secuenciación, lo que ha permitido que se realicen más proyectos de secuenciación de ARN . Estos proyectos de secuenciación de ARN pueden detectar nuevas transcripciones de ARN en lugar de la micromatriz tradicional en la que solo se pueden detectar transcripciones conocidas. La secuenciación profunda permite la detección de transcripciones incluso en niveles muy bajos. Esto ha permitido a los investigadores detectar muchos más ARN quiméricos y proteínas de fusión y ha facilitado la comprensión de su papel en la salud y la enfermedad.
Productos proteicos quiméricos
Se han identificado numerosos supuestos transcritos quiméricos entre las etiquetas de secuencia expresadas utilizando tecnología de secuenciación de ARN de alto rendimiento . En los seres humanos, los transcritos quiméricos se pueden generar de varias maneras, como el empalme trans de pre-ARNm, el desbordamiento de la transcripción del ARN, a partir de otros errores en la transcripción del ARN o también pueden ser el resultado de la fusión de genes después de translocaciones o reordenamientos intercromosómicos . Entre los pocos productos proteicos correspondientes que se han caracterizado hasta ahora, la mayoría resultan de translocaciones cromosómicas y están asociados con el cáncer. Por ejemplo, la fusión de genes en la leucemia mielógena crónica (LMC) conduce a un transcrito de ARNm que abarca el extremo 5' del gen de la proteína de la región del grupo de puntos de ruptura (BCR) y el extremo 3' del gen homólogo 1 del oncogén viral de la leucemia murina de Abelson (ABL). La traducción de este transcrito da como resultado una proteína BCR-ABL quimérica que posee una mayor actividad de la tirosina quinasa . Las transcripciones quiméricas caracterizan fenotipos celulares específicos y se sospecha que funcionan no solo en el cáncer, sino también en células normales. Un ejemplo de una quimera en células humanas normales se genera mediante el transempalme de los exones 5' del gen JAZF1 en el cromosoma 7p15 y los exones 3' de JJAZ1 ( SUZ12 ) en el cromosoma 17q1. Este ARN quimérico se traduce en células del estroma endometrial y codifica una proteína antiapoptótica. Ejemplos notables de genes quiméricos en el cáncer son los genes fusionados BCR-ABL, FUS - ERG , MLL -AF6 y MOZ-CBP expresados en la leucemia mieloide aguda (LMA) y la quimera TMPRSS2-ETS asociada con la sobreexpresión del oncogén en el cáncer de próstata. [1]
Características de las proteínas quiméricas
Frenkel-Morgenstern et al. han definido dos características principales de las proteínas quiméricas. Han informado que las quimeras explotan péptidos señal y dominios transmembrana para alterar la localización celular de las actividades asociadas. En segundo lugar, las quimeras incorporan genes parentales que se expresan a un alto nivel. [1] Un estudio de todos los dominios funcionales en proteínas codificadas por transcripciones quiméricas demostró que las quimeras contienen dominios proteicos completos con mucha más frecuencia que en conjuntos de datos aleatorios. [9]
Bases de datos de transcripciones quiméricas
Se han construido varias bases de datos para incorporar transcripciones quiméricas de diferentes recursos utilizando una variedad de procedimientos computacionales:
ChiTaRS [10] [11] [12]
Base de datos Chimer 2.0 [13]
Base de datos híbrida [14]
Base de datos de TI [15]
Cribado de datos [16]
Herramientas computacionales para detectar ARN quimérico
Los recientes avances en la secuenciación de transcriptomas de alto rendimiento han allanado el camino para nuevos métodos computacionales para el descubrimiento de fusiones. Las siguientes son herramientas computacionales disponibles para la detección de transcripciones de fusión a partir de datos de ARN-Seq:
Fusim es una herramienta de software para simular transcripciones de fusión para una comparación exhaustiva entre los métodos de descubrimiento de fusión. [17]
CRAC integra ubicaciones genómicas y cobertura local para permitir predicciones de unión de empalme o ARN de fusión directamente a partir del análisis de lectura de ARN-seq. [18]
TopHat-Fusion puede descubrir productos de fusión derivados de genes conocidos, genes desconocidos y variantes de empalme no anotadas de genes conocidos. [19]
ChimeraScan ofrece el descubrimiento de la transcripción quimérica entre dos transcripciones independientes en datos de secuenciación del transcriptoma de alto rendimiento al proporcionar características como la capacidad de procesar lecturas de extremos emparejados largos (>75 pb), procesamiento de lecturas de mapeo ambiguo y detección de lecturas que abarcan una unión de fusión. [21]
FusionHunter identifica transcripciones de fusión a partir del análisis transcripcional de lecturas de secuencias de ARN de extremos emparejados. [22]
SplitSeek permite la predicción de novo de uniones de empalme en datos de ARN-seq de lectura corta, lo que resulta adecuado para la detección de nuevos eventos de empalme y transcripciones quiméricas. [23]
Trans-AB ySS es un proceso de ensamblaje y análisis de transcriptomas de lectura corta de novo que ayuda en la identificación de estructuras conocidas, nuevas y alternativas en transcripciones expresadas, como transcripciones quiméricas. [24]
FusionSeq identifica las transcripciones de fusión a partir de la secuenciación de ARN de extremos emparejados. Incluye filtros para eliminar las fusiones de candidatos espurios con artefactos, como la desalineación o el emparejamiento aleatorio de fragmentos de transcripción. [25]
Se debe tener cierta precaución en la interpretación de los eventos de trans-splicing detectados en experimentos de secuenciación de alto rendimiento, ya que las enzimas transcriptasas inversas que se usan de manera ubicua para determinar secuencias de ARN son capaces de introducir eventos de trans-splicing aparentes que no estaban presentes en el ARN original. [26] [27] Sin embargo, algunos ARN quiméricos han sido confirmados por otros métodos. [28]
ARN quimérico en eucariotas inferiores
Aunque es poco común en eucariotas superiores, varios eucariotas inferiores, incluidos los nematodos y los tripanosomas, hacen un uso extensivo del trans-splicing para generar ARN quiméricos. [29] [30] En estos organismos, las reacciones de empalme entre un ARN codificador de proteínas y una secuencia universal dan como resultado la unión de un líder de empalme al extremo 5' del ARN, generando un ARN mensajero funcional . Este sistema permite el uso de operones : colecciones de genes codificadores de proteínas con una función compartida que se transcriben simultáneamente en un solo ARN y luego se empalman en ARN mensajeros individuales, cada uno de los cuales codifica una sola proteína.
Referencias
^ abcde Frenkel-Morgenstern, M.; Lacroix, V.; Ezkurdia, I.; Levin, Y.; Gabashvili, A.; Prilusky, J.; del Pozo, A.; Tress, M.; Johnson, R.; Guigo, R.; Valencia, A. (15 de mayo de 2012). "Quimeras tomando forma: Funciones potenciales de las proteínas codificadas por transcripciones de ARN quimérico". Genome Research . 22 (7): 1231–1242. doi :10.1101/gr.130062.111. PMC 3396365 . PMID 22588898.
^ Horspool, Daniel (28 de noviembre de 2008). "Dogma central de la bioquímica molecular con enzimas" . Consultado el 22 de julio de 2013 .
^ CRICK, FRANCIS (agosto de 1970). "Dogma central de la biología molecular". Nature . 227 (5258): 561–563. Bibcode :1970Natur.227..561C. doi :10.1038/227561a0. PMID 4913914. S2CID 4164029.
^ Geer, RC "Introducción a los recursos de biología molecular" . Consultado el 22 de julio de 2013 .
^ abc James D. Watson; et al. (2007). Biología molecular del gen (6.ª ed.). San Francisco, California: Benjamin Cummings. ISBN9780805395921.
^ Tomlins, SA; Mehra, R; Rhodes, DR; Smith, LR; Roulston, D; Helgeson, BE; Cao, X; Wei, JT; Rubin, MA; Shah, RB; Chinnaiyan, AM (1 de abril de 2006). "Las fusiones de genes TMPRSS2:ETV4 definen un tercer subtipo molecular de cáncer de próstata". Cancer Research . 66 (7): 3396–400. doi : 10.1158/0008-5472.CAN-06-0168 . PMID 16585160.
^ Panagopoulos, Ioannis; Thorsen, Jim; Gorunova, Ludmila; Micci, Francesca; Haugom, Lisbeth; Davidson, Ben; Heim, Sverre (1 de agosto de 2013). "La secuenciación de ARN identifica la fusión de los genes EWSR1 e YY1 en el mesotelioma con t(14;22)(q32;q12)". Genes, cromosomas y cáncer . 52 (8): 733–740. doi :10.1002/gcc.22068. PMID 23630070. S2CID 28377909.
^ Koontz, JI; Soreng, AL; Nucci, M.; Kuo, FC; Pauwels, P.; van den Berghe, H.; Cin, PD; Fletcher, JA; Sklar, J. (22 de mayo de 2001). "Fusión frecuente de los genes JAZF1 y JJAZ1 en tumores del estroma endometrial". Actas de la Academia Nacional de Ciencias . 98 (11): 6348–6353. Bibcode :2001PNAS...98.6348K. doi : 10.1073/pnas.101132598 . PMC 33471 . PMID 11371647.
^ Frenkel-Morgenstern, M.; Valencia, A. (11 de junio de 2012). "Nuevas combinaciones de dominios en proteínas codificadas por transcripciones quiméricas". Bioinformática . 28 (12): i67–i74. doi :10.1093/bioinformatics/bts216. PMC 3371848 . PMID 22689780.
^ Gorohovski, A.; Tagore, S.; Palande, V.; Malka, A.; Raviv-Shay, D.; Frenkel-Morgenstern, M. (4 de enero de 2017). "ChiTaRS-3.1: la base de datos de transcripciones quiméricas mejoradas y secuencias de ARN que coinciden con las interacciones proteína-proteína". Investigación de ácidos nucleicos . 45 (D1): D790–D795. doi :10.1093/nar/gkw1127. PMC 5210585 . PMID 27899596.
^ Frenkel-Morgenstern, M.; Gorohovski, A.; Vucenovic, D.; Maestre, L.; Valencia, A. (28 de enero de 2015). "ChiTaRS 2.1: una base de datos mejorada de las transcripciones quiméricas y datos de secuenciación de ARN con nuevas transcripciones de ARN quimérico sentido-antisentido". Investigación de ácidos nucleicos . 43 (D1): D68–D75. doi :10.1093/nar/gku1199. PMC 4383979 . PMID 25414346.
^ Frenkel-Morgenstern, M.; Gorohovski, A.; Lacroix, V.; Rogers, M.; Ibanez, K.; Boullosa, C.; Andres Leon, E.; Ben-Hur, A.; Valencia, A. (9 de noviembre de 2012). "ChiTaRS: una base de datos de transcripciones quiméricas y datos de secuenciación de ARN de humanos, ratones y moscas de la fruta". Nucleic Acids Research . 41 (D1): D142–D151. doi :10.1093/nar/gks1041. PMC 3531201 . PMID 23143107.
^ Kim, P.; Yoon, S.; Kim, N.; Lee, S.; Ko, M.; Lee, H.; Kang, H.; Kim, J.; Lee, S. (11 de noviembre de 2009). "ChimerDB 2.0: una base de conocimiento para genes de fusión actualizada". Nucleic Acids Research . 38 (Base de datos): D81–D85. doi :10.1093/nar/gkp982. PMC 2808913 . PMID 19906715.
^ Kim, Dae-Soo; Huh, Jae-Won; Kim, Heui-Soo (1 de enero de 2007). "HYBRIDdb: una base de datos de genes híbridos en el genoma humano". BMC Genomics . 8 (1): 128. doi : 10.1186/1471-2164-8-128 . PMC 1890557 . PMID 17519042.
^ Novo, FJ; de Mendíbil, IO; Vizmanos, JL (26 de enero de 2007). "TICdb: una colección de puntos de ruptura de translocación mapeados genéticamente en cáncer". BMC Genomics . 8 : 33. doi : 10.1186/1471-2164-8-33 . PMC 1794234 . PMID 17257420.
^ Kong, F.; Zhu, J.; Wu, J.; Peng, J.; Wang, Y.; Wang, Q.; Fu, S.; Yuan, L.-L.; Li, T. (4 de noviembre de 2010). "dbCRID: una base de datos de reordenamientos cromosómicos en enfermedades humanas". Nucleic Acids Research . 39 (Base de datos): D895–D900. doi :10.1093/nar/gkq1038. PMC 3013658 . PMID 21051346.
^ Bruno, Andrew; Jeffrey C Miecznikowski; Maochun Qin; Jianmin Wang; Song Liu (enero de 2013). "FUSIM: una herramienta de software para simular transcripciones de fusión". BMC Bioinformatics . 14 (13): 13. doi : 10.1186/1471-2105-14-13 . PMC 3637076 . PMID 23323884.
^ Philippe, Nicolas; Salson, Mikaël; Commes, Thérèse; Rivals, Eric (1 de enero de 2013). "CRAC: un enfoque integrado para el análisis de lecturas de ARN-seq". Genome Biology . 14 (3): R30. doi : 10.1186/gb-2013-14-3-r30 . PMC 4053775 . PMID 23537109.
^ Kim, Daehwan; Salzberg, Steven L (1 de enero de 2011). "TopHat-Fusion: un algoritmo para el descubrimiento de nuevas transcripciones de fusión". Genome Biology . 12 (8): R72. doi : 10.1186/gb-2011-12-8-r72 . PMC 3245612 . PMID 21835007.
^ Piazza, R.; Pirola, A.; Spinelli, R.; Valletta, S.; Redaelli, S.; Magistroni, V.; Gambacorti-Passerini, C. (8 de mayo de 2012). "FusionAnalyser: una nueva herramienta gráfica basada en eventos para el descubrimiento de reordenamientos de fusión". Nucleic Acids Research . 40 (16): e123. doi :10.1093/nar/gks394. PMC 3439881 . PMID 22570408.
^ Iyer, MK; Chinnaiyan, AM; Maher, CA (11 de agosto de 2011). "ChimeraScan: una herramienta para identificar la transcripción quimérica en datos de secuenciación". Bioinformática . 27 (20): 2903–2904. doi :10.1093/bioinformatics/btr467. PMC 3187648 . PMID 21840877.
^ Li, Y.; Chien, J.; Smith, DI; Ma, J. (5 de mayo de 2011). "FusionHunter: identificación de transcripciones de fusión en cáncer mediante secuenciación de ARN de extremos emparejados". Bioinformática . 27 (12): 1708–1710. doi : 10.1093/bioinformatics/btr265 . PMID 21546395.
^ Ameur, Adam; Wetterbom, Anna; Feuk, Lars; Gyllensten, Ulf (1 de enero de 2010). "Detección global e imparcial de uniones de empalme a partir de datos de ARN-seq". Genome Biology . 11 (3): R34. doi : 10.1186/gb-2010-11-3-r34 . PMC 2864574 . PMID 20236510.
^ Robertson, Gordon; Schein, Jacqueline; Chiu, Readman; Corbett, Richard; Field, Matthew; Jackman, Shaun D; Mungall, Karen; Lee, Sam; Okada, Hisanaga Mark; Qian, Jenny Q; Griffith, Malachi; Raymond, Anthony; Thiessen, Nina; Cezard, Timothee; Butterfield, Yaron S; Newsome, Richard; Chan, Simon K; She, Rong; Varhol, Richard; Kamoh, Baljit; Prabhu, Anna-Liisa; Tam, Angela; Zhao, YongJun; Moore, Richard A; Hirst, Martin; Marra, Marco A; Jones, Steven JM; Hoodless, Pamela A; Birol, Inanc (10 de octubre de 2010). "Ensamblaje y análisis de novo de datos de secuenciación de ARN". Nature Methods . 7 (11): 909–912. doi :10.1038/nmeth.1517. Número de modelo: PMID 20935650. Número de modelo: S2CID 1034682.
^ Sboner, Andrea; Habegger, Lukas; Pflueger, Dorothee; Terry, Stephane; Chen, David Z; Rozowsky, Joel S; Tewari, Ashutosh K; Kitabayashi, Naoki; Moss, Benjamin J; Chee, Mark S; Demichelis, Francesca; Rubin, Mark A; Gerstein, Mark B (1 de enero de 2010). "FusionSeq: un marco modular para encontrar fusiones de genes mediante el análisis de datos de secuenciación de ARN de extremos emparejados". Genome Biology . 11 (10): R104. doi : 10.1186/gb-2010-11-10-r104 . PMC 3218660 . PMID 20964841.
^ Houseley, J; Tollervey, D (18 de agosto de 2010). "La transcriptasa inversa genera un empalme trans aparentemente no canónico in vitro". PLOS ONE . 5 (8): e12271. Bibcode :2010PLoSO...512271H. doi : 10.1371/journal.pone.0012271 . PMC 2923612 . PMID 20805885.
^ McManus, CJ; Duff, MO; Eipper-Mains, J; Graveley, BR (20 de julio de 2010). "Análisis global del trans-splicing en Drosophila". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (29): 12975–9. Bibcode :2010PNAS..10712975M. doi : 10.1073/pnas.1007586107 . PMC 2919919 . PMID 20615941.
^ Blumenthal, T (25 de junio de 2005). "Trans-splicing y operones". WormBook : 1–9. doi : 10.1895/wormbook.1.5.1 . PMID: 18050426.
^ Michaeli, S (abril de 2011). "Trans-splicing en tripanosomas: maquinaria y su impacto en el transcriptoma del parásito". Future Microbiology . 6 (4): 459–74. doi :10.2217/fmb.11.20. PMID 21526946.