La mezcla de exones es un mecanismo molecular para la formación de nuevos genes. Es un proceso mediante el cual se pueden unir ectópicamente dos o más exones de diferentes genes , o se puede duplicar el mismo exón , para crear una nueva estructura exón-intrón. [1] Existen diferentes mecanismos a través de los cuales se produce la mezcla de exones: mezcla de exones mediada por transposones , cruce durante la recombinación sexual de genomas parentales y recombinación ilegítima .
La mezcla de exones sigue ciertas reglas del marco de empalme. Los intrones pueden interrumpir el marco de lectura de un gen insertando una secuencia entre dos codones consecutivos (intrones de fase 0), entre el primer y segundo nucleótido de un codón (intrones de fase 1) o entre el segundo y tercer nucleótido de un codón (intrones de fase 1). 2 intrones). Además, los exones se pueden clasificar en nueve grupos diferentes según la fase de los intrones flanqueantes (simétricos: 0-0, 1-1, 2-2 y asimétricos: 0–1, 0–2, 1–0, 1–2, etc.) Los exones simétricos son los únicos que pueden insertarse en intrones, duplicarse o eliminarse sin cambiar el marco de lectura. [2]
La mezcla de exones se introdujo por primera vez en 1978 cuando Walter Gilbert descubrió que la existencia de intrones podría desempeñar un papel importante en la evolución de las proteínas. [3] Se observó que la recombinación dentro de los intrones podría ayudar a clasificar los exones de forma independiente y que los segmentos repetitivos en el medio de los intrones podrían crear puntos de acceso para la recombinación para mezclar las secuencias exónicas. Sin embargo, la presencia de estos intrones en eucariotas y su ausencia en procariotas generó un debate sobre el momento en que aparecieron estos intrones. Surgieron dos teorías: la teoría de los "intrones tempranos" y la teoría de los "intrones tardíos". Los partidarios de la "teoría temprana de los intrones" creían que los intrones y el empalme del ARN eran reliquias del mundo del ARN y, por lo tanto, tanto los procariotas como los eucariotas tenían intrones al principio. Sin embargo, los procariotas eliminaron sus intrones para obtener una mayor eficiencia, mientras que los eucariotas conservaron los intrones y la plasticidad genética de los ancestros. Por otro lado, los partidarios de la teoría de los "intrones tardíos" creen que los genes procarióticos se parecen a los genes ancestrales y que los intrones se insertaron más tarde en los genes de los eucariotas. Lo que está claro ahora es que la estructura exón-intrón de los eucarióticos no es estática, los intrones se insertan y eliminan continuamente de los genes y la evolución de los intrones evoluciona paralelamente a la combinación de exones. [ cita necesaria ]
Para que la mezcla de exones comenzara a desempeñar un papel importante en la evolución de las proteínas, tuvo que producirse la aparición de intrones espliceosómicos. Esto se debió al hecho de que los intrones autocompensantes del mundo del ARN no eran adecuados para la mezcla de exones mediante recombinación intrónica. Estos intrones tenían una función esencial y por tanto no podían recombinarse. Además, existe una fuerte evidencia de que los intrones spliceosomales evolucionaron bastante recientemente y su distribución evolutiva está restringida. Por lo tanto, la mezcla de exones se convirtió en un papel importante en la construcción de proteínas más jóvenes. [ cita necesaria ]
Además, para definir con mayor precisión el momento en que la mezcla de exones se volvió significativa en los eucariotas, se examinó la distribución evolutiva de las proteínas modulares que evolucionaron a través de este mecanismo en diferentes organismos como Escherichia coli , Saccharomyces cerevisiae y Arabidopsis thaliana . Estos estudios sugirieron que existía una relación inversa entre la compacidad del genoma y la proporción de secuencias intrónicas y repetitivas, y que la mezcla de exones se volvió significativa después de la radiación de los metazoos. [4]
La evolución de los eucariotas está mediada por la recombinación sexual de los genomas parentales y, dado que los intrones son más largos que los exones, la mayoría de los cruces se producen en regiones no codificantes. En estos intrones hay una gran cantidad de elementos transponibles y secuencias repetidas que promueven la recombinación de genes no homólogos. Además, también se ha demostrado que las proteínas mosaico están compuestas por dominios móviles que se han extendido a diferentes genes durante la evolución y que son capaces de plegarse. [ cita necesaria ]
Existe un mecanismo para la formación y barajado de dichos dominios, esta es la hipótesis de la modularización. Este mecanismo se divide en tres etapas. La primera etapa es la inserción de intrones en posiciones que corresponden a los límites de un dominio proteico. La segunda etapa es cuando el "protomódulo" sufre duplicaciones en tándem por recombinación dentro de los intrones insertados. La tercera etapa es cuando uno o más protomódulos se transfieren a un gen no homólogo diferente mediante recombinación intrónica. Todos los estados de modularización se han observado en diferentes dominios como los de las proteínas hemostáticas. [2]
Un mecanismo potencial para la mezcla de exones es la transducción 3' mediada por elementos intercalados largos (LINE) -1. Sin embargo, primero es importante comprender qué son las LINE . Los LINE son un grupo de elementos genéticos que se encuentran en cantidades abundantes en los genomas de eucariotas. [5] LINE-1 es el LINE más común que se encuentra en humanos. Es transcrito por la ARN polimerasa II para dar un ARNm que codifica dos proteínas: ORF1 y ORF2, que son necesarias para la transposición. [6]
Tras la transposición, L1 se asocia con el ADN flanqueante en 3' y transporta la secuencia distinta de L1 a una nueva ubicación genómica. Esta nueva ubicación no tiene que estar en una secuencia homóloga ni muy cerca de la secuencia de ADN del donante. La secuencia de ADN del donante permanece sin cambios a lo largo de este proceso porque funciona copiando y pegando a través de intermediarios de ARN; sin embargo, se ha demostrado que sólo aquellas regiones ubicadas en la región 3' de la L1 son objeto de duplicación. [ cita necesaria ]
Sin embargo, hay razones para creer que esto puede no ser cierto siempre, como lo muestra el siguiente ejemplo. El gen ATM humano es responsable del trastorno autosómico recesivo ataxia-telangiectasia humana y está ubicado en el cromosoma 11. Sin embargo, se encuentra una secuencia ATM parcial en el cromosoma 7. Las características moleculares sugieren que esta duplicación estuvo mediada por la retrotransposición L1: la secuencia derivada estaba flanqueada por duplicaciones del lado objetivo (TSD) de 15 pb, la secuencia alrededor del extremo 5' coincidía con la secuencia consenso para el sitio de escisión de la endonucleasa L1 y una cola poli(A) precedía a la TSD 3'. Pero como el elemento L1 no estaba presente ni en el segmento retrotranspuesto ni en la secuencia original, la movilización del segmento no puede explicarse mediante la transducción 3'. Información adicional ha llevado a la creencia de que la transmovilización de la secuencia de ADN es otro mecanismo de L1 para mezclar exones, pero se deben realizar más investigaciones sobre el tema. [7]
Otro mecanismo mediante el cual se produce la mezcla de exones es mediante el uso de helitrones . Los transposones de helitron se descubrieron por primera vez durante estudios de segmentos repetitivos de ADN de genomas de arroz, gusanos y crestas de thale. Se han identificado helitrones en todos los reinos eucariotas, pero el número de copias varía de una especie a otra. [ cita necesaria ]
Las proteínas codificadas por helitron están compuestas por un iniciador de replicación (Rep) de círculo rodante (RC) y un dominio de ADN helicasa (Hel). El dominio Rep participa en las reacciones catalíticas de escisión endonucleolítica, transferencia y ligadura de ADN. Además, este dominio contiene tres motivos. El primer motivo es necesario para la unión del ADN. El segundo motivo tiene dos histidinas y participa en la unión de iones metálicos. Por último, el tercer motivo tiene dos tirosinas y cataliza la escisión y ligadura del ADN. [ cita necesaria ]
Hay tres modelos de captura de genes por helitrones: el modelo 1 de "lectura" (RTM1), el modelo 2 de "lectura" (RTM2) y un modelo de ADN de relleno (FDNA). Según el modelo RTM1, un "mal funcionamiento" accidental del terminador de replicación en el extremo 3' del Helitron conduce a la transposición del ADN genómico. Está compuesto por el elemento Helitron de lectura continua y sus regiones genómicas posteriores, flanqueadas por un sitio de ADN aleatorio, que actúa como un terminador RC "de novo". Según el modelo RTM2, el extremo 3' de otro Helitron sirve como terminador de transposición RC. Esto ocurre después de un mal funcionamiento del terminador RC. Por último, en el modelo FDNA, porciones de genes o regiones no codificantes pueden servir accidentalmente como plantillas durante la reparación de roturas del ADN ds que se producen en los helitrones. [8] Aunque se ha demostrado que los helitrones son una herramienta evolutiva muy importante, los detalles específicos de sus mecanismos de transposición aún están por definirse. [ cita necesaria ]
Un ejemplo de evolución mediante el uso de helitrones es la diversidad que se encuentra comúnmente en el maíz. Los helitrones en el maíz provocan un cambio constante de regiones genéticas y no genéticas mediante el uso de elementos transponibles, lo que genera diversidad entre diferentes líneas de maíz. [ cita necesaria ]
Los retrotransposones de repetición terminal larga (LTR) son parte de otro mecanismo a través del cual se produce la mezcla de exones. Suelen codificar dos marcos de lectura abiertos (ORF). El primer ORF denominado gag está relacionado con proteínas estructurales virales. El segundo ORF llamado pol es una poliproteína compuesta por una proteasa aspártica (AP) que escinde la poliproteína, una ARNasa H (RH) que divide el híbrido DNR-ARN, una transcriptasa inversa (RT) que produce una copia de ADNc de los transposones ARN y una integrasa DDE que inserta ADNc en el genoma del huésped. Además, los retrotransponsones LTR se clasifican en cinco subfamilias: Ty1/copia, Ty3/gypsy, Bel/Pao, retrovirus y retrovirus endógenos. [9]
Los retrotransponsones LTR requieren un ARN intermedio en su mecanismo de ciclo de transposición. Los retrotransponsones sintetizan una copia de ADNc basada en la cadena de ARN utilizando una transcriptasa inversa relacionada con la RT retroviral. Luego, la copia de ADNc se inserta en nuevas posiciones genómicas para formar un retrogén. [10] Se ha demostrado que este mecanismo es importante en la evolución genética del arroz y otras especies de pastos mediante la combinación de exones. [ cita necesaria ]
El transposón de ADN con repeticiones invertidas terminales (TIR) también puede contribuir a la mezcla genética. En las plantas, algunos elementos no autónomos llamados Pack-TYPE pueden capturar fragmentos de genes durante su movilización. [11] Este proceso parece estar mediado por la adquisición de ADN genético que reside entre transposones Pack-TYPE vecinos y su posterior movilización. [12]
Por último, la recombinación ilegítima (IR) es otro de los mecanismos mediante los cuales se produce la mezcla de exones. IR es la recombinación entre secuencias homólogas cortas o secuencias no homólogas. [13]
Hay dos clases de IR: La primera corresponde a errores de las enzimas que cortan y unen el ADN (es decir, las ADNasas). Este proceso es iniciado por una proteína de replicación que ayuda a generar un cebador para la síntesis del ADN. Mientras se sintetiza una cadena de ADN, la otra se desplaza. Este proceso finaliza cuando la hebra desplazada es unida por sus extremos por la misma proteína de replicación. La segunda clase de IR corresponde a la recombinación de secuencias homólogas cortas que no son reconocidas por las enzimas mencionadas anteriormente. Sin embargo, pueden ser reconocidos por enzimas no específicas que introducen cortes entre las repeticiones. Luego, los extremos se eliminan mediante exonucleasa para exponer las repeticiones. Luego, las repeticiones se hibridan y la molécula resultante se repara utilizando polimerasa y ligasa. [14]