La reorganización de exones es un mecanismo molecular para la formación de nuevos genes. Es un proceso a través del cual dos o más exones de diferentes genes pueden unirse ectópicamente , o el mismo exón puede duplicarse , para crear una nueva estructura exón-intrón. [1] Existen diferentes mecanismos a través de los cuales se produce la reorganización de exones: reorganización de exones mediada por transposones , entrecruzamiento durante la recombinación sexual de genomas parentales y recombinación ilegítima .
La redistribución de exones sigue ciertas reglas de marco de empalme. Los intrones pueden interrumpir el marco de lectura de un gen insertando una secuencia entre dos codones consecutivos (intrones de fase 0), entre el primer y el segundo nucleótido de un codón (intrones de fase 1) o entre el segundo y el tercer nucleótido de un codón (intrones de fase 2). Además, los exones se pueden clasificar en nueve grupos diferentes según la fase de los intrones flanqueantes (simétricos: 0-0, 1-1, 2-2 y asimétricos: 0-1, 0-2, 1-0, 1-2, etc.). Los exones simétricos son los únicos que se pueden insertar en intrones, sufrir duplicación o eliminar sin cambiar el marco de lectura. [2]
La recombinación de exones se introdujo por primera vez en 1978, cuando Walter Gilbert descubrió que la existencia de intrones podía desempeñar un papel importante en la evolución de las proteínas. [3] Se observó que la recombinación dentro de los intrones podía ayudar a clasificar los exones de forma independiente y que los segmentos repetitivos en el medio de los intrones podían crear puntos calientes para la recombinación para mezclar las secuencias exónicas. Sin embargo, la presencia de estos intrones en eucariotas y su ausencia en procariotas creó un debate sobre el momento en el que aparecieron estos intrones. Surgieron dos teorías: la teoría de los "intrones tempranos" y la teoría de los "intrones tardíos". Los partidarios de la "teoría de los intrones tempranos" creían que los intrones y el empalme del ARN eran reliquias del mundo del ARN y, por lo tanto, tanto procariotas como eucariotas tenían intrones en el principio. Sin embargo, los procariotas eliminaron sus intrones para obtener una mayor eficiencia, mientras que los eucariotas conservaron los intrones y la plasticidad genética de los ancestros. Por otra parte, los partidarios de la teoría de los "intrones tardíos" creen que los genes procariotas se parecen a los genes ancestrales y que los intrones se insertaron más tarde en los genes de los eucariotas. Lo que está claro ahora es que la estructura exón-intrón eucariota no es estática, los intrones se insertan y eliminan continuamente de los genes y la evolución de los intrones se desarrolla en paralelo a la redistribución de exones. [ cita requerida ]
Para que la reorganización de exones comenzara a desempeñar un papel importante en la evolución de las proteínas, tuvo que producirse la aparición de intrones espliceosomales. Esto se debió al hecho de que los intrones autoempalmables del mundo del ARN no eran adecuados para la reorganización de exones por recombinación intrónica. Estos intrones tenían una función esencial y, por lo tanto, no podían recombinarse. Además, hay pruebas sólidas de que los intrones espliceosomales evolucionaron bastante recientemente y están restringidos en su distribución evolutiva. Por lo tanto, la reorganización de exones se convirtió en un papel importante en la construcción de proteínas más jóvenes. [ cita requerida ]
Además, para definir con mayor precisión el momento en que la redistribución de exones se volvió significativa en eucariotas, se examinó la distribución evolutiva de las proteínas modulares que evolucionaron a través de este mecanismo en diferentes organismos como Escherichia coli , Saccharomyces cerevisiae y Arabidopsis thaliana . Estos estudios sugirieron que había una relación inversa entre la compacidad del genoma y la proporción de secuencias intrónicas y repetitivas, y que la redistribución de exones se volvió significativa después de la radiación de los metazoos. [4]
La evolución de los eucariotas está mediada por la recombinación sexual de los genomas parentales y, dado que los intrones son más largos que los exones, la mayoría de los cruces se producen en regiones no codificantes. En estos intrones hay una gran cantidad de elementos transponibles y secuencias repetidas que promueven la recombinación de genes no homólogos. Además, también se ha demostrado que las proteínas mosaico están compuestas por dominios móviles que se han extendido a diferentes genes durante la evolución y que son capaces de plegarse por sí mismos. [ cita requerida ]
Existe un mecanismo para la formación y reorganización de dichos dominios, se trata de la hipótesis de la modularización. Este mecanismo se divide en tres etapas. La primera etapa es la inserción de intrones en posiciones que corresponden a los límites de un dominio proteico. La segunda etapa es cuando el "protomódulo" sufre duplicaciones en tándem por recombinación dentro de los intrones insertados. La tercera etapa es cuando uno o más protomódulos son transferidos a un gen no homólogo diferente por recombinación intrónica. Todos los estados de modularización se han observado en diferentes dominios como los de las proteínas hemostáticas. [2]
Un mecanismo potencial para la redistribución de exones es la transducción 3' mediada por el elemento intercalado largo (LINE)-1. Sin embargo, es importante entender primero qué son los LINE . Los LINE son un grupo de elementos genéticos que se encuentran en cantidades abundantes en los genomas eucariotas. [5] LINE-1 es el LINE más común encontrado en humanos. Es transcrito por la ARN polimerasa II para dar un ARNm que codifica dos proteínas: ORF1 y ORF2, que son necesarias para la transposición. [6]
Tras la transposición, L1 se asocia con el ADN que flanquea el extremo 3' y lleva la secuencia que no es L1 a una nueva ubicación genómica. Esta nueva ubicación no tiene por qué estar en una secuencia homóloga o muy cerca de la secuencia de ADN donante. La secuencia de ADN donante permanece inalterada durante todo este proceso porque funciona de manera que se copia y pega a través de intermediarios de ARN; sin embargo, se ha demostrado que solo las regiones ubicadas en la región 3' de L1 son el objetivo de la duplicación. [ cita requerida ]
Sin embargo, hay razones para creer que esto puede no ser cierto siempre, como lo demuestra el siguiente ejemplo. El gen ATM humano es responsable del trastorno autosómico recesivo humano ataxia-telangiectasia y se encuentra en el cromosoma 11. Sin embargo, se encuentra una secuencia ATM parcial en el cromosoma 7. Las características moleculares sugieren que esta duplicación fue mediada por la retrotransposición de L1: la secuencia derivada estaba flanqueada por duplicaciones del lado diana (TSD) de 15 pb, la secuencia alrededor del extremo 5' coincidía con la secuencia de consenso para el sitio de escisión de la endonucleasa L1 y una cola de poli(A) precedía a la TSD 3'. Pero como el elemento L1 no estaba presente ni en el segmento retrotranspuesto ni en la secuencia original, la movilización del segmento no puede explicarse por la transducción 3'. Información adicional ha llevado a la creencia de que la transmovilización de la secuencia de ADN es otro mecanismo de L1 para barajar exones, pero se debe realizar más investigación sobre el tema. [7]
Otro mecanismo a través del cual se produce la redistribución de exones es mediante el uso de helitrones . Los transposones de helitrones se descubrieron por primera vez durante los estudios de segmentos de ADN repetitivos de los genomas del arroz, el gusano y la cresta de Thale. Los helitrones se han identificado en todos los reinos eucariotas, pero el número de copias varía de una especie a otra. [ cita requerida ]
Las proteínas codificadas por helitrones están compuestas por un iniciador de replicación de círculo rodante (RC) (Rep) y un dominio de helicasa de ADN (Hel). El dominio Rep está involucrado en las reacciones catalíticas para la escisión endonucleolítica, la transferencia de ADN y la ligación. Además, este dominio contiene tres motivos. El primer motivo es necesario para la unión del ADN. El segundo motivo tiene dos histidinas y está involucrado en la unión de iones metálicos. Por último, el tercer motivo tiene dos tirosinas y cataliza la escisión y la ligación del ADN. [ cita requerida ]
Existen tres modelos de captura de genes por helitrones: el modelo 1 de "lectura directa" (RTM1), el modelo 2 de "lectura directa" (RTM2) y un modelo de ADN de relleno (FDNA). Según el modelo RTM1, un "mal funcionamiento" accidental del terminador de replicación en el extremo 3' del helitrón conduce a la transposición de ADN genómico. Está compuesto por el elemento helitrón de lectura directa y sus regiones genómicas posteriores, flanqueadas por un sitio de ADN aleatorio, que actúa como un terminador RC "de novo". Según el modelo RTM2, el extremo 3' de otro helitrón actúa como un terminador RC de la transposición. Esto ocurre después de un mal funcionamiento del terminador RC. Por último, en el modelo FDNA, partes de genes o regiones no codificantes pueden servir accidentalmente como plantillas durante la reparación de roturas de ADN de doble cadena que ocurren en helitrones. [8] Aunque se ha demostrado que los helitrones son una herramienta evolutiva muy importante, los detalles específicos de sus mecanismos de transposición aún están por definir. [ cita requerida ]
Un ejemplo de evolución mediante el uso de helitrones es la diversidad que se encuentra comúnmente en el maíz. Los helitrones en el maíz provocan un cambio constante de regiones génicas y no génicas mediante el uso de elementos transponibles, lo que conduce a la diversidad entre diferentes líneas de maíz. [ cita requerida ]
Los retrotransposones de repetición terminal larga (LTR) forman parte de otro mecanismo a través del cual se produce la redistribución de exones. Por lo general, codifican dos marcos de lectura abiertos (ORF). El primer ORF, llamado gag, está relacionado con las proteínas estructurales virales. El segundo ORF, llamado pol, es una poliproteína compuesta por una proteasa aspártica (AP) que escinde la poliproteína, una ARNasa H (RH) que escinde el híbrido DNR-ARN, una transcriptasa inversa (RT) que produce una copia de ADNc del ARN del transposón y una integrasa DDE que inserta el ADNc en el genoma del huésped. Además, los retrotransponsones LTR se clasifican en cinco subfamilias: Ty1/copia, Ty3/gypsy, Bel/Pao, retrovirus y retrovirus endógenos. [9]
Los retrotransponsones LTR requieren un ARN intermediario en su mecanismo de ciclo de transposición. Los retrotransponsones sintetizan una copia de ADNc basada en la cadena de ARN utilizando una transcriptasa inversa relacionada con la RT retroviral. La copia de ADNc se inserta luego en nuevas posiciones genómicas para formar un retrogén. [10] Se ha demostrado que este mecanismo es importante en la evolución genética del arroz y otras especies de gramíneas a través de la redistribución de exones. [ cita requerida ]
Los transposones de ADN con repeticiones invertidas terminales (TIR) también pueden contribuir a la redistribución de genes. En las plantas, algunos elementos no autónomos llamados Pack-TYPE pueden capturar fragmentos de genes durante su movilización. [11] Este proceso parece estar mediado por la adquisición de ADN génico que reside entre transposones Pack-TYPE vecinos y su posterior movilización. [12]
Por último, la recombinación ilegítima (RI) es otro de los mecanismos a través de los cuales se produce la reorganización de exones. La RI es la recombinación entre secuencias homólogas cortas o secuencias no homólogas. [13]
Existen dos clases de IR: La primera corresponde a errores de las enzimas que cortan y unen el ADN (es decir, las ADNasas). Este proceso es iniciado por una proteína de replicación que ayuda a generar un cebador para la síntesis del ADN. Mientras se sintetiza una hebra de ADN se desplaza la otra. Este proceso termina cuando la hebra desplazada es unida por sus extremos por la misma proteína de replicación. La segunda clase de IR corresponde a la recombinación de secuencias homólogas cortas que no son reconocidas por las enzimas mencionadas anteriormente. Sin embargo, pueden ser reconocidas por enzimas no específicas que introducen cortes entre las repeticiones. Luego, los extremos son eliminados por exonucleasas para exponer las repeticiones. Luego, las repeticiones se aparean y la molécula resultante es reparada utilizando polimerasa y ligasa. [14]