Los retrotransposones (también llamados elementos transponibles de Clase I ) son elementos móviles que se mueven en el genoma del huésped convirtiendo su ARN transcrito en ADN mediante la transcripción inversa . [1] Por lo tanto, se diferencian de los elementos transponibles de Clase II, o transposones de ADN, en que utilizan un intermediario de ARN para la transposición y no modifican el sitio donante de transposición. [2]
A través de la transcripción inversa, los retrotransposones se amplifican rápidamente hasta volverse abundantes en genomas eucariotas como el maíz (49–78%) [3] y los humanos (42%). [4] Sólo están presentes en eucariotas, pero comparten características con retrovirus como el VIH , por ejemplo, la recombinación extracromosómica discontinua mediada por transcriptasa inversa . [5] [6]
Hay dos tipos principales de retrotransposones, repeticiones terminales largas (LTR) y repeticiones terminales no largas (no LTR). Los retrotransposones se clasifican según la secuencia y el método de transposición. [7] La mayoría de los retrotransposones en el genoma del maíz son LTR, mientras que en los humanos en su mayoría no son LTR.
Los retrotransposones LTR se caracterizan por sus repeticiones terminales largas (LTR), que están presentes en los extremos 5' y 3' de sus secuencias. Estas LTR contienen los promotores de estos elementos transponibles (TE), son esenciales para la integración de TE y pueden variar en longitud desde poco más de 100 pares de bases (pb) hasta más de 1000 pb. En promedio, los retrotransposones LTR abarcan varios miles de pares de bases, y los ejemplos más grandes conocidos alcanzan hasta 30 kilobases (kb).
Los LTR son secuencias altamente funcionales y, por esa razón, los retrotransposones LTR y no LTR difieren mucho en sus mecanismos de integración y transcripción inversa. Los retrotransposones que no son LTR utilizan un proceso de transcripción inversa cebada por objetivo (TPRT), que requiere que el ARN del TE se lleve al sitio de escisión de la integrasa del retrotransposón, donde se transcribe de manera inversa. Por el contrario, los retrotransposones LTR se someten a transcripción inversa en el citoplasma, utilizando dos rondas de cambio de plantilla y la formación de un complejo de preintegración (PIC) compuesto de ADN bicatenario y un dímero de integrasa unido a LTR. Este complejo luego pasa al núcleo para integrarse en una nueva ubicación genómica.
Los retrotransposones LTR normalmente codifican las proteínas gag y pol , que pueden combinarse en un único marco de lectura abierto (ORF) o separarse en ORF distintos. Al igual que los retrovirus, la proteína gag es esencial para el ensamblaje de la cápside y el empaquetamiento del ARN del TE y las proteínas asociadas. La proteína pol es necesaria para la transcripción inversa e incluye estos dominios cruciales: PR (proteasa), RT (transcriptasa inversa), RH ( RNasa H ) e INT (integrasa). Además, algunos retrotransposones LTR tienen un ORF para una proteína de envoltura ( env ) que se incorpora a la cápside ensamblada, lo que facilita la unión a las superficies celulares.
Un retrovirus endógeno es un retrovirus sin efectos patógenos virales que se ha integrado en el genoma del huésped insertando su información genética heredable en células que pueden transmitirse a la siguiente generación como un retrotransposón. [8] Debido a esto, comparten características con los retrovirus y los retrotransposones. Cuando el ADN retroviral se integra en el genoma del huésped, evolucionan hacia retrovirus endógenos que influyen en los genomas eucariotas. Se han insertado tantos retrovirus endógenos en genomas eucariotas que permiten comprender la biología entre las interacciones viral-huésped y el papel de los retrotransposones en la evolución y la enfermedad. Muchos retrotransposones comparten características con los retrovirus endógenos, la propiedad de reconocer y fusionarse con el genoma del huésped. Sin embargo, existe una diferencia clave entre los retrovirus y los retrotransposones, que está indicada por el gen env. Aunque es similar al gen que lleva a cabo la misma función en los retrovirus, el gen env se utiliza para determinar si el gen es retroviral o retrotransposón. Si el gen es retroviral, puede evolucionar de un retrotransposón a un retrovirus. Se diferencian por el orden de las secuencias de los genes pol. Los genes env se encuentran en los tipos de retrotransposones LTR Ty1-copia ( Pseudoviridae ), Ty3-gypsy ( Metaviridae ) y BEL/Pao. [9] [8] Codifican glicoproteínas en la envoltura del retrovirus necesarias para ingresar a la célula huésped. Los retrovirus pueden moverse entre células, mientras que los retrotransposones LTR solo pueden moverse ellos mismos hacia el genoma de la misma célula. [10] Muchos genes de vertebrados se formaron a partir de retrovirus y retrotransposones LTR. Un retrovirus endógeno o retrotransposón LTR tiene la misma función y ubicaciones genómicas en diferentes especies, lo que sugiere su papel en la evolución. [11]
Al igual que los retrotransposones LTR, los retrotransposones no LTR contienen genes para la transcriptasa inversa, la proteína de unión a ARN, la nucleasa y, a veces, el dominio H de la ribonucleasa [12], pero carecen de repeticiones terminales largas. Las proteínas de unión a ARN se unen al intermediario de transposición de ARN y las nucleasas son enzimas que rompen los enlaces fosfodiéster entre los nucleótidos de los ácidos nucleicos. En lugar de LTR, los retrotransposones no LTR tienen repeticiones cortas que pueden tener un orden invertido de bases una al lado de la otra, aparte de las repeticiones directas que se encuentran en los retrotransposones LTR, que son solo una secuencia de bases que se repite.
Aunque son retrotransposones, no pueden realizar la transcripción inversa utilizando un intermediario de transposición de ARN de la misma forma que los retrotransposones LTR. Esos dos componentes clave del retrotransposón siguen siendo necesarios, pero la forma en que se incorporan a las reacciones químicas es diferente. Esto se debe a que, a diferencia de los retrotransposones LTR, los retrotransposones no LTR no contienen secuencias que se unan al ARNt.
En su mayoría se dividen en dos tipos: LINE (elementos nucleares intercalados largos) y SINE (elementos nucleares intercalados cortos). Los elementos SVA son la excepción entre los dos, ya que comparten similitudes tanto con LINE como con SINE, ya que contienen elementos Alu y diferentes números de la misma repetición. Los SVA son más cortos que los LINE pero más largos que los SINE.
Aunque históricamente se los ha considerado "ADN basura", las investigaciones sugieren que en algunos casos tanto los LINE como los SINE se incorporaron a genes nuevos para formar nuevas funciones. [13]
Cuando se transcribe un LINE, la transcripción contiene un promotor de ARN polimerasa II que garantiza que los LINE se puedan copiar en cualquier ubicación en la que se inserte. La ARN polimerasa II es la enzima que transcribe genes en transcripciones de ARNm. Los extremos de las transcripciones de LINE son ricos en múltiples adeninas, [14] las bases que se agregan al final de la transcripción para que las transcripciones de LINE no se degraden. Esta transcripción es el intermediario de transposición de ARN.
El intermediario de transposición de ARN se mueve desde el núcleo al citoplasma para su traducción. Esto proporciona las dos regiones codificantes de una LINE que a su vez se une al ARN del que se transcribe. Luego, el LINE RNA regresa al núcleo para insertarse en el genoma eucariota.
Los LINE se insertan en regiones del genoma eucariota ricas en bases AT. En las regiones AT, LINE utiliza su nucleasa para cortar una hebra del ADN bicatenario eucariótico. La secuencia rica en adenina en los pares de bases del transcrito LINE con la cadena cortada para marcar dónde se insertará LINE con grupos hidroxilo. La transcriptasa inversa reconoce estos grupos hidroxilo para sintetizar el retrotransposón LINE donde se corta el ADN. Al igual que los retrotransposones LTR, este nuevo LINE insertado contiene información del genoma eucariota para que pueda copiarse y pegarse fácilmente en otras regiones genómicas. Las secuencias de información son más largas y variables que las de los retrotransposones LTR.
La mayoría de las copias de LINE tienen una longitud variable al principio porque la transcripción inversa generalmente se detiene antes de que se complete la síntesis de ADN. En algunos casos, esto hace que se pierda el promotor de la ARN polimerasa II, por lo que los LINE no pueden transponerse más. [15]
Los retrotransposones LINE-1 (L1) constituyen una parte importante del genoma humano, con unas 500.000 copias por genoma. Los genes que codifican LINE1 humano generalmente tienen su transcripción inhibida por la unión de grupos metilo a su ADN realizada por proteínas PIWI y enzimas ADN metiltransferasas. La retrotransposición L1 puede alterar la naturaleza de los genes transcritos al pegarse dentro o cerca de los genes, lo que a su vez podría provocar enfermedades humanas. Los LINE1 solo pueden retrotransponerse en algunos casos para formar diferentes estructuras cromosómicas que contribuyen a las diferencias genéticas entre individuos. [17] Hay una estimación de 80 a 100 L1 activas en el genoma de referencia del Proyecto Genoma Humano, y un número aún menor de L1 dentro de esas L1 activas se retrotransponen con frecuencia. Las inserciones de L1 se han asociado con la tumorigénesis mediante la activación de genes oncogenes relacionados con el cáncer y la disminución de genes supresores de tumores.
Cada LINE1 humano contiene dos regiones a partir de las cuales se pueden codificar productos genéticos. La primera región codificante contiene una proteína cremallera de leucina implicada en las interacciones proteína-proteína y una proteína que se une al extremo de los ácidos nucleicos. La segunda región codificante tiene una purina/pirimidina nucleasa, transcriptasa inversa y una proteína rica en aminoácidos cisteínas e histidinas. El final del LINE1 humano, como ocurre con otros retrotransposones, es rico en adenina. [18] [19] [20]
La L1 humana se retrotranspone activamente en el genoma humano. Un estudio reciente identificó 1.708 eventos de retrotransposición somática de L1, especialmente en células epiteliales colorrectales. Estos eventos ocurren desde la embriogénesis temprana y la tasa de retrotransposición aumenta sustancialmente durante la tumorigénesis colorrectal. [21]
Los SINE son mucho más cortos (300 pb) que los LINE. [22] Comparten similitud con los genes transcritos por la ARN polimerasa II, la enzima que transcribe genes en transcripciones de ARNm, y la secuencia de iniciación de la ARN polimerasa III, la enzima que transcribe genes en ARN ribosomal, ARNt y otras moléculas pequeñas de ARN. [23] Los SINE, como los elementos MIR de los mamíferos, tienen un gen de ARNt al principio y son ricos en adenina al final, como en los LINE.
Los SINE no codifican una proteína transcriptasa inversa funcional y dependen de otros transposones móviles, especialmente los LINE . [24] Los SINE explotan los componentes de transposición de LINE a pesar de que las proteínas de unión a LINE prefieren unirse al ARN de LINE. Los SINE no pueden transponerse por sí solos porque no pueden codificar transcripciones SINE. Por lo general, constan de partes derivadas de tRNA y LINE. La porción de ARNt contiene un promotor de ARN polimerasa III que es el mismo tipo de enzima que la ARN polimerasa II. Esto garantiza que las copias de LINE se transcriban a ARN para una mayor transposición. El componente LINE permanece para que las proteínas de unión a LINE puedan reconocer la parte LINE del SINE.
Los Alu s son los SINE más comunes en primates. Tienen aproximadamente 350 pares de bases de largo, no codifican proteínas y pueden ser reconocidos por la enzima de restricción AluI (de ahí el nombre). Su distribución puede ser importante en algunas enfermedades genéticas y cánceres. Copiar y pegar ARN de Alu requiere que el extremo rico en adenina de Alu y el resto de la secuencia se unan a una señal. El Alu unido a la señal puede luego asociarse con los ribosomas. LINE RNA se asocia en los mismos ribosomas que el Alu. La unión al mismo ribosoma permite que Alus de SINE interactúe con LINE. Esta traducción simultánea de Alu element y LINE permite copiar y pegar SINE.
Los elementos SVA están presentes en niveles más bajos que SINES y LINE en humanos. Los inicios de los elementos SVA y Alu son similares, seguidos de repeticiones y un final similar al retrovirus endógeno. Las LINE se unen a sitios que flanquean los elementos SVA para transponerlos. Los SVA son uno de los transposones más jóvenes del genoma de los grandes simios y uno de los más activos y polimórficos de la población humana. SVA fue creado mediante una fusión entre un elemento Alu, un VNTR (repetición en tándem de número variable) y un fragmento LTR. [25]
Los retrotransposones garantizan que no se pierdan por casualidad al aparecer únicamente en la genética celular que puede transmitirse de una generación a la siguiente a partir de los gametos originales. Sin embargo, los LINE pueden transponerse a las células del embrión humano que eventualmente se desarrollan en el sistema nervioso, lo que plantea la cuestión de si esta retrotransposición de LINE afecta la función cerebral. La retrotransposición de LINE también es una característica de varios cánceres, pero no está claro si la retrotransposición en sí misma causa cáncer en lugar de solo un síntoma. La retrotransposición incontrolada es mala tanto para el organismo huésped como para los propios retrotransposones, por lo que es necesario regularlos. Los retrotransposones están regulados por la interferencia del ARN . La interferencia de ARN se lleva a cabo mediante un grupo de ARN cortos no codificantes . El ARN corto no codificante interactúa con la proteína Argonauta para degradar las transcripciones de retrotransposones y cambiar la estructura de las histonas del ADN para reducir su transcripción.
Los retrotransposones LTR surgieron más tarde que los retrotransposones no LTR, posiblemente a partir de un retrotransposón ancestral no LTR que adquirió una integrasa de un transposón de ADN. Los retrovirus obtuvieron propiedades adicionales para sus envolturas virales al tomar los genes relevantes de otros virus utilizando el poder del retrotransposón LTR.
Debido a su mecanismo de retrotransposición, los retrotransposones se amplifican en número rápidamente y componen el 40% del genoma humano. Las tasas de inserción para los elementos LINE1, Alu y SVA son 1/200 – 1/20, 1/20 y 1/900 respectivamente. Las tasas de inserción de LINE1 han variado mucho en los últimos 35 millones de años, por lo que indican puntos en la evolución del genoma.
En particular, una gran cantidad de 100 kilobases en el genoma del maíz muestran variedad debido a la presencia o ausencia de retrotransposones. Sin embargo, dado que el maíz es genéticamente inusual en comparación con otras plantas, no se puede utilizar para predecir la retrotransposición en otras plantas.
Las mutaciones causadas por retrotransposones incluyen: