stringtranslate.com

Secuencia no codificante conservada

Una secuencia no codificante conservada ( CNS ) es una secuencia de ADN no codificante que se conserva evolutivamente . Estas secuencias son de interés por su potencial para regular la producción de genes . [1]

Los SNC en plantas [2] y animales [1] están altamente asociados con sitios de unión de factores de transcripción y otros elementos reguladores que actúan en cis . Las secuencias no codificantes conservadas pueden ser sitios importantes de divergencia evolutiva [3], ya que las mutaciones en estas regiones pueden alterar la regulación de genes conservados , produciendo patrones de expresión genética específicos de cada especie . Estas características los han convertido en un recurso invaluable en genómica comparada .

Fuentes

Es probable que todos los SNC realicen alguna función para tener limitaciones en su evolución, pero se pueden distinguir según en qué parte del genoma se encuentran y cómo llegaron allí.

Intrones

Los intrones son tramos de secuencia que se encuentran principalmente en organismos eucariotas y que interrumpen las regiones codificantes de los genes, con longitudes de pares de bases que varían en tres órdenes de magnitud. Las secuencias de intrones pueden conservarse, a menudo porque contienen elementos reguladores de la expresión que imponen limitaciones funcionales a su evolución . [4] Se han utilizado patrones de intrones conservados entre especies de diferentes reinos para hacer inferencias sobre la densidad de intrones en diferentes puntos de la historia evolutiva. Esto los convierte en un recurso importante para comprender la dinámica de la ganancia y pérdida de intrones en eucariotas (1,28). [4] [5]

Regiones no traducidas

Algunas de las regiones no codificantes más conservadas se encuentran en las regiones no traducidas (UTR) en el extremo 3' de las transcripciones de ARN maduro , en lugar de en los intrones. Esto sugiere una función importante que opera a nivel postranscripcional . Si estas regiones desempeñan una función reguladora importante, el aumento en la longitud de 3'-UTR a lo largo del tiempo evolutivo sugiere que las UTR conservadas contribuyen a la complejidad del organismo. Los motivos reguladores en las UTR, a menudo conservados en genes que pertenecen a la misma familia metabólica , podrían usarse para desarrollar medicamentos altamente específicos dirigidos a transcripciones de ARN. [4]

Elementos transponibles

Los elementos repetitivos pueden acumularse en el genoma de un organismo como resultado de algunos procesos de transposición diferentes . El grado en que esto ha ocurrido durante la evolución de los eucariotas varía mucho: el ADN repetitivo representa sólo el 3% del genoma de la mosca , pero representa el 50% del genoma humano . [4]

Existen diferentes teorías que explican la conservación de elementos transponibles . Una sostiene que, al igual que los pseudogenes , proporcionan una fuente de nuevo material genético, lo que permite una adaptación más rápida a los cambios en el medio ambiente. Una alternativa más simple es que, debido a que los genomas eucariotas pueden no tener medios para prevenir la proliferación de elementos transponibles, son libres de acumularse siempre que no se inserten dentro o cerca de un gen de tal manera que alteren funciones esenciales. [6] Un estudio reciente demostró que los transposones contribuyen al menos con el 16% del SNC específico de euterios , lo que los marca como una "fuerza creativa importante" en la evolución de la regulación genética en los mamíferos . [7] Hay tres clases principales de elementos transponibles, que se distinguen por los mecanismos por los cuales proliferan. [6]

Clases

Los transposones de ADN codifican una proteína transposasa , que está flanqueada por secuencias repetidas invertidas . La transposasa escinde la secuencia y la reintegra en otra parte del genoma. Al escindir inmediatamente después de la replicación del ADN e insertarlo en sitios objetivo que aún no se han replicado, puede aumentar el número de transposones en el genoma. [6]

Los retrotransposones utilizan la transcriptasa inversa para generar un ADNc a partir del transcrito TE. Estos se dividen a su vez en retrotransposones de repetición terminal larga (LTR), elementos nucleares intercalados largos (LINE) y elementos nucleares intercalados cortos (SINE). En los retrotransposones LTR, después de que se degrada el molde de ARN, una cadena de ADN complementaria al ADNc con transcripción inversa devuelve el elemento a un estado bicatenario. La integrasa , una enzima codificada por el retrotransposón LTR, luego reincorpora el elemento en un nuevo sitio objetivo. Estos elementos están flanqueados por repeticiones terminales largas (300 a 500 pb) que median en el proceso de transposición. [6]

Los LINE utilizan un método más simple en el que el ADNc se sintetiza en el sitio objetivo luego de la escisión mediante una endonucleasa codificada por LINE . La transcriptasa inversa codificada por LINE no es altamente específica de secuencia. La incorporación por parte de la maquinaria LINE de transcritos de ARN no relacionados da lugar a pseudogenes procesados ​​no funcionales. Si el promotor de un gen pequeño se incluye en la porción transcrita del gen, la transcripción estable se puede duplicar y reinsertar en el genoma varias veces. Los elementos producidos por este proceso se denominan SINE. [6]

Elementos reglamentarios transponibles conservados

Cuando los elementos reguladores transponibles conservados están activos en un genoma, pueden introducir nuevas regiones promotoras, alterar los sitios reguladores existentes o, si se insertan en regiones transcritas, alterar los patrones de empalme . Un elemento transpuesto particular será seleccionado positivamente si la expresión alterada que produce confiere una ventaja adaptativa. Esto ha dado lugar a algunas de las regiones conservadas que se encuentran en los humanos. Casi el 25% de los promotores caracterizados en humanos contienen elementos transpuestos. [8] Esto es de particular interés a la luz del hecho de que la mayoría de los elementos transponibles en los humanos ya no están activos. [6]

Pseudogenes

Los pseudogenes son vestigios de genes que alguna vez fueron funcionales y que fueron inhabilitados por eliminaciones, inserciones o mutaciones de secuencias . La evidencia principal de este proceso es la presencia de ortólogos en pleno funcionamiento de estas secuencias inactivadas en otros genomas relacionados. [4] Los pseudogenes comúnmente surgen después de un evento de duplicación o poliploidización de genes . Con dos copias funcionales de un gen, no existe presión selectiva para mantener la expresabilidad de ambas, lo que deja a uno libre para acumular mutaciones como un pseudogén no funcional. Este es el caso típico, en el que la selección neutra permite que los pseudogenes acumulen mutaciones, sirviendo como "reservorios" de nuevo material genético, con potencial para reincorporarse al genoma. Sin embargo, se ha descubierto que algunos pseudogenes se conservan en mamíferos. [9] La explicación más simple para esto es que estas regiones no codificantes pueden cumplir alguna función biológica, y se ha descubierto que este es el caso de varios pseudogenes conservados. Por ejemplo, se descubrió que el ARNm de Makorin1 estaba estabilizado por su pseudogén parálogo , Makorin1-p1, que se conserva en varias especies de ratones. También se ha descubierto que otros pseudogenes se conservan entre humanos y ratones y entre humanos y chimpancés , originados en eventos de duplicación anteriores a la divergencia de las especies . La evidencia de la transcripción de estos pseudogenes también respalda la hipótesis de que tienen una función biológica. [10] Los hallazgos de pseudogenes potencialmente funcionales crean dificultades para definirlos, ya que el término originalmente se refería a secuencias degeneradas sin función biológica. [11]

Un ejemplo de pseudogén es el gen de la L-gulonolactona oxidasa , una enzima hepática necesaria para la biosíntesis del ácido L-ascórbico (vitamina C) en la mayoría de las aves y mamíferos, pero que está mutada en el suborden haplorrini de los primates, incluidos los humanos, que requieren ácido ascórbico o ascorbato de los alimentos. Los restos de este gen no funcional y con muchas mutaciones todavía están presentes en los genomas de cobayas y humanos. [12]

Regiones ultraconservadas

Las regiones ultraconservadas (UCR) son regiones de más de 200 pb de longitud con 100% de identidad entre especies. Estas secuencias únicas se encuentran principalmente en regiones no codificantes. Todavía no se comprende del todo por qué la presión selectiva negativa sobre estas regiones es mucho más fuerte que la selección en las regiones codificantes de proteínas. [13] [14] Aunque estas regiones pueden considerarse únicas, la distinción entre regiones con un alto grado de conservación de secuencia y aquellas con conservación de secuencia perfecta no es necesariamente de importancia biológica. Un estudio en Science encontró que todas las secuencias no codificantes extremadamente conservadas tienen funciones reguladoras importantes independientemente de si la conservación es perfecta, lo que hace que la distinción de ultraconservación parezca algo arbitraria. [14]

En genómica comparada

La conservación de regiones no codificantes funcionales y no funcionales proporciona una herramienta importante para la genómica comparada , aunque la conservación de elementos reguladores cis ha demostrado ser particularmente útil. [4] La presencia de SNC podría deberse en algunos casos a una falta de tiempo de divergencia, [15] aunque el pensamiento más común es que realizan funciones que imponen diversos grados de restricción a su evolución. De acuerdo con esta teoría, los elementos reguladores en cis se encuentran comúnmente en regiones no codificantes conservadas. Por lo tanto, la similitud de secuencia se utiliza a menudo como parámetro para limitar el espacio de búsqueda cuando se intenta identificar elementos reguladores conservados entre especies, aunque esto es más útil en el análisis de organismos distantes, ya que los parientes más cercanos también tienen conservación de secuencia entre elementos no funcionales. [4] [16] [17]

Es posible que los ortólogos con alta similitud de secuencia no compartan los mismos elementos regulatorios. [18] Estas diferencias pueden explicar diferentes patrones de expresión entre especies. [19] La conservación de la secuencia no codificante también es importante para el análisis de parálogos dentro de una sola especie. Los SNC compartidos por grupos parálogos de genes Hox son candidatos para regiones reguladoras de la expresión, posiblemente coordinando los patrones de expresión similares de estos genes. [dieciséis]

Los estudios genómicos comparativos de las regiones promotoras de genes ortólogos también pueden detectar diferencias en la presencia y el posicionamiento relativo de los sitios de unión de factores de transcripción en las regiones promotoras. [20] Los ortólogos con alta similitud de secuencia pueden no compartir los mismos elementos regulatorios. [18] Estas diferencias pueden explicar diferentes patrones de expresión entre especies. [19]

Se cree que las funciones reguladoras comúnmente asociadas con las regiones no codificantes conservadas desempeñan un papel en la evolución de la complejidad eucariota. En promedio, las plantas contienen menos SNC por gen que los mamíferos. Se cree que esto está relacionado con haber sufrido más poliploidización o eventos de duplicación del genoma. Durante la subfuncionalización que sigue a la duplicación de genes, existe la posibilidad de que se produzca una mayor tasa de pérdida del SNC por gen. Por tanto, los eventos de duplicación del genoma pueden explicar el hecho de que las plantas tengan más genes, cada una con menos SNC. Suponiendo que el número de SNC sea un indicador de la complejidad regulatoria, esto puede explicar la disparidad en la complejidad entre plantas y mamíferos. [21]

Dado que se cree que los cambios en la regulación genética explican la mayoría de las diferencias entre humanos y chimpancés, los investigadores han recurrido al SNC para intentar demostrarlo. Una parte del SNC entre humanos y otros primates tiene un enriquecimiento de polimorfismos de un solo nucleótido específicos de humanos , lo que sugiere una selección positiva para estos SNP y una evolución acelerada de esos SNC. Muchos de estos SNP también están asociados con cambios en la expresión genética, lo que sugiere que estos SNC desempeñaron un papel importante en la evolución humana . [22]

Software bioinformático en línea

Referencias

  1. ^ ab Hardison, RC. (septiembre de 2000). "Las secuencias no codificantes conservadas son guías fiables para los elementos reguladores". Tendencias Genet . 16 (9): 369–72. doi :10.1016/s0168-9525(00)02081-3. PMID  10973062. Archivado desde el original el 4 de diciembre de 2000 . Consultado el 18 de febrero de 2011 .
  2. ^ Freeling, M; Subramaniam, S (abril de 2009). "Secuencias no codificantes (SNC) conservadas en plantas superiores". Opinión actual Planta Biol . 12 (2): 126–32. doi :10.1016/j.pbi.2009.01.005. PMID  19249238.
  3. ^ Prabhakar, S.; Noonan, JP.; Pääbo, S.; Rubin, EM. (noviembre de 2006). "Evolución acelerada de secuencias no codificantes conservadas en humanos". Ciencia . 314 (5800): 786. doi :10.1126/ciencia.1130738. PMID  17082449. S2CID  15049725.
  4. ^ abcdefgh Jegga, AG.; Aronow, BJ. (abril de 2008). ADN no codificante conservado evolutivamente . doi : 10.1002/9780470015902.a0006126.pub2. ISBN 978-0470016176. {{cite book}}: |journal=ignorado ( ayuda )
  5. ^ Rogozin, IB.; Lobo, YI.; Sorokin, AV.; Mirkin, BG.; Koonin, EV. (septiembre de 2003). "Notable conservación entre reinos de posiciones de intrones y pérdida y ganancia masiva de intrones específicos del linaje en la evolución eucariótica". Biología actual . 13 (17): 1512-1517. doi : 10.1016/S0960-9822(03)00558-X . PMID  12956953.
  6. ^ abcdef Eickbush, TH.; Eickbush, DJ. (Julio de 2006). "Elementos transponibles: evolución". eLS . doi :10.1038/npg.els.0005130. ISBN 9780470016176.
  7. ^ Mikkelsen, TS; et al. (2007). "El genoma del marsupial Monodelphis domestica revela innovación en secuencias no codificantes". Naturaleza . 447 (7141): 167–177. Código Bib :2007Natur.447..167M. doi : 10.1038/naturaleza05805 . PMID  17495919.
  8. ^ Feschotte, Cédric (mayo de 2008). "Elementos transponibles y la evolución de las redes regulatorias". Naturaleza Reseñas Genética . 9 (5): 397–405. doi :10.1038/nrg2337. PMC 2596197 . PMID  18368054. 
  9. ^ Cooper, DN. Evolución del gen humano . Oxford: BIOS Scientific Publishers, septiembre de 1988, páginas 265-292
  10. ^ Svensson, O.; Arvestad, L.; Lagergren, J. (mayo de 2005). "Estudio de todo el genoma en busca de pseudogenes biológicamente funcionales". Computación más. Biol . 2 (5): 46. doi : 10.1371/journal.pcbi.0020046 . PMC 1456316 . PMID  16680195. 
  11. ^ Podlaha, Ondrej.; Zhang, Jianzhi. (noviembre de 2010). "Pseudogenes y su evolución". eLS . doi : 10.1002/9780470015902.a0005118.pub2. ISBN 9780470016176.
  12. ^ Nishikimi M, Kawai T, Yagi K (octubre de 1992). "Las cobayas poseen un gen altamente mutado para la L-gulono-gamma-lactona oxidasa, la enzima clave para la biosíntesis del ácido L-ascórbico que falta en esta especie". J. Biol. química . 267 (30): 21967–72. doi : 10.1016/S0021-9258(19)36707-9 . PMID  1400507.
  13. ^ Bejerano, G.; Faisán, M.; Makunin, I.; Esteban, S.; Kent, WJ; Mattick, JS; Haussler, David. (mayo de 2004). "Elementos ultraconservados del genoma humano". Ciencia . 304 (5675): 1321–1325. Código bibliográfico : 2004 Ciencia... 304.1321B. CiteSeerX 10.1.1.380.9305 . doi : 10.1126/ciencia.1098119. PMID  15131266. S2CID  2790337. 
  14. ^ ab Katzman, Sol.; Kern, AD; Bejerano, G.; Fewell, G.; Fulton, L.; Wilson, RK; Salamá, SR; Haussler, David. (agosto de 2007). "Los elementos ultraconservados del genoma humano están ultraseleccionados". Ciencia . 317 (5840): 915. Código bibliográfico : 2007Sci...317..915K. doi : 10.1126/ciencia.1142430. PMID  17702936. S2CID  35322654.
  15. ^ Dubchack, yo; Brudno, M.; Botín, GG.; Pachter, L .; Alcalde, C.; Rubin, EM.; Frazer, KA. (2000). "Conservación activa de secuencias no codificantes reveladas por comparaciones de especies de tres vías". Res del genoma . 10 (9): 1304-1306. doi :10.1101/gr.142200. PMC 310906 . PMID  10984448. 
  16. ^ ab Matsunami, M.; Sumiyama, K.; Saitou, N. (septiembre de 2010). "Evolución de secuencias no codificantes conservadas dentro de los grupos de vertebrados Hox a través de las duplicaciones del genoma completo en dos rondas reveladas por el análisis de huellas filogenéticas". Revista de evolución molecular . 71 (5–6): 427–463. Código Bib : 2010JMolE..71..427M. doi :10.1007/s00239-010-9396-1. PMID  20981416. S2CID  9733304.
  17. ^ Santini, S.; Booré, JL.; Meyer, A. (2003). "Conservación evolutiva de elementos reguladores en grupos de genes Hox de vertebrados". Res del genoma . 13 (6A): 1111-1122. doi :10.1101/gr.700503. PMC 403639 . PMID  12799348. 
  18. ^ ab Grebas, DR; et al. (1998). "Comparación funcional de los promotores de macrosialina murina y CD68 humano en líneas celulares de macrófagos y no macrófagos". Genómica . 54 (1): 165–168. doi :10.1006/geno.1998.5546. PMID  9806844.
  19. ^ ab Marchese, A.; et al. (1994). "Estudios de mapeo de dos genes receptores acoplados a proteína G: una diferencia de aminoácidos puede conferir una variación funcional entre un receptor humano y de roedor". Biochem Biophys Res Commun . 205 (3): 1952-1958. doi :10.1006/bbrc.1994.2899. PMID  7811287.
  20. ^ Margarita, Ester; et al. (1998). "Identificación de secuencias conservadas potencialmente reguladoras del gen SRY de 10 especies diferentes de mamíferos". Biochem Biophys Res Commun . 245 (2): 370–377. doi :10.1006/bbrc.1998.8441. PMID  9571157.
  21. ^ Lockton, Steven.; Gaut, BS. (Enero de 2005). "Planta conserva secuencias no codificantes y evolución de parálogos". Tendencias en Genética . 21 (1): 60–65. doi :10.1016/j.tig.2004.11.013. PMID  15680516.
  22. ^ Pájaro, Christine P.; et al. (2007). "Secuencias no codificantes de rápida evolución en el genoma humano". Biología del genoma . 8 (6): R118. doi : 10.1186/gb-2007-8-6-r118 . PMC 2394770 . PMID  17578567.