Los sitios CpG o sitios CG son regiones del ADN donde un nucleótido de citosina es seguido por un nucleótido de guanina en la secuencia lineal de bases a lo largo de su dirección 5' → 3' . Los sitios CpG ocurren con alta frecuencia en regiones genómicas llamadas islas CpG.
Las citosinas en los dinucleótidos CpG se pueden metilar para formar 5-metilcitosinas . Las enzimas que añaden un grupo metilo se llaman ADN metiltransferasas . En los mamíferos, entre el 70% y el 80% de las citosinas CpG están metiladas. [1] La metilación de la citosina dentro de un gen puede cambiar su expresión, un mecanismo que forma parte de un campo científico más amplio que estudia la regulación genética y que se llama epigenética . Las citosinas metiladas a menudo mutan a timinas .
En humanos, alrededor del 70% de los promotores ubicados cerca del sitio de inicio de la transcripción de un gen (promotores proximales) contienen una isla CpG. [2] [3]
CpG es la abreviatura de 5'-C-fosfato-G-3' , es decir, citosina y guanina separadas por un solo grupo fosfato ; El fosfato une dos nucleósidos cualesquiera en el ADN. La notación CpG se utiliza para distinguir esta secuencia lineal monocatenaria del emparejamiento de bases CG de citosina y guanina para secuencias bicatenarias. Por lo tanto, la notación CpG debe interpretarse como que la citosina está en quinto lugar con respecto a la base de guanina. CpG no debe confundirse con GpC , ya que esta última significa que una guanina va seguida de una citosina en la dirección 5' → 3' de una secuencia monocatenaria.
Durante mucho tiempo se ha observado que los dinucleótidos CpG aparecen con una frecuencia mucho menor en la secuencia de genomas de vertebrados de lo que se esperaría debido al azar. Por ejemplo, en el genoma humano, que tiene un contenido de GC del 42% , [4] se esperaría que en ese momento se produjera un par de nucleótidos formado por citosina seguida de guanina. La frecuencia de dinucleótidos CpG en genomas humanos es menos de una quinta parte de la frecuencia esperada. [5]
Esta subrepresentación es una consecuencia de la alta tasa de mutación de los sitios CpG metilados: la desaminación espontánea de una citosina metilada da como resultado una timina , y las bases G:T no coincidentes resultantes a menudo se resuelven incorrectamente en A:T; mientras que la desaminación de la citosina no metilada da como resultado un uracilo , que como base extraña es rápidamente reemplazado por una citosina mediante el mecanismo de reparación por escisión de la base . La tasa de transición de C a T en los sitios CpG metilados es aproximadamente 10 veces mayor que en los sitios no metilados. [6] [7] [8] [9]
Los dinucleótidos CpG se encuentran con frecuencia en islas CpG (consulte la definición de islas CpG a continuación). Hay 28.890 islas CpG en el genoma humano (50.267 si se incluyen islas CpG en secuencias repetidas). [10] Esto está de acuerdo con las 28.519 islas CpG encontradas por Venter et al. [11] desde Venter et al. La secuencia del genoma no incluía los interiores de elementos repetitivos muy similares ni las regiones repetidas extremadamente densas cerca de los centrómeros. [12] Dado que las islas CpG contienen múltiples secuencias de dinucleótidos CpG, parece haber más de 20 millones de dinucleótidos CpG en el genoma humano.
Las islas CpG (o islas CG) son regiones con una alta frecuencia de sitios CpG. Aunque las definiciones objetivas para las islas CpG son limitadas, la definición formal habitual es una región con al menos 200 pb , un porcentaje de GC superior al 50 % y una relación CpG observada/esperada superior al 60 %. La "relación CpG observada-esperada" se puede derivar donde lo observado se calcula como: y lo esperado como [13] o . [14]
Muchos genes en genomas de mamíferos tienen islas CpG asociadas con el inicio del gen [15] ( regiones promotoras ). Debido a esto, la presencia de una isla CpG se utiliza para ayudar en la predicción y anotación de genes.
En los genomas de mamíferos, las islas CpG suelen tener entre 300 y 3000 pares de bases de longitud y se han encontrado en o cerca de aproximadamente el 40% de los promotores de genes de mamíferos. [16] Más del 60% de los genes humanos y casi todos los genes constitutivos tienen sus promotores incrustados en islas CpG. [17] Dada la frecuencia de las secuencias de dos nucleótidos de GC, el número de dinucleótidos CpG es mucho menor de lo que se esperaría. [14]
Un estudio de 2002 revisó las reglas de predicción de islas CpG para excluir otras secuencias genómicas ricas en GC, como las repeticiones de Alu . Sobre la base de una búsqueda exhaustiva de las secuencias completas de los cromosomas humanos 21 y 22, se descubrió que era más probable que las regiones de ADN de más de 500 pb fueran las "verdaderas" islas CpG asociadas con las regiones 5' de los genes si tenían un contenido de GC mayor que 55% y una relación CpG observada y esperada del 65%. [18]
Las islas CpG se caracterizan por un contenido de dinucleótidos CpG de al menos el 60% de lo que se esperaría estadísticamente (~4–6%), mientras que el resto del genoma tiene una frecuencia de CpG mucho menor (~1%), un fenómeno llamado supresión de CG . . A diferencia de los sitios CpG en la región codificante de un gen, en la mayoría de los casos los sitios CpG en las islas CpG de los promotores no están metilados si los genes se expresan. Esta observación llevó a la especulación de que la metilación de sitios CpG en el promotor de un gen puede inhibir la expresión génica. La metilación, junto con la modificación de las histonas , es fundamental para la impresión . [19] La mayoría de las diferencias de metilación entre tejidos, o entre muestras normales y cancerosas, ocurren a corta distancia de las islas CpG (en las "costas de las islas CpG") en lugar de en las islas mismas. [20]
Las islas CpG normalmente ocurren en o cerca del sitio de inicio de la transcripción de genes, particularmente genes de mantenimiento , en los vertebrados. [14] La base AC (citosina) seguida inmediatamente por una base G (guanina) (una CpG) es rara en el ADN de los vertebrados porque las citosinas en tal disposición tienden a estar metiladas. Esta metilación ayuda a distinguir la cadena de ADN recién sintetizada de la cadena original, lo que ayuda en las etapas finales de la corrección del ADN después de la duplicación. Sin embargo, con el tiempo las citosinas metiladas tienden a convertirse en timinas debido a la desaminación espontánea . Existe una enzima especial en los seres humanos ( timina-ADN glicosilasa , o TDG) que reemplaza específicamente las T de los desajustes T/G. Sin embargo, debido a la rareza de los CpG, se teoriza que no es suficientemente eficaz para prevenir una mutación posiblemente rápida de los dinucleótidos. La existencia de islas CpG generalmente se explica por la existencia de fuerzas selectivas para un contenido relativamente alto de CpG, o niveles bajos de metilación en esa área genómica, quizás teniendo que ver con la regulación de la expresión génica. Un estudio de 2011 demostró que la mayoría de las islas CpG son el resultado de fuerzas no selectivas. [21]
En humanos, alrededor del 70% de los promotores ubicados cerca del sitio de inicio de la transcripción de un gen (promotores proximales) contienen una isla CpG. [2] [3]
Los elementos promotores distales también contienen frecuentemente islas CpG. Un ejemplo es el gen de reparación del ADN ERCC1 , donde el elemento que contiene la isla CpG se encuentra aproximadamente 5.400 nucleótidos aguas arriba del sitio de inicio de la transcripción del gen ERCC1 . [22] Las islas CpG también aparecen con frecuencia en promotores de ARN funcionales no codificantes , como los microARN . [23]
En humanos, la metilación del ADN ocurre en la posición 5 del anillo de pirimidina de los residuos de citosina dentro de los sitios CpG para formar 5-metilcitosinas . La presencia de múltiples sitios CpG metilados en islas CpG de promotores provoca un silenciamiento estable de genes. [24] El silenciamiento de un gen puede iniciarse mediante otros mecanismos, pero esto suele ir seguido de la metilación de los sitios CpG en la isla CpG promotora para provocar el silenciamiento estable del gen. [24]
En los cánceres, la pérdida de expresión de genes ocurre aproximadamente 10 veces más frecuentemente por hipermetilación de las islas CpG promotoras que por mutaciones. Por ejemplo, en un cáncer colorrectal suele haber entre 3 y 6 mutaciones de conductor y de 33 a 66 mutaciones de autoestopista o pasajero. [25] Por el contrario, en un estudio de tumores de colon en comparación con la mucosa colónica adyacente de apariencia normal, 1734 islas CpG estaban muy metiladas en los tumores, mientras que estas islas CpG no estaban metiladas en la mucosa adyacente. [26] La mitad de las islas CpG estaban en promotores de genes codificadores de proteínas anotados, [26] lo que sugiere que alrededor de 867 genes en un tumor de colon han perdido expresión debido a la metilación de las islas CpG. Un estudio separado encontró un promedio de 1.549 regiones metiladas diferencialmente (hipermetiladas o hipometiladas) en los genomas de seis cánceres de colon (en comparación con la mucosa adyacente), de las cuales 629 estaban en regiones promotoras de genes conocidas. [27] Un tercer estudio encontró más de 2.000 genes metilados diferencialmente entre los cánceres de colon y la mucosa adyacente. Utilizando el análisis de enriquecimiento de conjuntos de genes , 569 de 938 conjuntos de genes estaban hipermetilados y 369 estaban hipometilados en los cánceres. [28] La hipometilación de las islas CpG en los promotores da como resultado la sobreexpresión de los genes o conjuntos de genes afectados.
Un estudio de 2012 [29] enumeró 147 genes específicos con promotores hipermetilados asociados al cáncer de colon, junto con la frecuencia con la que se encontraron estas hipermetilaciones en los cánceres de colon. Al menos 10 de esos genes tenían promotores hipermetilados en casi el 100% de los cánceres de colon. También indicaron 11 microARN cuyos promotores estaban hipermetilados en los cánceres de colon en frecuencias entre el 50% y el 100% de los cánceres. Los microARN (miARN) son pequeños ARN endógenos que se emparejan con secuencias de los ARN mensajeros para dirigir la represión postranscripcional. En promedio, cada microARN reprime varios cientos de genes diana. [30] Por lo tanto, los microARN con promotores hipermetilados pueden estar permitiendo la sobreexpresión de cientos a miles de genes en un cáncer.
La información anterior muestra que, en los cánceres, la hiper/hipometilación del promotor CpG de genes y microARN provoca la pérdida de expresión (o, a veces, un aumento de la expresión) de muchos más genes que la mutación.
Los genes de reparación del ADN frecuentemente están reprimidos en los cánceres debido a la hipermetilación de las islas CpG dentro de sus promotores. En los carcinomas de células escamosas de cabeza y cuello, al menos 15 genes de reparación del ADN tienen frecuentemente promotores hipermetilados; estos genes son XRCC1 , MLH3 , PMS1 , RAD51B, XRCC3 , RAD54B , BRCA1 , SHFM1 , GEN1, FANCE , FAAP20, SPRTN , SETMAR , HUS1 y PER1 . [31] Alrededor de diecisiete tipos de cáncer son frecuentemente deficientes en uno o más genes de reparación del ADN debido a la hipermetilación de sus promotores. [32] Como ejemplo, la hipermetilación del promotor del gen de reparación del ADN MGMT ocurre en el 93% de los cánceres de vejiga, el 88% de los cánceres de estómago, el 74% de los cánceres de tiroides, el 40%-90% de los cánceres colorrectales y el 50% de los cánceres cerebrales. La hipermetilación del promotor de LIG4 ocurre en el 82% de los cánceres colorrectales. La hipermetilación del promotor de NEIL1 ocurre en el 62% de los cánceres de cabeza y cuello y en el 42% de los cánceres de pulmón de células no pequeñas . La hipermetilación del promotor de ATM ocurre en el 47% de los cánceres de pulmón de células no pequeñas . La hipermetilación del promotor de MLH1 ocurre en el 48% de los carcinomas de células escamosas de cáncer de pulmón de células no pequeñas . La hipermetilación del promotor de FANCB ocurre en el 46% de los cánceres de cabeza y cuello .
Por otro lado, los promotores de dos genes, PARP1 y FEN1 , estaban hipometilados y estos genes estaban sobreexpresados en numerosos cánceres. "PARP1 y FEN1 son genes esenciales en la unión de extremos mediada por microhomología de la vía de reparación del ADN mutagénica y propensa a errores ". Si esta vía se sobreexpresa, el exceso de mutaciones que provoca puede provocar cáncer. PARP1 se sobreexpresa en leucemias activadas por tirosina quinasa, [33] en neuroblastoma, [34] en tumores testiculares y otros tumores de células germinales, [35] y en el sarcoma de Ewing, [36] FEN1 se sobreexpresa en la mayoría de los cánceres. de mama, [37] próstata, [38] estómago, [39] [40] neuroblastomas, [41] pancreáticos, [42] y pulmón. [43]
El daño al ADN parece ser la principal causa subyacente del cáncer. [44] [45] Si la reparación precisa del ADN es deficiente, los daños en el ADN tienden a acumularse. Tal daño excesivo en el ADN puede aumentar los errores mutacionales durante la replicación del ADN debido a la síntesis de translesiones propensa a errores . El exceso de daño en el ADN también puede aumentar las alteraciones epigenéticas debido a errores durante la reparación del ADN. [46] [47] Tales mutaciones y alteraciones epigenéticas pueden dar lugar a cáncer (ver neoplasias malignas ). Por lo tanto, la hiper/hipometilación de la isla CpG en los promotores de los genes de reparación del ADN probablemente sea fundamental para la progresión al cáncer.
Dado que la edad tiene un fuerte efecto sobre los niveles de metilación del ADN en decenas de miles de sitios CpG, se puede definir un reloj biológico de alta precisión (denominado reloj epigenético o edad de metilación del ADN ) en humanos y chimpancés. [48]
Los sitios de dinucleótidos CpG no metilados pueden detectarse mediante el receptor tipo Toll 9 ( TLR 9 ) [49] en células dendríticas plasmocitoides , monocitos , células asesinas naturales (NK) y células B en humanos. Esto se utiliza para detectar una infección viral intracelular.
En los mamíferos, las ADN metiltransferasas (que añaden grupos metilo a las bases del ADN) exhiben una secuencia de preferencia por las citosinas dentro de los sitios CpG. [50] En el cerebro del ratón, el 4,2% de todas las citosinas están metiladas, principalmente en el contexto de los sitios CpG, formando 5mCpG. [51] La mayoría de los sitios 5mCpG hipermetilados aumentan la represión de genes asociados. [51]
Como lo revisaron Duke et al., la metilación del ADN de las neuronas (que reprime la expresión de genes particulares) se ve alterada por la actividad neuronal. La metilación del ADN neuronal es necesaria para la plasticidad sináptica ; es modificado por las experiencias; y se requiere la metilación y desmetilación activa del ADN para la formación y el mantenimiento de la memoria. [52]
En 2016 Halder et al. [53] utilizando ratones, y en 2017 Duke et al. [52] utilizaron ratas y sometieron a los roedores a un condicionamiento de miedo contextual, lo que provocó la formación de una memoria a largo plazo especialmente fuerte . 24 horas después del condicionamiento, en la región del cerebro del hipocampo de las ratas, la expresión de 1.048 genes estaba regulada negativamente (normalmente asociada con 5mCpG en los promotores de genes ) y la expresión de 564 genes estaba regulada positivamente (a menudo asociada con la hipometilación de CpG). sitios en promotores de genes). 24 horas después del entrenamiento, el 9,2% de los genes del genoma de las neuronas del hipocampo de rata estaban metilados diferencialmente. Sin embargo, si bien el hipocampo es esencial para aprender nueva información, no almacena información por sí mismo. En los experimentos con ratones de Halder, se observaron 1.206 genes metilados diferencialmente en el hipocampo una hora después del condicionamiento de miedo contextual, pero estas metilaciones alteradas se revirtieron y no se observaron después de cuatro semanas. En contraste con la ausencia de cambios a largo plazo en la metilación de CpG en el hipocampo, se pudo detectar una metilación diferencial sustancial de CpG en las neuronas corticales durante el mantenimiento de la memoria. Había 1.223 genes metilados diferencialmente en la corteza cingulada anterior de ratones cuatro semanas después del condicionamiento de miedo contextual.
En las células somáticas adultas, la metilación del ADN ocurre típicamente en el contexto de los dinucleótidos CpG ( sitios CpG ), formando 5-metilcitosina -pG o 5mCpG. Las especies reactivas de oxígeno (ROS) pueden atacar la guanina en el sitio del dinucleótido, formando 8-hidroxi-2'-desoxiguanosina (8-OHdG) y dando como resultado un sitio de dinucleótido de 5mCp-8-OHdG. La enzima reparadora de escisión de bases OGG1 se dirige a 8-OHdG y se une a la lesión sin escisión inmediata. OGG1, presente en un sitio de 5mCp-8-OHdG, recluta TET1 y TET1 oxida el 5mC adyacente al 8-OHdG. Esto inicia la desmetilación de 5 mC. [54]
Como se revisó en 2018, [55] en las neuronas cerebrales, la familia de dioxigenasas de translocación diez-once (TET) ( TET1 , TET2 , TET3 ) oxida 5mC para generar 5-hidroximetilcitosina (5hmC). En pasos sucesivos, las enzimas TET hidroxilan aún más 5hmC para generar 5-formilcitosina (5fC) y 5-carboxilcitosina (5caC). La timina-ADN glicosilasa (TDG) reconoce las bases intermedias 5fC y 5caC y escinde el enlace glicosídico dando como resultado un sitio apirimidínico ( sitio AP ). En una vía de desaminación oxidativa alternativa, 5hmC puede ser desaminado oxidativamente mediante desaminasas del complejo de edición de ARNm de citidina desaminasa/apolipoproteína B inducida por actividad (AID/APOBEC) para formar 5-hidroximetiluracilo (5hmU) o 5mC puede convertirse en timina (Thy). 5hmU puede escindirse mediante TDG, uracilo-ADN glicosilasa 1 monofuncional selectiva de cadena única ( SMUG1 ), ADN glicosilasa 1 similar a Nei ( NEIL1 ) o proteína de unión a metil-CpG 4 ( MBD4 ). Los sitios AP y los desajustes T:G se reparan luego mediante enzimas reparadoras por escisión de bases (BER) para producir citosina (Cyt).
Dos revisiones [56] [57] resumen la gran cantidad de evidencia sobre el papel crítico y esencial de las ROS en la formación de la memoria . La desmetilación del ADN de miles de sitios CpG durante la formación de la memoria depende de la iniciación por ROS. En 2016, Zhou et al. [54] demostraron que las ROS tienen un papel central en la desmetilación del ADN .
TET1 es una enzima clave implicada en la desmetilación de 5mCpG. Sin embargo, TET1 sólo es capaz de actuar sobre 5mCpG si una ROS ha actuado primero sobre la guanina para formar 8-hidroxi-2'-desoxiguanosina (8-OHdG), lo que da como resultado un dinucleótido de 5mCp-8-OHdG (consulte la primera figura en este sección). [54] Después de la formación de 5mCp-8-OHdG, la enzima reparadora de escisión de bases OGG1 se une a la lesión de 8-OHdG sin escisión inmediata. La adherencia de OGG1 al sitio 5mCp-8-OHdG recluta TET1 , lo que permite que TET1 oxide los 5mC adyacentes a 8-OHdG, como se muestra en la primera figura de esta sección. Esto inicia la vía de desmetilación que se muestra en la segunda figura de esta sección.
La expresión alterada de proteínas en las neuronas, controlada por la desmetilación dependiente de ROS de los sitios CpG en los promotores de genes dentro del ADN de las neuronas, es fundamental para la formación de la memoria. [58]
El agotamiento de CpG se ha observado en el proceso de metilación del ADN de elementos transponibles (TE), donde los TE no solo son responsables de la expansión del genoma sino también de la pérdida de CpG en el ADN del huésped. Los TE pueden conocerse como "centros de metilación", mediante los cuales durante el proceso de metilación los TE se propagan al ADN flanqueante una vez en el ADN del huésped. Esta propagación podría resultar posteriormente en una pérdida de CpG a lo largo del tiempo evolutivo. Los tiempos evolutivos más antiguos muestran una mayor pérdida de CpG en el ADN flanqueante, en comparación con los tiempos evolutivos más jóvenes. Por lo tanto, la metilación del ADN puede conducir eventualmente a una pérdida notable de sitios CpG en el ADN vecino. [59]
Estudios anteriores han confirmado la variedad de tamaños de genomas entre especies, donde los invertebrados y vertebrados tienen genomas más pequeños y más grandes en comparación con los humanos. El tamaño del genoma está fuertemente relacionado con el número de elementos transponibles. Sin embargo, existe una correlación entre el número de metilación de TE y la cantidad de CpG. En consecuencia, esta correlación negativa provoca el agotamiento de CpG debido a la metilación del ADN intergénico que se atribuye principalmente a la metilación de los TE. En general, esto contribuye a una cantidad notable de pérdida de CpG en los genomas de diferentes especies. [59]
Los elementos de aluminio se conocen como el tipo más abundante de elementos transponibles. Algunos estudios han utilizado elementos Alu como forma de estudiar los factores responsables de la expansión del genoma. Los elementos Alu son ricos en CpG en una secuencia más larga, a diferencia de los LINE y los ERV. Alus puede funcionar como un centro de metilación, y la inserción en el ADN del huésped puede producir la metilación del ADN y provocar una extensión al área flanqueante del ADN. Esta propagación es la razón por la que hay una pérdida considerable de CpG y una expansión del genoma. [59] Sin embargo, este es un resultado que se analiza a lo largo del tiempo porque los elementos Alus más antiguos muestran más pérdida de CpG en sitios del ADN vecino en comparación con los más jóvenes.
{{cite book}}
: |journal=
ignorado ( ayuda ){{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace ){{cite journal}}
: Mantenimiento CS1: fecha y año ( enlace )