Una secuencia reguladora es un segmento de una molécula de ácido nucleico capaz de aumentar o disminuir la expresión de genes específicos dentro de un organismo. La regulación de la expresión génica es una característica esencial de todos los organismos vivos y de los virus.
En el ADN , la regulación de la expresión génica ocurre normalmente a nivel de la biosíntesis del ARN ( transcripción ). Se logra a través de la unión específica de secuencia de proteínas ( factores de transcripción ) que activan o inhiben la transcripción. Los factores de transcripción pueden actuar como activadores , represores o ambos. Los represores a menudo actúan impidiendo que la ARN polimerasa forme un complejo productivo con la región de iniciación de la transcripción ( promotor ), mientras que los activadores facilitan la formación de un complejo productivo. Además, se ha demostrado que los motivos del ADN predicen modificaciones epigenómicas, lo que sugiere que los factores de transcripción desempeñan un papel en la regulación del epigenoma . [2]
En el ARN , la regulación puede ocurrir a nivel de la biosíntesis de proteínas ( traducción ), la escisión del ARN, el empalme del ARN o la terminación de la transcripción. Las secuencias reguladoras se asocian con frecuencia con moléculas de ARN mensajero (ARNm), donde se utilizan para controlar la biogénesis o la traducción del ARNm. Una variedad de moléculas biológicas pueden unirse al ARN para lograr esta regulación, incluidas las proteínas (p. ej., represores de la traducción y factores de empalme), otras moléculas de ARN (p. ej., miARN ) y moléculas pequeñas , en el caso de los riboswitches .
Una secuencia de ADN reguladora no regula a menos que se active. Diferentes secuencias reguladoras se activan y luego implementan su regulación mediante diferentes mecanismos.
La expresión de genes en mamíferos puede ser regulada positivamente cuando las señales se transmiten a los promotores asociados con los genes. Las secuencias de ADN cis -reguladoras que se encuentran en regiones de ADN distantes de los promotores de genes pueden tener efectos muy grandes en la expresión génica, y algunos genes experimentan una expresión hasta 100 veces mayor debido a dicha secuencia cis -reguladora. [3] Estas secuencias cis -reguladoras incluyen potenciadores , silenciadores , aisladores y elementos de anclaje. [4] Entre esta constelación de secuencias, los potenciadores y sus proteínas de factores de transcripción asociadas tienen un papel principal en la regulación de la expresión génica. [5]
Los potenciadores son secuencias del genoma que son elementos importantes de regulación de genes. Los potenciadores controlan programas de expresión de genes específicos de cada tipo de célula, la mayoría de las veces mediante bucles que recorren largas distancias para acercarse físicamente a los promotores de sus genes objetivo. [6] En un estudio de neuronas corticales cerebrales, se encontraron 24.937 bucles que llevaban potenciadores a promotores. [3] Múltiples potenciadores, cada uno a menudo a decenas o cientos de miles de nucleótidos de distancia de sus genes objetivo, se unen a sus promotores de genes objetivo y se coordinan entre sí para controlar la expresión de su gen objetivo común. [6]
La ilustración esquemática en esta sección muestra un potenciador que gira para acercarse físicamente al promotor de un gen objetivo. El bucle está estabilizado por un dímero de una proteína conectora (por ejemplo, el dímero de CTCF o YY1 ), con un miembro del dímero anclado a su motivo de unión en el potenciador y el otro miembro anclado a su motivo de unión en el promotor (representado por los zigzags rojos en la ilustración). [7] Varias proteínas de factores de transcripción específicos de la función celular (en 2018, Lambert et al. indicaron que había alrededor de 1600 factores de transcripción en una célula humana [8] ) generalmente se unen a motivos específicos en un potenciador [9] y una pequeña combinación de estos factores de transcripción unidos al potenciador, cuando se acercan a un promotor por un bucle de ADN, gobiernan el nivel de transcripción del gen objetivo. El mediador (coactivador) (un complejo que generalmente consta de alrededor de 26 proteínas en una estructura interactuante) comunica señales reguladoras de los factores de transcripción potenciadores unidos al ADN directamente a la enzima ARN polimerasa II (RNAP II) unida al promotor. [10]
Los potenciadores, cuando están activos, generalmente se transcriben a partir de ambas cadenas de ADN con ARN polimerasas que actúan en dos direcciones diferentes, produciendo dos eARN como se ilustra en la Figura. [11] Un potenciador inactivo puede estar unido a un factor de transcripción inactivo. La fosforilación del factor de transcripción puede activarlo y ese factor de transcripción activado puede entonces activar el potenciador al que está unido (ver la pequeña estrella roja que representa la fosforilación de un factor de transcripción unido a un potenciador en la ilustración). [12] Un potenciador activado comienza la transcripción de su ARN antes de activar un promotor para iniciar la transcripción del ARN mensajero de su gen objetivo. [13]
La 5-metilcitosina (5-mC) es una forma metilada de la base de ADN citosina (ver figura). La 5-mC es un marcador epigenético que se encuentra predominantemente en las citosinas dentro de los dinucleótidos CpG, que consisten en una citosina seguida de una lectura de guanina en la dirección 5′ a 3′ a lo largo de la cadena de ADN ( sitios CpG ). Alrededor de 28 millones de dinucleótidos CpG se encuentran en el genoma humano. [14] En la mayoría de los tejidos de los mamíferos, en promedio, entre el 70% y el 80% de las citosinas CpG están metiladas (formando 5-metil-CpG o 5-mCpG). [15] Las citosinas metiladas dentro de las secuencias CpG a menudo se presentan en grupos, llamados islas CpG . Alrededor del 59% de las secuencias promotoras tienen una isla CpG, mientras que solo alrededor del 6% de las secuencias potenciadoras tienen una isla CpG. [16] Las islas CpG constituyen secuencias reguladoras, ya que si las islas CpG están metiladas en el promotor de un gen esto puede reducir o silenciar la expresión genética. [17]
La metilación del ADN regula la expresión génica a través de la interacción con proteínas de dominio de unión a metilo (MBD), como MeCP2, MBD1 y MBD2. Estas proteínas MBD se unen con mayor fuerza a islas CpG altamente metiladas . [18] Estas proteínas MBD tienen tanto un dominio de unión a metil-CpG como un dominio de represión transcripcional. [18] Se unen al ADN metilado y guían o dirigen complejos proteicos con actividad de remodelación de cromatina y/o modificación de histonas a islas CpG metiladas. Las proteínas MBD generalmente reprimen la cromatina local por medios como la catálisis de la introducción de marcas de histonas represivas o la creación de un entorno de cromatina represivo general a través de la remodelación de nucleosomas y la reorganización de la cromatina. [18]
Los factores de transcripción son proteínas que se unen a secuencias específicas de ADN para regular la expresión de un gen determinado. La secuencia de unión de un factor de transcripción en el ADN suele tener una longitud de unos 10 u 11 nucleótidos. Hay aproximadamente 1.400 factores de transcripción diferentes codificados en el genoma humano y constituyen alrededor del 6% de todos los genes codificadores de proteínas humanas. [19] Alrededor del 94% de los sitios de unión de factores de transcripción que están asociados con genes sensibles a señales se encuentran en potenciadores, mientras que solo alrededor del 6% de dichos sitios se encuentran en promotores. [9]
EGR1 es un factor de transcripción importante para la regulación de la metilación de las islas CpG. Un sitio de unión del factor de transcripción EGR1 se encuentra frecuentemente en secuencias potenciadoras o promotoras. [20] Existen alrededor de 12.000 sitios de unión para EGR1 en el genoma de los mamíferos y aproximadamente la mitad de los sitios de unión de EGR1 se encuentran en promotores y la otra mitad en potenciadores. [20] La unión de EGR1 a su sitio de unión de ADN objetivo es insensible a la metilación de citosina en el ADN. [20]
Aunque solo se detectan pequeñas cantidades de proteína EGR1 en células que no están estimuladas, la traducción de EGR1 en proteína una hora después de la estimulación está marcadamente elevada. [21] La expresión de EGR1 en varios tipos de células puede ser estimulada por factores de crecimiento, neurotransmisores, hormonas, estrés y lesiones. [21] En el cerebro, cuando se activan las neuronas, las proteínas EGR1 se regulan positivamente y se unen a (reclutan) enzimas TET1 preexistentes, que se expresan en gran medida en las neuronas. Las enzimas TET pueden catalizar la desmetilación de la 5-metilcitosina. Cuando los factores de transcripción EGR1 llevan las enzimas TET1 a los sitios de unión de EGR1 en los promotores, las enzimas TET pueden desmetilar las islas CpG metiladas en esos promotores. Tras la desmetilación, estos promotores pueden iniciar la transcripción de sus genes diana. Cientos de genes en las neuronas se expresan de manera diferencial después de la activación neuronal a través del reclutamiento de TET1 por parte de EGR1 a secuencias reguladoras metiladas en sus promotores. [20]
Alrededor de 600 secuencias reguladoras en promotores y alrededor de 800 secuencias reguladoras en potenciadores parecen depender de roturas de doble cadena iniciadas por la topoisomerasa 2β (TOP2B) para su activación. [22] [23] La inducción de roturas de doble cadena particulares es específica con respecto a la señal inductora. Cuando las neuronas se activan in vitro , solo ocurren 22 roturas de doble cadena inducidas por TOP2B en sus genomas. [24] Sin embargo, cuando se lleva a cabo un condicionamiento contextual del miedo en un ratón, este condicionamiento provoca cientos de DSB asociados a genes en la corteza prefrontal medial y el hipocampo, que son importantes para el aprendizaje y la memoria. [25]
Estas roturas de doble cadena inducidas por TOP2B están acompañadas por al menos cuatro enzimas de la vía de reparación del ADN por unión de extremos no homólogos (NHEJ) (DNA-PKcs, KU70, KU80 y DNA LIGASE IV) (véase la figura). Estas enzimas reparan las roturas de doble cadena en un plazo de entre 15 minutos y 2 horas. [24] [26] Por tanto, las roturas de doble cadena en el promotor están asociadas con TOP2B y al menos estas cuatro enzimas reparadoras. Estas proteínas están presentes simultáneamente en un único nucleosoma promotor (hay unos 147 nucleótidos en la secuencia de ADN envueltos alrededor de un único nucleosoma) situado cerca del sitio de inicio de la transcripción de su gen diana. [26]
La ruptura de doble cadena introducida por TOP2B aparentemente libera la parte del promotor en un sitio de inicio de transcripción unido a la ARN polimerasa para que se desplace físicamente hacia su potenciador asociado. Esto permite que el potenciador, con sus factores de transcripción unidos y proteínas mediadoras, interactúe directamente con la ARN polimerasa que se había detenido en el sitio de inicio de la transcripción para iniciar la transcripción. [24] [10]
De manera similar, las enzimas topoisomerasa I (TOP1) parecen estar ubicadas en muchos potenciadores, y esos potenciadores se activan cuando TOP1 introduce una rotura de cadena sencilla. [27] TOP1 causa roturas de cadena sencilla en secuencias reguladoras de ADN potenciadoras particulares cuando es señalizada por un factor de transcripción de unión a potenciador específico. [27] Las roturas de topoisomerasa I están asociadas con diferentes factores de reparación de ADN que los que rodean las roturas de TOP2B. En el caso de TOP1, las roturas están asociadas más inmediatamente con las enzimas de reparación de ADN MRE11 , RAD50 y ATR . [27]
Los genomas se pueden analizar sistemáticamente para identificar regiones reguladoras. [28] Las secuencias no codificantes conservadas a menudo contienen regiones reguladoras y, por lo tanto, suelen ser objeto de estos análisis.
Las secuencias reguladoras del gen de la insulina son: [29]