En genética , un promotor es una secuencia de ADN a la que se unen las proteínas para iniciar la transcripción de un único transcrito de ARN a partir del ADN aguas abajo del promotor. El transcrito de ARN puede codificar una proteína ( ARNm ), o puede tener una función en sí mismo, como el ARNt o el ARNr . Los promotores se encuentran cerca de los sitios de inicio de la transcripción de los genes, aguas arriba en el ADN (hacia la región 5' de la cadena sentido ). Los promotores pueden tener una longitud de entre 100 y 1000 pares de bases , cuya secuencia depende en gran medida del gen y el producto de la transcripción, el tipo o la clase de ARN polimerasa reclutada en el sitio y la especie del organismo. [1] [2]
Los promotores controlan la expresión génica en bacterias y eucariotas . [3] La ARN polimerasa debe unirse al ADN cerca de un gen para que se produzca la transcripción. Las secuencias de ADN promotoras proporcionan un sitio de unión a la enzima . La secuencia -10 es TATAAT. Las secuencias -35 se conservan en promedio, pero no en la mayoría de los promotores.
Los promotores artificiales con elementos -10 y -35 conservados se transcriben más lentamente. Todos los ADN tienen "promotores muy espaciados". Son posibles las orientaciones divergentes, en tándem y convergentes. Es probable que dos promotores muy espaciados interfieran. Los elementos reguladores pueden estar a varias kilobases del sitio de inicio de la transcripción en los promotores de genes (potenciadores).
En los eucariotas, el complejo transcripcional puede doblar el ADN, lo que permite colocar secuencias reguladoras lejos del sitio de transcripción. El promotor distal está aguas arriba del gen y puede contener elementos reguladores adicionales con una influencia más débil. La ARN polimerasa II (RNAP II) unida al promotor del sitio de inicio de la transcripción puede iniciar la síntesis de ARNm. También contiene típicamente islas CpG , una caja TATA y elementos de reconocimiento TFIIB .
La hipermetilación regula a la baja ambos genes, mientras que la desmetilación los regula al alza. Los ARN no codificantes están vinculados a las regiones promotoras del ARNm. Los promotores subgenómicos tienen entre 24 y 100 nucleótidos (virus de la vena amarilla necrótica de la remolacha). La expresión génica depende de la unión del promotor. Los cambios genéticos no deseados pueden aumentar el riesgo de cáncer de una célula.
Los promotores de microARN suelen contener islas CpG. La metilación del ADN forma 5-metilcitosinas en el anillo de pirimidina 5' de los residuos de citosina CpG. Algunos genes del cáncer se silencian por mutación, pero la mayoría se silencian por metilación del ADN. Otros son promotores regulados. La selección puede favorecer una unión transcripcional menos energética.
Las variaciones en los promotores o en los factores de transcripción causan algunas enfermedades. El uso de una secuencia canónica para describir un promotor puede dar lugar a malentendidos.
Para que se produzca la transcripción, la enzima que sintetiza el ARN, conocida como ARN polimerasa , debe unirse al ADN cerca de un gen. Los promotores contienen secuencias de ADN específicas, como elementos de respuesta que proporcionan un sitio de unión inicial seguro para la ARN polimerasa y para proteínas llamadas factores de transcripción que reclutan a la ARN polimerasa. Estos factores de transcripción tienen secuencias activadoras o represoras específicas de nucleótidos correspondientes que se unen a promotores específicos y regulan la expresión génica. [ cita requerida ]
Los promotores representan elementos críticos que pueden trabajar en conjunto con otras regiones reguladoras ( potenciadores , silenciadores , elementos límite/ aislantes ) para dirigir el nivel de transcripción de un gen determinado. Un promotor se induce en respuesta a cambios en la abundancia o conformación de las proteínas reguladoras en una célula, lo que permite activar factores de transcripción para reclutar a la ARN polimerasa. [4] [5]
Dadas las secuencias cortas de la mayoría de los elementos promotores, los promotores pueden evolucionar rápidamente a partir de secuencias aleatorias. Por ejemplo, en E. coli , aproximadamente el 60 % de las secuencias aleatorias pueden desarrollar niveles de expresión comparables a los del promotor lac de tipo salvaje con solo una mutación, y aproximadamente el 10 % de las secuencias aleatorias pueden servir como promotores activos incluso sin evolución. [6]
Como los promotores suelen estar inmediatamente adyacentes al gen en cuestión, las posiciones en el promotor se designan en relación con el sitio de inicio de la transcripción , donde comienza la transcripción del ADN para un gen en particular (es decir, las posiciones aguas arriba son números negativos contando hacia atrás desde -1, por ejemplo -100 es una posición 100 pares de bases aguas arriba). [ cita requerida ]
En las bacterias , el promotor contiene dos elementos de secuencia corta aproximadamente 10 ( Pribnow Box ) y 35 nucleótidos aguas arriba del sitio de inicio de la transcripción . [2]
Las secuencias promotoras anteriores son reconocidas únicamente por la holoenzima de la ARN polimerasa que contiene sigma-70 . Las holoenzimas de la ARN polimerasa que contienen otros factores sigma reconocen diferentes secuencias promotoras centrales.
← aguas arriba aguas abajo →5'-XXXXXXXXXPPPPPPXXXXXXPPPPPPXXXXGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGXXXX-3' -35 -10 Gen a transcribir
para secuencia -10 TATAAT77% 76% 60% 61% 56% 82%
para la secuencia -35 TTGACA69% 79% 61% 56% 54% 54%
Los promotores pueden estar ubicados muy cerca en el ADN. Estos "promotores con un espaciado muy cercano" se han observado en el ADN de todas las formas de vida, desde los humanos [9] hasta los procariotas [10] y están altamente conservados. [11] Por lo tanto, pueden proporcionar algunas ventajas (actualmente desconocidas). Estos pares de promotores pueden ubicarse en direcciones divergentes, en tándem y convergentes. También pueden estar regulados por factores de transcripción y difieren en varias características, como la distancia de nucleótidos entre ellos, la fuerza de los dos promotores, etc. El aspecto más importante de dos promotores con un espaciado muy cercano es que, muy probablemente, interferirán entre sí. Varios estudios han explorado esto utilizando modelos tanto analíticos como estocásticos. [12] [13] [14] También hay estudios que midieron la expresión génica en genes sintéticos o de uno a unos pocos genes controlados por promotores bidireccionales. [15]
Más recientemente, un estudio midió la mayoría de los genes controlados por promotores en tándem en E. coli . [16] En ese estudio, se midieron dos formas principales de interferencia. Una es cuando una ARN polimerasa está en el promotor aguas abajo, bloqueando el movimiento de las ARN polimerasas que se alargan desde el promotor aguas arriba. La otra es cuando los dos promotores están tan cerca que cuando una ARN polimerasa se asienta en uno de los promotores, bloquea cualquier otra ARN polimerasa que llegue al otro promotor. Estos eventos son posibles porque la ARN polimerasa ocupa varios nucleótidos cuando está unida al ADN, incluso en los sitios de inicio de la transcripción. Eventos similares ocurren cuando los promotores están en formaciones divergentes y convergentes. Los eventos posibles también dependen de la distancia entre ellos.
Los promotores de genes se ubican típicamente aguas arriba del gen y pueden tener elementos reguladores a varias kilobases del sitio de inicio de la transcripción (potenciadores). En eucariotas, el complejo transcripcional puede hacer que el ADN se doble sobre sí mismo, lo que permite la ubicación de secuencias reguladoras lejos del sitio real de la transcripción. Los promotores eucariotas dependientes de la ARN-polimerasa-II pueden contener una caja TATA ( secuencia de consenso TATAAA), que es reconocida por el factor de transcripción general proteína de unión a TATA (TBP); y un elemento de reconocimiento B (BRE), que es reconocido por el factor de transcripción general TFIIB . [17] [18] [19] El elemento TATA y BRE típicamente se ubican cerca del sitio de inicio de la transcripción (típicamente dentro de 30 a 40 pares de bases).
Las secuencias reguladoras de los promotores eucariotas suelen unirse a proteínas llamadas factores de transcripción que participan en la formación del complejo transcripcional. Un ejemplo es la E-box (secuencia CACGTG), que se une a los factores de transcripción de la familia básica hélice-bucle-hélice (bHLH) (por ejemplo, BMAL1-Clock , cMyc ). [20] Algunos promotores que son el objetivo de múltiples factores de transcripción pueden alcanzar un estado hiperactivo, lo que conduce a una mayor actividad transcripcional. [21]
La expresión regulada al alza de los genes en mamíferos se inicia cuando se transmiten señales a los promotores asociados con los genes. Las secuencias de ADN promotoras pueden incluir diferentes elementos como islas CpG (presentes en aproximadamente el 70% de los promotores), una caja TATA (presente en aproximadamente el 24% de los promotores), iniciador (Inr) (presente en aproximadamente el 49% de los promotores), elementos de reconocimiento TFIIB aguas arriba y aguas abajo (BREu y BREd) (presentes en aproximadamente el 22% de los promotores), y elemento promotor central aguas abajo (DPE) (presente en aproximadamente el 12% de los promotores). [23] La presencia de múltiples sitios CpG metilados en islas CpG de promotores causa silenciamiento estable de genes. [24] Sin embargo, la presencia o ausencia de los otros elementos tiene efectos relativamente pequeños en la expresión génica en experimentos. [25] Dos secuencias, la caja TATA e Inr, causaron aumentos pequeños pero significativos en la expresión (aumentos del 45% y 28%, respectivamente). Los elementos BREu y BREd redujeron significativamente la expresión en un 35% y un 20%, respectivamente, y el elemento DPE no tuvo ningún efecto detectado sobre la expresión. [25]
Los módulos cis-reguladores que se localizan en regiones de ADN distantes de los promotores de genes pueden tener efectos muy grandes en la expresión génica, y algunos genes experimentan una expresión hasta 100 veces mayor debido a dicho módulo cis-regulador. [26] Estos módulos cis-reguladores incluyen potenciadores , silenciadores , aisladores y elementos de anclaje. [27] Entre esta constelación de elementos, los potenciadores y sus factores de transcripción asociados tienen un papel principal en la regulación de la expresión génica. [28]
Los potenciadores son regiones del genoma que son elementos reguladores de genes importantes. Los potenciadores controlan programas de expresión de genes específicos de cada tipo de célula, la mayoría de las veces mediante bucles que recorren largas distancias para acercarse físicamente a los promotores de sus genes objetivo. [29] En un estudio de neuronas corticales cerebrales, se encontraron 24.937 bucles que llevaban potenciadores a promotores. [26] Múltiples potenciadores, cada uno a menudo a decenas o cientos de miles de nucleótidos de distancia de sus genes objetivo, se unen a sus promotores de genes objetivo y se coordinan entre sí para controlar la expresión de su gen objetivo común. [29]
La ilustración esquemática de esta sección muestra un potenciador que forma un bucle para acercarse físicamente al promotor de un gen diana. El bucle se estabiliza mediante un dímero de una proteína conectora (por ejemplo, el dímero de CTCF o YY1 ), con un miembro del dímero anclado a su motivo de unión en el potenciador y el otro miembro anclado a su motivo de unión en el promotor (representado por los zigzags rojos en la ilustración). [30] Varios factores de transcripción específicos de la función celular (hay alrededor de 1.600 factores de transcripción en una célula humana [31] ) generalmente se unen a motivos específicos en un potenciador [32] y una pequeña combinación de estos factores de transcripción unidos al potenciador, cuando se acercan a un promotor mediante un bucle de ADN, gobiernan el nivel de transcripción del gen diana. El mediador (coactivador) (un complejo que generalmente consta de alrededor de 26 proteínas en una estructura interactuante) comunica señales reguladoras de los factores de transcripción potenciadores unidos al ADN directamente a la enzima ARN polimerasa II (pol II) unida al promotor. [33]
Los potenciadores, cuando están activos, generalmente se transcriben a partir de ambas cadenas de ADN con ARN polimerasas que actúan en dos direcciones diferentes, produciendo dos eARN como se ilustra en la Figura. [34] Un potenciador inactivo puede estar unido a un factor de transcripción inactivo. La fosforilación del factor de transcripción puede activarlo y ese factor de transcripción activado puede entonces activar el potenciador al que está unido (ver la pequeña estrella roja que representa la fosforilación del factor de transcripción unido al potenciador en la ilustración). [35] Un potenciador activado comienza la transcripción de su ARN antes de activar un promotor para iniciar la transcripción del ARN mensajero de su gen objetivo. [36]
Los promotores bidireccionales son regiones intergénicas cortas (<1 kbp) de ADN entre los extremos 5' de los genes en un par de genes bidireccionales. [37] Un "par de genes bidireccionales" se refiere a dos genes adyacentes codificados en cadenas opuestas, con sus extremos 5' orientados uno hacia el otro. [38] Los dos genes a menudo están relacionados funcionalmente, y la modificación de su región promotora compartida permite que se co-regulen y, por lo tanto, se co-expresen. [39] Los promotores bidireccionales son una característica común de los genomas de los mamíferos . [40] Aproximadamente el 11% de los genes humanos están emparejados bidireccionalmente. [37]
Los genes emparejados bidireccionalmente en la base de datos Gene Ontology compartieron al menos una categoría funcional asignada por la base de datos con sus socios el 47% del tiempo. [41] El análisis de microarrays ha demostrado que los genes emparejados bidireccionalmente se coexpresan en un grado mayor que los genes aleatorios o los genes unidireccionales vecinos. [37] Aunque la coexpresión no necesariamente indica corregulación, se ha demostrado que la metilación de las regiones promotoras bidireccionales regula a la baja ambos genes, y la desmetilación regula al alza ambos genes. [42] Sin embargo, existen excepciones a esto. En algunos casos (alrededor del 11%), solo se expresa un gen de un par bidireccional. [37] En estos casos, el promotor está implicado en la supresión del gen no expresado. El mecanismo detrás de esto podría ser la competencia por las mismas polimerasas o la modificación de la cromatina . La transcripción divergente podría cambiar los nucleosomas para regular al alza la transcripción de un gen, o eliminar los factores de transcripción unidos para regular a la baja la transcripción de un gen. [43]
Algunas clases funcionales de genes tienen más probabilidades de estar emparejados bidireccionalmente que otras. Los genes implicados en la reparación del ADN tienen cinco veces más probabilidades de estar regulados por promotores bidireccionales que por promotores unidireccionales. Las proteínas chaperonas tienen tres veces más probabilidades, y los genes mitocondriales tienen más del doble de probabilidades. Muchos genes metabólicos celulares y de mantenimiento básico están regulados por promotores bidireccionales. [37] La sobrerrepresentación de genes de reparación del ADN emparejados bidireccionalmente asocia estos promotores con el cáncer . El cuarenta y cinco por ciento de los oncogenes somáticos humanos parecen estar regulados por promotores bidireccionales, significativamente más que los genes que no causan cáncer. La hipermetilación de los promotores entre los pares de genes WNT9A /CD558500, CTDSPL /BC040563 y KCNK15 /BF195580 se ha asociado con tumores. [42]
Se han observado ciertas características de secuencia en promotores bidireccionales, incluyendo una falta de cajas TATA , una abundancia de islas CpG y una simetría alrededor del punto medio de Cs y As dominantes en un lado y Gs y Ts en el otro. Recientemente se ha demostrado que un motivo con la secuencia de consenso de TCTCGCGAGA, también llamado elemento CGCG, impulsa la transcripción bidireccional impulsada por PolII en islas CpG. [44] Las cajas CCAAT son comunes, como lo son en muchos promotores que carecen de cajas TATA. Además, los motivos NRF-1, GABPA , YY1 y ACTACAnnTCCC están representados en promotores bidireccionales a tasas significativamente más altas que en promotores unidireccionales. La ausencia de cajas TATA en promotores bidireccionales sugiere que las cajas TATA desempeñan un papel en la determinación de la direccionalidad de los promotores, pero los contraejemplos de promotores bidireccionales poseen cajas TATA y los promotores unidireccionales sin ellas indican que no pueden ser el único factor. [45]
Aunque el término "promotor bidireccional" se refiere específicamente a las regiones promotoras de los genes que codifican el ARNm , los ensayos de luciferasa han demostrado que más de la mitad de los genes humanos no tienen un sesgo direccional fuerte. Las investigaciones sugieren que los ARN no codificantes se asocian con frecuencia con las regiones promotoras de los genes que codifican el ARNm. Se ha planteado la hipótesis de que el reclutamiento y la iniciación de la ARN polimerasa II suelen comenzar de forma bidireccional, pero la transcripción divergente se detiene en un punto de control más adelante durante la elongación. Los posibles mecanismos detrás de esta regulación incluyen secuencias en la región promotora, modificación de la cromatina y la orientación espacial del ADN. [43]
Un promotor subgenómico es un promotor añadido a un virus para un gen heterólogo específico , lo que da como resultado la formación de ARNm para ese gen solo. Muchos virus de ARN de sentido positivo producen estos ARNm subgenómicos (sgRNA) como una de las técnicas de infección comunes utilizadas por estos virus y generalmente transcriben genes virales tardíos. Los promotores subgenómicos varían de 24 nucleótidos ( virus Sindbis ) a más de 100 nucleótidos ( virus de la vena amarilla necrótica de la remolacha ) y generalmente se encuentran aguas arriba del inicio de la transcripción. [46]
Se ha desarrollado una amplia variedad de algoritmos para facilitar la detección de promotores en la secuencia genómica, y la predicción de promotores es un elemento común de muchos métodos de predicción de genes . Una región promotora se ubica antes de las secuencias de consenso -35 y -10. Cuanto más cerca esté la región promotora de las secuencias de consenso, más a menudo se producirá la transcripción de ese gen. No existe un patrón establecido para las regiones promotoras, como sí lo hay para las secuencias de consenso.
El inicio de la transcripción es un proceso secuencial de varios pasos que involucra varios mecanismos: ubicación del promotor, unión reversible inicial de la ARN polimerasa, cambios conformacionales en la ARN polimerasa, cambios conformacionales en el ADN, unión del trifosfato de nucleósido (NTP) al complejo funcional ARN polimerasa-promotor e inicio no productivo y productivo de la síntesis de ARN. [47] [2]
El proceso de unión del promotor es crucial para comprender el proceso de expresión génica. El ajuste de los sistemas genéticos sintéticos depende de promotores sintéticos diseñados con precisión y con niveles conocidos de tasas de transcripción. [2]
Aunque la holoenzima ARN polimerasa muestra una alta afinidad por sitios no específicos del ADN, esta característica no permite esclarecer el proceso de localización del promotor. [48] Este proceso de localización del promotor se ha atribuido a la estructura de la holoenzima al ADN y de los complejos sigma 4 al ADN. [49]
La mayoría de las enfermedades tienen causas heterogéneas, lo que significa que una "enfermedad" suele ser un conjunto de muchas enfermedades diferentes a nivel molecular, aunque los síntomas que se presentan y la respuesta al tratamiento pueden ser idénticos. La farmacogenómica aborda parcialmente la forma en que las enfermedades de diferente origen molecular responden a los tratamientos .
No se enumeran aquí los numerosos tipos de cáncer que implican una regulación transcripcional aberrante debido a la creación de genes quiméricos a través de una translocación cromosómica patológica . Es importante destacar que la intervención en el número o la estructura de las proteínas unidas al promotor es una clave para tratar una enfermedad sin afectar la expresión de genes no relacionados que comparten elementos con el gen objetivo. [50] Algunos genes cuyo cambio no es deseable son capaces de influir en el potencial de una célula de volverse cancerosa. [51]
En los seres humanos, aproximadamente el 70% de los promotores ubicados cerca del sitio de inicio de la transcripción de un gen (promotores proximales) contienen una isla CpG . [52] [53] Las islas CpG generalmente tienen una longitud de 200 a 2000 pares de bases, un contenido de pares de bases C:G >50% y tienen regiones de ADN donde un nucleótido de citosina es seguido por un nucleótido de guanina y esto ocurre con frecuencia en la secuencia lineal de bases a lo largo de su dirección 5' → 3' .
Los promotores distales también contienen frecuentemente islas CpG, como el promotor del gen de reparación de ADN ERCC1 , donde el promotor que contiene la isla CpG se encuentra aproximadamente 5.400 nucleótidos aguas arriba de la región codificante del gen ERCC1 . [54] Las islas CpG también aparecen con frecuencia en los promotores de ARN funcionales no codificantes, como los microARN .
En los seres humanos, la metilación del ADN se produce en la posición 5' del anillo de pirimidina de los residuos de citosina dentro de los sitios CpG para formar 5-metilcitosinas . La presencia de múltiples sitios CpG metilados en las islas CpG de los promotores provoca el silenciamiento estable de los genes. [24] El silenciamiento de un gen puede iniciarse por otros mecanismos, pero a menudo esto es seguido por la metilación de los sitios CpG en la isla CpG del promotor para provocar el silenciamiento estable del gen. [24]
En general, durante la progresión hacia el cáncer, cientos de genes se silencian o se activan . Aunque el silenciamiento de algunos genes en los cánceres ocurre por mutación, una gran proporción del silenciamiento de genes cancerígenos es resultado de una metilación alterada del ADN (ver Metilación del ADN en el cáncer ). La metilación del ADN que causa el silenciamiento en el cáncer ocurre típicamente en múltiples sitios CpG en las islas CpG que están presentes en los promotores de los genes codificadores de proteínas.
Las expresiones alteradas de microARN también silencian o activan muchos genes en la progresión hacia el cáncer (ver microARN en el cáncer ). La expresión alterada de microARN ocurre a través de la hiper/hipometilación de sitios CpG en islas CpG en promotores que controlan la transcripción de los microARN .
El silenciamiento de los genes de reparación del ADN a través de la metilación de las islas CpG en sus promotores parece ser especialmente importante en la progresión al cáncer (ver metilación de genes de reparación del ADN en el cáncer ).
El uso del término secuencia canónica para referirse a un promotor suele ser problemático y puede dar lugar a malentendidos sobre las secuencias promotoras. Canónico implica, en cierto sentido, perfecto.
En el caso de un sitio de unión de un factor de transcripción, puede haber una única secuencia que se una a la proteína con mayor fuerza en determinadas condiciones celulares. Esto podría denominarse canónico.
Sin embargo, la selección natural puede favorecer la unión menos energética como forma de regular la producción transcripcional. En este caso, podemos llamar a la secuencia más común en una población la secuencia de tipo salvaje. Puede que ni siquiera sea la secuencia más ventajosa en las condiciones prevalecientes.
Evidencias recientes también indican que varios genes (incluido el protooncogén c-myc ) tienen motivos G-quadruplex como posibles señales reguladoras.
Los promotores son elementos reguladores genéticos importantes que se utilizan para ajustar circuitos genéticos y redes metabólicas diseñados sintéticamente . Por ejemplo, para sobreexpresar un gen importante en una red y obtener una mayor producción de la proteína objetivo, los biólogos sintéticos diseñan promotores para regular positivamente su expresión . Se pueden utilizar algoritmos automatizados para diseñar ADN neutro o aisladores que no desencadenen la expresión génica de secuencias posteriores. [55] [2]
Algunos casos de muchas enfermedades genéticas están asociados con variaciones en los promotores o factores de transcripción.
Algunos ejemplos incluyen:
Algunos promotores se denominan constitutivos porque son activos en todas las circunstancias de la célula, mientras que otros son regulados y se activan en la célula sólo en respuesta a estímulos específicos.
Un promotor específico de tejido es un promotor que tiene actividad sólo en ciertos tipos de células.
Al referirse a un promotor, algunos autores en realidad se refieren a promotor + operador ; es decir, el promotor lac es inducible por IPTG, lo que significa que además del promotor lac, también está presente el operón lac . Si el operador lac no estuviera presente, el IPTG no tendría un efecto inducible. [ cita requerida ] Otro ejemplo es el sistema Tac-Promoter (Ptac). Observe cómo tac se escribe como un promotor tac, mientras que, de hecho, tac es en realidad tanto un promotor como un operador. [60]