En genética , un promotor es una secuencia de ADN a la que se unen las proteínas para iniciar la transcripción de un único transcrito de ARN del ADN aguas abajo del promotor. El transcrito de ARN puede codificar una proteína ( ARNm ) o puede tener una función en sí mismo, como ARNt o ARNr . Los promotores se encuentran cerca de los sitios de inicio de la transcripción de los genes, aguas arriba del ADN (hacia la región 5' de la cadena sentido ). Los promotores pueden tener entre 100 y 1 000 pares de bases de largo, cuya secuencia depende en gran medida del gen y el producto de la transcripción, el tipo o clase de ARN polimerasa reclutada en el sitio y la especie de organismo. [1] [2]
Los promotores controlan la expresión genética en bacterias y eucariotas . [3] La ARN polimerasa debe unirse al ADN cerca de un gen para que se produzca la transcripción. Las secuencias de ADN promotor proporcionan un sitio de unión a enzimas . La secuencia -10 es TATAAT. -35 secuencias se conservan en promedio, pero no en la mayoría de los promotores.
Los promotores artificiales con elementos -10 y -35 conservados se transcriben más lentamente. Todos los ADN tienen "promotores muy espaciados". Son posibles orientaciones divergentes, en tándem y convergentes. Es probable que interfieran dos promotores muy cercanos. Los elementos reguladores pueden estar a varias kilobases de distancia del sitio de inicio de la transcripción en los promotores de genes (potenciadores).
En los eucariotas, el complejo transcripcional puede doblar el ADN, permitiendo que las secuencias reguladoras se coloquen lejos del sitio de transcripción. El promotor distal se encuentra aguas arriba del gen y puede contener elementos reguladores adicionales con una influencia más débil. La ARN polimerasa II (RNAP II) unida al promotor del sitio de inicio de la transcripción puede iniciar la síntesis de ARNm. También suele contener islas CpG , una caja TATA y elementos de reconocimiento TFIIB .
La hipermetilación regula negativamente ambos genes, mientras que la desmetilación los regula positivamente. Los ARN no codificantes están unidos a regiones promotoras de ARNm. Los promotores subgenómicos varían de 24 a 100 nucleótidos (virus de la vena amarilla necrótica de la remolacha). La expresión genética depende de la unión del promotor. Los cambios genéticos no deseados pueden aumentar el riesgo de cáncer de una célula.
Los promotores de microARN suelen contener islas CpG. La metilación del ADN forma 5-metilcitosinas en el anillo de pirimidina 5' de los residuos de citosina CpG. Algunos genes del cáncer son silenciados por mutación, pero la mayoría lo son por la metilación del ADN. Otros son promotores regulados. La selección puede favorecer una unión transcripcional menos energética.
Las variaciones en los promotores o factores de transcripción provocan algunas enfermedades. Pueden surgir malentendidos al utilizar una secuencia canónica para describir un promotor.
Para que se produzca la transcripción, la enzima que sintetiza el ARN, conocida como ARN polimerasa , debe unirse al ADN cerca de un gen. Los promotores contienen secuencias de ADN específicas, como elementos de respuesta , que proporcionan un sitio de unión inicial seguro para la ARN polimerasa y para proteínas llamadas factores de transcripción que reclutan la ARN polimerasa. Estos factores de transcripción tienen secuencias activadoras o represoras específicas de nucleótidos correspondientes que se unen a promotores específicos y regulan la expresión génica. [ cita necesaria ]
Los promotores representan elementos críticos que pueden trabajar en conjunto con otras regiones reguladoras ( potenciadores , silenciadores , elementos límite/ aisladores ) para dirigir el nivel de transcripción de un gen determinado. Se induce un promotor en respuesta a cambios en la abundancia o conformación de proteínas reguladoras en una célula, que permiten activar factores de transcripción para reclutar ARN polimerasa. [4] [5]
Dadas las secuencias cortas de la mayoría de los elementos promotores, los promotores pueden evolucionar rápidamente a partir de secuencias aleatorias. Por ejemplo, en E. coli , aproximadamente el 60 % de las secuencias aleatorias pueden desarrollar niveles de expresión comparables a los del promotor lac de tipo salvaje con una sola mutación, y ese ~10 % de las secuencias aleatorias pueden servir como promotores activos incluso sin evolución. [6]
Como los promotores suelen estar inmediatamente adyacentes al gen en cuestión, las posiciones en el promotor se designan en relación con el sitio de inicio de la transcripción , donde comienza la transcripción del ADN para un gen particular (es decir, las posiciones aguas arriba son números negativos que cuentan hacia atrás desde -1, por ejemplo -100 es una posición de 100 pares de bases aguas arriba). [ cita necesaria ]
En las bacterias , el promotor contiene dos elementos de secuencia corta aproximadamente a 10 ( Pribnow Box ) y 35 nucleótidos aguas arriba del sitio de inicio de la transcripción . [2]
Las secuencias promotoras anteriores son reconocidas únicamente por la holoenzima de ARN polimerasa que contiene sigma-70 . Las holoenzimas de ARN polimerasa que contienen otros factores sigma reconocen diferentes secuencias promotoras centrales.
← aguas arriba aguas abajo →5'-XXXXXXXPPPPPPXXXXXXPPPPPPXXXXGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGXXXX-3' -35 -10 Gen a transcribir
para secuencia -10 TATAAT77% 76% 60% 61% 56% 82%
para secuencia -35 TTGACA69% 79% 61% 56% 54% 54%
Los promotores pueden estar ubicados muy cerca del ADN. Estos "promotores estrechamente espaciados" se han observado en el ADN de todas las formas de vida, desde humanos [9] hasta procariotas [10] y están altamente conservados. [11] Por lo tanto, pueden proporcionar algunas ventajas (actualmente desconocidas). Estos pares de promotores se pueden colocar en direcciones divergentes, en tándem y convergentes. También pueden estar regulados por factores de transcripción y difieren en varias características, como la distancia de nucleótidos entre ellos, la fuerza de los dos promotores, etc. El aspecto más importante de dos promotores estrechamente espaciados es que, muy probablemente, interferirán entre sí. . Varios estudios han explorado esto utilizando modelos tanto analíticos como estocásticos. [12] [13] [14] También hay estudios que midieron la expresión genética en genes sintéticos o de uno a unos pocos genes controlados por promotores bidireccionales. [15]
Más recientemente, un estudio midió la mayoría de los genes controlados por promotores en tándem en E. coli . [16] En ese estudio, se midieron dos formas principales de interferencia. Una es cuando una RNAP está en el promotor aguas abajo, bloqueando el movimiento de las RNAP que se extienden desde el promotor aguas arriba. La otra es cuando los dos promotores están tan cerca que cuando una RNAP se asienta sobre uno de los promotores, impide que cualquier otra RNAP llegue al otro promotor. Estos eventos son posibles porque la RNAP ocupa varios nucleótidos cuando se une al ADN, incluso en los sitios de inicio de la transcripción. Sucesos similares ocurren cuando los promotores están en formaciones divergentes y convergentes. Los posibles eventos también dependen de la distancia entre ellos.
Los promotores de genes suelen estar ubicados aguas arriba del gen y pueden tener elementos reguladores a varias kilobases de distancia del sitio de inicio de la transcripción (potenciadores). En los eucariotas, el complejo transcripcional puede hacer que el ADN se doble sobre sí mismo, lo que permite la colocación de secuencias reguladoras lejos del sitio real de transcripción. Los promotores eucariotas dependientes de la ARN polimerasa II pueden contener una caja TATA ( secuencia de consenso TATAAA), que es reconocida por la proteína de unión a TATA (TBP) del factor de transcripción general ; y un elemento de reconocimiento B (BRE), que es reconocido por el factor de transcripción general TFIIB . [17] [18] [19] El elemento TATA y BRE normalmente se encuentran cerca del sitio de inicio de la transcripción (normalmente entre 30 y 40 pares de bases).
Las secuencias reguladoras del promotor eucariota normalmente se unen a proteínas llamadas factores de transcripción que participan en la formación del complejo transcripcional. Un ejemplo es la E-box (secuencia CACGTG), que se une a factores de transcripción de la familia básica hélice-bucle-hélice (bHLH) (p. ej., BMAL1-Clock , cMyc ). [20] Algunos promotores que son atacados por múltiples factores de transcripción podrían alcanzar un estado hiperactivo, lo que lleva a una mayor actividad transcripcional. [21]
La expresión regulada positivamente de genes en mamíferos se inicia cuando se transmiten señales a los promotores asociados con los genes. Las secuencias de ADN del promotor pueden incluir diferentes elementos tales como islas CpG (presentes en aproximadamente el 70% de los promotores), una caja TATA (presente en aproximadamente el 24% de los promotores), iniciador (Inr) (presente en aproximadamente el 49% de los promotores), aguas arriba y elementos de reconocimiento TFIIB aguas abajo (BREu y BREd) (presentes en aproximadamente el 22 % de los promotores) y elemento promotor central aguas abajo (DPE) (presente en aproximadamente el 12 % de los promotores). [23] La presencia de múltiples sitios CpG metilados en islas CpG de promotores provoca un silenciamiento estable de genes. [24] Sin embargo, la presencia o ausencia de otros elementos tiene efectos relativamente pequeños sobre la expresión genética en los experimentos. [25] Dos secuencias, la caja TATA e Inr, provocaron aumentos pequeños pero significativos en la expresión (aumentos del 45% y 28%, respectivamente). Los elementos BREu y BREd disminuyeron significativamente la expresión en un 35% y un 20%, respectivamente, y el elemento DPE no tuvo ningún efecto detectado en la expresión. [25]
Los módulos reguladores en cis que están localizados en regiones del ADN distantes de los promotores de los genes pueden tener efectos muy grandes en la expresión génica, y algunos genes experimentan una expresión aumentada hasta 100 veces debido a dicho módulo regulador en cis. [26] Estos módulos reguladores cis incluyen potenciadores , silenciadores , aisladores y elementos de anclaje. [27] Entre esta constelación de elementos, los potenciadores y sus factores de transcripción asociados tienen un papel principal en la regulación de la expresión génica. [28]
Los potenciadores son regiones del genoma que son importantes elementos reguladores de genes. Los potenciadores controlan los programas de expresión genética específicos de cada tipo de célula, generalmente recorriendo largas distancias para acercarse físicamente a los promotores de sus genes diana. [29] En un estudio de neuronas corticales del cerebro, se encontraron 24.937 bucles que aportaban potenciadores a los promotores. [26] Múltiples potenciadores, cada uno a menudo a decenas o cientos de miles de nucleótidos distantes de sus genes diana, se enlazan con los promotores de sus genes diana y se coordinan entre sí para controlar la expresión de su gen diana común. [29]
La ilustración esquemática de esta sección muestra un potenciador dando vueltas para acercarse físicamente al promotor de un gen diana. El bucle se estabiliza mediante un dímero de una proteína conectora (por ejemplo, dímero de CTCF o YY1 ), con un miembro del dímero anclado a su motivo de unión en el potenciador y el otro miembro anclado a su motivo de unión en el promotor (representado por el zigzags rojos en la ilustración). [30] Varios factores de transcripción específicos de la función celular (hay alrededor de 1.600 factores de transcripción en una célula humana [31] ) generalmente se unen a motivos específicos en un potenciador [32] y una pequeña combinación de estos factores de transcripción unidos al potenciador, cuando se acercan a un promotor mediante un bucle de ADN, gobiernan el nivel de transcripción del gen diana. El mediador (coactivador) (un complejo que generalmente consta de aproximadamente 26 proteínas en una estructura que interactúa) comunica señales reguladoras de los factores de transcripción potenciadores unidos al ADN directamente a la enzima ARN polimerasa II (pol II) unida al promotor. [33]
Los potenciadores, cuando están activos, generalmente se transcriben a partir de ambas cadenas de ADN con ARN polimerasas que actúan en dos direcciones diferentes, produciendo dos ARNe como se ilustra en la Figura. [34] Un potenciador inactivo puede estar unido a un factor de transcripción inactivo. La fosforilación del factor de transcripción puede activarlo y ese factor de transcripción activado puede luego activar el potenciador al que está unido (ver la pequeña estrella roja que representa la fosforilación del factor de transcripción unido al potenciador en la ilustración). [35] Un potenciador activado comienza la transcripción de su ARN antes de activar un promotor para iniciar la transcripción del ARN mensajero de su gen objetivo. [36]
Los promotores bidireccionales son regiones intergénicas cortas (<1 kpb) de ADN entre los extremos 5' de los genes en un par de genes bidireccionales. [37] Un "par de genes bidireccional" se refiere a dos genes adyacentes codificados en cadenas opuestas, con sus extremos 5' orientados uno hacia el otro. [38] Los dos genes a menudo están relacionados funcionalmente y la modificación de su región promotora compartida les permite coregularse y, por lo tanto, coexpresarse. [39] Los promotores bidireccionales son una característica común de los genomas de los mamíferos . [40] Alrededor del 11% de los genes humanos están emparejados bidireccionalmente. [37]
Los genes emparejados bidireccionalmente en la base de datos Gene Ontology compartieron al menos una categoría funcional asignada por la base de datos con sus socios el 47% del tiempo. [41] El análisis de microarrays ha demostrado que los genes emparejados bidireccionalmente se coexpresan en un grado mayor que los genes aleatorios o los genes unidireccionales vecinos. [37] Aunque la coexpresión no necesariamente indica corregulación, se ha demostrado que la metilación de regiones promotoras bidireccionales regula negativamente ambos genes y la desmetilación regula positivamente ambos genes. [42] Sin embargo, hay excepciones a esto. En algunos casos (alrededor del 11%), sólo se expresa un gen de un par bidireccional. [37] En estos casos, el promotor está implicado en la supresión del gen no expresado. El mecanismo detrás de esto podría ser la competencia por las mismas polimerasas o la modificación de la cromatina . La transcripción divergente podría cambiar los nucleosomas para regular positivamente la transcripción de un gen, o eliminar factores de transcripción unidos para regular negativamente la transcripción de un gen. [43]
Es más probable que algunas clases funcionales de genes estén emparejadas bidireccionalmente que otras. Los genes implicados en la reparación del ADN tienen cinco veces más probabilidades de estar regulados por promotores bidireccionales que por promotores unidireccionales. Las proteínas chaperonas tienen tres veces más probabilidades y los genes mitocondriales tienen más del doble de probabilidades. Muchos genes metabólicos celulares y de limpieza básicos están regulados por promotores bidireccionales. [37] La sobrerrepresentación de genes de reparación del ADN emparejados bidireccionalmente asocia estos promotores con el cáncer . El cuarenta y cinco por ciento de los oncogenes somáticos humanos parecen estar regulados por promotores bidireccionales, una cantidad significativamente mayor que los genes que no causan cáncer. La hipermetilación de los promotores entre los pares de genes WNT9A /CD558500, CTDSPL /BC040563 y KCNK15 /BF195580 se ha asociado con tumores. [42]
Se han observado ciertas características de secuencia en promotores bidireccionales, incluida la falta de cajas TATA , una abundancia de islas CpG y una simetría alrededor del punto medio de C y As dominantes en un lado y G y T en el otro. Recientemente se demostró que un motivo con la secuencia consenso de TCTCGCGAGA, también llamado elemento CGCG, impulsa la transcripción bidireccional impulsada por PolII en islas CpG. [44] Las cajas CCAAT son comunes, como lo son en muchos promotores que carecen de cajas TATA. Además, los motivos NRF-1, GABPA , YY1 y ACTACAnnTCCC están representados en promotores bidireccionales a tasas significativamente más altas que en promotores unidireccionales. La ausencia de cajas TATA en promotores bidireccionales sugiere que las cajas TATA desempeñan un papel en la determinación de la direccionalidad de los promotores, pero los contraejemplos de promotores bidireccionales poseen cajas TATA y los promotores unidireccionales sin ellas indican que no pueden ser el único factor. [45]
Aunque el término "promotor bidireccional" se refiere específicamente a regiones promotoras de genes que codifican ARNm , los ensayos de luciferasa han demostrado que más de la mitad de los genes humanos no tienen un fuerte sesgo direccional. Las investigaciones sugieren que los ARN no codificantes se asocian frecuentemente con las regiones promotoras de genes que codifican ARNm. Se ha planteado la hipótesis de que el reclutamiento y la iniciación de la ARN polimerasa II generalmente comienza de forma bidireccional, pero la transcripción divergente se detiene en un punto de control posterior durante el alargamiento. Los posibles mecanismos detrás de esta regulación incluyen secuencias en la región promotora, modificación de la cromatina y la orientación espacial del ADN. [43]
Un promotor subgenómico es un promotor añadido a un virus para un gen heterólogo específico , lo que da como resultado la formación de ARNm solo para ese gen. Muchos virus de ARN de sentido positivo producen estos ARNm subgenómicos (ARNsg) como una de las técnicas de infección comunes utilizadas por estos virus y generalmente transcriben genes virales tardíos. Los promotores subgenómicos varían desde 24 nucleótidos ( virus Sindbis ) hasta más de 100 nucleótidos ( virus de la vena amarilla necrótica de la remolacha ) y generalmente se encuentran aguas arriba del inicio de la transcripción. [46]
Se ha desarrollado una amplia variedad de algoritmos para facilitar la detección de promotores en la secuencia genómica, y la predicción de promotores es un elemento común de muchos métodos de predicción de genes . Una región promotora está ubicada antes de las secuencias de consenso -35 y -10. Cuanto más cerca esté la región promotora de las secuencias consenso, más frecuentemente se producirá la transcripción de ese gen. No existe un patrón establecido para las regiones promotoras como lo existe para las secuencias consenso.
El inicio de la transcripción es un proceso secuencial de varios pasos que involucra varios mecanismos: ubicación del promotor, unión inicial reversible de la ARN polimerasa, cambios conformacionales en la ARN polimerasa, cambios conformacionales en el ADN, unión del nucleósido trifosfato (NTP) al promotor funcional de la ARN polimerasa. Iniciación compleja, no productiva y productiva de la síntesis de ARN. [47] [2]
El proceso de unión del promotor es crucial en la comprensión del proceso de expresión génica. El ajuste de los sistemas genéticos sintéticos se basa en promotores sintéticos diseñados con precisión con niveles conocidos de tasas de transcripción. [2]
Aunque la holoenzima ARN polimerasa muestra una alta afinidad por sitios no específicos del ADN, esta característica no nos permite aclarar el proceso de localización del promotor. [48] Este proceso de ubicación del promotor se ha atribuido a la estructura de la holoenzima al ADN y sigma 4 a los complejos de ADN. [49]
La mayoría de las enfermedades tienen causas heterogéneas, lo que significa que una "enfermedad" suele ser muchas enfermedades diferentes a nivel molecular, aunque los síntomas mostrados y la respuesta al tratamiento pueden ser idénticos. La forma en que las enfermedades de diferente origen molecular responden a los tratamientos se aborda parcialmente en la disciplina de la farmacogenómica .
No se enumeran aquí los muchos tipos de cánceres que implican una regulación transcripcional aberrante debido a la creación de genes quiméricos mediante translocación cromosómica patológica . Es importante destacar que la intervención en el número o la estructura de las proteínas unidas al promotor es una clave para tratar una enfermedad sin afectar la expresión de genes no relacionados que comparten elementos con el gen diana. [50] Algunos genes cuyo cambio no es deseable son capaces de influir en el potencial de una célula para volverse cancerosa. [51]
En humanos, alrededor del 70% de los promotores ubicados cerca del sitio de inicio de la transcripción de un gen (promotores proximales) contienen una isla CpG . [52] [53] Las islas CpG generalmente tienen de 200 a 2000 pares de bases de largo, tienen un contenido de pares de bases C:G >50% y tienen regiones de ADN donde un nucleótido de citosina es seguido por un nucleótido de guanina y esto ocurre con frecuencia en el secuencia lineal de bases a lo largo de su dirección 5' → 3' .
Los promotores distales también contienen frecuentemente islas CpG, como el promotor del gen de reparación del ADN ERCC1 , donde el promotor que contiene la isla CpG se encuentra aproximadamente 5.400 nucleótidos aguas arriba de la región codificante del gen ERCC1 . [54] Las islas CpG también aparecen con frecuencia en promotores de ARN funcionales no codificantes , como los microARN .
En humanos, la metilación del ADN ocurre en la posición 5' del anillo de pirimidina de los residuos de citosina dentro de los sitios CpG para formar 5-metilcitosinas . La presencia de múltiples sitios CpG metilados en islas CpG de promotores provoca un silenciamiento estable de genes. [24] El silenciamiento de un gen puede iniciarse mediante otros mecanismos, pero esto suele ir seguido de la metilación de los sitios CpG en la isla CpG promotora para provocar el silenciamiento estable del gen. [24]
Generalmente, en la progresión hacia el cáncer, cientos de genes son silenciados o activados . Aunque el silenciamiento de algunos genes en los cánceres se produce por mutación, una gran proporción del silenciamiento de genes cancerígenos es el resultado de una metilación alterada del ADN (ver Metilación del ADN en el cáncer ). La metilación del ADN que causa el silenciamiento en el cáncer ocurre típicamente en múltiples sitios CpG en las islas CpG que están presentes en los promotores de genes codificantes de proteínas.
Las expresiones alteradas de microARN también silencian o activan muchos genes en la progresión hacia el cáncer (ver microARN en cáncer ). "La expresión alterada de microARN se produce mediante hiper/hipometilación de sitios CpG en islas CpG en promotores que controlan la transcripción de los microARN ".
El silenciamiento de los genes de reparación del ADN mediante la metilación de islas CpG en sus promotores parece ser especialmente importante en la progresión hacia el cáncer (ver metilación de genes de reparación del ADN en el cáncer ).
El uso del término secuencia canónica para referirse a un promotor suele ser problemático y puede dar lugar a malentendidos sobre las secuencias promotoras. Canónico implica perfecto, en cierto sentido.
En el caso de un sitio de unión de un factor de transcripción, puede haber una única secuencia que se una a la proteína con mayor fuerza en condiciones celulares específicas. Esto podría llamarse canónico.
Sin embargo, la selección natural puede favorecer una unión menos energética como forma de regular la producción transcripcional. En este caso, podemos llamar secuencia natural a la secuencia más común en una población. Puede que ni siquiera sea la secuencia más ventajosa en las condiciones imperantes.
La evidencia reciente también indica que varios genes (incluido el protooncogén c-myc ) tienen motivos G-quadruplex como posibles señales reguladoras.
Los promotores son importantes elementos reguladores de genes que se utilizan para ajustar circuitos genéticos y redes metabólicas diseñados sintéticamente . Por ejemplo, para sobreexpresar un gen importante en una red, para producir una mayor producción de proteína objetivo, los biólogos sintéticos diseñan promotores para regular positivamente su expresión . Se pueden utilizar algoritmos automatizados para diseñar ADN neutro o aislantes que no desencadenen la expresión genética de secuencias posteriores. [55] [2]
Algunos casos de muchas enfermedades genéticas están asociados con variaciones en los promotores o factores de transcripción.
Ejemplos incluyen:
Algunos promotores se denominan constitutivos porque están activos en todas las circunstancias en la célula, mientras que otros están regulados , volviéndose activos en la célula sólo en respuesta a estímulos específicos.
Un promotor específico de tejido es un promotor que tiene actividad sólo en ciertos tipos de células.
Cuando se refieren a un promotor, algunos autores en realidad se refieren a promotor + operador ; es decir, el promotor lac es inducible por IPTG, lo que significa que además del promotor lac, también está presente el operón lac . Si el operador lac no estuviera presente, el IPTG no tendría un efecto inducible. [ cita necesaria ] Otro ejemplo es el sistema Tac-Promoter (Ptac). Observe cómo tac se escribe como promotor tac, cuando en realidad tac es tanto un promotor como un operador. [60]
{{cite journal}}
: Mantenimiento CS1: DOI inactivo a partir de abril de 2024 ( enlace )