Los elementos cis -reguladores ( CRE ) o módulos cis -reguladores ( CRM ) son regiones de ADN no codificante que regulan la transcripción de genes vecinos. Los CRE son componentes vitales de las redes reguladoras genéticas , que a su vez controlan la morfogénesis , el desarrollo de la anatomía y otros aspectos del desarrollo embrionario , estudiados en la biología del desarrollo evolutivo .
Los CRE se encuentran en la proximidad de los genes que regulan. Los CRE suelen regular la transcripción génica uniéndose a factores de transcripción . Un único factor de transcripción puede unirse a muchos CRE y, por lo tanto, controlar la expresión de muchos genes ( pleiotropía ). El prefijo latino cis significa "de este lado", es decir, en la misma molécula de ADN que el gen o los genes que se van a transcribir.
Los CRM son tramos de ADN , normalmente de 100 a 1000 pares de bases de ADN de longitud, [1] donde una serie de factores de transcripción pueden unirse y regular la expresión de genes cercanos y regular sus tasas de transcripción. Se etiquetan como cis porque normalmente se encuentran en la misma cadena de ADN que los genes que controlan, a diferencia de trans , que se refiere a los efectos sobre genes que no se encuentran en la misma cadena o más lejos, como los factores de transcripción. [1] Un elemento cis -regulador puede regular varios genes, [2] y, a la inversa, un gen puede tener varios módulos cis -reguladores. [3] Los módulos cis -reguladores llevan a cabo su función integrando los factores de transcripción activos y los cofactores asociados en un momento y lugar específicos de la célula donde se lee esta información y se proporciona un resultado. [4]
Los CRE suelen estar, aunque no siempre, aguas arriba del sitio de transcripción. Los CRE contrastan con los elementos transreguladores (TRE) . Los TRE codifican factores de transcripción. [ cita requerida ]
El genoma de un organismo contiene desde unos pocos cientos hasta miles de genes diferentes, todos ellos codificando un producto singular o más. Por numerosas razones, entre ellas el mantenimiento organizativo, la conservación de la energía y la generación de varianza fenotípica , es importante que los genes solo se expresen cuando son necesarios. La forma más eficiente de que un organismo regule la expresión génica es a nivel transcripcional. Los CRE funcionan para controlar la transcripción actuando cerca o dentro de un gen. Los tipos de CRE mejor caracterizados son los potenciadores y los promotores . Ambos elementos de secuencia son regiones estructurales del ADN que sirven como reguladores transcripcionales . [ cita requerida ]
Los módulos cis -reguladores son uno de los varios tipos de elementos reguladores funcionales . Los elementos reguladores son sitios de unión para factores de transcripción, que están involucrados en la regulación genética. [1] Los módulos cis -reguladores realizan una gran cantidad de procesamiento de información del desarrollo. [1] Los módulos cis -reguladores son grupos no aleatorios en su sitio objetivo específico que contienen sitios de unión de factores de transcripción. [1]
La definición original presentaba a los módulos cis-reguladores como potenciadores del ADN que actúa en cis, lo que aumentaba la tasa de transcripción a partir de un promotor vinculado . [4] Sin embargo, esta definición ha cambiado para definir los módulos cis -reguladores como una secuencia de ADN con sitios de unión de factores de transcripción que se agrupan en estructuras modulares, que incluyen, entre otras, regiones de control de locus, promotores, potenciadores, silenciadores, elementos de control de límites y otros moduladores. [4]
Los módulos cis -reguladores se pueden dividir en tres clases: potenciadores , que regulan positivamente la expresión genética; [1] aisladores , que funcionan indirectamente al interactuar con otros módulos cis -reguladores cercanos; y [1] silenciadores que desactivan la expresión de genes. [1]
El diseño de los módulos cis -reguladores es tal que los factores de transcripción y las modificaciones epigenéticas sirven como entradas, y la salida del módulo es la orden dada a la maquinaria de transcripción, que a su vez determina la tasa de transcripción génica o si se activa o desactiva . [1] Hay dos tipos de entradas de factores de transcripción: las que determinan cuándo se expresará el gen objetivo y las que sirven como impulsores funcionales , que entran en juego solo durante situaciones específicas durante el desarrollo. [1] Estas entradas pueden provenir de diferentes puntos temporales, pueden representar diferentes ligandos de señal o pueden provenir de diferentes dominios o linajes de células. Sin embargo, todavía queda mucho por saber. [ cita requerida ]
Además, la regulación de la estructura de la cromatina y la organización nuclear también desempeñan un papel en la determinación y el control de la función de los módulos reguladores cis. [4] Por lo tanto, las funciones de regulación génica (GRF) proporcionan una característica única de un módulo regulador cis (CRM), relacionando las concentraciones de factores de transcripción (entrada) con las actividades del promotor (salida). El desafío es predecir las GRF. Este desafío aún permanece sin resolver. En general, las funciones de regulación génica no utilizan la lógica booleana , [2] aunque en algunos casos la aproximación de la lógica booleana sigue siendo muy útil. [ cita requerida ]
Dentro del supuesto de la lógica booleana, los principios que guían el funcionamiento de estos módulos incluyen el diseño del módulo que determina la función reguladora. En relación con el desarrollo, estos módulos pueden generar salidas tanto positivas como negativas. La salida de cada módulo es un producto de las diversas operaciones que se realizan en él. Las operaciones comunes incluyen la compuerta OR : este diseño indica que se dará una salida cuando se dé cualquiera de las entradas [3], y la compuerta AND : en este diseño son necesarios dos factores reguladores diferentes para asegurarse de que se produzca una salida positiva. [1] "Interruptores de palanca": este diseño se produce cuando el ligando de señal está ausente mientras que el factor de transcripción está presente; este factor de transcripción termina actuando como un represor dominante. Sin embargo, una vez que el ligando de señal está presente, el papel del factor de transcripción como represor se elimina y puede ocurrir la transcripción. [1]
También pueden ocurrir otras operaciones lógicas booleanas, como los represores transcripcionales específicos de secuencia, que cuando se unen al módulo regulador cis dan como resultado un resultado de cero. Además de la influencia de las diferentes operaciones lógicas, el resultado de un módulo regulador cis también se verá influenciado por eventos anteriores. [1] 4) Los módulos reguladores cis deben interactuar con otros elementos reguladores. En la mayoría de los casos, incluso con la presencia de superposición funcional entre los módulos reguladores cis de un gen, las entradas y salidas de los módulos tienden a no ser las mismas. [1]
Si bien el supuesto de la lógica booleana es importante para la biología de sistemas , estudios detallados muestran que, en general, la lógica de la regulación génica no es booleana. [2] Esto significa, por ejemplo, que en el caso de un módulo cis -regulador regulado por dos factores de transcripción, las funciones de regulación génica determinadas experimentalmente no pueden describirse mediante las 16 posibles funciones booleanas de dos variables. Se han propuesto extensiones no booleanas de la lógica de regulación génica para corregir este problema. [2]
Los módulos cis -reguladores se pueden caracterizar por el procesamiento de la información que codifican y la organización de sus sitios de unión de factores de transcripción. Además, los módulos cis -reguladores también se caracterizan por la forma en que afectan la probabilidad, proporción y tasa de transcripción. [4] Los módulos cis -reguladores altamente cooperativos y coordinados se clasifican como enhanceosomas . [4] La arquitectura y la disposición de los sitios de unión de los factores de transcripción son fundamentales porque la interrupción de la disposición podría cancelar la función. [4] Los módulos cis -reguladores funcionales y flexibles se denominan billboards. Su salida transcripcional es el efecto sumatorio de los factores de transcripción unidos. [4] Los potenciadores afectan la probabilidad de que se active un gen, pero tienen poco o ningún efecto en la tasa. [4] El modelo de respuesta binaria actúa como un interruptor de encendido/apagado para la transcripción. Este modelo aumentará o disminuirá la cantidad de células que transcriben un gen, pero no afecta la tasa de transcripción. [4] El modelo de respuesta reostática describe los módulos cis-reguladores como reguladores de la tasa de iniciación de la transcripción de su gen asociado. [4]
Los promotores son CRE que consisten en secuencias relativamente cortas de ADN que incluyen el sitio donde se inicia la transcripción y la región aproximadamente 35 pb aguas arriba o aguas abajo del sitio de iniciación (pb). [5] En eucariotas , los promotores suelen tener los siguientes cuatro componentes: la caja TATA , un sitio de reconocimiento TFIIB , un iniciador y el elemento promotor central aguas abajo . [5] Se ha descubierto que un solo gen puede contener múltiples sitios promotores. [6] Para iniciar la transcripción del gen aguas abajo, una serie de proteínas de unión al ADN llamadas factores de transcripción (TF) deben unirse secuencialmente a esta región. [5] Solo una vez que esta región se ha unido con el conjunto apropiado de TF, y en el orden adecuado, la ARN polimerasa puede unirse y comenzar a transcribir el gen.
Los potenciadores son CRE que influyen (mejoran) la transcripción de genes en la misma molécula de ADN y se pueden encontrar aguas arriba, aguas abajo, dentro de los intrones o incluso relativamente lejos del gen que regulan. Múltiples potenciadores pueden actuar de manera coordinada para regular la transcripción de un gen. [7] Varios proyectos de secuenciación de todo el genoma han revelado que los potenciadores a menudo se transcriben a ARN largo no codificante (lncRNA) o ARN potenciador (eRNA), cuyos cambios en los niveles frecuentemente se correlacionan con los del ARNm del gen diana. [8]
Los silenciadores son CRE que pueden unirse a factores de regulación de la transcripción (proteínas) llamados represores , impidiendo así la transcripción de un gen. El término "silenciador" también puede referirse a una región en la región 3' no traducida del ARN mensajero, que se une a proteínas que suprimen la traducción de esa molécula de ARNm, pero este uso es distinto de su uso para describir un CRE. [ cita requerida ]
Los operadores son CRE en procariotas y algunos eucariotas que existen dentro de los operones , donde pueden unirse a proteínas llamadas represores para afectar la transcripción. [ cita requerida ]
Los CRE tienen un papel evolutivo importante. Las regiones codificantes de los genes suelen estar bien conservadas entre los organismos; sin embargo, diferentes organismos muestran una marcada diversidad fenotípica. Se ha descubierto que los polimorfismos que se producen dentro de secuencias no codificantes tienen un profundo efecto en el fenotipo al alterar la expresión génica . [7] Las mutaciones que surgen dentro de un CRE pueden generar variación de expresión al cambiar la forma en que se unen los TF. Una unión más estrecha o más laxa de las proteínas reguladoras conducirá a una transcripción regulada al alza o a la baja.
La función de una red reguladora de genes depende de la arquitectura de los nodos , cuya función depende de los múltiples módulos cis -reguladores. [1] El diseño de los módulos cis -reguladores puede proporcionar suficiente información para generar patrones espaciales y temporales de expresión génica. [1] Durante el desarrollo, cada dominio, donde cada dominio representa una región espacial diferente del embrión, de expresión génica estará bajo el control de diferentes módulos cis -reguladores. [1] El diseño de módulos reguladores ayuda a producir bucles de retroalimentación , avance y regulación cruzada. [9]
Los módulos cis -reguladores pueden regular sus genes diana a grandes distancias. Se han propuesto varios modelos para describir la forma en que estos módulos pueden comunicarse con su promotor del gen diana. [4] Estos incluyen el modelo de escaneo de ADN, el modelo de bucle de secuencia de ADN y el modelo de seguimiento facilitado. En el modelo de escaneo de ADN, el complejo de factor de transcripción y cofactor se forma en el módulo cis -regulador y luego continúa moviéndose a lo largo de la secuencia de ADN hasta que encuentra el promotor del gen diana. [4] En el modelo de bucle, el factor de transcripción se une al módulo cis -regulador, que luego causa el bucle de la secuencia de ADN y permite la interacción con el promotor del gen diana. El complejo de factor de transcripción- módulo cis -regulador causa el bucle de la secuencia de ADN lentamente hacia el promotor diana y forma una configuración de bucle estable. [4] El modelo de seguimiento facilitado combina partes de los dos modelos anteriores.
Además de determinar experimentalmente los CRM, existen varios algoritmos bioinformáticos para predecirlos. La mayoría de los algoritmos intentan buscar combinaciones significativas de sitios de unión de factores de transcripción ( sitios de unión del ADN ) en secuencias promotoras de genes coexpresados. [10] Los métodos más avanzados combinan la búsqueda de motivos significativos con la correlación en conjuntos de datos de expresión génica entre factores de transcripción y genes diana. [11] Ambos métodos se han implementado, por ejemplo, en ModuleMaster. Otros programas creados para la identificación y predicción de módulos cis -reguladores incluyen:
INSECT 2.0 [12] es un servidor web que permite buscar módulos reguladores cis en todo el genoma. El programa se basa en la definición de restricciones estrictas entre los sitios de unión de factores de transcripción (TFBS) que componen el módulo para disminuir la tasa de falsos positivos. INSECT está diseñado para ser fácil de usar, ya que permite la recuperación automática de secuencias y varias visualizaciones y enlaces a herramientas de terceros para ayudar a los usuarios a encontrar aquellas instancias que tienen más probabilidades de ser verdaderos sitios reguladores. El algoritmo INSECT 2.0 se publicó anteriormente y el algoritmo y la teoría detrás de él se explican en [13].
Stubb utiliza modelos ocultos de Markov para identificar grupos estadísticamente significativos de combinaciones de factores de transcripción. También utiliza un segundo genoma relacionado para mejorar la precisión de predicción del modelo. [14]
Las redes bayesianas utilizan un algoritmo que combina predicciones de sitios y datos de expresión específicos de tejidos para factores de transcripción y genes objetivo de interés. Este modelo también utiliza árboles de regresión para representar la relación entre el módulo regulador cis identificado y el posible conjunto de factores de transcripción de unión. [15]
CRÈME examina grupos de sitios objetivo para factores de transcripción de interés. Este programa utiliza una base de datos de sitios de unión de factores de transcripción confirmados que fueron anotados en todo el genoma humano . Se aplica un algoritmo de búsqueda al conjunto de datos para identificar posibles combinaciones de factores de transcripción, que tienen sitios de unión que están cerca del promotor del conjunto de genes de interés. Luego se analizan estadísticamente los posibles módulos reguladores cis y las combinaciones significativas se representan gráficamente [16]
Los módulos cis -reguladores activos en una secuencia genómica han sido difíciles de identificar. Los problemas en la identificación surgen porque a menudo los científicos se encuentran con un pequeño conjunto de factores de transcripción conocidos, por lo que se hace más difícil identificar grupos estadísticamente significativos de sitios de unión de factores de transcripción. [14] Además, los altos costos limitan el uso de grandes matrices de mosaicos de todo el genoma . [15]
Un ejemplo de una secuencia reguladora que actúa en cis es el operador en el operón lac . Esta secuencia de ADN está unida por el represor lac , que, a su vez, impide la transcripción de los genes adyacentes en la misma molécula de ADN. Por lo tanto, se considera que el operador lac "actúa en cis" en la regulación de los genes cercanos. El operador en sí no codifica ninguna proteína o ARN .
Por el contrario, los elementos transreguladores son factores difusibles, normalmente proteínas, que pueden modificar la expresión de genes distantes del gen que se transcribió originalmente para crearlos. Por ejemplo, un factor de transcripción que regula un gen del cromosoma 6 podría haber sido transcrito a su vez a partir de un gen del cromosoma 11. El término transregulador se construye a partir de la raíz latina trans , que significa "frente a".
Existen elementos reguladores cis y trans. Los elementos reguladores cis suelen ser sitios de unión para uno o más factores que actúan en trans .
En resumen, los elementos cis-reguladores están presentes en la misma molécula de ADN que el gen que regulan, mientras que los elementos trans-reguladores pueden regular genes distantes del gen del que fueron transcritos.