En biología molecular , una caja CCAAT (a veces también abreviada como caja CAAT o caja CAT ) es un patrón distintivo de nucleótidos con secuencia de consenso GGCCAATCT que se encuentra aguas arriba de 60 a 100 bases del sitio de transcripción inicial. La caja CAAT señala el sitio de unión para el factor de transcripción de ARN y generalmente está acompañada por una secuencia de consenso conservada . Es una secuencia de ADN invariante a aproximadamente menos 70 pares de bases del origen de la transcripción en muchos promotores eucariotas . Los genes que tienen este elemento parecen requerirlo para que el gen se transcriba en cantidades suficientes. Con frecuencia está ausente de los genes que codifican proteínas utilizadas en prácticamente todas las células. Esta caja, junto con la caja GC, es conocida por unirse a factores de transcripción generales. Ambas secuencias de consenso pertenecen al promotor regulador . La expresión génica completa ocurre cuando las proteínas activadoras de la transcripción se unen a cada módulo dentro del promotor regulador. La unión específica de proteínas es necesaria para la activación de la caja CCAAT. Estas proteínas se conocen como proteínas de unión a la caja CCAAT/factores de unión a la caja CCAAT.
Una caja CCAAT es una característica que se encuentra frecuentemente antes de las regiones codificantes eucariotas, pero no se encuentra en procariotas. [2]
En la dirección de la transcripción de la cadena molde, la secuencia de consenso , o el orden calculado de los residuos más frecuentes, para la caja CAAT fue 3'-TG ATTGG (T/C)(T/C)(A/G)-5'. El uso de paréntesis denota que cualquiera de las bases está presente, pero no se especifica en cuanto a sus frecuencias relativas. Por ejemplo, "(T/C)" significaría que se seleccionan preferentemente la timina o la citosina. [3] Dentro de los metazoos (reino animal), el complejo factor de unión central (CBF)-ADN conserva un alto grado de conservación dentro del motivo de unión CCAAT, así como las secuencias que flanquean este motivo pentamérico. El motivo CCAAT en plantas (se utilizó espinaca en un experimento) difiere ligeramente de los metazoos en que es en realidad un motivo de unión CAAT; el promotor carece de uno de los dos residuos C del motivo pentamérico, y la adición artificial del segundo C no tiene efectos significativos en la actividad de unión. Algunas secuencias carecen por completo de la caja CAAT. En segundo lugar, los nucleótidos circundantes en las plantas no coinciden con la secuencia de consenso determinada anteriormente por Bi et al. [4]
La caja CAAT es lo que se conoce como un promotor central, también conocido como promotor basal o simplemente el promotor , es una región de ADN que inicia la transcripción de un gen particular. Esta región, en particular para la caja CAAT, se encuentra aproximadamente entre 60 y 100 bases aguas arriba (hacia el extremo 5'), pero no menos de 27 pares de bases de distancia, del sitio de transcripción inicial o un gen eucariota en el que un complejo de factores de transcripción generales se une con la ARN polimerasa II antes del inicio de la transcripción. [5] [6] Es esencial para la transcripción que estos factores de unión centrales (también denominados factor nuclear Y o NF-Y) puedan unirse al motivo CCAAT. Experimentos en muchos laboratorios han demostrado que las mutaciones en el motivo CCAAT que causan una pérdida de la unión de CBF también disminuyen la actividad transcripcional en estos promotores, lo que sugiere que los complejos CBF-CCAAT son esenciales para una actividad transcripcional óptima. [3]
En un experimento realizado con factores de unión al núcleo (CBF) y complejos de ADN, los investigadores pudieron determinar las secuencias preferenciales del promotor en una región sobre e inmediatamente adyacente a la caja CAAT, y dos regiones a cada lado de la caja CAAT. Mediante el uso de un proceso de selección de unión aleatoria mediado por PCR , los investigadores pudieron demostrar que la secuencia "3' - (T/C)G ATTGG (T/C)(T/C)(A/G) - 5'" que flanquea inmediatamente la región ATTGG (CCAAT en la cadena complementaria) se seleccionó preferentemente en la cadena codificante (opuesta a la cadena molde). [3] [7] [8] Esto se demostró utilizando una secuencia de oligonucleótidos (R1) que contenía 27 nucleótidos aleatorios, flanqueados por una secuencia definida de 20 nucleótidos en cada lado. Si bien no se seleccionó ningún nucleótido en cada clon a cada lado del motivo ATTGG (CCAAT en la cadena complementaria), hubo varios nucleótidos en posiciones seleccionadas con alta frecuencia. Lo más notable de la secuencia anterior fue el residuo G hacia el extremo 5' del ATTGG. Los otros residuos también enumerados fueron notables, pero hay una división entre dos residuos. Este mismo experimento también produjo la misma secuencia que se muestra arriba cuando se utilizó un oligonucleótido diferente (R2) que contenía un núcleo ATTGG y estaba flanqueado por 12 nucleótidos aleatorios 5' y 10 nucleótidos aleatorios 3'. Ambas secuencias son muy similares y se confirmaron en múltiples experimentos. Para las secuencias que flanqueaban el motivo ATTGG con dos residuos de adenina (AA) en su extremo 5' y G(A/G) en su extremo 3', parece haber inhibido la formación del complejo CBF-ADN y, posteriormente, se produjo solo en el 1% de las secuencias promotoras. [3] En otro experimento realizado con el promotor tardío mayor (MLP) de adenovirus de una variedad de especies hospedadoras, se demostró que la mutación de la secuencia CAAT y CCAAT, que se cree que desempeña un papel fundamental en el (MLP) de los adenovirus humanos del subgrupo C, en especies con una secuencia CAAT deficiente. La iniciación de la transcripción en especies MLP mutantes se redujo significativamente en comparación con la del tipo salvaje o las especies en las que había un mutante CAAT. La incapacidad de restaurar los adenovirus normalmente funcionales, exhibida por una caja CAAT, es consistente con la idea de que la caja CAAT desempeña un papel vital en el MLP de los adenovirus y es preferida sobre otros elementos transcripcionales. [9]
Estos factores de unión centrales, o factores nucleares (NF-Y), están compuestos por tres subunidades: NF-YA, NF-YB y NF-YC. Mientras que en los animales cada subunidad de NF-Y está codificada por un solo gen, en las plantas se ha producido una diversificación tanto en la estructura como en la función. Las familias de NF-Y constan de entre ocho y 39 miembros por subunidad. Una de las principales razones de esta diversificación se debe a las duplicaciones de genes y las duplicaciones en tándem, que han contribuido a que las familias de NF-Y sean más grandes en comparación con los factores nucleares animales codificados individualmente. [10] Cada subunidad contiene una parte conservada evolutivamente: el extremo C-terminal de NF-YA, la parte central de NF-YB y el extremo N-terminal de NF-YC, de las cuales más del 70 % en todas las especies sigue estando conservada. Sin embargo, las regiones vecinas no suelen estar conservadas. [6]
La familia NF-YA codifica factores de transcripción de longitud variable (entre 207 y 347 aminoácidos para M. truncatula ). Las proteínas NF-YA se caracterizan generalmente por dos dominios que están fuertemente conservados en todos los eucariotas superiores investigados hasta la fecha. El primer dominio (A1) contiene 20 aminoácidos que forman una hélice alfa que parece significativa en sus interacciones con NF-YB y NF-YC. El segundo dominio (A2) es adyacente al dominio A1 por una secuencia de enlace conservada que es una secuencia de 21 aminoácidos vitales en la unión específica del ADN a la caja CCAAT. Los dominios A1 y A2 se conservan hacia el extremo C de los mamíferos, pero ocupan una región más central en las subunidades NF-YA de las plantas. En las plantas, la subunidad NF-YA ha evolucionado para regular el desarrollo de un órgano radicular facultativo solo presente en plantas leguminosas y que se ha demostrado que se expresa en el tejido radicular. Se ha demostrado que tiene propiedades similares a las de resistencia a la sequía, y se regula positivamente durante el estrés por sequía en las raíces y hojas de Arabidopsis . Los mutantes NF-YA han mostrado una pérdida de función y una hipersensibilidad a condiciones similares a la sequía y, por el contrario, la sobreexpresión de NF-YA ha resultado en resistencia a la sequía . [10]
La familia NF-YB es, al igual que la subunidad NF-YA, variable en longitud, sin embargo, en promedio, mucho más pequeña que la subunidad NF-YA (90–240 aminoácidos en "M. truncatula"). Se han caracterizado con una estructura y composición de aminoácidos similar al motivo de pliegue de histona (HFM). Este está compuesto de tres hélices alfa separadas por dos dominios de bucle de cadena beta. Al igual que NF-YA, se ha demostrado que NF-YB también mejora la resistencia a la sequía cuando se sobreexpresa y también la promoción de la floración en Arabidopsis . [10]
Las proteínas NF-YC tienen un tamaño intermedio entre las proteínas NF-YA y NF-YB (117–292 aminoácidos en M. truncatula ) y también contienen el HFM que predomina en las proteínas NF-YB. También se ha demostrado que está involucrado en el tiempo de floración en ciertas plantas (la sobreexpresión conduce a una floración más temprana) donde su influencia está potencialmente regulada por la unión de la proteína CONSTANS (CO) a la subunidad NF-YC. [10]
Debido al cambio evolutivo en los genes codificadores de NF-Y en las plantas, posteriormente tienen una gran variedad de complejos triméricos potenciales. Por ejemplo, en Arabidopsis , se han identificado 36 subunidades del factor de transcripción NF-Y (incluidas 10 subunidades NF-YA, 13 NF-YB y 13 NF-YC) y que teóricamente podrían formar 1690 complejos únicos (que contienen una de cada tipo de subunidad). Este número, por supuesto, es mayor que lo que realmente sucede, ya que algunas subunidades tienen patrones de unión específicos. Los análisis funcionales de los genes codificadores de NF-Y en plantas han demostrado que, como resultado de su diversificación evolutiva en relación con sus contrapartes animales, han adquirido diversas funciones específicas, como el desarrollo del embrión, el control del tiempo de floración, el estrés del RE, el estrés por sequía y el desarrollo de nódulos y raíces. Esto puede ser solo una pequeña parte de sus capacidades, ya que el número de combinaciones teóricas de complejos NF-Y es tan grande y solo una pequeña parte puede crearse realmente (menos del 10% de todas las interacciones posibles se confirmaron en ambas direcciones en levadura). [10]
Otro aspecto del motivo de unión CCAAT son las proteínas de unión CCAAT/enhancer (C/EBPs). Son un grupo de factores de transcripción de 6 miembros (α-ζ), que están altamente conservados y se unen al motivo CCAAT. Si bien la investigación sobre estas proteínas de unión es relativamente reciente, se ha demostrado que su función tiene papeles vitales en la proliferación y diferenciación celular, el metabolismo , la inflamación y la inmunidad en varias células, pero específicamente en los hepatocitos , adipocitos y células hematopoyéticas . [11] Por ejemplo, en los adipocitos, esto se ha demostrado en una variedad de experimentos con ratones: la expresión ectópica de estas C/EBP (C/EBPα y C/EBPβ) fueron capaces de iniciar los programas de diferenciación de la célula, incluso en ausencia de hormonas adipogénicas , o la diferenciación de preadipocitos a adipocitos (o células grasas). Además, una sobreabundancia de estas C/EBP (específicamente, C/EBPδ) causa una respuesta acelerada. Y además, en células que carecen de C/EBP o en ratones deficientes en C/EBP, ambas son incapaces de experimentar adipogénesis. Esto da como resultado que los ratones mueran por hipoglucemia o la acumulación reducida de lípidos en el tejido adiposo. [12] Las C/EBP siguen un dominio general de cremallera de leucina básica (bZIP) en el extremo C y pueden formar dímeros con otras C/EBP u otros factores de transcripción. Esta dimerización permite que las C/EBP se unan específicamente al ADN a través de una secuencia palindrómica en el surco mayor del ADN. Se regulan a través de varios medios, incluidas hormonas , mitógenos , citocinas , nutrientes y otros diversos factores. [11]