La estructura genética es la organización de elementos de secuencia especializados dentro de un gen . Los genes contienen la mayor parte de la información necesaria para que las células vivas sobrevivan y se reproduzcan. [1] [2] En la mayoría de los organismos, los genes están hechos de ADN, donde la secuencia de ADN particular determina la función del gen. Un gen se transcribe (copia) del ADN en ARN , que puede ser no codificante ( ARNnc ) con una función directa, o un mensajero intermedio ( ARNm ) que luego se traduce en proteína . Cada uno de estos pasos está controlado por elementos de secuencia específicos, o regiones, dentro del gen. Por lo tanto, cada gen requiere múltiples elementos de secuencia para ser funcional. [2] Esto incluye la secuencia que realmente codifica la proteína funcional o ARNnc, así como múltiples regiones de secuencia reguladora . Estas regiones pueden ser tan cortas como unos pocos pares de bases , hasta muchos miles de pares de bases de longitud.
Gran parte de la estructura genética es muy similar entre eucariotas y procariotas . Estos elementos comunes son en gran medida el resultado de la ascendencia compartida de la vida celular en los organismos hace más de 2 mil millones de años. [3] Las diferencias clave en la estructura genética entre eucariotas y procariotas reflejan su maquinaria divergente de transcripción y traducción. [4] [5] Comprender la estructura genética es la base para comprender la anotación , la expresión y la función de los genes . [6]
Las estructuras de los genes tanto eucariotas como procariotas involucran varios elementos de secuencia anidados. Cada elemento tiene una función específica en el proceso de múltiples pasos de la expresión génica . Las secuencias y longitudes de estos elementos varían, pero las mismas funciones generales están presentes en la mayoría de los genes. [2] Aunque el ADN es una molécula de doble cadena, típicamente solo una de las cadenas codifica información que la ARN polimerasa lee para producir ARNm codificador de proteínas o ARN no codificante. Esta cadena "sentido" o "codificante" corre en la dirección 5' a 3' donde los números se refieren a los átomos de carbono del azúcar ribosa de la cadena principal . Por lo tanto, el marco de lectura abierto (ORF) de un gen generalmente se representa como una flecha que indica la dirección en la que se lee la cadena sentido. [7]
Las secuencias reguladoras se encuentran en los extremos de los genes. Estas regiones de secuencia pueden estar próximas a la región transcrita (el promotor ) o separadas por muchas kilobases ( potenciadores y silenciadores ). [8] El promotor se encuentra en el extremo 5' del gen y está compuesto por una secuencia promotora central y una secuencia promotora proximal. El promotor central marca el sitio de inicio de la transcripción uniéndose a la ARN polimerasa y otras proteínas necesarias para copiar el ADN en ARN. La región promotora proximal une factores de transcripción que modifican la afinidad del promotor central por la ARN polimerasa. [9] [10] Los genes pueden estar regulados por múltiples secuencias potenciadoras y silenciadoras que modifican aún más la actividad de los promotores uniéndose a proteínas activadoras o represoras . [11] [12] Los potenciadores y silenciadores pueden estar ubicados distantes del gen, a muchos miles de pares de bases de distancia. Por lo tanto, la unión de diferentes factores de transcripción regula la tasa de inicio de la transcripción en diferentes momentos y en diferentes células. [13]
Los elementos reguladores pueden superponerse entre sí, y una sección de ADN puede interactuar con muchos activadores y represores que compiten entre sí, así como con la ARN polimerasa. Por ejemplo, algunas proteínas represoras pueden unirse al promotor central para evitar la unión de la polimerasa. [14] En el caso de genes con múltiples secuencias reguladoras, la tasa de transcripción es el producto de todos los elementos combinados. [15] La unión de activadores y represores a múltiples secuencias reguladoras tiene un efecto cooperativo en la iniciación de la transcripción. [16]
Aunque todos los organismos utilizan tanto activadores como represores transcripcionales, se dice que los genes eucariotas están "desactivados por defecto", mientras que los genes procariotas están "activados por defecto". [5] El promotor central de los genes eucariotas normalmente requiere una activación adicional por parte de elementos promotores para que se produzca la expresión. El promotor central de los genes procariotas, por el contrario, es suficiente para una expresión fuerte y está regulado por represores. [5]
Una vez que el ARNm ha sido procesado para prepararlo para su traducción a proteína, se produce una capa adicional de regulación para los genes que codifican proteínas. Solo la región entre los codones de inicio y de terminación codifica el producto proteico final. Las regiones no traducidas (UTR) flanqueantes contienen secuencias reguladoras adicionales. [18] La UTR 3' contiene una secuencia terminadora , que marca el punto final de la transcripción y libera la ARN polimerasa. [19] La UTR 5' se une al ribosoma , que traduce la región codificante de proteínas en una cadena de aminoácidos que se pliegan para formar el producto proteico final. En el caso de los genes para ARN no codificantes, el ARN no se traduce sino que se pliega para ser directamente funcional. [20] [21]
La estructura de los genes eucariotas incluye características que no se encuentran en los procariotas. La mayoría de ellas se relacionan con la modificación postranscripcional de los pre-ARNm para producir ARNm maduro listo para traducirse en proteína. Los genes eucariotas suelen tener más elementos reguladores para controlar la expresión génica en comparación con los procariotas. [5] Esto es particularmente cierto en los eucariotas multicelulares , los humanos por ejemplo, donde la expresión génica varía ampliamente entre diferentes tejidos . [11]
Una característica clave de la estructura de los genes eucariotas es que sus transcripciones se subdividen típicamente en regiones de exones e intrones . Las regiones de exones se conservan en la molécula final de ARNm maduro , mientras que las regiones de intrones se eliminan (extirpan) durante el procesamiento postranscripcional. [22] De hecho, las regiones de intrones de un gen pueden ser considerablemente más largas que las regiones de exones. Una vez empalmados, los exones forman una única región codificante de proteínas continua, y los límites de empalme no son detectables. El procesamiento postranscripcional eucariota también agrega una tapa 5' al inicio del ARNm y una cola de poliadenosina al final del ARNm. Estas adiciones estabilizan el ARNm y dirigen su transporte desde el núcleo hasta el citoplasma , aunque ninguna de estas características está codificada directamente en la estructura de un gen. [18]
La organización general de los genes procariotas es marcadamente diferente de la de los eucariotas. La diferencia más obvia es que los ORFs procariotas a menudo se agrupan en un operón policistrónico bajo el control de un conjunto compartido de secuencias reguladoras. Estos ORFs se transcriben todos en el mismo ARNm y, por lo tanto, están co-regulados y a menudo cumplen funciones relacionadas. [23] [24] Cada ORF normalmente tiene su propio sitio de unión al ribosoma (RBS) de modo que los ribosomas traducen simultáneamente los ORFs en el mismo ARNm. Algunos operones también muestran acoplamiento traduccional, donde las tasas de traducción de múltiples ORFs dentro de un operón están vinculadas. [25] Esto puede ocurrir cuando el ribosoma permanece unido al final de un ORF y simplemente se transloca al siguiente sin la necesidad de un nuevo RBS. [26] El acoplamiento traduccional también se observa cuando la traducción de un ORF afecta la accesibilidad del siguiente RBS a través de cambios en la estructura secundaria del ARN. [27] Tener múltiples ORFs en un solo ARNm solo es posible en procariotas porque su transcripción y traducción ocurren al mismo tiempo y en la misma ubicación subcelular. [23] [28]
La secuencia operadora junto al promotor es el principal elemento regulador en procariotas. Las proteínas represoras unidas a la secuencia operadora obstruyen físicamente la enzima ARN polimerasa, impidiendo la transcripción. [29] [30] Los riboswitches son otra secuencia reguladora importante que se encuentra comúnmente en los UTR procariotas. Estas secuencias cambian entre estructuras secundarias alternativas en el ARN dependiendo de la concentración de metabolitos clave . Las estructuras secundarias luego bloquean o revelan regiones de secuencia importantes como los RBS. Los intrones son extremadamente raros en procariotas y por lo tanto no juegan un papel significativo en la regulación génica procariota. [31]
Este artículo fue adaptado de la siguiente fuente bajo licencia CC BY 4.0 (2017) (informes de los revisores): Thomas Shafee; Rohan Lowe (17 de enero de 2017). "Estructura de genes eucariotas y procariotas" (PDF) . WikiJournal of Medicine . 4 (1). doi : 10.15347/WJM/2017.002 . ISSN 2002-4436. Wikidata Q28867140.