En biología molecular , un codón de parada (o codón de terminación ) es un codón ( triplete de nucleótidos dentro del ARN mensajero ) que señala la terminación del proceso de traducción de la proteína actual . [1] La mayoría de los codones en el ARN mensajero corresponden a la adición de un aminoácido a una cadena polipeptídica en crecimiento , que finalmente puede convertirse en una proteína; Los codones de parada señalan la terminación de este proceso al unirse a factores de liberación , que hacen que las subunidades ribosómicas se disocian, liberando la cadena de aminoácidos.
Si bien los codones de inicio necesitan secuencias cercanas o factores de inicio para iniciar la traducción, un codón de parada por sí solo es suficiente para iniciar la terminación.
En el código genético estándar, existen tres codones de terminación diferentes:
Existen variaciones en el código genético estándar y se han encontrado codones de parada alternativos en los genomas mitocondriales de vertebrados , [2] Scenedesmus obliquus , [3] y Thraustochytrium . [4]
El código genético nuclear es flexible, como lo ilustran los códigos genéticos variantes que reasigna codones de terminación estándar a los aminoácidos. [5]
En 1986, se proporcionó evidencia convincente de que la selenocisteína (Sec) se incorporó de forma cotraduccional. Además, el codón que dirige parcialmente su incorporación en la cadena polipeptídica se identificó como UGA, también conocido como codón de terminación ópalo. [6] Se han identificado diferentes mecanismos para anular la función de terminación de este codón en procariotas y eucariotas. [7] Una diferencia particular entre estos reinos es que los elementos cis parecen restringidos a la vecindad del codón UAG en procariotas, mientras que en eucariotas esta restricción no está presente. Más bien, esos lugares parecen desfavorecidos, aunque no prohibidos. [8]
En 2003, un artículo histórico describió la identificación de todas las selenoproteínas conocidas en humanos: 25 en total. [9] Se han realizado análisis similares para otros organismos.
El codón UAG se puede traducir a pirrolisina (Pyl) de manera similar.
La distribución de codones de parada dentro del genoma de un organismo no es aleatoria y puede correlacionarse con el contenido de GC . [10] [11] Por ejemplo, el genoma de E. coli K-12 contiene 2705 TAA (63%), 1257 TGA (29%) y 326 TAG (8%) codones de parada (contenido de GC 50,8%). [12] Además, los sustratos para los codones de parada del factor de liberación 1 o del factor de liberación 2 están fuertemente correlacionados con la abundancia de codones de parada. [11] Un estudio a gran escala de bacterias con una amplia gama de contenidos de GC muestra que, si bien la frecuencia de aparición de TAA se correlaciona negativamente con el contenido de GC y la frecuencia de aparición de TGA se correlaciona positivamente con el contenido de GC, la La frecuencia de aparición del codón de parada TAG, que a menudo es el codón de parada mínimamente utilizado en un genoma, no está influenciado por el contenido de GC. [13]
El reconocimiento de codones de parada en bacterias se ha asociado con el llamado "anticodón tripéptido", [14] un motivo de aminoácido altamente conservado en RF1 (PxT) y RF2 (SPF). Aunque esto está respaldado por estudios estructurales, se demostró que la hipótesis del anticodón tripéptido es una simplificación excesiva. [15]
Históricamente, los codones de parada recibieron muchos nombres diferentes, ya que cada uno correspondía a una clase distinta de mutantes que se comportaban de manera similar. Estos mutantes se aislaron por primera vez dentro de los bacteriófagos ( T4 y lambda ), virus que infectan a la bacteria Escherichia coli . Las mutaciones en genes virales debilitaron su capacidad infecciosa, creando en ocasiones virus que eran capaces de infectar y crecer sólo dentro de ciertas variedades de E. coli .
Fueron el primer conjunto de mutaciones sin sentido descubiertas, aisladas por Richard H. Epstein y Charles Steinberg y nombradas en honor a su amigo y estudiante graduado de Caltech Harris Bernstein, cuyo apellido significa " ámbar " en alemán ( cf. Bernstein). [16] [17]
Los virus con mutaciones de color ámbar se caracterizan por su capacidad de infectar sólo determinadas cepas de bacterias, conocidas como supresores de color ámbar. Estas bacterias portan su propia mutación que permite una recuperación de la función en los virus mutantes. Por ejemplo, una mutación en el ARNt que reconoce el codón de parada ámbar permite que la traducción "lea" el codón y produzca una proteína de longitud completa, recuperando así la forma normal de la proteína y "suprimiendo" la mutación ámbar. [18] Por lo tanto, los mutantes ámbar son una clase completa de mutantes de virus que pueden crecer en bacterias que contienen mutaciones supresoras de color ámbar. También se conocen supresores similares para los codones de terminación ocre y ópalo.
Se han diseñado moléculas de ARNt que transportan aminoácidos no naturales para reconocer el codón de parada ámbar en el ARN bacteriano. Esta tecnología permite la incorporación de aminoácidos ortogonales (como p-azidofenilalanina) en ubicaciones específicas de la proteína objetivo.
Fue la segunda mutación del codón de parada descubierta. Con reminiscencias del habitual color amarillo, naranja y marrón asociado con el ámbar, este segundo codón de parada recibió el nombre de " ocre " , un pigmento mineral de color naranja, marrón rojizo. [17]
Los virus mutantes ocre tenían una propiedad similar a los mutantes ámbar en el sentido de que recuperaban la capacidad infecciosa dentro de ciertas cepas supresoras de bacterias. El conjunto de supresores ocre era distinto de los supresores ámbar, por lo que se dedujo que los mutantes ocre correspondían a un triplete de nucleótidos diferente. A través de una serie de experimentos de mutación comparando estos mutantes entre sí y con otros codones de aminoácidos conocidos, Sydney Brenner concluyó que las mutaciones ámbar y ocre correspondían a los tripletes de nucleótidos "UAG" y "UAA". [19]
Poco después se descubrió el tercer y último codón de parada del código genético estándar y corresponde al triplete de nucleótidos "UGA". [20]
Para seguir coincidiendo con el tema de los minerales coloreados, el tercer codón sin sentido pasó a ser conocido como " ópalo " , que es un tipo de sílice que muestra variedad de colores. [17] Las mutaciones sin sentido que crearon este codón de parada prematuro se denominaron más tarde mutaciones ópalo o mutaciones sombra .
Las mutaciones sin sentido son cambios en la secuencia del ADN que introducen un codón de parada prematuro, lo que provoca que cualquier proteína resultante se acorte anormalmente. Esto a menudo provoca una pérdida de función en la proteína, ya que las partes críticas de la cadena de aminoácidos ya no se ensamblan. Debido a esta terminología, a los codones de terminación también se les ha denominado codones sin sentido .
Una mutación continua , también llamada variante stop-loss , es una mutación puntual que se produce dentro de un codón de parada. Las mutaciones continuas provocan la traducción continua de una cadena de ARNm a lo que debería ser una región no traducida. La mayoría de los polipéptidos resultantes de un gen con una mutación continua pierden su función debido a su longitud extrema y al impacto en el plegamiento normal. Las mutaciones continuas se diferencian de las mutaciones sin sentido en que no crean un codón de parada sino que, en cambio, lo eliminan. Las mutaciones continuas también difieren de las mutaciones sin sentido , que son mutaciones puntuales en las que se cambia un solo nucleótido para provocar el reemplazo por un aminoácido diferente . Las mutaciones continuas se han relacionado con muchas enfermedades hereditarias, incluidos trastornos endocrinos , [21] enfermedades oculares, [22] y trastornos del desarrollo neurológico . [23] [24]
Las paradas ocultas son codones continuos que se leerían como codones de parada si tuvieran un desplazamiento de marco +1 o −1. Estos terminan prematuramente la traducción si el cambio de marco correspondiente (por ejemplo, debido a un deslizamiento del ARN ribosomal) ocurre antes de la parada oculta. Se plantea la hipótesis de que esto disminuye el desperdicio de recursos en proteínas no funcionales y la producción de citotoxinas potenciales . Investigadores de la Universidad Estatal de Luisiana proponen la hipótesis de la emboscada , para la que se seleccionan paradas ocultas. Los codones que pueden formar paradas ocultas se utilizan en los genomas con más frecuencia en comparación con codones sinónimos que de otro modo codificarían el mismo aminoácido. El ARNr inestable en un organismo se correlaciona con una mayor frecuencia de paradas ocultas. [25] Sin embargo, esta hipótesis no pudo validarse con un conjunto de datos más grande. [26]
Los codones de parada y las paradas ocultas juntas se denominan colectivamente señales de parada. Investigadores de la Universidad de Memphis descubrieron que las proporciones de las señales de parada en los tres marcos de lectura de un genoma (denominado índice de señales de parada de la traducción o TSSR) de bacterias genéticamente relacionadas, a pesar de sus grandes diferencias en el contenido de los genes, son muy parecidas. . Este valor genómico-TSSR casi idéntico de bacterias genéticamente relacionadas puede sugerir que la expansión del genoma bacteriano está limitada por el sesgo único de las señales de parada de esa especie bacteriana. [27]
La supresión del codón de parada o la lectura traslacional ocurre cuando en la traducción un codón de parada se interpreta como un codón sentido, es decir, cuando un aminoácido (estándar) está "codificado" por el codón de parada. Los ARNt mutados pueden ser la causa de la lectura completa, pero también ciertos motivos de nucleótidos cercanos al codón de parada. La lectura traslacional es muy común en virus y bacterias, y también se ha encontrado como un principio regulador de genes en humanos, levaduras, bacterias y drosophila. [28] [29] Este tipo de lectura traduccional endógena constituye una variación del código genético , porque un codón de terminación codifica un aminoácido. En el caso de la malato deshidrogenasa humana , el codón de parada se lee con una frecuencia de aproximadamente el 4%. [30] El aminoácido insertado en el codón de parada depende de la identidad del codón de parada en sí: se han encontrado Gln, Tyr y Lys para los codones UAA y UAG, mientras que se han encontrado Cys, Trp y Arg para el codón UGA. identificado por espectrometría de masas. [31] El grado de lectura en los mamíferos tiene extensiones muy variables y puede diversificar ampliamente el proteoma y afectar la progresión del cáncer. [32]
En 2010, cuando Craig Venter dio a conocer la primera célula reproductora en pleno funcionamiento controlada por ADN sintético, describió cómo su equipo utilizó frecuentes codones de parada para crear marcas de agua en el ARN y el ADN para ayudar a confirmar que los resultados eran realmente sintéticos (y no estaban contaminados ni de otro modo). usándolo para codificar los nombres de los autores y las direcciones de sitios web. [33]
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )