stringtranslate.com

Sesgo de uso de codones

Sesgo de uso de codones en Physcomitrella patens

El sesgo en el uso de codones se refiere a diferencias en la frecuencia de aparición de codones sinónimos en la codificación del ADN . Un codón es una serie de tres nucleótidos (un triplete) que codifica un residuo de aminoácido específico en una cadena polipeptídica o para la terminación de la traducción ( codones de parada ).

Hay 64 codones diferentes (61 codones que codifican aminoácidos y 3 codones de parada) pero sólo 20 aminoácidos traducidos diferentes. La sobreabundancia en el número de codones permite que muchos aminoácidos sean codificados por más de un codón. A causa de tal redundancia se dice que el código genético está degenerado. Los códigos genéticos de diferentes organismos a menudo están sesgados hacia el uso de uno de los varios codones que codifican el mismo aminoácido sobre los demás; es decir, se encontrará una frecuencia mayor de uno de lo esperado por casualidad. Cómo surgen tales sesgos es un área muy debatida de la evolución molecular . Las tablas de uso de codones que detallan el sesgo de uso de codones genómicos para organismos en GenBank y RefSeq se pueden encontrar en el proyecto HIVE-Codon Usage Tables (HIVE-CUT), [1] que contiene dos bases de datos distintas, CoCoPUT y TissueCoCoPUT. Juntas, estas dos bases de datos proporcionan estadísticas completas y actualizadas sobre el uso de codones, pares de codones y dinucleótidos para todos los organismos con información de secuencia disponible y 52 tejidos humanos, respectivamente. [2] [3]

En general, se reconoce que los sesgos de codones reflejan las contribuciones de tres factores principales: la conversión de genes sesgada por GC que favorece los codones que terminan en GC en organismos diploides, los sesgos de llegada que reflejan preferencias mutacionales (que generalmente favorecen los codones que terminan en AT) y la selección natural de codones que son favorables en materia de traducción. [4] [5] [6] Los codones óptimos en microorganismos de rápido crecimiento, como Escherichia coli o Saccharomyces cerevisiae (levadura de panadería), reflejan la composición de su respectivo conjunto de ARN de transferencia genómica (ARNt). [7] Se cree que los codones óptimos ayudan a lograr velocidades de traducción más rápidas y una alta precisión. Como resultado de estos factores, se espera que la selección traslacional sea más fuerte en genes altamente expresados , como es el caso de los organismos mencionados anteriormente. [8] [9] En otros organismos que no muestran altas tasas de crecimiento o que presentan genomas pequeños, la optimización del uso de codones normalmente está ausente y las preferencias de codones están determinadas por los sesgos mutacionales característicos observados en ese genoma en particular. Ejemplos de ello son el Homo sapiens (humano) y el Helicobacter pylori . [10] [11] Los organismos que muestran un nivel intermedio de optimización del uso de codones incluyen Drosophila melanogaster (mosca de la fruta), Caenorhabditis elegans ( gusano nematodo ), Strongylocentrotus purpuratus ( erizo de mar ) y Arabidopsis thaliana ( thale berro ). [12] Se sabe que varias familias virales ( herpesvirus , lentivirus , papilomavirus , poliomavirus , adenovirus y parvovirus ) codifican proteínas estructurales que muestran un uso de codones muy sesgado en comparación con la célula huésped . Se ha sugerido que estos sesgos de codones desempeñan un papel en la regulación temporal de sus proteínas tardías. [13]

La naturaleza de la optimización del uso de codones y del ARNt ha sido objeto de intensos debates. No está claro si el uso de codones impulsa la evolución del ARNt o viceversa. Se ha desarrollado al menos un modelo matemático en el que tanto el uso de codones como la expresión de ARNt coevolucionan en forma de retroalimentación ( es decir , los codones que ya están presentes en altas frecuencias aumentan la expresión de sus ARNt correspondientes, y los ARNt normalmente expresados ​​en niveles altos aumentan la frecuencia). de sus codones correspondientes). Sin embargo, este modelo no parece tener aún confirmación experimental. Otro problema es que la evolución de los genes de ARNt ha sido un área de investigación muy inactiva. [ cita necesaria ]

Factores contribuyentes

Se han propuesto diferentes factores relacionados con el sesgo en el uso de codones, incluido el nivel de expresión genética (que refleja la selección para optimizar el proceso de traducción mediante la abundancia de ARNt), el contenido de guanina-citosina (contenido de GC, que refleja la transferencia horizontal de genes o el sesgo mutacional), la guanina-citosina sesgo (sesgo de GC, que refleja un sesgo mutacional específico de la cadena), conservación de aminoácidos , hidropatía de proteínas , selección transcripcional, estabilidad del ARN, temperatura óptima de crecimiento, adaptación hipersalina y nitrógeno en la dieta. [14] [15] [16] [17] [18] [19]

Teorías evolutivas

Sesgo mutacional versus selección

Aunque el mecanismo de selección del sesgo de codones sigue siendo controvertido, las posibles explicaciones de este sesgo se dividen en dos categorías generales. Una explicación gira en torno a la teoría seleccionista , en la que el sesgo de codones contribuye a la eficiencia y/o precisión de la expresión de proteínas y, por lo tanto, sufre una selección positiva . El modelo seleccionista también explica por qué los codones más frecuentes son reconocidos por moléculas de ARNt más abundantes, así como la correlación entre los codones preferidos, los niveles de ARNt y el número de copias de genes . Aunque se ha demostrado que la tasa de incorporación de aminoácidos en codones más frecuentes ocurre a una tasa mucho mayor que la de codones raros, no se ha demostrado que la velocidad de traducción se vea afectada directamente y por lo tanto el sesgo hacia codones más frecuentes puede no ser directamente ventajoso. Sin embargo, el aumento en la velocidad de elongación de la traducción aún puede ser indirectamente ventajoso al aumentar la concentración celular de ribosomas libres y potencialmente la tasa de iniciación de los ARN mensajeros (ARNm). [20]

La segunda explicación para el uso de codones puede explicarse por el sesgo mutacional , una teoría que postula que el sesgo de codones existe debido a la no aleatoriedad en los patrones mutacionales. En otras palabras, algunos codones pueden sufrir más cambios y, por lo tanto, dar lugar a frecuencias de equilibrio más bajas, también conocidas como codones "raros". Diferentes organismos también exhiben diferentes sesgos mutacionales, y cada vez hay más evidencia de que el nivel de contenido de GC en todo el genoma es el parámetro más significativo para explicar las diferencias de sesgo de codones entre organismos. Estudios adicionales han demostrado que los sesgos de codones pueden predecirse estadísticamente en procariotas utilizando únicamente secuencias intergénicas , lo que va en contra de la idea de fuerzas selectivas en las regiones codificantes y respalda aún más el modelo de sesgo de mutación. Sin embargo, este modelo por sí solo no puede explicar completamente por qué los codones preferidos son reconocidos por ARNt más abundantes. [20]

Modelo de equilibrio mutación-selección-deriva

Para conciliar la evidencia tanto de las presiones mutacionales como de la selección, la hipótesis predominante sobre el sesgo de codones puede explicarse mediante el modelo de equilibrio mutación-selección-deriva . Esta hipótesis establece que la selección favorece los codones mayores sobre los codones menores, pero los codones menores pueden persistir debido a la presión de la mutación y la deriva genética . También sugiere que la selección es generalmente débil, pero que la intensidad de la selección aumenta hacia una mayor expresión y más restricciones funcionales de las secuencias codificantes. [20]

Consecuencias de la composición de codones.

Efecto sobre la estructura secundaria del ARN.

Debido a que la estructura secundaria del extremo 5' del ARNm influye en la eficiencia de la traducción, cambios sinónimos en esta región del ARNm pueden tener efectos profundos en la expresión génica. Por lo tanto, el uso de codones en regiones de ADN no codificantes puede desempeñar un papel importante en la estructura secundaria del ARN y en la expresión de proteínas posteriores, que pueden sufrir presiones selectivas adicionales. En particular, una estructura secundaria fuerte en el sitio de unión al ribosoma o en el codón de iniciación puede inhibir la traducción, y el plegamiento del ARNm en el extremo 5' genera una gran variación en los niveles de proteína. [21]

Efecto sobre la transcripción o expresión genética.

La expresión de genes heterólogos se utiliza en muchas aplicaciones biotecnológicas, incluida la producción de proteínas y la ingeniería metabólica . Debido a que los conjuntos de ARNt varían entre diferentes organismos, la tasa de transcripción y traducción de una secuencia codificante particular puede ser menos eficiente cuando se coloca en un contexto no nativo. Para un transgén sobreexpresado , el ARNm correspondiente constituye un gran porcentaje del ARN celular total, y la presencia de codones raros a lo largo del transcrito puede conducir a un uso ineficiente y al agotamiento de los ribosomas y, en última instancia, reducir los niveles de producción de proteínas heterólogas. Además, la composición del gen (por ejemplo, el número total de codones raros y la presencia de codones raros consecutivos) también puede afectar la precisión de la traducción. [22] [23] Sin embargo, el uso de codones optimizados para conjuntos de ARNt en un huésped particular para sobreexpresar un gen heterólogo también puede causar falta de aminoácidos y alterar el equilibrio de los conjuntos de ARNt. Este método de ajustar codones para que coincidan con la abundancia de ARNt del huésped, llamado optimización de codones , se ha utilizado tradicionalmente para la expresión de un gen heterólogo. Sin embargo, las nuevas estrategias para la optimización de la expresión heteróloga consideran el contenido global de nucleótidos, como el plegamiento local del ARNm, el sesgo de pares de codones, una rampa de codones, la armonización de codones o las correlaciones de codones. [24] [25] Con la cantidad de cambios de nucleótidos introducidos, la síntesis de genes artificiales a menudo es necesaria para la creación de un gen tan optimizado.

El sesgo de codones especializados se observa además en algunos genes endógenos , como los implicados en la falta de aminoácidos. Por ejemplo, las enzimas biosintéticas de aminoácidos utilizan preferentemente codones que están mal adaptados a la abundancia normal de ARNt, pero tienen codones que se adaptan a conjuntos de ARNt en condiciones de inanición. Por tanto, el uso de codones puede introducir un nivel adicional de regulación transcripcional para la expresión genética adecuada en condiciones celulares específicas. [25]

Efecto sobre la velocidad de alargamiento por traslación.

En términos generales, para genes altamente expresados, las tasas de elongación de la traducción son más rápidas en las transcripciones con una mayor adaptación de codones a los conjuntos de ARNt y más lentas en las transcripciones con codones raros. Esta correlación entre las tasas de traducción de codones y las concentraciones de ARNt afines proporciona una modulación adicional de las tasas de elongación de la traducción, lo que puede proporcionar varias ventajas al organismo. Específicamente, el uso de codones puede permitir la regulación global de estas tasas, y los codones raros pueden contribuir a la precisión de la traducción a expensas de la velocidad. [26]

Efecto sobre el plegamiento de proteínas.

El plegamiento de proteínas in vivo es vectorial , de modo que el extremo N de una proteína sale del ribosoma de traducción y queda expuesto al disolvente antes que sus regiones más C-terminales . Como resultado, el plegamiento cotraduccional de proteínas introduce varias limitaciones espaciales y temporales en la cadena polipeptídica naciente en su trayectoria de plegamiento. Debido a que las tasas de traducción del ARNm están acopladas al plegamiento de proteínas y la adaptación de los codones está vinculada al alargamiento de la traducción, se ha planteado la hipótesis de que la manipulación a nivel de secuencia puede ser una estrategia eficaz para regular o mejorar el plegamiento de proteínas. Varios estudios han demostrado que en determinadas proteínas se produce una pausa en la traducción como resultado de la estructura local del ARNm, lo que puede ser necesario para un plegamiento adecuado. Además, se ha demostrado que mutaciones sinónimas tienen consecuencias importantes en el proceso de plegamiento de la proteína naciente e incluso pueden cambiar la especificidad del sustrato de las enzimas. Estos estudios sugieren que el uso de codones influye en la velocidad a la que los polipéptidos emergen vectorialmente del ribosoma, lo que puede afectar aún más las vías de plegamiento de proteínas en todo el espacio estructural disponible. [26]

Métodos de análisis

En el campo de la bioinformática y la biología computacional , se han propuesto y utilizado muchos métodos estadísticos para analizar el sesgo en el uso de codones. [27] Métodos como la 'frecuencia de codones óptimos' (Fop), [28] la adaptación relativa de codones (RCA) [29] o el índice de adaptación de codones (CAI) [30] se utilizan para predecir los niveles de expresión génica, mientras que Para medir la uniformidad en el uso de codones se utilizan métodos como el ' número efectivo de codones ' (Nc) y la entropía de Shannon de la teoría de la información . [31] Los métodos estadísticos multivariados, como el análisis de correspondencia y el análisis de componentes principales , se utilizan ampliamente para analizar variaciones en el uso de codones entre genes. [32] Existen muchos programas informáticos para implementar los análisis estadísticos enumerados anteriormente, incluidos CodonW, GCUA, INCA, etc. La optimización de codones tiene aplicaciones en el diseño de genes sintéticos y vacunas de ADN . Hay varios paquetes de software disponibles en línea para este propósito (consulte enlaces externos). [ cita necesaria ]

Referencias

  1. ^ A ellos, John; Alexaki, Aikaterini; Osipova, Ekaterina; Rostovtsev, Alexandre; Santana Quintero, Luis V.; Katneni, Upendra; Simonyan, Vahan; Kimchi-Sarfaty, Chava (2 de septiembre de 2017). "Un recurso nuevo y actualizado para tablas de uso de codones". Bioinformática BMC . 18 (391): 391. doi : 10.1186/s12859-017-1793-7 . PMC  5581930 . PMID  28865429.
  2. ^ Alexaki, Aikaterini; Kamés, Jacob; Holcomb, David D.; A ellos, John; Santana Quintero, Luis V.; Lam, Phuc Vihn Nguyen; Hamasaki-Katagiri, Nobuko; Osipova, Ekaterina; Simonyan, Vahan; Bar, Haim; Komar, Antón A.; Kimchi-Sarfaty, Chava (junio de 2019). "Tablas de uso de codones y pares de codones (CoCoPUT): facilitación de análisis de variación genética y diseño de genes recombinantes". Revista de biología molecular . 431 (13): 2434–2441. doi : 10.1016/j.jmb.2019.04.021 . PMID  31029701. S2CID  139104807.
  3. ^ Kames, Jacob; Alexaki, Aikaterini; Holcomb, David D.; Santana Quintero, Luis V.; Athey, John C.; Hamasaki-Katagiri, Nobuko; Katneni, Upendra; Golikov, Antón; Ibla, Juan C.; Bar, Haim; Kimchi-Sarfaty, Chava (enero de 2020). "TissueCoCoPUTs: nuevas tablas de uso de pares de codones y codones específicos de tejido humano basadas en la expresión genética diferencial de tejido". Revista de biología molecular . 432 (11): 3369–3378. doi : 10.1016/j.jmb.2020.01.011 . PMID  31982380.
  4. ^ P. Shah y MA Gilchrist (2011). "Explicar patrones complejos de uso de codones con selección de eficiencia traslacional, sesgo de mutación y deriva genética". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (25): 10231–6. doi : 10.1073/pnas.1016719108 . PMC 3121864 . PMID  21646514. 
  5. ^ L. Duret y N. Galtier (2009). "Conversión genética sesgada y evolución de paisajes genómicos de mamíferos". Annu Rev Genomics Hum Genet . 10 : 285–311. doi :10.1146/annurev-genom-082908-150001.
  6. ^ N. Galtier, C. Roux, M. Rousselle, J. Romiguier, E. Figuet, S. Glemin, N. Bierne y L. Duret (2018). "Sesgo en el uso de codones en animales: desentrañar los efectos de la selección natural, el tamaño efectivo de la población y la conversión genética sesgada por GC". Mol Biol Evol . 35 (5): 1092-1103. doi : 10.1093/molbev/msy015 . hdl : 20.500.12210/34500 .{{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  7. ^ Dong, Hengjiang; Nilsson, Lars; Kurland, Charles G. (1996). "Covariación de la abundancia de ARNt y el uso de codones en Escherichia coli a diferentes tasas de crecimiento". Revista de biología molecular . 260 (5): 649–663. doi :10.1006/jmbi.1996.0428. ISSN  0022-2836. PMID  8709146.
  8. ^ Agudo, Paul M.; Stenico, Michele; Peden, John F.; Lloyd, Andrew T. (1993). "Uso de codones: ¿sesgo mutacional, selección traslacional o ambas?". Bioquímica. Soc. Trans . 21 (4): 835–841. doi :10.1042/bst0210835. PMID  8132077. S2CID  8582630.
  9. ^ Kanaya, Shigehiko; Yamada, Yuko; Felicitaciones, Yoshihiro; Ikemura, Toshimichi (1999). "Estudios del uso de codones y genes de ARNt de 18 organismos unicelulares y cuantificación de ARNt de Bacillus subtilis : nivel de expresión génica y diversidad específica de especie del uso de codones basado en análisis multivariado". Gen.238 (1): 143-155. doi :10.1016/s0378-1119(99)00225-5. ISSN  0378-1119. PMID  10570992.
  10. ^ Atherton, John C.; Afilado, Paul M.; Lafay, Bénédicte (1 de abril de 2000). "Ausencia de sesgo de uso de codones sinónimos seleccionados traslacionalmente en Helicobacter pylori". Microbiología . 146 (4): 851–860. doi : 10.1099/00221287-146-4-851 . ISSN  1350-0872. PMID  10784043.
  11. ^ Bornelöv, Susanne; Selmi, Tomasso; Flad, Sofía; Dietmann, Sabine; Frye, Michaela (7 de junio de 2019). "Optimización del uso de codones en células madre embrionarias pluripotentes". Biología del genoma . 20 (1): 119. doi : 10.1186/s13059-019-1726-z . ISSN  1474-760X. PMC 6555954 . PMID  31174582. 
  12. ^ Duret, Laurent (2000). "El número de genes de ARNt y el uso de codones en el genoma de C. elegans están coadaptados para una traducción óptima de genes altamente expresados". Tendencias en Genética . 16 (7): 287–289. doi :10.1016/s0168-9525(00)02041-2. ISSN  0168-9525. PMID  10858656.
  13. ^ Shin, joven C.; Bischof, Georg F.; Lauer, William A.; Desrosiers, Ronald C. (10 de septiembre de 2015). "Importancia del uso de codones para la regulación temporal de la expresión de genes virales". Procedimientos de la Academia Nacional de Ciencias . 112 (45): 14030–14035. Código Bib : 2015PNAS..11214030S. doi : 10.1073/pnas.1515387112 . PMC 4653223 . PMID  26504241. 
  14. ^ Ermolaeva MD (octubre de 2001). "Uso sinónimo de codones en bacterias". Problemas actuales Mol Biol . 3 (4): 91–7. PMID  11719972.
  15. ^ Lynn DJ, Singer GA, Hickey DA (octubre de 2002). "El uso de codones sinónimos está sujeto a selección en bacterias termófilas". Ácidos nucleicos Res . 30 (19): 4272–7. doi : 10.1093/nar/gkf546. PMC 140546 . PMID  12364606. 
  16. ^ Paul S, Bag SK, Das S, Harvill ET, Dutta C (2008). "Firma molecular de la adaptación hipersalina: conocimientos del genoma y la composición del proteoma de procariotas halófilos". Genoma Biol . 9 (4): R70. doi : 10.1186/gb-2008-9-4-r70 . PMC 2643941 . PMID  18397532. 
  17. ^ Kober, KM; Pogson, GH (2013). "Los patrones de sesgo de codones en todo el genoma están moldeados por la selección natural en el erizo de mar púrpura, Strongylocentrotus purpuratus". G3 . 3 (7): 1069–1083. doi :10.1534/g3.113.005769. PMC 3704236 . PMID  23637123. 
  18. ^ McInerney, James O. (1 de septiembre de 1998). "Selección replicacional y transcripcional sobre el uso de codones en Borrelia burgdorferi". Procedimientos de la Academia Nacional de Ciencias . 95 (18): 10698–10703. Código bibliográfico : 1998PNAS...9510698M. doi : 10.1073/pnas.95.18.10698 . ISSN  0027-8424. PMC 27958 . PMID  9724767. 
  19. ^ Seward, Emily; Kelly, Steve (2016). "El nitrógeno de la dieta altera el sesgo de los codones y la composición del genoma en microorganismos parásitos". Biología del genoma . 17 (226): 3-15. doi : 10.1186/s13059-016-1087-9 . PMC 5109750 . PMID  27842572. 
  20. ^ abc Hershberg, R; Petrov, DA (2008). "Selección por sesgo de codones". Revista Anual de Genética . 42 : 287–99. doi :10.1146/annurev.genet.42.110807.091442. PMID  18983258. S2CID  7085012.
  21. ^ Novoa, EM; Ribas De Pouplana, L (2012). "Acelerar con control: uso de codones, ARNt y ribosomas". Tendencias en Genética . 28 (11): 574–81. doi :10.1016/j.tig.2012.07.006. PMID  22921354.
  22. ^ Shu, P.; Dai, H.; Gao, W.; Goldman, E. (2006). "Inhibición de la traducción por codones de leucina raros consecutivos en E. coli: ausencia del efecto de la estabilidad variable del ARNm". Expr gen . 13 (2): 97-106. doi :10.3727/000000006783991881. PMC 6032470 . PMID  17017124. 
  23. ^ Corredu, D.; Montaño López, J. d. J.; Angermayr, SA; Middleditch, MJ; Payne, LS; Leung, IKH (2019). "Efecto de codones raros consecutivos sobre la producción recombinante de proteínas humanas en Escherichia coli". Vida IUBMB . 72 (2): 266–274. doi :10.1002/iub.2162. hdl : 11343/286411 . PMID  31509345. S2CID  202555575.
  24. ^ Mignon, C.; Mariano, N.; Stadthagen, G.; Lugari, A.; Lagoutte, P.; Donnat, S.; Chenavas, S.; Perot, C.; Sodoyer, R.; Werle, B. (2018). "Armonización de codones: ir más allá del límite de velocidad para la expresión de proteínas". Cartas FEBS . 592 (9): 1554-1564. doi : 10.1002/1873-3468.13046 . PMID  29624661.
  25. ^ ab Plotkin, JB; Kudla, G (2011). "Sinónimo pero no igual: las causas y consecuencias del sesgo de codones". Naturaleza Reseñas Genética . 12 (1): 32–42. doi :10.1038/nrg2899. PMC 3074964 . PMID  21102527. 
  26. ^ ab Spencer, PD; Barral, JM (2012). "Redundancia del código genético y su influencia sobre los polipéptidos codificados". Revista de Biotecnología Computacional y Estructural . 1 : 1–8. doi :10.5936/csbj.201204006. PMC 3962081 . PMID  24688635. 
  27. ^ Comeron JM, Aguadé M (septiembre de 1998). "Una evaluación de medidas de sesgo de uso de codones sinónimos". J. Mol. Evolución . 47 (3): 268–74. Código Bib : 1998JMolE..47..268C. doi :10.1007/PL00006384. PMID  9732453. S2CID  21862217.
  28. ^ Ikemura T (septiembre de 1981). "Correlación entre la abundancia de ARN de transferencia de Escherichia coli y la aparición de los respectivos codones en sus genes proteicos: una propuesta para una elección de codones sinónimos que sea óptima para el sistema de traducción de E. coli". J. Mol. Biol . 151 (3): 389–409. doi :10.1016/0022-2836(81)90003-6. PMID  6175758.
  29. ^ Fox JM, Erill I (junio de 2010). "Adaptación relativa de codones: un índice de sesgo de codones genérico para la predicción de la expresión génica". Res. ADN . 17 (3): 185–96. doi :10.1093/dnares/dsq012. PMC 2885275 . PMID  20453079. 
  30. ^ Agudo, Paul M .; Li, Wen-Hsiung (1987). "El índice de adaptación de codones: una medida del sesgo direccional de uso de codones sinónimos y sus posibles aplicaciones". Investigación de ácidos nucleicos . 15 (3): 1281-1295. doi :10.1093/nar/15.3.1281. PMC 340524 . PMID  3547335. 
  31. ^ Peden J (15 de abril de 2005). "Índices de uso de codones". Análisis de correspondencia del uso de codones . FuenteForge . Consultado el 20 de octubre de 2010 .
  32. ^ Suzuki H, Brown CJ, Forney LJ, Top EM (diciembre de 2008). "Comparación de métodos de análisis de correspondencia para el uso de codones sinónimos en bacterias". Res. ADN . 15 (6): 357–65. doi :10.1093/dnares/dsn028. PMC 2608848 . PMID  18940873. 

enlaces externos