stringtranslate.com

contenido GC

Enlaces de nucleótidos que muestran pares AT y GC. Las flechas señalan los enlaces de hidrógeno .

En biología molecular y genética , el contenido de GC (o contenido de guanina-citosina ) es el porcentaje de bases nitrogenadas en una molécula de ADN o ARN que son guanina (G) o citosina (C). [1] Esta medida indica la proporción de bases G y C de un total implícito de cuatro bases, incluyendo también adenina y timina en el ADN y adenina y uracilo en el ARN.

El contenido de GC se puede proporcionar para un determinado fragmento de ADN o ARN o para un genoma completo . Cuando se refiere a un fragmento, puede indicar el contenido de GC de un gen individual o una sección de un gen (dominio), un grupo de genes o conjuntos de genes, una región no codificante o un oligonucleótido sintético como un cebador .

Estructura

Cualitativamente, la guanina (G) y la citosina (C) experimentan un enlace de hidrógeno específico entre sí, mientras que la adenina (A) se une específicamente con la timina (T) en el ADN y con el uracilo (U) en el ARN. Cuantitativamente, cada par de bases de GC se mantiene unido mediante tres enlaces de hidrógeno, mientras que los pares de bases AT y AU se mantienen unidos mediante dos enlaces de hidrógeno. Para enfatizar esta diferencia, los pares de bases a menudo se representan como "G≡C" versus "A=T" o "A=U".

El ADN con bajo contenido de GC es menos estable que el ADN con alto contenido de GC; sin embargo, los enlaces de hidrógeno en sí no tienen un impacto particularmente significativo en la estabilidad molecular, que es causada principalmente por interacciones moleculares de apilamiento de bases. [2] A pesar de la mayor termoestabilidad conferida a un ácido nucleico con alto contenido de GC, se ha observado que al menos algunas especies de bacterias con ADN con alto contenido de GC experimentan autólisis más fácilmente, reduciendo así la longevidad de la célula. per se . [3] Debido a la termoestabilidad de los pares de GC, alguna vez se supuso que un alto contenido de GC era una adaptación necesaria a las altas temperaturas, pero esta hipótesis fue refutada en 2001. [4] Aun así, se ha demostrado que existe una fuerte correlación entre el crecimiento óptimo de procariotas a temperaturas más altas y el contenido de GC de los ARN estructurales como el ARN ribosomal , el ARN de transferencia y muchos otros ARN no codificantes . [4] [5] Los pares de bases de AU son menos estables que los pares de bases de GC, lo que hace que las estructuras de ARN con alto contenido de GC sean más resistentes a los efectos de las altas temperaturas.

Más recientemente, se ha demostrado que el factor más importante que contribuye a la estabilidad térmica de los ácidos nucleicos bicatenarios se debe en realidad al apilamiento de bases adyacentes más que al número de enlaces de hidrógeno entre las bases. Hay una energía de apilamiento más favorable para los pares GC que para los pares AT o AU debido a las posiciones relativas de los grupos exocíclicos. Además, existe una correlación entre el orden en que se apilan las bases y la estabilidad térmica de la molécula en su conjunto. [6]

Determinación

Cariograma esquemático de un ser humano, que muestra una descripción general del genoma humano en bandas G (que incluye tinción de Giemsa ), donde las regiones ricas en GC son más claras y las regiones pobres en GC son más oscuras.

El contenido de GC generalmente se expresa como un valor porcentual, pero a veces como una relación (llamada relación G+C o relación GC ). El porcentaje de contenido de GC se calcula como [7]

mientras que la relación AT/GC se calcula como [8]

.

Los porcentajes de contenido de GC y la relación de GC se pueden medir por varios medios, pero uno de los métodos más simples es medir la temperatura de fusión de la doble hélice del ADN mediante espectrofotometría . La absorbancia del ADN a una longitud de onda de 260 nm aumenta bastante bruscamente cuando la molécula de ADN bicatenario se separa en dos hebras simples cuando se calienta lo suficiente. [9] El protocolo más utilizado para determinar las proporciones de GC utiliza citometría de flujo para un gran número de muestras. [10]

De manera alternativa, si la molécula de ADN o ARN bajo investigación se ha secuenciado de manera confiable , entonces el contenido de GC se puede calcular con precisión mediante aritmética simple o utilizando una variedad de herramientas de software disponibles públicamente, como la calculadora de GC en línea gratuita.

Contenido genómico

Variación dentro del genoma

Se ha descubierto que la proporción de GC dentro de un genoma es marcadamente variable. Estas variaciones en la proporción de GC dentro de los genomas de organismos más complejos dan como resultado una formación similar a un mosaico con regiones de islotes llamadas isocoras . [11] Esto da como resultado variaciones en la intensidad de la tinción en los cromosomas . [12] Las isocoras ricas en GC generalmente incluyen muchos genes codificadores de proteínas dentro de ellas y, por lo tanto, la determinación de las proporciones de GC de estas regiones específicas contribuye al mapeo de regiones del genoma ricas en genes. [13] [14]

Secuencias de codificación

Dentro de una larga región de secuencia genómica, los genes a menudo se caracterizan por tener un mayor contenido de GC en contraste con el contenido de GC de fondo para todo el genoma. [15] Existe evidencia de que la longitud de la región codificante de un gen es directamente proporcional a un mayor contenido de G+C. [16] Esto se ha señalado al hecho de que el codón de parada tiene un sesgo hacia los nucleótidos A y T y, por lo tanto, cuanto más corta sea la secuencia, mayor será el sesgo AT. [17]

La comparación de más de 1.000 genes ortólogos en mamíferos mostró marcadas variaciones dentro del genoma del contenido de GC en la posición del tercer codón , con un rango de menos del 30% a más del 80%. [18]

Variación entre genomas

Se ha descubierto que el contenido de GC es variable en diferentes organismos, y se prevé que el proceso se vea favorecido por la variación en la selección , el sesgo mutacional y la reparación del ADN sesgada asociada a la recombinación . [19]

El contenido promedio de GC en los genomas humanos oscila entre el 35% y el 60% en fragmentos de 100 Kb, con una media del 41%. [20] El contenido de GC de la levadura ( Saccharomyces cerevisiae ) es del 38%, [21] y el de otro organismo modelo común , el berro ( Arabidopsis thaliana ), es del 36%. [22] Debido a la naturaleza del código genético , es prácticamente imposible que un organismo tenga un genoma con un contenido de GC cercano al 0% o al 100%. Sin embargo, una especie con un contenido de GC extremadamente bajo es Plasmodium falciparum (% de GC = ~20%), [23] y generalmente es común referirse a tales ejemplos como ricos en AT en lugar de pobres en GC. [24]

Varias especies de mamíferos (p. ej., musaraña , micromurciélago , tenrec , conejo ) han experimentado de forma independiente un marcado aumento en el contenido de GC de sus genes. Estos cambios en el contenido de GC se correlacionan con los rasgos de la historia de vida de las especies (p. ej., masa corporal o longevidad) y el tamaño del genoma , [18] y podrían estar relacionados con un fenómeno molecular llamado conversión genética sesgada por GC . [25]

Aplicaciones

Biología Molecular

En los experimentos de reacción en cadena de la polimerasa (PCR), el contenido de GC de oligonucleótidos cortos conocidos como cebadores se utiliza a menudo para predecir su temperatura de hibridación con el ADN molde. Un nivel de contenido de GC más alto indica una temperatura de fusión relativamente más alta.

Muchas tecnologías de secuenciación, como la secuenciación de Illumina , tienen problemas para leer secuencias con alto contenido de GC. Se sabe que los genomas de las aves tienen muchas de esas partes, lo que causa el problema de los "genes faltantes" que se espera que estén presentes en la evolución y el fenotipo, pero que nunca se secuenciaron, hasta que se utilizaron métodos mejorados. [26]

sistemática

El problema de las especies en la taxonomía no eucariota ha dado lugar a varias sugerencias para la clasificación de bacterias, y el comité ad hoc sobre conciliación de enfoques de sistemática bacteriana de 1987 recomendó el uso de proporciones de GC en una clasificación jerárquica de nivel superior. [27] Por ejemplo, los Actinomycetota se caracterizan como " bacterias con alto contenido de GC ". [28] En Streptomyces coelicolor A3(2), el contenido de GC es del 72%. [29] Con el uso de métodos modernos y más confiables de sistemática molecular, se ha abolido la definición de contenido de GC de Actinomycetota y se han encontrado bacterias con bajo contenido de GC de este clado . [30]

Herramientas de software

GCSpeciesSorter [31] y TopSort [32] son ​​herramientas de software para clasificar especies según su contenido de GC.

Ver también

Referencias

  1. ^ Definición de GC: contenido en CancerWeb de la Universidad de Newcastle , Reino Unido
  2. ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). "Contribuciones del apilamiento y emparejamiento de bases a la estabilidad térmica de la doble hélice del ADN". Ácidos nucleicos Res . 34 (2): 564–74. doi : 10.1093/nar/gkj454. PMC  1360284 . PMID  16449200.
  3. ^ Levin RE, Van Sickle C (1976). "Autólisis de aislados de Pseudomonas putrefaciens con alto contenido de GC". Antonie van Leeuwenhoek . 42 (1–2): 145–55. doi :10.1007/BF00399459. PMID  7999. S2CID  9960732.
  4. ^ ab Hurst LD, Merchant AR (marzo de 2001). "El alto contenido de guanina-citosina no es una adaptación a las altas temperaturas: un análisis comparativo entre procariotas". Proc. Biol. Ciencia . 268 (1466): 493–7. doi :10.1098/rspb.2000.1397. PMC 1088632 . PMID  11296861. 
  5. ^ Galtier, N.; Lobry, JR (1997). "Relaciones entre el contenido genómico de G + C, las estructuras secundarias de ARN y la temperatura óptima de crecimiento en procariotas". Revista de evolución molecular . 44 (6): 632–636. Código Bib : 1997JMolE..44..632G. doi :10.1007/PL00006186. PMID  9169555. S2CID  19054315.
  6. ^ Yakovchuk, Pedro; Protozanova, Ekaterina; Frank-Kamenetskii, Maxim D. (2006). "Contribuciones del apilamiento y emparejamiento de bases a la estabilidad térmica de la doble hélice del ADN". Investigación de ácidos nucleicos . 34 (2): 564–574. doi : 10.1093/nar/gkj454. ISSN  0305-1048. PMC 1360284 . PMID  16449200. 
  7. ^ Madigan, MT. y Martinko JM. (2003). Biología de Brock de los microorganismos (10ª ed.). Pearson-Prentice Hall. ISBN 978-84-205-3679-8.
  8. ^ "Definición de relación GC en la Universidad Northwestern, IL, EE. UU.". Archivado desde el original el 20 de junio de 2010 . Consultado el 11 de junio de 2007 .
  9. ^ Wilhelm J, Pingoud A, Hahn M (mayo de 2003). "Método basado en PCR en tiempo real para la estimación del tamaño del genoma". Ácidos nucleicos Res . 31 (10): e56. doi : 10.1093/nar/gng056. PMC 156059 . PMID  12736322. 
  10. ^ Vinogradov AE (mayo de 1994). "Medición por citometría de flujo de la relación AT/GC genómica y el tamaño del genoma". Citometría . 16 (1): 34–40. doi : 10.1002/cyto.990160106 . PMID  7518377.
  11. ^ Bernardi G (enero de 2000). "Isocoros y genómica evolutiva de vertebrados". Gen.241 (1): 3–17. doi :10.1016/S0378-1119(99)00485-0. PMID  10607893.
  12. ^ Furey TS, Haussler D (mayo de 2003). "Integración del mapa citogenético con el borrador de secuencia del genoma humano". Tararear. Mol. Genet . 12 (9): 1037–44. doi : 10.1093/hmg/ddg113 . PMID  12700172.
  13. ^ Sumner AT, de la Torre J, Stuppia L (agosto de 1993). "La distribución de genes en los cromosomas: un enfoque citológico". J. Mol. Evolución . 37 (2): 117–22. Código Bib : 1993JMolE..37..117S. doi :10.1007/BF02407346. PMID  8411200. S2CID  24677431.
  14. ^ Aïssani B, Bernardi G (octubre de 1991). "Islas CpG, genes e isocoros en los genomas de vertebrados". Gen.106 (2): 185–95. doi :10.1016/0378-1119(91)90198-K. PMID  1937049.
  15. ^ Romiguier J, Roux C (2017). "Sesgos analíticos asociados con el contenido de GC en la evolución molecular". Genet delantero . 8 : 16. doi : 10.3389/fgene.2017.00016 . PMC 5309256 . PMID  28261263. 
  16. ^ Pozzoli U, Menozzi G, Fumagalli M, et al. (2008). "Tanto los procesos selectivos como los neutrales impulsan la evolución del contenido de GC en el genoma humano". BMC evolución. Biol . 8 (1): 99. Código bibliográfico : 2008BMCEE...8...99P. doi : 10.1186/1471-2148-8-99 . PMC 2292697 . PMID  18371205. 
  17. ^ Wuitschick JD, Karrer KM (1999). "Análisis del contenido genómico de G + C, uso de codones, contexto de codones iniciadores y sitios de terminación de traducción en Tetrahymena thermophila ". J. Eucariota. Microbiol . 46 (3): 239–47. doi :10.1111/j.1550-7408.1999.tb05120.x. PMID  10377985. S2CID  28836138.
  18. ^ ab Romiguier, Jonathan; Ranwez, Vicente; Douzery, Emmanuel JP; Galtier, Nicolas (1 de agosto de 2010). "Dinámica contrastante del contenido de GC en 33 genomas de mamíferos: relación con los rasgos de la historia de vida y el tamaño de los cromosomas". Investigación del genoma . 20 (8): 1001–1009. doi :10.1101/gr.104372.109. ISSN  1088-9051. PMC 2909565 . PMID  20530252. 
  19. ^ Birdsell JA (1 de julio de 2002). "Integrando genómica, bioinformática y genética clásica para estudiar los efectos de la recombinación en la evolución del genoma". Mol. Biol. Evolución . 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535 . doi : 10.1093/oxfordjournals.molbev.a004176. PMID  12082137. 
  20. ^ Consorcio Internacional de Secuenciación del Genoma Humano (febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Naturaleza . 409 (6822): 860–921. Código Bib :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID  11237011.(página 876)
  21. ^ Datos completos del genoma de Saccharomyces cerevisiae en NCBI
  22. ^ Datos completos del genoma de Arabidopsis thaliana en NCBI
  23. ^ Datos completos del genoma de Plasmodium falciparum en NCBI
  24. ^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). "Restricciones de composición en el genoma de Plasmodium falciparum, extremadamente pobre en GC" (PDF) . Memoria. Inst. Oswaldo Cruz . 92 (6): 835–41. doi : 10.1590/S0074-02761997000600020 . PMID  9566216.
  25. ^ Duret L, Galtier N (2009). "Conversión genética sesgada y evolución de paisajes genómicos de mamíferos". Annu Rev Genom Hum Genet . 10 : 285–311. doi :10.1146/annurev-genom-082908-150001. PMID  19630562. S2CID  9126286.
  26. ^ Huttener R, Thorrez L, Veld TI, et al. (2021). "La secuenciación de regiones refractarias en genomas de aves son puntos críticos para la evolución acelerada de proteínas". BMC Ecol Evol . 21 (176): 176. doi : 10.1186/s12862-021-01905-7 . PMC 8449477 . PMID  34537008. 
  27. ^ Wayne LG; et al. (1987). "Informe del comité ad hoc sobre conciliación de enfoques sistemáticos bacterianos". Revista Internacional de Bacteriología Sistemática . 37 (4): 463–4. doi : 10.1099/00207713-37-4-463 .
  28. ^ Navegador de taxonomía en NCBI
  29. ^ Datos completos del genoma de Streptomyces coelicolor A3 (2) en NCBI
  30. ^ Ghai R, McMahon KD, Rodríguez-Valera F (2012). "Rompiendo un paradigma: las actinobacterias de agua dulce cosmopolitas y abundantes tienen GC bajo". Informes de Microbiología Ambiental . 4 (1): 29–35. Código Bib : 2012EnvMR...4...29G. doi :10.1111/j.1758-2229.2011.00274.x. PMID  23757226.
  31. ^ Karimi K, Wuitchik D, Oldach M, Vize P (2018). "Distinguir especies utilizando contenidos de GC en secuencias mixtas de ADN o ARN". Evol Bioinform en línea . 14 (1 de enero de 2018): 1176934318788866. doi :10.1177/1176934318788866. PMC 6052495 . PMID  30038485. 
  32. ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). "Amplias diferencias en la expresión genética entre cnidarios simbióticos y aposimbióticos". G3 (Bethesda) . 4 (2): 277–95. doi :10.1534/g3.113.009084. PMC 3931562 . PMID  24368779. 

enlaces externos

  1. Tabla con contenido de GC de todos los procariotas secuenciados.
  2. Explorador taxonómico de bacterias basado en la proporción de GC en el sitio web del NCBI.
  3. Relación de GC en diversas especies.