stringtranslate.com

Curva Z

Curva Z del cromosoma III de C.elegans

El método de la curva Z (o curva Z ) es un algoritmo bioinformático para el análisis del genoma . La curva Z es una curva tridimensional que constituye una representación única de una secuencia de ADN , es decir, para la curva Z y la secuencia de ADN dada cada una puede reconstruirse de forma única a partir de la otra . [1] La curva resultante tiene forma de zigzag, de ahí el nombre de curva Z.

Fondo

El método de la curva Z se creó por primera vez en 1994 como una forma de mapear visualmente una secuencia de ADN o ARN. Diferentes propiedades de la curva Z, como su simetría y periodicidad, pueden brindar información única sobre la secuencia de ADN. [2] La curva Z se genera a partir de una serie de nodos, P 0 , P 1 ,...P N , con las coordenadas x n , y n y z n (n = 0, 1, 2... N, donde N es la longitud de la secuencia de ADN). La curva Z se crea conectando cada uno de los nodos secuencialmente. [3]

Aplicaciones

La información sobre la distribución de nucleótidos en una secuencia de ADN se puede determinar a partir de la curva Z. Los cuatro nucleótidos se combinan en seis categorías diferentes. Los nucleótidos se colocan en cada categoría según alguna característica definitoria y cada categoría se designa con una letra. [4]

Los componentes x, y y z de la curva Z muestran la distribución de cada una de estas categorías de bases para la secuencia de ADN que se está estudiando. El componente x representa la distribución de bases púricas y pirimidínicas (R/Y). El componente y muestra la distribución de bases amino y cetogénicas (M/K) y el componente z muestra la distribución de bases con enlaces H fuertes y débiles (S/W) en la secuencia de ADN. [5]

El método de la curva Z se ha utilizado en muchas áreas diferentes de la investigación del genoma , como la identificación del origen de replicación , [6] [7] [8] [9] , la predicción de genes ab initio , [10] la identificación de isócoras , [11] la identificación de islas genómicas [12] y la genómica comparativa . [13] También se ha demostrado que el análisis de la curva Z puede predecir si un gen contiene intrones , [14]

Investigación

Los experimentos han demostrado que la curva Z se puede utilizar para identificar el origen de la replicación en varios organismos. Un estudio analizó la curva Z para múltiples especies de Archaea y descubrió que el oriC se encuentra en un pico agudo en la curva seguido de una base ancha. Esta región era rica en bases AT y tenía múltiples repeticiones, lo que se espera para los sitios de origen de la replicación. [15] Este y otros estudios similares se utilizaron para generar un programa que pudiera predecir los orígenes de la replicación utilizando la curva Z.

La curva Z también se ha utilizado experimentalmente para determinar relaciones filogenéticas. En un estudio, se analizó un nuevo coronavirus en China mediante el análisis de secuencias y el método de la curva Z para determinar su relación filogenética con otros coronavirus. Se determinó que las similitudes y diferencias en especies relacionadas se pueden determinar rápidamente examinando visualmente sus curvas Z. Se creó un algoritmo para identificar el centro geométrico y otras tendencias en la curva Z de 24 especies de coronavirus. Los datos se utilizaron para crear un árbol filogenético. Los resultados coincidieron con el árbol que se generó mediante el análisis de secuencias. El método de la curva Z resultó superior porque, mientras que el análisis de secuencias crea un árbol filogenético basado únicamente en secuencias codificantes en el genoma, el método de la curva Z analizó el genoma completo. [16]

Referencias

  1. ^ Zhang CT, Zhang R, Ou HY (2003). "La base de datos de curva Z: una representación gráfica de secuencias del genoma". Bioinformática . 19 (5): 593–99. doi : 10.1093/bioinformatics/btg041 . PMID  12651717.
  2. ^ Zhang, Ren; Zhang, Chun-Ting (febrero de 1994). "Curvas Z, una herramienta intuitiva [ sic ] para visualizar y analizar las secuencias de ADN". Revista de estructura y dinámica biomolecular . 11 (4): 767–782. doi :10.1080/07391102.1994.10508031. PMID  8204213.
  3. ^ Yu, Chenglong; Deng, Mo; Zheng, Lu; He, Rong Lucy; Yang, Jie; Yau, Stephen S.-T. (18 de julio de 2014). "DFA7, un nuevo método para distinguir entre genes que contienen intrones y genes sin intrones". PLOS ONE . ​​9 (7): e101363. Bibcode :2014PLoSO...9j1363Y. doi : 10.1371/journal.pone.0101363 . PMC 4103774 . PMID  25036549. 
  4. ^ Zhang, Ren; Zhang, Chun-Ting (1 de abril de 2014). "Una breve revisión: la teoría de la curva Z y su aplicación en el análisis del genoma". Genómica actual . 15 (2): 78–94. doi :10.2174/1389202915999140328162433. ISSN  1389-2029. PMC 4009844 . PMID  24822026. 
  5. ^ Zhang, CT (1997-08-07). "Una teoría simétrica de secuencias de ADN y sus aplicaciones". Journal of Theoretical Biology . 187 (3): 297–306. Bibcode :1997JThBi.187..297Z. doi :10.1006/jtbi.1997.0401. ISSN  0022-5193. PMID  9245572.
  6. ^ Zhang R, Zhang CT (2005). "Identificación de orígenes de replicación en genomas arqueológicos basados ​​en el método de la curva Z". Archaea . 1 (5): 335–46. doi : 10.1155/2005/509646 . PMC 2685548 . PMID  15876567. 
  7. ^ Worning P, Jensen LJ, Hallin PF, Staerfeldt HH, Ussery DW (febrero de 2006). "Origen de la replicación en cromosomas procariotas circulares". Environ. Microbiol . 8 (2): 353–61. Bibcode :2006EnvMi...8..353W. doi :10.1111/j.1462-2920.2005.00917.x. PMID  16423021. S2CID  3135023.
  8. ^ Zhang, Ren; Zhang, Chun-Ting (2002-09-20). "Origen de replicación única de la arqueona Methanosarcina mazei revelado por el método de la curva Z". Comunicaciones de investigación bioquímica y biofísica . 297 (2): 396–400. doi :10.1016/s0006-291x(02)02214-3. ISSN  0006-291X. PMID  12237132.
  9. ^ Worning, Peder; Jensen, Lars J.; Hallin, Peter F.; Staerfeldt, Hans-Henrik; Ussery, David W. (1 de febrero de 2006). "Origen de la replicación en cromosomas procariotas circulares". Microbiología ambiental . 8 (2): 353–361. Bibcode :2006EnvMi...8..353W. doi :10.1111/j.1462-2920.2005.00917.x. ISSN  1462-2912. PMID  16423021. S2CID  3135023.
  10. ^ Guo FB, Ou HY, Zhang CT (2003). "ZCURVE: un nuevo sistema para reconocer genes codificadores de proteínas en genomas bacterianos y arqueológicos". Nucleic Acids Research . 31 (6): 1780–89. doi :10.1093/nar/gkg254. PMC 152858 . PMID  12626720. 
  11. ^ Zhang CT, Zhang R (2004). "Estructuras isocóricas en el genoma del ratón". Genomics . 83 (3): 384–94. doi :10.1016/j.ygeno.2003.09.011. PMID  14962664.
  12. ^ Zhang R, Zhang CT (2004). "Un método sistemático para identificar islas genómicas y sus aplicaciones en el análisis de los genomas de Corynebacterium glutamicum y Vibrio vulnificus CMCP6 cromosoma I". Bioinformática . 20 (5): 612–22. doi : 10.1093/bioinformatics/btg453 . PMID  15033867.
  13. ^ Zhang R, Zhang CT (2003). "Identificación de islas genómicas en el genoma de Bacillus cereus mediante análisis comparativo con Bacillus anthracis". Genómica fisiológica . 16 (1): 19–23. doi :10.1152/physiolgenomics.00170.2003. PMID  14600214.
  14. ^ Zhang, CT; Lin, ZS; Yan, M.; Zhang, R. (21 de junio de 1998). "Un nuevo enfoque para distinguir entre genes que contienen intrones y genes sin intrones basado en el formato de curvas Z". Journal of Theoretical Biology . 192 (4): 467–473. Bibcode :1998JThBi.192..467Z. doi :10.1006/jtbi.1998.0671. ISSN  0022-5193. PMID  9680720.
  15. ^ Zhang, Ren; Zhang, Chun-Ting (2002-09-20). "Origen de replicación única de la arqueona Methanosarcina mazei revelado por el método de la curva Z". Comunicaciones de investigación bioquímica y biofísica . 297 (2): 396–400. doi :10.1016/s0006-291x(02)02214-3. ISSN  0006-291X. PMID  12237132.
  16. ^ Zheng, Wen-Xin; Chen, Ling-Ling; Ou, Hong-Yu; Gao, Feng; Zhang, Chun-Ting (1 de agosto de 2005). "Filogenia del coronavirus basada en un enfoque geométrico". Filogenética molecular y evolución . 36 (2): 224–232. Código Bib : 2005 MolPE..36..224Z. doi : 10.1016/j.ympev.2005.03.030 . ISSN  1055-7903. PMC 7111192 . PMID  15890535. 

Enlaces externos