stringtranslate.com

proyecto genoma

Cuando se imprime, la secuencia del genoma humano ocupa alrededor de 100 enormes libros de letra pequeña

Los proyectos genómicos son esfuerzos científicos que en última instancia tienen como objetivo determinar la secuencia completa del genoma de un organismo (ya sea un animal , una planta , un hongo , una bacteria , un arcaico , un protista o un virus ) y anotar genes codificadores de proteínas y otros características importantes codificadas en el genoma. [1] La secuencia del genoma de un organismo incluye las secuencias colectivas de ADN de cada cromosoma del organismo. Para una bacteria que contiene un solo cromosoma, un proyecto genómico tendrá como objetivo mapear la secuencia de ese cromosoma. Para la especie humana, cuyo genoma incluye 22 pares de autosomas y 2 cromosomas sexuales, una secuencia genómica completa implicará 46 secuencias cromosómicas separadas.

El Proyecto Genoma Humano es un ejemplo bien conocido de proyecto genoma. [2]

ensamblaje del genoma

El ensamblaje del genoma se refiere al proceso de tomar una gran cantidad de secuencias cortas de ADN y reensamblarlas para crear una representación de los cromosomas originales a partir de los cuales se originó el ADN. En un proyecto de secuenciación rápida , todo el ADN de una fuente (generalmente un solo organismo , desde una bacteria hasta un mamífero ) primero se fractura en millones de pedazos pequeños. Luego, estas piezas son "leídas" por máquinas secuenciadoras automáticas. Un algoritmo de ensamblaje del genoma funciona tomando todas las piezas y alineándolas entre sí, y detectando todos los lugares donde dos de las secuencias cortas, o lecturas , se superponen. Estas lecturas superpuestas se pueden fusionar y el proceso continúa.

El ensamblaje del genoma es un problema computacional muy difícil , que se complica aún más porque muchos genomas contienen una gran cantidad de secuencias idénticas, conocidas como repeticiones . Estas repeticiones pueden tener miles de nucleótidos de largo y ocurrir en diferentes ubicaciones, especialmente en los grandes genomas de plantas y animales .

La secuencia del genoma resultante (borrador) se produce combinando la información secuenciada contigs y luego empleando información de enlace para crear andamios. Los andamios se colocan a lo largo del mapa físico de los cromosomas creando un "camino dorado".

Software de montaje

Originalmente, la mayoría de los centros de secuenciación de ADN a gran escala desarrollaban su propio software para ensamblar las secuencias que producían. Sin embargo, esto ha cambiado a medida que el software se ha vuelto más complejo y ha aumentado el número de centros de secuenciación. Un ejemplo de dicho paquete de análisis de oligonucleótidos cortos en ensamblador desarrollado por BGI para el ensamblaje de novo de genomas de tamaño humano, alineación, detección de SNP , resecuenciación, búsqueda de indeles y análisis de variación estructural. [3] [4] [5]

Anotación del genoma

Desde la década de 1980, la biología molecular y la bioinformática han creado la necesidad de la anotación del ADN . La anotación del ADN o la anotación del genoma es el proceso de identificar, adjuntar información biológica a secuencias y, en particular, identificar las ubicaciones de los genes y determinar qué hacen esos genes.

Hora de finalización

Al secuenciar un genoma, normalmente hay regiones que son difíciles de secuenciar (a menudo regiones con ADN muy repetitivo ). Por lo tanto, las secuencias genómicas "completas" rara vez lo son, y se han utilizado términos como "borrador de trabajo" o "esencialmente completo" para describir con mayor precisión el estado de dichos proyectos genómicos. Incluso cuando se ha determinado cada par de bases de la secuencia del genoma, es probable que haya errores porque la secuenciación del ADN no es un proceso completamente preciso. También se podría argumentar que un proyecto de genoma completo debería incluir las secuencias de las mitocondrias y (en el caso de las plantas) los cloroplastos, ya que estos orgánulos tienen sus propios genomas.

A menudo se informa que el objetivo de secuenciar un genoma es obtener información sobre el conjunto completo de genes en esa secuencia genómica particular. La proporción de un genoma que codifica genes puede ser muy pequeña (particularmente en eucariotas como los humanos, donde el ADN codificante puede representar sólo un pequeño porcentaje de la secuencia completa). Sin embargo, no siempre es posible (o deseable) secuenciar únicamente las regiones codificantes por separado. Además, a medida que los científicos comprendan más sobre el papel de este ADN no codificante (a menudo denominado ADN basura ), será más importante tener una secuencia genómica completa como base para comprender la genética y la biología de cualquier organismo determinado.

En muchos sentidos, los proyectos genómicos no se limitan a determinar únicamente la secuencia de ADN de un organismo. Dichos proyectos también pueden incluir la predicción de genes para descubrir dónde están los genes en un genoma y qué hacen esos genes. También puede haber proyectos relacionados para secuenciar tecnologías ecológicamente racionales o ARNm para ayudar a descubrir dónde están realmente los genes.

Perspectivas históricas y tecnológicas.

Históricamente, al secuenciar genomas eucariotas (como el gusano Caenorhabditis elegans ) era común mapear primero el genoma para proporcionar una serie de puntos de referencia a lo largo del genoma. En lugar de secuenciar un cromosoma de una sola vez, se secuenciaría pieza por pieza (con el conocimiento previo de aproximadamente dónde se encuentra esa pieza en el cromosoma más grande). Los cambios en la tecnología y, en particular, las mejoras en la potencia de procesamiento de las computadoras, significan que ahora los genomas pueden ser " secuenciados rápidamente " de una sola vez (aunque este enfoque tiene sus salvedades en comparación con el enfoque tradicional).

Las mejoras en la tecnología de secuenciación del ADN han significado que el costo de secuenciar una nueva secuencia del genoma ha disminuido constantemente (en términos de costo por par de bases ) y la tecnología más nueva también ha significado que los genomas se pueden secuenciar mucho más rápidamente.

Cuando las agencias de investigación deciden qué nuevos genomas secuenciar, el énfasis se ha puesto en especies que son de gran importancia como organismo modelo o que tienen relevancia para la salud humana (por ejemplo, bacterias patógenas o vectores de enfermedades como los mosquitos ) o especies que tienen importancia comercial ( por ejemplo, ganado y plantas de cultivo). Se pone un énfasis secundario en las especies cuyos genomas ayudarán a responder preguntas importantes sobre la evolución molecular (por ejemplo, el chimpancé común ).

En el futuro, es probable que sea aún más barato y más rápido secuenciar un genoma. Esto permitirá determinar secuencias completas del genoma de muchos individuos diferentes de la misma especie. Para los humanos, esto nos permitirá comprender mejor aspectos de la diversidad genética humana .

Ejemplos

L1 Dominette 01449, el Hereford que sirve como sujeto del Proyecto Genoma Bovino
La secuencia del genoma de la Secuoya Gigante se extrajo de una única semilla fertilizada recolectada de un árbol de 1.360 años en el Parque Nacional Sequoia/Kings Canyon .

Muchos organismos tienen proyectos genómicos que se han completado o se completarán en breve, incluidos:

Ver también

Referencias

  1. ^ Pevsner, Jonathan (2009). Bioinformática y genómica funcional (2ª ed.). Hoboken, Nueva Jersey: Wiley-Blackwell. ISBN 9780470085851.
  2. ^ "Beneficios potenciales de la investigación del proyecto del genoma humano". Departamento de Energía , Información del Proyecto Genoma Humano. 09/10/2009. Archivado desde el original el 8 de julio de 2013 . Consultado el 18 de junio de 2010 .
  3. ^ Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K, Li S, Yang H, Wang J, Wang J (febrero de 2010). "Ensamblaje de novo de genomas humanos con secuenciación de lectura corta masivamente paralela". Investigación del genoma . 20 (2): 265–272. doi :10.1101/gr.097261.109. ISSN  1549-5469. PMC 2813482 . PMID  20019144. 
  4. ^ ab Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, Metspalu M, Metspalu E, Kivisild T, Gupta R, Bertalan M, Nielsen K, Gilbert MT, Wang Y, Raghavan M, Campos PF, Kamp HM, Wilson AS, Gledhill A, Tridico S, Bunce M, Lorenzen ED, Binladen J, Guo X, Zhao J, Zhang X, Zhang H, Li Z, Chen M, Orlando L, Kristiansen K, Bak M, Tommerup N , Bendixen C, Pierre TL, Grønnow B, Meldgaard M, Andreasen C, Fedorova SA, Osipova LP, Higham TF, Ramsey CB, Hansen TV, Nielsen FC, Crawford MH, Brunak S, Sicheritz-Pontén T, Villems R, Nielsen R , Krogh A, Wang J, Willerslev E (11 de febrero de 2010). "Secuencia del genoma humano antiguo de un paleoesquimal extinto". Naturaleza . 463 (7282): 757–762. Código Bib :2010Natur.463..757R. doi : 10.1038/naturaleza08835. ISSN  1476-4687. PMC 3951495 . PMID  20148029. 
  5. ^ Wang J, Wang W, Li R, Li Y, Tian G, Goodman L, Fan W, Zhang J, Li J, Zhang J, Guo Y, Feng B, Li H, Lu Y, Fang X, Liang H, Du Z, Li D, Zhao Y, Hu Y, Yang Z, Zheng H, Hellmann I, Inouye M, Pool J, Yi X, Zhao J, Duan J, Zhou Y, Qin J, Ma L, Li G, Yang Z, Zhang G, Yang B, Yu C, Liang F, Li W, Li S, Li D, Ni P, Ruan J, Li Q, Zhu H, Liu D, Lu Z, Li N, Guo G, Zhang J, Ye J , Fang L, Hao Q, Chen Q, Liang Y, Su Y, San A, Ping C, Yang S, Chen F, Li L, Zhou K, Zheng H, Ren Y, Yang L, Gao Y, Yang G, Li Z, Feng X, Kristiansen K, Wong GK, Nielsen R, Durbin R, Bolund L, Zhang X, Li S, Yang H, Wang J (6 de noviembre de 2008). "La secuencia del genoma diploide de un individuo asiático". Naturaleza . 456 (7218): 60–65. Código Bib :2008Natur.456...60W. doi : 10.1038/naturaleza07484. ISSN  0028-0836. PMC 2716080 . PMID  18987735. 
  6. ^ Ghosh, Pallab (23 de abril de 2015). "Secuencia del genoma del mamut completada". Noticias de la BBC .
  7. ^ Yates, Diana (23 de abril de 2009). "¿Qué hace que una vaca sea vaca? La secuencia del genoma arroja luz sobre la evolución de los rumiantes" (Comunicado de prensa) . Eurek¡Alerta! . Consultado el 22 de diciembre de 2012 .
  8. ^ Elsik, CG; Elsik, RL; Tellam, KC; Worley, RA; Gibbs, DM; Muzny, GM; Weinstock, DL; Adelson, EE; Eichler, L.; Elnitski, R.; Guigó, DL; Hamernik, SM; Kappes, HA; Lewin, DJ; Lynn, FW; Nicolás, A.; Reymond, M.; Rijnkels, LC; Skow, EM; Zdobnov, L.; Schook, J.; Womack, T.; Alioto, SE; Antonarakis, A.; Astashyn, CE; Chapple, H.-C.; Chen, J.; Chrast, F.; Cámara, O.; et al. (2009). "La secuencia del genoma del ganado taurino: una ventana a la biología y evolución de los rumiantes". Ciencia . 324 (5926): 522–528. Código Bib : 2009 Ciencia... 324.. 522A. doi : 10.1126/ciencia.1169588. PMC 2943200 . PMID  19390049. 
  9. ^ "Lanzamiento de 2007: genoma del caballo ensamblado". Instituto Nacional de Investigación del Genoma Humano (NHGRI) . Consultado el 19 de abril de 2018 .
  10. ^ Scott, Alison D; Zimin, Aleksey V; Puiú, Daniela; Obrero, Raquel; Britton, Mónica; Zaman, Sumaira; Caballero, Madison; Leer, Andrés C; Bogdanove, Adam J; Quemaduras, Emily; Wegrzyn, Jill; Timp, Winston; Salzberg, Steven L; Neale, David B (1 de noviembre de 2020). "Una secuencia del genoma de referencia de la secuoya gigante". G3: Genes, Genomas, Genética . 10 (11): 3907–3919. doi :10.1534/g3.120.401612. PMC 7642918 . PMID  32948606. 

enlaces externos