Proyecto 1000 Genomas

El Proyecto 1000 Genomas ( 1KGP ), que se llevó a cabo entre enero de 2008 y 2015, fue un esfuerzo de investigación internacional para establecer el catálogo más detallado de la variación genética humana en ese momento. Los científicos planearon secuenciar los genomas de al menos mil participantes sanos anónimos de varios grupos étnicos diferentes en los siguientes tres años, utilizando avances en tecnologías recientemente desarrolladas . En 2010, el proyecto terminó su fase piloto, que se describió en detalle en una publicación en la revista Nature . ^[1] En 2012, la secuenciación de 1092 genomas se anunció en una publicación de Nature . ^[2] En 2015, dos artículos en Nature informaron los resultados y la finalización del proyecto y las oportunidades para futuras investigaciones. ^[3]^[4]

Se identificaron muchas variaciones raras, restringidas a grupos estrechamente relacionados, y se analizaron ocho clases de variación estructural. ^[5]

El proyecto unió a equipos de investigación multidisciplinarios de institutos de todo el mundo, incluidos China , Italia , Japón , Kenia , Nigeria , Perú , el Reino Unido y los Estados Unidos , que contribuyeron al conjunto de datos de secuencias y a un mapa refinado del genoma humano de libre acceso a través de bases de datos públicas para la comunidad científica y el público en general por igual. ^[2]

El Recurso Internacional de Muestras del Genoma se creó para albergar y ampliar el conjunto de datos una vez finalizado el proyecto. ^[6]

Fondo

Desde la finalización del Proyecto Genoma Humano, los avances en la genética de poblaciones humanas y la genómica comparativa permitieron un mayor conocimiento de la diversidad genética. ^[7] La comprensión de las variaciones estructurales (inserciones/deleciones ( indels ), variaciones del número de copias (CNV), retroelementos ), polimorfismos de un solo nucleótido (SNP) y selección natural se estaba consolidando. ^[8]^[9]^[10]^[11]

La diversidad de la variación genética humana, como los indeles, se estaban descubriendo y se estaban investigando las variaciones genómicas humanas ^{[ cita requerida ]}

Selección natural

También se propuso proporcionar evidencia que pueda utilizarse para explorar el impacto de la selección natural en las diferencias poblacionales. Los patrones de polimorfismos de ADN pueden utilizarse para detectar de manera confiable las firmas de selección y pueden ayudar a identificar genes que podrían ser la base de la variación en la resistencia a las enfermedades o el metabolismo de los fármacos. ^[12]^[13] Estos conocimientos podrían mejorar la comprensión de las variaciones fenotípicas , los trastornos genéticos y la herencia mendeliana y sus efectos en la supervivencia y/o reproducción de diferentes poblaciones humanas.

Descripción del proyecto

Objetivos

El Proyecto 1000 Genomas fue diseñado para cerrar la brecha de conocimiento entre las variantes genéticas raras que tienen un efecto severo predominantemente en rasgos simples (por ejemplo, fibrosis quística , enfermedad de Huntington ) y las variantes genéticas comunes que tienen un efecto leve y están implicadas en rasgos complejos (por ejemplo, cognición , diabetes , enfermedad cardíaca ). ^[14]

El objetivo principal de este proyecto era crear un catálogo completo y detallado de las variaciones genéticas humanas , que se pueda utilizar para estudios de asociación que relacionen la variación genética con las enfermedades. El consorcio tenía como objetivo descubrir >95 % de las variantes (por ejemplo, SNP, CNV, indels) con frecuencias de alelos menores tan bajas como el 1 % en todo el genoma y el 0,1-0,5 % en las regiones genéticas, así como estimar las frecuencias poblacionales, los antecedentes haplotípicos y los patrones de desequilibrio de ligamiento de los alelos variantes. ^[15]

Los objetivos secundarios incluyeron el apoyo a una mejor selección de SNP y sondas para plataformas de genotipado en estudios futuros y la mejora de la secuencia de referencia humana . Se esperaba que la base de datos completa fuera una herramienta útil para estudiar las regiones bajo selección, la variación en múltiples poblaciones y la comprensión de los procesos subyacentes de mutación y recombinación . ^[15]

Describir

El genoma humano consta de aproximadamente 3 mil millones de pares de bases de ADN y se estima que contiene alrededor de 20.000 genes codificadores de proteínas . Al diseñar el estudio, el consorcio tuvo que abordar varias cuestiones críticas relacionadas con las métricas del proyecto, como los desafíos tecnológicos, los estándares de calidad de los datos y la cobertura de secuencias. ^[15]

En el transcurso de los próximos tres años, ^{los científicos} del Instituto Sanger , BGI Shenzhen y la Red de Secuenciación a Gran Escala del Instituto Nacional de Investigación del Genoma Humano planearon secuenciar un mínimo de 1.000 genomas humanos. Debido ^a la gran cantidad de datos de secuenciación que se requerían, se mantuvo el reclutamiento de participantes adicionales. ^[14]

Se debían secuenciar casi 10 mil millones de bases por día durante un período de dos años de la fase de producción, lo que equivaldría a más de dos genomas humanos cada 24 horas. El conjunto de datos de secuenciación previsto debía comprender 6 billones de bases de ADN, 60 veces más datos de secuenciación que lo que se había publicado en las bases de datos de ADN hasta el momento. ^[14]

Para determinar el diseño final del proyecto completo, se llevaron a cabo tres estudios piloto durante el primer año del proyecto. El primer piloto pretende genotipar a 180 personas de 3 grupos geográficos principales con una cobertura baja (2×). Para el segundo estudio piloto, se secuenciarán los genomas de dos familias nucleares (ambos padres y un hijo adulto) con una cobertura profunda (20× por genoma). El tercer estudio piloto implica la secuenciación de las regiones codificantes ( exones ) de 1000 genes en 1000 personas con una cobertura profunda (20×). ^[14]^[15]

Se estimó que el proyecto probablemente costaría más de 500 millones de dólares si se utilizaran tecnologías de secuenciación de ADN estándar. Se aplicarían varias tecnologías más nuevas (por ejemplo, Solexa , 454 , SOLiD ), lo que reduciría los costos esperados a entre 30 y 50 millones de dólares. El principal apoyo lo brindarán el Wellcome Trust Sanger Institute en Hinxton, Inglaterra; el Beijing Genomics Institute , Shenzhen (BGI Shenzhen), China; y el NHGRI , parte de los Institutos Nacionales de Salud (NIH). ^[14]

De acuerdo con los principios de Fort Lauderdale Archivado el 28 de diciembre de 2013 en Wayback Machine , todos los datos de la secuencia del genoma (incluidas las llamadas variantes) están disponibles gratuitamente a medida que avanza el proyecto y se pueden descargar a través de FTP desde la página web del proyecto 1000 genomas.

Muestras del genoma humano

En función de los objetivos generales del proyecto, las muestras se seleccionarán para que aporten potencia en poblaciones en las que se están realizando estudios de asociación de enfermedades comunes. Además, las muestras no necesitan tener información médica o fenotípica, ya que el catálogo propuesto será un recurso básico sobre la variación humana. ^[15]

Para los estudios piloto se secuenciarán muestras del genoma humano de la colección HapMap . Será útil centrarse en muestras que tengan datos adicionales disponibles (como la secuencia ENCODE , los genotipos de todo el genoma, la secuencia del extremo de los fósmidos , los ensayos de variación estructural y la expresión génica ) para poder comparar los resultados con los de otros proyectos. ^[15]

Cumpliendo con extensos procedimientos éticos, el Proyecto 1000 Genomas utilizará muestras de donantes voluntarios. Las siguientes poblaciones se incluirán en el estudio: Yoruba en Ibadan (YRI), Nigeria ; Japoneses en Tokio (JPT); Chinos en Beijing (CHB); Residentes de Utah con ascendencia del norte y oeste de Europa (CEU); Luhya en Webuye , Kenia (LWK); Maasai en Kinyawa, Kenia (MKK); Toscani en Italia (TSI); Peruanos en Lima , Perú (PEL); Indios Gujarati en Houston (GIH); Chinos en el área metropolitana de Denver (CHD); Personas de ascendencia mexicana en Los Ángeles (MXL); y Personas de ascendencia africana en el suroeste de los Estados Unidos (ASW). ^[14]

* Población que fue recolectada en diáspora

Reunión comunitaria

Los datos generados por el Proyecto 1000 Genomas son ampliamente utilizados por la comunidad genética, lo que convierte al primer Proyecto 1000 Genomas en uno de los artículos más citados en biología. ^[17] Para apoyar a esta comunidad de usuarios, el proyecto celebró una reunión de análisis de la comunidad en julio de 2012 que incluyó charlas que destacaron los descubrimientos clave del proyecto, su impacto en la genética de poblaciones y los estudios de enfermedades humanas, y resúmenes de otros estudios de secuenciación a gran escala. ^[18]

Resultados del proyecto

Fase piloto

La fase piloto constó de tres proyectos:

Secuenciación del genoma completo de baja cobertura de 179 individuos de 4 poblaciones
Secuenciación de alta cobertura de 2 tríos (madre-padre-hijo)
Secuenciación dirigida por exones de 697 individuos de 7 poblaciones

Se descubrió que, en promedio, cada persona porta alrededor de 250 a 300 variantes con pérdida de función en genes anotados y entre 50 y 100 variantes previamente implicadas en trastornos hereditarios. Con base en los dos tríos, se estima que la tasa de mutación de novo en la línea germinal es de aproximadamente 10 ⁻⁸ por base por generación. ^[1]

Véase también

Referencias

^ ab Abecasis GR , Altshuler D , Auton A, Brooks LD, Durbin RM, Gibbs RA, et al. (octubre de 2010). "Un mapa de la variación del genoma humano a partir de la secuenciación a escala poblacional". Nature . 467 (7319): 1061–73. Bibcode :2010Natur.467.1061T. doi : 10.1038/nature09534. PMC 3042601. PMID 20981092.
^ ab Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, et al. (noviembre de 2012). "Un mapa integrado de la variación genética de 1.092 genomas humanos". Nature . 491 (7422): 56–65. Bibcode :2012Natur.491...56T. doi :10.1038/nature11632. PMC 3498066 . PMID 23128226.
^ Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, et al. (octubre de 2015). "Una referencia global para la variación genética humana". Nature . 526 (7571): 68–74. Bibcode :2015Natur.526...68T. doi :10.1038/nature15393. PMC 4750478 . PMID 26432245.
^ Sudmant PH, Rausch T, Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, et al. (octubre de 2015). "Un mapa integrado de variación estructural en 2504 genomas humanos". Nature . 526 (7571): 75–81. Bibcode :2015Natur.526...75.. doi :10.1038/nature15394. PMC 4617611 . PMID 26432246.
^ "Variedad de vida". Nature News & Comment . 2015-09-30 . Consultado el 2015-10-15 .
^ "Proyecto 1000 Genomas | Computación y datos científicos". Facultad de Medicina del Monte Sinaí . 2020-07-07 . Consultado el 2023-10-01 .
^ Nielsen R (octubre de 2010). «Genómica: en busca de variantes humanas raras». Nature . 467 (7319): 1050–1. Bibcode :2010Natur.467.1050N. doi : 10.1038/4671050a . PMID 20981085.
^ JC Long, Variación genética humana: los mecanismos y resultados de la microevolución, Asociación Antropológica Americana (2004)
^ Anzai T, Shiina T, Kimura N, Yanagiya K, Kohara S, Shigenari A, et al. (junio de 2003). "La secuenciación comparativa de las regiones de clase I del MHC humano y del chimpancé revela inserciones/deleciones como el camino principal hacia la divergencia genómica". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (13): 7708–13. Bibcode :2003PNAS..100.7708A. doi : 10.1073/pnas.1230533100 . PMC 164652 . PMID 12799463.
^ Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, et al. (noviembre de 2006). "Variación global en el número de copias en el genoma humano". Nature . 444 (7118): 444–54. Bibcode :2006Natur.444..444R. doi :10.1038/nature05329. PMC 2669898 . PMID 17122850.
^ Barreiro LB, Laval G, Quach H, Patin E, Quintana-Murci L (marzo de 2008). "La selección natural ha impulsado la diferenciación poblacional en los humanos modernos". Nature Genetics . 40 (3): 340–5. doi :10.1038/ng.78. PMID 18246066. S2CID 205357396.
^ EE Harris et al., La firma molecular de la selección subyacente a las adaptaciones humanas, Anuario de Antropología Física 49: 89-130 (2006)
^ Bamshad M, Wooding SP (febrero de 2003). "Firmas de selección natural en el genoma humano". Nature Reviews. Genética . 4 (2): 99–111. doi :10.1038/nrg999. PMID 12560807. S2CID 13722452.
^ abcdef G Spencer, Consorcio internacional anuncia el proyecto de los 1000 genomas, EMBARGOED (2008) http://www.nih.gov/news/health/jan2008/nhgri-22.htm
^ abcdef Informe de la reunión: Taller para planificar un catálogo profundo de la variación genética humana, (2007) http://www.1000genomes.org/sites/1000genomes.org/files/docs/1000Genomes-MeetingReport.pdf
^ Oleksyk TK, Brukhin V, O'Brien SJ (2015). "El proyecto Genome Russia: cerrando la mayor omisión restante en el mapa mundial del genoma". GigaScience . 4 : 53. doi : 10.1186/s13742-015-0095-0 . PMC 4644275 . PMID 26568821.
^ C. King (2012) Las investigaciones más candentes de 2011. Science Watch http://archive.sciencewatch.com/newsletter/2012/201203/hottest_research_2012/
^ Reunión de análisis de la comunidad del Proyecto 1000 Genomas http://1000gconference.sph.umich.edu/

Enlaces externos

1000 Genomas - Un catálogo profundo de la variación genética humana - página web oficial
Proyecto Internacional HapMap Archivado el 16 de abril de 2014 en Wayback Machine - página web oficial
Información sobre el Proyecto Genoma Humano