Proyecto Internacional HapMap

El Proyecto Internacional HapMap fue una organización que tuvo como objetivo desarrollar un mapa de haplotipos ( HapMap ) del genoma humano , para describir los patrones comunes de variación genética humana . HapMap se utiliza para encontrar variantes genéticas que afectan la salud, la enfermedad y las respuestas a medicamentos y factores ambientales. La información producida por el proyecto se pone a disposición de forma gratuita para la investigación.

El Proyecto Internacional HapMap es una colaboración entre investigadores de centros académicos, grupos de investigación biomédica sin fines de lucro y empresas privadas en Canadá , China (incluido Hong Kong ), Japón , Nigeria , el Reino Unido y los Estados Unidos . Comenzó oficialmente con una reunión del 27 al 29 de octubre de 2002 y se esperaba que durara unos tres años. Comprende dos fases; los datos completos obtenidos en la Fase I se publicaron el 27 de octubre de 2005. ^[1] El análisis del conjunto de datos de la Fase II se publicó en octubre de 2007. ^[2] El conjunto de datos de la Fase III se publicó en la primavera de 2009 y la publicación que presenta los resultados finales se publicó en septiembre de 2010. ^[3]

Fondo

A diferencia de las enfermedades mendelianas más raras , las combinaciones de diferentes genes y el medio ambiente juegan un papel en el desarrollo y la progresión de enfermedades comunes (como diabetes , cáncer , enfermedades cardíacas , accidentes cerebrovasculares , depresión y asma ), o en la respuesta individual a agentes farmacológicos . ^[4] Para encontrar los factores genéticos involucrados en estas enfermedades, en principio se podría hacer un estudio de asociación de todo el genoma : obtener la secuencia genética completa de varios individuos, algunos con la enfermedad y otros sin ella, y luego buscar diferencias entre los dos conjuntos de genomas. En ese momento, este enfoque no era factible debido al costo de la secuenciación completa del genoma . El proyecto HapMap propuso un atajo.

Aunque dos personas no relacionadas comparten aproximadamente el 99,5% de su secuencia de ADN , sus genomas difieren en ubicaciones de nucleótidos específicas. Estos sitios se conocen como polimorfismos de un solo nucleótido (SNP), y cada una de las posibles formas genéticas resultantes se denomina alelo . ^[5] El proyecto HapMap se centra únicamente en los SNP comunes, aquellos en los que cada alelo se presenta en al menos el 1% de la población.

Cada persona tiene dos copias de todos los cromosomas , excepto los cromosomas sexuales en los varones . Para cada SNP, la combinación de alelos que tiene una persona se denomina genotipo . La genotipificación se refiere al descubrimiento del genotipo que tiene una persona en un sitio particular. El proyecto HapMap eligió una muestra de 269 individuos y seleccionó varios millones de SNP bien definidos, genotipificó a los individuos para estos SNP y publicó los resultados. ^[6]

Los alelos de los SNP cercanos en un solo cromosoma están correlacionados. Específicamente, si se conoce el alelo de un SNP para un individuo dado, a menudo se pueden predecir los alelos de los SNP cercanos, un proceso conocido como imputación de genotipo . ^[7] Esto se debe a que cada SNP surgió en la historia evolutiva como una única mutación puntual y luego se transmitió en el cromosoma rodeado de otras mutaciones puntuales anteriores. Los SNP que están separados por una gran distancia en el cromosoma normalmente no están muy bien correlacionados, porque la recombinación ocurre en cada generación y mezcla las secuencias de alelos de los dos cromosomas. Una secuencia de alelos consecutivos en un cromosoma particular se conoce como haplotipo . ^[8]

Para encontrar los factores genéticos implicados en una enfermedad en particular, se puede proceder de la siguiente manera. Primero se identifica una región de interés en el genoma, posiblemente de estudios de herencia anteriores. En esta región se localiza un conjunto de SNP de etiqueta a partir de los datos de HapMap; estos son SNP que están muy bien correlacionados con todos los demás SNP de la región. Con estos, se puede utilizar la imputación de genotipo para determinar (imputar) los otros SNP y, por lo tanto, el haplotipo completo con alta confianza. A continuación, se determina el genotipo para estos SNP de etiqueta en varios individuos, algunos con la enfermedad y otros sin ella. Al comparar los dos grupos, se determinan las posibles ubicaciones y los haplotipos que están involucrados en la enfermedad.

Muestras utilizadas

Los haplotipos son generalmente compartidos entre poblaciones, pero su frecuencia puede variar ampliamente. Se seleccionaron cuatro poblaciones para su inclusión en el HapMap: 30 tríos de adultos y ambos padres Yoruba de Ibadan , Nigeria (YRI), 30 tríos de residentes de Utah de ascendencia del norte y oeste de Europa (CEU), 44 individuos japoneses no relacionados de Tokio , Japón (JPT) y 45 individuos chinos Han no relacionados de Beijing , China (CHB). Aunque los haplotipos revelados a partir de estas poblaciones deberían ser útiles para estudiar muchas otras poblaciones, actualmente se están realizando estudios paralelos para examinar la utilidad de incluir poblaciones adicionales en el proyecto.

Todas las muestras se recogieron mediante un proceso de participación comunitaria con el consentimiento informado correspondiente. El proceso de participación comunitaria se diseñó para identificar y tratar de responder a las preocupaciones culturales específicas y brindar a las comunidades participantes aportes para el consentimiento informado y los procesos de recolección de muestras. ^[9]

En la fase III, se han reunido 11 grupos de ascendencia global: ASW (ascendencia africana en el suroeste de EE. UU.); CEU (residentes de Utah con ascendencia del norte y oeste de Europa de la colección CEPH); CHB (chinos han en Pekín, China); CHD (chinos en el área metropolitana de Denver, Colorado); GIH (indios gujarati en Houston, Texas); JPT (japoneses en Tokio, Japón); LWK (luhya en Webuye, Kenia); MEX (ascendencia mexicana en Los Ángeles, California); MKK (maasai en kinyawa, Kenia); TSI (toscanos en Italia); YRI (yoruba en Ibadan, Nigeria). ^[10]

También se han creado tres paneles combinados que permiten una mejor identificación de los SNP en grupos fuera de las nueve muestras homogéneas: CEU+TSI (panel combinado de residentes de Utah con ascendencia de Europa del Norte y del Oeste de la colección CEPH y toscanos en Italia); JPT+CHB (panel combinado de japoneses en Tokio, Japón y chinos han en Pekín, China) y JPT+CHB+CHD (panel combinado de japoneses en Tokio, Japón, chinos han en Pekín, China y chinos en el área metropolitana de Denver, Colorado). CEU+TSI, por ejemplo, es un mejor modelo de individuos británicos del Reino Unido que CEU solo. ^[10]

Estrategia científica

En los años 90, secuenciar el genoma completo de los pacientes era muy costoso, por lo que los Institutos Nacionales de Salud adoptaron la idea de un "atajo", que consistía en examinar únicamente los lugares del genoma en los que muchas personas tienen una unidad de ADN variante. La teoría que sustentaba el atajo era que, como las enfermedades más importantes son comunes, también lo serían las variantes genéticas que las causaban. La selección natural mantiene el genoma humano libre de variantes que dañan la salud antes de que los niños crezcan, según la teoría, pero no funciona contra las variantes que atacan más tarde en la vida, lo que permite que se vuelvan bastante comunes (en 2002, los Institutos Nacionales de Salud iniciaron un proyecto de 138 millones de dólares llamado HapMap para catalogar las variantes comunes en los genomas de Europa, Asia oriental y África). ^[11]

En la Fase I, se genotipificó un SNP común cada 5000 bases. En total, se genotipificaron más de un millón de SNP. La genotipificación se llevó a cabo en 10 centros utilizando cinco tecnologías de genotipificación diferentes. La calidad de la genotipificación se evaluó utilizando muestras duplicadas o relacionadas y realizando controles de calidad periódicos en los que los centros tuvieron que genotipar conjuntos comunes de SNP.

El equipo canadiense estuvo dirigido por Thomas J. Hudson en la Universidad McGill de Montreal y se centró en los cromosomas 2 y 4p. El equipo chino estuvo dirigido por Huanming Yang en Pekín y Shanghái , y Lap-Chee Tsui en Hong Kong , y se centró en los cromosomas 3, 8p y 21. El equipo japonés estuvo dirigido por Yusuke Nakamura en la Universidad de Tokio y se centró en los cromosomas 5, 11, 14, 15, 16, 17 y 19. El equipo británico estuvo dirigido por David R. Bentley en el Instituto Sanger y se centró en los cromosomas 1, 6, 10, 13 y 20. Había cuatro centros de genotipado de Estados Unidos: un equipo dirigido por Mark Chee y Arnold Oliphant en Illumina Inc. en San Diego (estudiando los cromosomas 8q, 9, 18q, 22 y X), un equipo dirigido por David Altshuler y Mark Daly en el Instituto Broad en Cambridge, EE. UU. (cromosomas 4q, 7q, 18p, Y y mitocondria ), un equipo dirigido por Richard Gibbs en el Baylor College of Medicine en Houston (cromosoma 12), y un equipo dirigido por Pui-Yan Kwok en la Universidad de California, San Francisco (cromosoma 7p).

Para obtener suficientes SNP para crear el Mapa, el Consorcio financió un gran proyecto de resecuenciación para descubrir millones de SNP adicionales. Estos se enviaron a la base de datos pública dbSNP . Como resultado, en agosto de 2006, la base de datos incluía más de diez millones de SNP, y se sabía que más del 40% de ellos eran polimórficos . En comparación, al comienzo del proyecto, se identificaron menos de 3 millones de SNP, y no se sabía que más del 10% de ellos fueran polimórficos.

Durante la Fase II, David R. Cox, Kelly A. Frazer y otros en Perlegen Sciences genotipificaron más de dos millones de SNP adicionales en todo el genoma y la empresa Affymetrix genotipificó otros 500.000 .

Acceso a datos

Todos los datos generados por el proyecto, incluyendo frecuencias de SNP, genotipos y haplotipos , se colocaron en el dominio público y están disponibles para su descarga. ^[12] Este sitio web también contiene un navegador de genoma que permite encontrar SNP en cualquier región de interés, sus frecuencias alélicas y su asociación con SNP cercanos. También se proporciona una herramienta que puede determinar SNP de etiqueta para una región de interés dada. También se puede acceder a estos datos directamente desde el programa Haploview ampliamente utilizado.

Publicaciones

Consorcio Internacional HapMap (2003). "El Proyecto Internacional HapMap" (PDF) . Nature . 426 (6968): 789–796. Bibcode :2003Natur.426..789G. doi :10.1038/nature02168. hdl : 2027.42/62838 . PMID 14685227. S2CID 4387110.
Consorcio Internacional HapMap (2004). "Integración de la ética y la ciencia en el Proyecto Internacional HapMap". Nature Reviews Genetics . 5 (6): 467–475. doi :10.1038/nrg1351. PMC 2271136 . PMID 15153999.
Consorcio Internacional HapMap (2005). "Un mapa de haplotipos del genoma humano". Nature . 437 (7063): 1299–1320. Bibcode :2005Natur.437.1299T. doi :10.1038/nature04226. PMC 1880871 . PMID 16255080.
Consorcio Internacional HapMap (2007). "Un mapa de haplotipos humanos de segunda generación de más de 3,1 millones de SNP". Nature . 449 (7164): 851–861. Bibcode :2007Natur.449..851F. doi :10.1038/nature06258. PMC 2689609 . PMID 17943122.
Consorcio Internacional HapMap 3 (2010). «Integración de la variación genética común y rara en diversas poblaciones humanas». Nature . 467 (7311): 52–58. Bibcode :2010Natur.467...52T. doi :10.1038/nature09298. PMC 3173859 . PMID 20811451.{{cite journal}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
Deloukas P, Bentley D (2004). "El proyecto HapMap y su aplicación a los estudios genéticos de la respuesta a fármacos". The Pharmacogenomics Journal . 4 (2): 88–90. doi :10.1038/sj.tpj.6500226. PMID 14676823.
Thorisson GA, Smith AV, Krishnan L, Stein LD (2005). "El sitio web del Proyecto Internacional HapMap". Genome Research . 15 (11): 1592–1593. doi :10.1101/gr.4413105. PMC 1310647 . PMID 16251469.
Terwilliger JD, Hiekkalinna T (2006). "Una refutación total del 'teorema fundamental del HapMap'". Revista europea de genética humana . 14 (4): 426–437. doi : 10.1038/sj.ejhg.5201583 . PMID 16479260.
Secko, David (2005). "Fase I del HapMap completa" Archivado el 14 de mayo de 2011 en Wayback Machine . El científico

Véase también

Referencias

^ Altshuler, David; Donnelly, Peter; The International HapMap Consortium (octubre de 2005). "Un mapa de haplotipos del genoma humano". Nature . 437 (7063): 1299–1320. Bibcode :2005Natur.437.1299T. doi : 10.1038/nature04226 . ISSN 1476-4687. PMC 1880871 . PMID 16255080.
^ Frazer, Kelly A.; Ballinger, Dennis G.; Cox, David R.; Hinds, David A.; Stuve, Laura L.; Gibbs, Richard A.; Belmont, John W.; Boudreau, Andrew; Hardenbol, Paul; Leal, Suzanne M.; Pasternak, Shiran (octubre de 2007). "Un mapa de haplotipos humanos de segunda generación de más de 3,1 millones de SNP". Nature . 449 (7164): 851–861. Bibcode :2007Natur.449..851F. doi :10.1038/nature06258. hdl : 2027.42/62863 . ISSN 1476-4687. PMC 2689609 . PMID 17943122.
^ Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Dermitzakis, Emmanouil; Schaffner, Stephen F.; Yu, Fuli; Peltonen, Leena; Dermitzakis, Emmanouil (septiembre de 2010). "Integración de la variación genética común y rara en diversas poblaciones humanas". Nature . 467 (7311): 52–58. Bibcode :2010Natur.467...52T. doi :10.1038/nature09298. ISSN 1476-4687. PMC 3173859 . PMID 20811451.
^ Crouch, Daniel JM; Bodmer, Walter F. (11 de agosto de 2020). "Herencia poligénica, GWAS, puntuaciones de riesgo poligénico y búsqueda de variantes funcionales". Actas de la Academia Nacional de Ciencias . 117 (32): 18924–18933. Bibcode :2020PNAS..11718924C. doi : 10.1073/pnas.2005634117 . PMC 7431089 . PMID 32753378.
^ "Alelo". Genome.gov . Instituto Nacional de Investigación del Genoma Humano.
^ El Consorcio Internacional HapMap (diciembre de 2003). "El Proyecto Internacional HapMap". Nature . 426 (6968): 789–796. doi : 10.1038/nature02168 . hdl : 2027.42/62838 . PMID 14685227. S2CID 8151693.
^ Deng, Tianyu; Zhang, Pengfei; Garrick, Dorian; Gao, Huijiang; Wang, Lixian; Zhao, Fuping (2022). "Comparación de la imputación de genotipos para matrices de SNP y datos de secuenciación de genoma completo de baja cobertura". Frontiers in Genetics . 12 : 704118. doi : 10.3389/fgene.2021.704118 . PMC 8762119 . PMID 35046990.
^ "Haplotipo". Genome.gov . Instituto Nacional de Investigación del Genoma Humano . Consultado el 25 de junio de 2022 .
^ Rotimi, Charles; Leppert, Mark; Matsuda, Ichiro; Zeng, Changqing; Zhang, Houcan; Adebamowo, Clement; Ajayi, Ike; Aniagwu, Toyin; Dixon, Missy; Fukushima, Yoshimitsu; Macer, Darryl (2007). "Participación comunitaria y consentimiento informado en el proyecto internacional HapMap". Public Health Genomics . 10 (3): 186–198. doi :10.1159/000101761. ISSN 1662-4246. PMID 17575464. S2CID 10844405.
^ ab International HapMap consortium et al. (2010). Integración de la variación genética común y rara en diversas poblaciones humanas. Nature , 467 , 52-8. doi
^ Naidoo N, Pawitan Y, Soong R, Cooper DN, Ku CS (octubre de 2011). "Genética humana y genómica una década después de la publicación del borrador de la secuencia del genoma humano". Genómica humana . 5 (6): 577–622. doi : 10.1186/1479-7364-5-6-577 . PMC 3525251 . PMID 22155605.
^ Thorisson, Gudmundur A.; Smith, Albert V.; Krishnan, Lalitha; Stein, Lincoln D. (1 de noviembre de 2005). "El sitio web del Proyecto Internacional HapMap". Genome Research . 15 (11): 1592–1593. doi :10.1101/gr.4413105. ISSN 1088-9051. PMC 1310647 . PMID 16251469.

Enlaces externos

Proyecto Internacional HapMap (Página de inicio de HapMap) Archivado el 16 de abril de 2014 en Wayback Machine.
Página HapMap del Instituto Nacional de Investigación del Genoma Humano (NHGRI)
Exploración de datos de HapMap mediante el explorador de genoma
Proyecto de Diversidad Genómica Mexicana