stringtranslate.com

Identidad por descendencia

Un segmento de ADN es idéntico por estado (IBS) en dos o más individuos si tienen secuencias de nucleótidos idénticas en este segmento. Un segmento de SII es idéntico por descendencia ( EII ) en dos o más individuos si lo han heredado de un ancestro común sin recombinación , es decir, el segmento tiene el mismo origen ancestral en estos individuos. Los segmentos de ADN que son IBD son IBD por definición, pero los segmentos que no son IBD aún pueden ser IBS debido a las mismas mutaciones en diferentes individuos o recombinaciones que no alteran el segmento. [ cita necesaria ]

El origen de los segmentos de IBD se representa mediante un pedigrí.
El origen de los segmentos de IBD se representa mediante un pedigrí.
El origen de los segmentos de IBD se representa mediante un pedigrí.
Una versión para daltónicos de esta imagen.

Teoría

Todos los individuos de una población finita están relacionados si se les rastrea lo suficiente y, por lo tanto, compartirán segmentos de sus genomas IBD. Durante la meiosis, los segmentos de IBD se rompen mediante recombinación. Por lo tanto, la longitud esperada de un segmento de IBD depende del número de generaciones desde el ancestro común más reciente en el lugar del segmento. La longitud de los segmentos de IBD que resultan de un ancestro común de n generaciones en el pasado (por lo tanto, implican 2 n meiosis) se distribuye exponencialmente con una media de 1/(2 n ) Morgans (M). [1] El número esperado de segmentos de IBD disminuye con el número de generaciones desde el ancestro común en este locus. Para un segmento de ADN específico, la probabilidad de ser EII disminuye como 2 −2 n ya que en cada meiosis la probabilidad de transmitir este segmento es 1/2. [2]

Aplicaciones

Los segmentos de IBD identificados se pueden utilizar para una amplia gama de propósitos. Como se señaló anteriormente, la cantidad (duración y número) de EII compartida depende de las relaciones familiares entre los individuos evaluados. Por lo tanto, una aplicación de la detección de segmentos de EII es cuantificar la relación. [3] [4] [5] [6] La medición de la relación se puede utilizar en genética forense , [7] pero también puede aumentar la información en el mapeo de vínculos genéticos [3] [8] y ayudar a disminuir el sesgo por relaciones no documentadas en estándares estudios de asociación . [6] [9] Otra aplicación de la EII es la imputación del genotipo y la inferencia de fase del haplotipo . [10] [11] [12] Los segmentos largos compartidos de EII, que están divididos en regiones cortas, pueden ser indicativos de errores de fase. [5] [13] : SI 

mapeo de EII

El mapeo de EII [3] es similar al análisis de vinculación, pero se puede realizar sin un pedigrí conocido en una cohorte de individuos no relacionados. El mapeo de EII puede verse como una nueva forma de análisis de asociación que aumenta el poder de mapear genes o regiones genómicas que contienen múltiples variantes de susceptibilidad a enfermedades raras. [6] [14]

Utilizando datos simulados, Browning y Thompson demostraron que el mapeo de la EII tiene mayor poder que las pruebas de asociación cuando múltiples variantes raras dentro de un gen contribuyen a la susceptibilidad a la enfermedad. [14] A través del mapeo de EII, se encontraron regiones significativas de todo el genoma en poblaciones aisladas, así como poblaciones exógenas, mientras que las pruebas de asociación estándar fallaron. [11] [15] Houwen et al. utilizaron el intercambio de EII para identificar la ubicación cromosómica de un gen responsable de la colestasis intrahepática recurrente benigna en una población pesquera aislada. [16] Kenny y otros. También utilizó una población aislada para mapear con precisión una señal encontrada en un estudio de asociación de todo el genoma (GWAS) de los niveles de esteroles vegetales en plasma (PPS), una medida sustituta de la absorción de colesterol en el intestino. [17] Francks y cols. pudo identificar un locus de susceptibilidad potencial para la esquizofrenia y el trastorno bipolar con datos de genotipo de muestras de casos y controles. [18] Lin et al. encontró una señal de vinculación significativa en todo el genoma en un conjunto de datos de pacientes con esclerosis múltiple . [19] Letouzé et al. utilizó el mapeo de IBD para buscar mutaciones fundadoras en muestras de cáncer . [20]

Un segmento de EII identificado por HapFABIA en los 1000 Genomas
Un segmento de EII identificado por HapFABIA en genomas asiáticos. Las raras variantes de un solo nucleótido (SNV) que marcan el segmento de IBD están coloreadas en violeta. Debajo de la barra turquesa, se muestra el segmento de EII en genomas antiguos.

EII en genética de poblaciones

La detección de la selección natural en el genoma humano también es posible mediante segmentos de IBD detectados. La selección normalmente tenderá a aumentar el número de segmentos de EII entre los individuos de una población. Al buscar regiones con exceso de EII compartida, se pueden identificar regiones del genoma humano que han estado bajo una selección fuerte y muy reciente. [21] [22]

Además de eso, los segmentos de EII pueden resultar útiles para medir e identificar otras influencias en la estructura de la población. [6] [23] [24] [25] [26] Gusev et al. demostró que los segmentos de IBD se pueden utilizar con modelos adicionales para estimar la historia demográfica, incluidos los cuellos de botella y la mezcla . [24] Utilizando modelos similares Palamara et al. y Carmi et al. Reconstruyó la historia demográfica de los judíos asquenazíes y los masai de Kenia . [25] [26] [27] Botigué et al. investigó las diferencias en la ascendencia africana entre las poblaciones europeas. [28] Ralph y Coop utilizaron la detección de EII para cuantificar la ascendencia común de diferentes poblaciones europeas [29] y Gravel et al. De manera similar intentó sacar conclusiones de la historia genética de las poblaciones de las Américas. [30] Ringbauer et al. utilizaron la estructura geográfica de los segmentos de EII para estimar la dispersión dentro de Europa del Este durante los últimos siglos. [31] Utilizando los datos de 1000 genomas, Hochreiter encontró diferencias en el intercambio de EII entre poblaciones africanas, asiáticas y europeas, así como segmentos de EII que se comparten con genomas antiguos como el neandertal o el Denisova . [13]

Métodos y software

Programas para la detección de segmentos de EII en individuos no emparentados:

Ver también

Referencias

  1. ^ Browning, SR (2008). "Estimación de la identidad por pares por descendencia a partir de datos densos de marcadores genéticos en una muestra de población de haplotipos". Genética . 178 (4): 2123–2132. doi :10.1534/genética.107.084624. PMC  2323802 . PMID  18430938.
  2. ^ Thompson, EA (2008). "El proceso de la EII a lo largo de cuatro cromosomas". Biología Teórica de Poblaciones . 73 (3): 369–373. doi :10.1016/j.tpb.2007.11.011. PMC 2518088 . PMID  18282591. 
  3. ^ abcd Albrechtsen, A.; Arena Korneliussen, T.; Moltke, I.; Van supervisa Hansen, T.; Nielsen, FC; Nielsen, R. (2009). "Mapeo de relaciones y tramos de relaciones para datos de todo el genoma en presencia de desequilibrio de ligamiento". Epidemiología genética . 33 (3): 266–274. doi :10.1002/gepi.20378. PMID  19025785. S2CID  12029712.
  4. ^ Browning, SR; Browning, BL (2010). "Detección de identidad por ascendencia en alta resolución en individuos no emparentados". La Revista Estadounidense de Genética Humana . 86 (4): 526–539. doi :10.1016/j.ajhg.2010.02.021. PMC 2850444 . PMID  20303063. 
  5. ^ abc Gusev, A.; Lowe, JK; Stoffel, M.; Daly, MJ; Altshuler, D.; Breslow, JL; Friedman, JM; Pe'Er, I. (2008). "Toda la población, mapeo de relaciones ocultas en todo el genoma". Investigación del genoma . 19 (2): 318–326. doi :10.1101/gr.081398.108. PMC 2652213 . PMID  18971310. 
  6. ^ abcde Purcell, S.; Neale, B.; Todd-Brown, K.; Tomás, L.; Ferreira, MAR; Bender, D.; Maller, J.; Sklar, P.; De Bakker, PIW; Daly, MJ; Sham, ordenador personal (2007). "PLINK: un conjunto de herramientas para análisis de vinculación poblacional y de asociación del genoma completo". La Revista Estadounidense de Genética Humana . 81 (3): 559–575. doi :10.1086/519795. PMC 1950838 . PMID  17701901. 
  7. ^ Ian W. Evett; Bruce S. Weir (enero de 1998). Interpretación de la evidencia de ADN: genética estadística para científicos forenses. Sinauer Asociados, Incorporada. ISBN 978-0-87893-155-2.
  8. ^ Leutenegger, A.; Prüm, B.; Genin, E.; Verny, C.; Lemainque, A.; Clergetdarpoux, F.; Thompson, E. (2003). "Estimación del coeficiente de endogamia mediante el uso de datos genómicos". La Revista Estadounidense de Genética Humana . 73 (3): 516–523. doi :10.1086/378207. PMC 1180677 . PMID  12900793. 
  9. ^ Voight, mejor amigo; Pritchard, JK (2005). "Confusión de relaciones crípticas en estudios de asociación de casos y controles". PLOS Genética . 1 (3): e32. doi : 10.1371/journal.pgen.0010032 . PMC 1200427 . PMID  16151517. 
  10. ^ Kong, A.; Masón, G.; Frigge, ML; Gylfason, A.; Zusmanovich, P.; Thorleifsson, G.; Olason, PI; Ingason, A.; Steinberg, S.; Rafnar, T.; Sulem, P.; Mouy, M.; Jonsson, F.; Thorsteinsdóttir, U.; Gudbjartsson, DF; Stefansson, H.; Stefansson, K. (2008). "Detección de compartición por descendencia, fase de largo alcance e imputación de haplotipos". Genética de la Naturaleza . 40 (9): 1068-1075. doi :10.1038/ng.216. PMC 4540081 . PMID  19165921. 
  11. ^ ab Gusev, A.; Shah, MJ; Kenny, EE; Ramachandran, A.; Lowe, JK; Salit, J.; Lee, CC; Levandowsky, CE; Tejedor, Tennessee; Doan, control de calidad; Peckham, ÉL; McLaughlin, SF; Lyon, señor; Sheth, VN; Stoffel, M.; De La Vega, FM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "Secuenciación de paso bajo de todo el genoma e inferencia de variantes utilizando identidad por descendencia en una población humana aislada". Genética . 190 (2): 679–689. doi :10.1534/genética.111.134874. PMC 3276614 . PMID  22135348. 
  12. ^ Browning, BL; Browning, SR (2009). "Un enfoque unificado para la imputación de genotipo y la inferencia de fase de haplotipo para grandes conjuntos de datos de tríos e individuos no relacionados". La Revista Estadounidense de Genética Humana . 84 (2): 210–223. doi :10.1016/j.ajhg.2009.01.005. PMC 2668004 . PMID  19200528. 
  13. ^ abc Hochreiter, S. (2013). "HapFABIA: Identificación de segmentos muy cortos de identidad por descendencia caracterizados por variantes raras en grandes datos de secuenciación". Investigación de ácidos nucleicos . 41 (22): e202. doi : 10.1093/nar/gkt1013. PMC 3905877 . PMID  24174545. 
  14. ^ ab Browning, SR; Thompson, EA (2012). "Detección de asociaciones de variantes raras mediante mapeo de identidad por descendencia en estudios de casos y controles". Genética . 190 (4): 1521-1531. doi :10.1534/genética.111.136937. PMC 3316661 . PMID  22267498. 
  15. ^ ab Gusev, A.; Kenny, EE; Lowe, JK; Salit, J.; Saxena, R.; Kathiresan, S.; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "DASH: un método para el mapeo de haplotipos idénticos por descendencia descubre una asociación con variaciones recientes". La Revista Estadounidense de Genética Humana . 88 (6): 706–717. doi :10.1016/j.ajhg.2011.04.023. PMC 3113343 . PMID  21620352. 
  16. ^ Houwen, RHJ; Baharloo, S.; Blankenship, K.; Raeymaekers, P.; Juyn, J.; Sandkuijl, Luisiana; Freimer, NB (1994). "Detección del genoma mediante la búsqueda de segmentos compartidos: mapeo de un gen para la colestasis intrahepática recurrente benigna". Genética de la Naturaleza . 8 (4): 380–386. doi :10.1038/ng1294-380. hdl : 1765/55192 . PMID  7894490. S2CID  8131209.
  17. ^ Kenny, EE; Gusev, A.; Riegel, K.; Lutjohann, D.; Lowe, JK; Salit, J.; Maller, JB; Stoffel, M.; Daly, MJ; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I.; Sehayek, E. (2009). "El análisis sistemático de haplotipos resuelve un locus complejo de esteroles vegetales plasmáticos en la isla micronesia de Kosrae". Procedimientos de la Academia Nacional de Ciencias . 106 (33): 13886–13891. Código Bib : 2009PNAS..10613886K. doi : 10.1073/pnas.0907336106 . PMC 2728990 . PMID  19667188. 
  18. ^ Franck, C.; Tozzi, F.; Granjero, A.; Vicente, JB; Rujescu, D.; Santa Clara, D.; Muglia, P. (2008). "El análisis de vinculación poblacional de esquizofrenia y cohortes de casos y controles bipolares identifica un locus de susceptibilidad potencial en 19q13". Psiquiatría molecular . 15 (3): 319–325. doi : 10.1038/mp.2008.100 . hdl : 11858/00-001M-0000-0012-C935-9 . PMID  18794890.
  19. ^ Lin, R.; Charlesworth, J.; Stankovich, J.; Perreau, VM; Marrón, MA; Anzgene, BV; Taylor, BV (2013). Toland, Amanda Ewart (ed.). "Mapeo de identidad por descendencia para detectar variantes raras que confieren susceptibilidad a la esclerosis múltiple". MÁS UNO . 8 (3): e56379. Código Bib : 2013PLoSO...856379L. doi : 10.1371/journal.pone.0056379 . PMC 3589405 . PMID  23472070. 
  20. ^ Letouzé, E.; Cerda, A.; Petel, F.; Rosati, R.; Figueiredo, BC; Burnichon, N.; Giménez-Roqueplo, AP; Lalli, E.; De Reyniès, AL (2012). Mailund, Thomas (ed.). "Mapeo de identidad por descendencia de mutaciones fundadoras en el cáncer utilizando datos de SNP tumorales de alta resolución". MÁS UNO . 7 (5): e35897. Código Bib : 2012PLoSO...735897L. doi : 10.1371/journal.pone.0035897 . PMC 3342326 . PMID  22567117. 
  21. ^ Albrechtsen, A.; Moltke, I.; Nielsen, R. (2010). "Selección natural y distribución de la identidad por descendencia en el genoma humano". Genética . 186 (1): 295–308. doi :10.1534/genética.110.113977. PMC 2940294 . PMID  20592267. 
  22. ^ Han, L.; Abney, M. (2011). "Estimación de identidad por descendencia con datos densos de genotipo de todo el genoma". Epidemiología genética . 35 (6): 557–567. doi :10.1002/gepi.20606. PMC 3587128 . PMID  21769932. 
  23. ^ Cockerham, CC; Vertedero, BS (1983). "Varianza de la endogamia real". Biología Teórica de Poblaciones . 23 (1): 85-109. doi :10.1016/0040-5809(83)90006-0. PMID  6857551.
  24. ^ ab Gusev, A.; Palamara, PF; Aponte, G.; Zhuang, Z.; Darvasi, A.; Gregersen, P.; Pe'Er, I. (2011). "La arquitectura de haplotipos de largo alcance compartida dentro y entre poblaciones". Biología Molecular y Evolución . 29 (2): 473–486. doi :10.1093/molbev/msr133. PMC 3350316 . PMID  21984068. 
  25. ^ ab Palamara, PF; Lencz, T.; Darvasi, A.; Pe'Er, I. (2012). "Las distribuciones de longitud de la identidad por ascendencia revelan una historia demográfica a gran escala". La Revista Estadounidense de Genética Humana . 91 (5): 809–822. doi :10.1016/j.ajhg.2012.08.030. PMC 3487132 . PMID  23103233. 
  26. ^ ab Palamara, PF; Pe'Er, I. (2013). "Inferencia de tasas de migración históricas mediante el intercambio de haplotipos". Bioinformática . 29 (13): i180–i188. doi : 10.1093/bioinformática/btt239. PMC 3694674 . PMID  23812983. 
  27. ^ Carmi, S.; Palamara, PF; Vacić, V.; Lencz, T.; Darvasi, A.; Pe'Er, I. (2013). "La variación del intercambio de identidad por descendencia en el modelo Wright-Fisher". Genética . 193 (3): 911–928. arXiv : 1206.4745 . doi :10.1534/genética.112.147215. PMC 3584006 . PMID  23267057. 
  28. ^ Botigue, LR; Henn, BM; Grava, S.; Arces, BK; Gignoux, CR; Corona, E.; Atzmon, G.; Quemaduras, E.; Ostrer, H.; Flores, C.; Bertranpetit, J.; Comas, D.; Bustamante, CD (2013). "El flujo de genes del norte de África contribuye a la diversidad genética humana diferencial en el sur de Europa". Procedimientos de la Academia Nacional de Ciencias . 110 (29): 11791–11796. Código Bib : 2013PNAS..11011791B. doi : 10.1073/pnas.1306223110 . PMC 3718088 . PMID  23733930. 
  29. ^ Ralph, P.; Cooperativa, G. (2013). Tyler-Smith, Chris (ed.). "La geografía de la ascendencia genética reciente en Europa". Más biología . 11 (5): e1001555. doi : 10.1371/journal.pbio.1001555 . PMC 3646727 . PMID  23667324. 
  30. ^ Grava, S.; Zakaria, F.; Moreno-Estrada, A.; Byrnes, JK; Muzzio, M.; Rodríguez-Flores, JL; Kenny, EE; Gignoux, CR; Arces, BK; Guiblet, W.; Dutil, J.; Vía, M.; Sandoval, K.; Bedoya, G.; 1000 genomas, conocimientos tradicionales; Oleksyk, A.; Ruiz-Linares, EG; Burchard, JC; Martínez-Cruzado, CD; Bustamante, CD (2013). Williams, Scott M (ed.). "Reconstrucción de las migraciones de nativos americanos a partir de datos del genoma completo y del exoma completo". PLOS Genética . 9 (12): e1004023. arXiv : 1306.4021 . doi : 10.1371/journal.pgen.1004023 . PMC 3873240 . PMID  24385924. {{cite journal}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  31. ^ Ringbauer, Harald; Cooper, Graham; Barton, Nicholas H. (1 de marzo de 2017). "Inferir demografía reciente a partir del aislamiento por la distancia de bloques de secuencia compartidos largos". Genética . 205 (3): 1335-1351. doi :10.1534/genética.116.196220. ISSN  0016-6731. PMC 5340342 . PMID  28108588. 
  32. ^ Naseri A, Liu X, Zhang S, Zhi D. Identidad ultrarrápida mediante detección de descenso en cohortes a escala de biobanco utilizando madrigueras posicionales: transformación de Wheeler BioRxiv 2017.
  33. ^ Rodríguez JM, Batzoglou S, Bercovici S. Un método preciso para inferir parentesco en grandes conjuntos de datos de genotipos sin fases mediante una prueba de índice de probabilidad integrada. RECOMB 2013, LNBI 7821:212-229.
  34. ^ Browning, BL; Browning, SR (2011). "Un método rápido y potente para detectar la identidad por ascendencia". La Revista Estadounidense de Genética Humana . 88 (2): 173–182. doi :10.1016/j.ajhg.2011.01.010. PMC 3035716 . PMID  21310274. 
  35. ^ Browning, BL; Browning, SR (2013). "Mejora de la precisión y eficiencia de la detección de identidad por ascendencia en datos de población". Genética . 194 (2): 459–471. doi :10.1534/genética.113.150029. PMC 3664855 . PMID  23535385. 
  36. ^ Browning, BL; Browning, SR (2013). "Detección de identidad por ascendencia y estimación de tasas de error de genotipo en datos de secuencia". La Revista Estadounidense de Genética Humana . 93 (5): 840–851. doi :10.1016/j.ajhg.2013.09.014. PMC 3824133 . PMID  24207118. 
  37. ^ Moltke, yo; Albrechtsen, A.; Hansen, TVO; Nielsen, FC; Nielsen, R. (2011). "Un método para detectar regiones de EII simultáneamente en varios individuos, con aplicaciones a la genética de enfermedades". Investigación del genoma . 21 (7): 1168-1180. doi :10.1101/gr.115360.110. PMC 3129259 . PMID  21493780. 
  38. ^ Él, D. (2013). "IBD-Groupon: un método eficaz para detectar regiones de identidad por descendencia a nivel de grupo simultáneamente en varios individuos en función de relaciones IBD por pares". Bioinformática . 29 (13): i162-i170. doi : 10.1093/bioinformática/btt237. PMC 3694672 . PMID  23812980.