Secuencia de nucleótidos idéntica debido a herencia sin recombinación de un ancestro común
Un segmento de ADN es idéntico por estado (IBS) en dos o más individuos si tienen secuencias de nucleótidos idénticas en este segmento. Un segmento de SII es idéntico por descendencia ( EII ) en dos o más individuos si lo han heredado de un ancestro común sin recombinación , es decir, el segmento tiene el mismo origen ancestral en estos individuos. Los segmentos de ADN que son IBD son IBD por definición, pero los segmentos que no son IBD aún pueden ser IBS debido a las mismas mutaciones en diferentes individuos o recombinaciones que no alteran el segmento. [ cita necesaria ]
Teoría
Todos los individuos de una población finita están relacionados si se les rastrea lo suficiente y, por lo tanto, compartirán segmentos de sus genomas IBD. Durante la meiosis, los segmentos de IBD se rompen mediante recombinación. Por lo tanto, la longitud esperada de un segmento de IBD depende del número de generaciones desde el ancestro común más reciente en el lugar del segmento. La longitud de los segmentos de IBD que resultan de un ancestro común de n generaciones en el pasado (por lo tanto, implican 2 n meiosis) se distribuye exponencialmente con una media de 1/(2 n ) Morgans (M). [1] El número esperado de segmentos de IBD disminuye con el número de generaciones desde el ancestro común en este locus. Para un segmento de ADN específico, la probabilidad de ser EII disminuye como 2 −2 n ya que en cada meiosis la probabilidad de transmitir este segmento es 1/2. [2]
Aplicaciones
Los segmentos de IBD identificados se pueden utilizar para una amplia gama de propósitos. Como se señaló anteriormente, la cantidad (duración y número) de EII compartida depende de las relaciones familiares entre los individuos evaluados. Por lo tanto, una aplicación de la detección de segmentos de EII es cuantificar la relación. [3] [4] [5] [6] La medición de la relación se puede utilizar en genética forense , [7] pero también puede aumentar la información en el mapeo de vínculos genéticos [3] [8] y ayudar a disminuir el sesgo por relaciones no documentadas en estándares estudios de asociación . [6] [9]
Otra aplicación de la EII es la imputación del genotipo y la inferencia de fase del haplotipo . [10] [11] [12] Los segmentos largos compartidos de EII, que están divididos en regiones cortas, pueden ser indicativos de errores de fase. [5] [13] : SI
mapeo de EII
El mapeo de EII [3] es similar al análisis de vinculación, pero se puede realizar sin un pedigrí conocido en una cohorte de individuos no relacionados. El mapeo de EII puede verse como una nueva forma de análisis de asociación que aumenta el poder de mapear genes o regiones genómicas que contienen múltiples variantes de susceptibilidad a enfermedades raras. [6] [14]
Utilizando datos simulados, Browning y Thompson demostraron que el mapeo de la EII tiene mayor poder que las pruebas de asociación cuando múltiples variantes raras dentro de un gen contribuyen a la susceptibilidad a la enfermedad. [14] A través del mapeo de EII, se encontraron regiones significativas de todo el genoma en poblaciones aisladas, así como poblaciones exógenas, mientras que las pruebas de asociación estándar fallaron. [11] [15] Houwen et al. utilizaron el intercambio de EII para identificar la ubicación cromosómica de un gen responsable de la colestasis intrahepática recurrente benigna en una población pesquera aislada. [16] Kenny y otros. También utilizó una población aislada para mapear con precisión una señal encontrada en un estudio de asociación de todo el genoma (GWAS) de los niveles de esteroles vegetales en plasma (PPS), una medida sustituta de la absorción de colesterol en el intestino. [17] Francks y cols. pudo identificar un locus de susceptibilidad potencial para la esquizofrenia y el trastorno bipolar con datos de genotipo de muestras de casos y controles. [18] Lin et al. encontró una señal de vinculación significativa en todo el genoma en un conjunto de datos de pacientes con esclerosis múltiple . [19] Letouzé et al. utilizó el mapeo de IBD para buscar mutaciones fundadoras en muestras de cáncer . [20]
EII en genética de poblaciones
La detección de la selección natural en el genoma humano también es posible mediante segmentos de IBD detectados. La selección normalmente tenderá a aumentar el número de segmentos de EII entre los individuos de una población. Al buscar regiones con exceso de EII compartida, se pueden identificar regiones del genoma humano que han estado bajo una selección fuerte y muy reciente. [21] [22]
Además de eso, los segmentos de EII pueden resultar útiles para medir e identificar otras influencias en la estructura de la población. [6] [23] [24] [25] [26] Gusev et al. demostró que los segmentos de IBD se pueden utilizar con modelos adicionales para estimar la historia demográfica, incluidos los cuellos de botella y la mezcla . [24] Utilizando modelos similares Palamara et al. y Carmi et al. Reconstruyó la historia demográfica de los judíos asquenazíes y los masai de Kenia . [25] [26] [27] Botigué et al. investigó las diferencias en la ascendencia africana entre las poblaciones europeas. [28] Ralph y Coop utilizaron la detección de EII para cuantificar la ascendencia común de diferentes poblaciones europeas [29] y Gravel et al. De manera similar intentó sacar conclusiones de la historia genética de las poblaciones de las Américas. [30] Ringbauer et al. utilizaron la estructura geográfica de los segmentos de EII para estimar la dispersión dentro de Europa del Este durante los últimos siglos. [31] Utilizando los datos de 1000 genomas, Hochreiter encontró diferencias en el intercambio de EII entre poblaciones africanas, asiáticas y europeas, así como segmentos de EII que se comparten con genomas antiguos como el neandertal o el Denisova . [13]
Métodos y software
Programas para la detección de segmentos de EII en individuos no emparentados:
RAPID: Identidad ultrarrápida mediante detección de descenso en cohortes a escala de biobanco mediante transformación posicional de Burrows-Wheeler [32]
Parente: identifica segmentos de EII entre pares de individuos en datos de genotipo sin fases [33]
BEAGLE/fastIBD: encuentra segmentos de EII entre pares de individuos en datos de SNP de todo el genoma [34]
BEAGLE/RefinedIBD: encuentra segmentos de IBD en pares de individuos utilizando un método de hash y evalúa su importancia mediante una relación de probabilidad [35]
IBDseq: detecta segmentos de IBD por pares en datos de secuenciación [36]
GERMLINE: descubre en tiempo lineal segmentos de EII en pares de individuos [5]
DASH: se basa en segmentos de EII por pares para inferir grupos de individuos que probablemente compartan un solo haplotipo [15]
PLINK: es un conjunto de herramientas para la asociación del genoma completo y análisis de vinculación basados en la población que incluye un método para la detección de segmentos de EII por pares [6]
Relacionar: estima la probabilidad de EII entre pares de individuos en un locus específico utilizando SNP [3]
MCMC_IBDfinder: se basa en la cadena de Markov Monte Carlo (MCMC) para encontrar segmentos de EII en múltiples individuos [37]
IBD-Groupon: detecta segmentos de IBD grupales basándose en relaciones de IBD por pares [38]
HapFABIA: identifica segmentos de EII muy cortos caracterizados por variantes raras en grandes datos de secuenciación simultáneamente en varios individuos [13]
^ Browning, SR (2008). "Estimación de la identidad por pares por descendencia a partir de datos densos de marcadores genéticos en una muestra de población de haplotipos". Genética . 178 (4): 2123–2132. doi :10.1534/genética.107.084624. PMC 2323802 . PMID 18430938.
^ Thompson, EA (2008). "El proceso de la EII a lo largo de cuatro cromosomas". Biología Teórica de Poblaciones . 73 (3): 369–373. doi :10.1016/j.tpb.2007.11.011. PMC 2518088 . PMID 18282591.
^ abcd Albrechtsen, A.; Arena Korneliussen, T.; Moltke, I.; Van supervisa Hansen, T.; Nielsen, FC; Nielsen, R. (2009). "Mapeo de relaciones y tramos de relaciones para datos de todo el genoma en presencia de desequilibrio de ligamiento". Epidemiología genética . 33 (3): 266–274. doi :10.1002/gepi.20378. PMID 19025785. S2CID 12029712.
^ Browning, SR; Browning, BL (2010). "Detección de identidad por ascendencia en alta resolución en individuos no emparentados". La Revista Estadounidense de Genética Humana . 86 (4): 526–539. doi :10.1016/j.ajhg.2010.02.021. PMC 2850444 . PMID 20303063.
^ abc Gusev, A.; Lowe, JK; Stoffel, M.; Daly, MJ; Altshuler, D.; Breslow, JL; Friedman, JM; Pe'Er, I. (2008). "Toda la población, mapeo de relaciones ocultas en todo el genoma". Investigación del genoma . 19 (2): 318–326. doi :10.1101/gr.081398.108. PMC 2652213 . PMID 18971310.
^ abcde Purcell, S.; Neale, B.; Todd-Brown, K.; Tomás, L.; Ferreira, MAR; Bender, D.; Maller, J.; Sklar, P.; De Bakker, PIW; Daly, MJ; Sham, ordenador personal (2007). "PLINK: un conjunto de herramientas para análisis de vinculación poblacional y de asociación del genoma completo". La Revista Estadounidense de Genética Humana . 81 (3): 559–575. doi :10.1086/519795. PMC 1950838 . PMID 17701901.
^ Ian W. Evett; Bruce S. Weir (enero de 1998). Interpretación de la evidencia de ADN: genética estadística para científicos forenses. Sinauer Asociados, Incorporada. ISBN978-0-87893-155-2.
^ Leutenegger, A.; Prüm, B.; Genin, E.; Verny, C.; Lemainque, A.; Clergetdarpoux, F.; Thompson, E. (2003). "Estimación del coeficiente de endogamia mediante el uso de datos genómicos". La Revista Estadounidense de Genética Humana . 73 (3): 516–523. doi :10.1086/378207. PMC 1180677 . PMID 12900793.
^ Voight, mejor amigo; Pritchard, JK (2005). "Confusión de relaciones crípticas en estudios de asociación de casos y controles". PLOS Genética . 1 (3): e32. doi : 10.1371/journal.pgen.0010032 . PMC 1200427 . PMID 16151517.
^ Kong, A.; Masón, G.; Frigge, ML; Gylfason, A.; Zusmanovich, P.; Thorleifsson, G.; Olason, PI; Ingason, A.; Steinberg, S.; Rafnar, T.; Sulem, P.; Mouy, M.; Jonsson, F.; Thorsteinsdóttir, U.; Gudbjartsson, DF; Stefansson, H.; Stefansson, K. (2008). "Detección de compartición por descendencia, fase de largo alcance e imputación de haplotipos". Genética de la Naturaleza . 40 (9): 1068-1075. doi :10.1038/ng.216. PMC 4540081 . PMID 19165921.
^ ab Gusev, A.; Shah, MJ; Kenny, EE; Ramachandran, A.; Lowe, JK; Salit, J.; Lee, CC; Levandowsky, CE; Tejedor, Tennessee; Doan, control de calidad; Peckham, ÉL; McLaughlin, SF; Lyon, señor; Sheth, VN; Stoffel, M.; De La Vega, FM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "Secuenciación de paso bajo de todo el genoma e inferencia de variantes utilizando identidad por descendencia en una población humana aislada". Genética . 190 (2): 679–689. doi :10.1534/genética.111.134874. PMC 3276614 . PMID 22135348.
^ Browning, BL; Browning, SR (2009). "Un enfoque unificado para la imputación de genotipo y la inferencia de fase de haplotipo para grandes conjuntos de datos de tríos e individuos no relacionados". La Revista Estadounidense de Genética Humana . 84 (2): 210–223. doi :10.1016/j.ajhg.2009.01.005. PMC 2668004 . PMID 19200528.
^ abc Hochreiter, S. (2013). "HapFABIA: Identificación de segmentos muy cortos de identidad por descendencia caracterizados por variantes raras en grandes datos de secuenciación". Investigación de ácidos nucleicos . 41 (22): e202. doi : 10.1093/nar/gkt1013. PMC 3905877 . PMID 24174545.
^ ab Browning, SR; Thompson, EA (2012). "Detección de asociaciones de variantes raras mediante mapeo de identidad por descendencia en estudios de casos y controles". Genética . 190 (4): 1521-1531. doi :10.1534/genética.111.136937. PMC 3316661 . PMID 22267498.
^ ab Gusev, A.; Kenny, EE; Lowe, JK; Salit, J.; Saxena, R.; Kathiresan, S.; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "DASH: un método para el mapeo de haplotipos idénticos por descendencia descubre una asociación con variaciones recientes". La Revista Estadounidense de Genética Humana . 88 (6): 706–717. doi :10.1016/j.ajhg.2011.04.023. PMC 3113343 . PMID 21620352.
^ Houwen, RHJ; Baharloo, S.; Blankenship, K.; Raeymaekers, P.; Juyn, J.; Sandkuijl, Luisiana; Freimer, NB (1994). "Detección del genoma mediante la búsqueda de segmentos compartidos: mapeo de un gen para la colestasis intrahepática recurrente benigna". Genética de la Naturaleza . 8 (4): 380–386. doi :10.1038/ng1294-380. hdl : 1765/55192 . PMID 7894490. S2CID 8131209.
^ Kenny, EE; Gusev, A.; Riegel, K.; Lutjohann, D.; Lowe, JK; Salit, J.; Maller, JB; Stoffel, M.; Daly, MJ; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I.; Sehayek, E. (2009). "El análisis sistemático de haplotipos resuelve un locus complejo de esteroles vegetales plasmáticos en la isla micronesia de Kosrae". Procedimientos de la Academia Nacional de Ciencias . 106 (33): 13886–13891. Código Bib : 2009PNAS..10613886K. doi : 10.1073/pnas.0907336106 . PMC 2728990 . PMID 19667188.
^ Franck, C.; Tozzi, F.; Granjero, A.; Vicente, JB; Rujescu, D.; Santa Clara, D.; Muglia, P. (2008). "El análisis de vinculación poblacional de esquizofrenia y cohortes de casos y controles bipolares identifica un locus de susceptibilidad potencial en 19q13". Psiquiatría molecular . 15 (3): 319–325. doi : 10.1038/mp.2008.100 . hdl : 11858/00-001M-0000-0012-C935-9 . PMID 18794890.
^ Lin, R.; Charlesworth, J.; Stankovich, J.; Perreau, VM; Marrón, MA; Anzgene, BV; Taylor, BV (2013). Toland, Amanda Ewart (ed.). "Mapeo de identidad por descendencia para detectar variantes raras que confieren susceptibilidad a la esclerosis múltiple". MÁS UNO . 8 (3): e56379. Código Bib : 2013PLoSO...856379L. doi : 10.1371/journal.pone.0056379 . PMC 3589405 . PMID 23472070.
^ Letouzé, E.; Cerda, A.; Petel, F.; Rosati, R.; Figueiredo, BC; Burnichon, N.; Giménez-Roqueplo, AP; Lalli, E.; De Reyniès, AL (2012). Mailund, Thomas (ed.). "Mapeo de identidad por descendencia de mutaciones fundadoras en el cáncer utilizando datos de SNP tumorales de alta resolución". MÁS UNO . 7 (5): e35897. Código Bib : 2012PLoSO...735897L. doi : 10.1371/journal.pone.0035897 . PMC 3342326 . PMID 22567117.
^ Albrechtsen, A.; Moltke, I.; Nielsen, R. (2010). "Selección natural y distribución de la identidad por descendencia en el genoma humano". Genética . 186 (1): 295–308. doi :10.1534/genética.110.113977. PMC 2940294 . PMID 20592267.
^ Han, L.; Abney, M. (2011). "Estimación de identidad por descendencia con datos densos de genotipo de todo el genoma". Epidemiología genética . 35 (6): 557–567. doi :10.1002/gepi.20606. PMC 3587128 . PMID 21769932.
^ Cockerham, CC; Vertedero, BS (1983). "Varianza de la endogamia real". Biología Teórica de Poblaciones . 23 (1): 85-109. doi :10.1016/0040-5809(83)90006-0. PMID 6857551.
^ ab Gusev, A.; Palamara, PF; Aponte, G.; Zhuang, Z.; Darvasi, A.; Gregersen, P.; Pe'Er, I. (2011). "La arquitectura de haplotipos de largo alcance compartida dentro y entre poblaciones". Biología Molecular y Evolución . 29 (2): 473–486. doi :10.1093/molbev/msr133. PMC 3350316 . PMID 21984068.
^ ab Palamara, PF; Lencz, T.; Darvasi, A.; Pe'Er, I. (2012). "Las distribuciones de longitud de la identidad por ascendencia revelan una historia demográfica a gran escala". La Revista Estadounidense de Genética Humana . 91 (5): 809–822. doi :10.1016/j.ajhg.2012.08.030. PMC 3487132 . PMID 23103233.
^ ab Palamara, PF; Pe'Er, I. (2013). "Inferencia de tasas de migración históricas mediante el intercambio de haplotipos". Bioinformática . 29 (13): i180–i188. doi : 10.1093/bioinformática/btt239. PMC 3694674 . PMID 23812983.
^ Carmi, S.; Palamara, PF; Vacić, V.; Lencz, T.; Darvasi, A.; Pe'Er, I. (2013). "La variación del intercambio de identidad por descendencia en el modelo Wright-Fisher". Genética . 193 (3): 911–928. arXiv : 1206.4745 . doi :10.1534/genética.112.147215. PMC 3584006 . PMID 23267057.
^ Botigue, LR; Henn, BM; Grava, S.; Arces, BK; Gignoux, CR; Corona, E.; Atzmon, G.; Quemaduras, E.; Ostrer, H.; Flores, C.; Bertranpetit, J.; Comas, D.; Bustamante, CD (2013). "El flujo de genes del norte de África contribuye a la diversidad genética humana diferencial en el sur de Europa". Procedimientos de la Academia Nacional de Ciencias . 110 (29): 11791–11796. Código Bib : 2013PNAS..11011791B. doi : 10.1073/pnas.1306223110 . PMC 3718088 . PMID 23733930.
^ Ralph, P.; Cooperativa, G. (2013). Tyler-Smith, Chris (ed.). "La geografía de la ascendencia genética reciente en Europa". Más biología . 11 (5): e1001555. doi : 10.1371/journal.pbio.1001555 . PMC 3646727 . PMID 23667324.
^ Grava, S.; Zakaria, F.; Moreno-Estrada, A.; Byrnes, JK; Muzzio, M.; Rodríguez-Flores, JL; Kenny, EE; Gignoux, CR; Arces, BK; Guiblet, W.; Dutil, J.; Vía, M.; Sandoval, K.; Bedoya, G.; 1000 genomas, conocimientos tradicionales; Oleksyk, A.; Ruiz-Linares, EG; Burchard, JC; Martínez-Cruzado, CD; Bustamante, CD (2013). Williams, Scott M (ed.). "Reconstrucción de las migraciones de nativos americanos a partir de datos del genoma completo y del exoma completo". PLOS Genética . 9 (12): e1004023. arXiv : 1306.4021 . doi : 10.1371/journal.pgen.1004023 . PMC 3873240 . PMID 24385924.{{cite journal}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
^ Ringbauer, Harald; Cooper, Graham; Barton, Nicholas H. (1 de marzo de 2017). "Inferir demografía reciente a partir del aislamiento por la distancia de bloques de secuencia compartidos largos". Genética . 205 (3): 1335-1351. doi :10.1534/genética.116.196220. ISSN 0016-6731. PMC 5340342 . PMID 28108588.
^ Naseri A, Liu X, Zhang S, Zhi D. Identidad ultrarrápida mediante detección de descenso en cohortes a escala de biobanco utilizando madrigueras posicionales: transformación de Wheeler BioRxiv 2017.
^ Rodríguez JM, Batzoglou S, Bercovici S. Un método preciso para inferir parentesco en grandes conjuntos de datos de genotipos sin fases mediante una prueba de índice de probabilidad integrada. RECOMB 2013, LNBI 7821:212-229.
^ Browning, BL; Browning, SR (2011). "Un método rápido y potente para detectar la identidad por ascendencia". La Revista Estadounidense de Genética Humana . 88 (2): 173–182. doi :10.1016/j.ajhg.2011.01.010. PMC 3035716 . PMID 21310274.
^ Browning, BL; Browning, SR (2013). "Mejora de la precisión y eficiencia de la detección de identidad por ascendencia en datos de población". Genética . 194 (2): 459–471. doi :10.1534/genética.113.150029. PMC 3664855 . PMID 23535385.
^ Browning, BL; Browning, SR (2013). "Detección de identidad por ascendencia y estimación de tasas de error de genotipo en datos de secuencia". La Revista Estadounidense de Genética Humana . 93 (5): 840–851. doi :10.1016/j.ajhg.2013.09.014. PMC 3824133 . PMID 24207118.
^ Moltke, yo; Albrechtsen, A.; Hansen, TVO; Nielsen, FC; Nielsen, R. (2011). "Un método para detectar regiones de EII simultáneamente en varios individuos, con aplicaciones a la genética de enfermedades". Investigación del genoma . 21 (7): 1168-1180. doi :10.1101/gr.115360.110. PMC 3129259 . PMID 21493780.
^ Él, D. (2013). "IBD-Groupon: un método eficaz para detectar regiones de identidad por descendencia a nivel de grupo simultáneamente en varios individuos en función de relaciones IBD por pares". Bioinformática . 29 (13): i162-i170. doi : 10.1093/bioinformática/btt237. PMC 3694672 . PMID 23812980.