Mapeo de asociaciones

En genética, el mapeo de asociaciones , también conocido como " mapeo de desequilibrio de ligamiento ", es un método de mapeo de loci de rasgos cuantitativos (QTL) que aprovecha el desequilibrio de ligamiento histórico para vincular fenotipos (características observables) con genotipos (la constitución genética de los organismos), descubriendo asociaciones genéticas . ^[1]^[2]

Teoría

El mapeo de asociaciones se basa en la idea de que los rasgos que han entrado en una población recientemente seguirán estando vinculados a la secuencia genética circundante del ancestro evolutivo original, o en otras palabras, se encontrarán con mayor frecuencia dentro de un haplotipo determinado que fuera de él. La mayoría de las veces se realiza escaneando el genoma completo en busca de asociaciones significativas entre un panel de polimorfismos de un solo nucleótido (SNP) (que, en muchos casos, se colocan en portaobjetos de vidrio para crear " chips SNP ") y un fenotipo particular. Estas asociaciones deben verificarse luego de forma independiente para demostrar que (a) contribuyen directamente al rasgo de interés o (b) están vinculadas a/en desequilibrio de ligamiento con un locus de rasgo cuantitativo (QTL) que contribuye al rasgo de interés. ^[3]

El mapeo de asociaciones busca identificar variantes genéticas funcionales específicas (loci, alelos) vinculadas a diferencias fenotípicas en un rasgo para facilitar la detección de polimorfismos de secuencia de ADN que causan rasgos y la selección de genotipos que se asemejen estrechamente al fenotipo. Para identificar estas variantes funcionales, se requieren marcadores de alto rendimiento como los SNP. ^[4]

Usar

La ventaja del mapeo de asociación es que puede mapear rasgos cuantitativos con alta resolución de una manera que es estadísticamente muy poderosa. El mapeo de asociación, sin embargo, también requiere un amplio conocimiento de los SNP dentro del genoma del organismo de interés y, por lo tanto, es difícil de realizar en especies que no han sido bien estudiadas o no tienen genomas bien anotados . ^[5] El mapeo de asociación se ha aplicado más ampliamente al estudio de enfermedades humanas, específicamente en la forma de un estudio de asociación de todo el genoma (GWAS). Un estudio de asociación de todo el genoma se realiza escaneando un genoma completo en busca de SNP asociados con un rasgo particular de interés, o en el caso de una enfermedad humana, con una enfermedad particular de interés. ^[3]^[6] Hasta la fecha, se han realizado miles de estudios de asociación de todo el genoma en el genoma humano en un intento de identificar SNP asociados con una amplia variedad de enfermedades humanas complejas (por ejemplo, cáncer , enfermedad de Alzheimer y obesidad ). Los resultados de todos estos GWAS publicados se mantienen en una base de datos del NIH (figura 1). Sin embargo, sigue siendo controvertido si estos estudios han sido clínica y/o terapéuticamente útiles o no. ^[6]

Figura 1. Asociaciones de todo el genoma publicadas hasta junio de 2009, 439 GWA publicados con p < 5 × 10 ⁻⁸ .

Tipos y variaciones

(A) Mapeo de asociaciones en una población donde se supone que los miembros son independientes.

Varios métodos estándar para probar la asociación. Estudios de casos y controles: los estudios de casos y controles fueron uno de los primeros enfoques utilizados para determinar si una variante genética particular está asociada con un mayor riesgo de enfermedad en humanos. Woofle, en 1955, propuso una estadística de riesgo relativo que podría usarse para evaluar el riesgo dependiente del genotipo. Sin embargo, la preocupación persistente con respecto a estos estudios es la adecuación de los emparejamientos de casos y controles. En particular, la estratificación de la población puede producir asociaciones de falsos positivos. En respuesta a esta preocupación, Falk y Rubenstein (1987) sugirieron un método para evaluar el riesgo relativo que utiliza controles basados en la familia, obviando esta fuente de error potencial. Básicamente, el método utiliza una muestra de control de los alelos o haplotipos parentales no transmitidos a la descendencia afectada.

(B) Mapeo de asociaciones de la población donde se supone que los miembros están relacionados

En el mundo real es muy difícil encontrar individuos independientes (no relacionados). El mapeo de asociación basado en la población se ha modificado para controlar la estratificación de la población o el parentesco en el mapeo de asociación anidada . Aún hay otra limitación en el mapeo de QTL basado en la población; cuando la frecuencia del alelo favorable debe ser relativamente alta para ser detectado. Por lo general, los alelos favorables son alelos mutantes raros (por ejemplo, por lo general, un progenitor resistente puede ser 1 de cada 10000 genotipos). Otra variante del mapeo de asociación en poblaciones relacionadas es el mapeo de asociación basado en la familia. En el mapeo de asociación basado en la familia, en lugar de múltiples individuos no relacionados, se utilizan múltiples familias o pedigríes no relacionados. El mapeo de asociación basado en la familia ^[7] se puede utilizar en situaciones en las que los alelos mutantes se han introgresado en poblaciones. Un mapeo de asociación basado en la familia popular es la prueba de desequilibrio de transmisión. Para obtener más detalles, consulte Mapeo de QTL basado en la familia .

Ventajas

Las ventajas del mapeo de asociaciones basado en la población, utilizando una muestra de individuos de las colecciones de germoplasma o una población natural, sobre el mapeo tradicional de QTL en cruces biparentales, se deben principalmente a la disponibilidad de variaciones genéticas más amplias con un fondo más amplio para correlaciones de marcadores y rasgos. La ventaja del mapeo de asociaciones es que puede mapear rasgos cuantitativos con alta resolución de una manera que es estadísticamente muy poderosa. La resolución del mapeo depende del grado de LD , o asociación no aleatoria de marcadores, que ha ocurrido a lo largo del genoma. El mapeo de asociaciones ofrece la oportunidad de investigar material genético diverso y potencialmente identificar múltiples alelos y mecanismos de rasgos subyacentes. Utiliza eventos de recombinación que han ocurrido durante un período prolongado de tiempo. El mapeo de asociaciones permite la posibilidad de explotar datos de rasgos medidos históricamente para la asociación y, por último, no necesita el desarrollo de poblaciones biparentales costosas y tediosas, lo que hace que el enfoque ahorre tiempo y sea rentable. ^[8]^[9]

Limitaciones

Un problema importante de los estudios de asociación es la tendencia a encontrar falsos positivos. Las poblaciones que muestran un rasgo deseado también son portadoras de una variante genética específica, no porque la variante controle realmente el rasgo, sino debido a la relación genética. En particular, las asociaciones indirectas que no son causales no se eliminarán aumentando el tamaño de la muestra o el número de marcadores. Las principales fuentes de estos falsos positivos son la vinculación entre sitios causales y no causales, más de un sitio causal y la epistasis. Estas asociaciones indirectas no se distribuyen aleatoriamente por todo el genoma y son menos comunes que los falsos positivos que surgen de la estructura de la población. ^[10]

De la misma manera, la estructura de la población siempre ha sido un problema constante. La estructura de la población conduce a asociaciones espurias entre los marcadores y el rasgo. Esto generalmente no es un problema en el análisis de ligamiento porque los investigadores conocen la estructura genética de la familia que crearon. Pero en el mapeo de asociaciones, donde las relaciones entre poblaciones diversas no se entienden necesariamente bien, las asociaciones entre marcadores y rasgos que surgen del parentesco y la historia evolutiva pueden confundirse fácilmente con asociaciones causales. Esto se puede explicar con modelos mixtos MLM. También llamado modelo Q+K, fue desarrollado para reducir aún más la tasa de falsos positivos al controlar tanto la estructura de la población como la relación familiar críptica. ^[11]

Véase también

Referencias

^ Breseghello, Flavio; Sorrells, Mark E (1 de febrero de 2006). "Mapeo de asociación del tamaño del grano y la calidad de molienda en cultivares de trigo (Triticum aestivum L.)". Genética . 172 (2): 1165–1177. doi :10.1534/genetics.105.044586. ISSN 1943-2631. PMC 1456215 . PMID 16079235.
^ Zondervan, Krina T.; Cardon, Lon R. (1 de febrero de 2007). "Diseño de estudios de asociación de casos y controles de todo el genoma y genes candidatos". Nature Protocols . 2 (10): 2492–2501. doi :10.1038/nprot.2007.366. ISSN 1750-2799. PMC 4180089 . PMID 17947991.
^ ab Gibson, G.; Muse SV (2009). Introducción a la ciencia del genoma . MA: Sinauer Associates.
^ Hoeschele, I. (15 de julio de 2004). "Mapeo de loci de rasgos cuantitativos en pedigríes exogámicos". Manual de genética estadística . Chichester: John Wiley & Sons, Ltd. doi :10.1002/0470022620.bbc17. ISBN 978-0470022627.
^ Yu, J.; Holland, JB; McMullen, MD; Buckler, ES (2008). "Diseño genético y poder estadístico del mapeo de asociaciones anidadas en maíz". Genética . 178 (1): 539–551. doi :10.1534/genetics.107.074245. PMC 2206100 . PMID 18202393.
^ ab Nussbaum, RL; McInnes, RR; Willard, HF (2007). Genética en medicina . Filadelfia, PA: Saunders Elsevier.
^ Rosyara UR, JL Gonzalez-Hernandez, KD Glover, KR Gedye y JM Stein. 2009. Mapeo basado en familias de loci de rasgos cuantitativos en poblaciones de mejoramiento de plantas con resistencia a la plaga de Fusarium en trigo como ilustración. Genética teórica y aplicada 118:1617-1631 enlace externo
^ Abdurakhmonov, Ibrokhim Y.; Abdukarimov, Abdusattor (8 de junio de 2008). "Aplicación del mapeo de asociaciones para comprender la diversidad genética de los recursos de germoplasma vegetal". Revista internacional de genómica vegetal . 2008. Hindawi : 574927. doi : 10.1155/ 2008 /574927 . ISSN 1687-5370. PMC 2423417. PMID 18551188. S2CID 7629296 .
^ Kraakman, ATW (1 de septiembre de 2004). "Mapeo del desequilibrio de ligamiento del rendimiento y la estabilidad del rendimiento en cultivares modernos de cebada de primavera". Genética . 168 (1): 435–446. doi :10.1534/genetics.104.026831. ISSN 0016-6731. PMC 1448125 . PMID 15454555.
^ Platt, A.; Vilhjalmsson, BJ; Nordborg, M. (2010-09-02). "Condiciones bajo las cuales los estudios de asociación de todo el genoma serán positivamente engañosos". Genética . 186 (3): 1045–1052. doi :10.1534/genetics.110.121665. ISSN 0016-6731. PMC 2975277 . PMID 20813880.
^ Yu, Jianming; Pressoir, Gael; Briggs, William H; Vroh Bi, Irie; Yamasaki, Masanori; Doebley, John F; McMullen, Michael D; Gaut, Brandon S; Nielsen, Dahlia M (25 de diciembre de 2005). "Un método unificado de modelo mixto para el mapeo de asociaciones que tiene en cuenta múltiples niveles de parentesco". Nature Genetics . 38 (2): 203–208. doi :10.1038/ng1702. ISSN 1061-4036. PMID 16380716. S2CID 8507433.