En genética, el mapeo de asociaciones , también conocido como " mapeo de desequilibrio de ligamiento ", es un método de mapeo de loci de rasgos cuantitativos (QTL) que aprovecha el desequilibrio de ligamiento histórico para vincular fenotipos (características observables) con genotipos (la constitución genética de los organismos), descubriendo asociaciones genéticas . [1] [2]
El mapeo de asociaciones se basa en la idea de que los rasgos que han ingresado a una población recientemente seguirán estando vinculados a la secuencia genética circundante del ancestro evolutivo original, o en otras palabras, se encontrarán con mayor frecuencia dentro de un haplotipo dado que fuera de él. La mayoría de las veces se realiza escaneando el genoma completo en busca de asociaciones significativas entre un panel de polimorfismos de un solo nucleótido (SNP) (que, en muchos casos, se colocan en portaobjetos de vidrio para crear " chips SNP ") y un fenotipo particular. Luego, estas asociaciones deben verificarse de forma independiente para demostrar que (a) contribuyen directamente al rasgo de interés o (b) están vinculadas a/en desequilibrio de ligamiento con un locus de rasgo cuantitativo (QTL) que contribuye al rasgo de interés. [3]
El mapeo de asociaciones busca identificar variantes genéticas funcionales específicas (loci, alelos) vinculadas a diferencias fenotípicas en un rasgo para facilitar la detección de polimorfismos de secuencia de ADN que causan rasgos y la selección de genotipos que se asemejen estrechamente al fenotipo. Para identificar estas variantes funcionales, se requieren marcadores de alto rendimiento como los SNP. [4]
La ventaja del mapeo de asociación es que puede mapear rasgos cuantitativos con alta resolución de una manera que es estadísticamente muy poderosa. El mapeo de asociación, sin embargo, también requiere un amplio conocimiento de los SNP dentro del genoma del organismo de interés y, por lo tanto, es difícil de realizar en especies que no han sido bien estudiadas o no tienen genomas bien anotados . [5] El mapeo de asociación se ha aplicado más ampliamente al estudio de enfermedades humanas, específicamente en la forma de un estudio de asociación de todo el genoma (GWAS). Un estudio de asociación de todo el genoma se realiza escaneando un genoma completo en busca de SNP asociados con un rasgo particular de interés, o en el caso de una enfermedad humana, con una enfermedad particular de interés. [3] [6] Hasta la fecha, se han realizado miles de estudios de asociación de todo el genoma en el genoma humano en un intento de identificar SNP asociados con una amplia variedad de enfermedades humanas complejas (por ejemplo, cáncer , enfermedad de Alzheimer y obesidad ). Los resultados de todos estos GWAS publicados se mantienen en una base de datos del NIH (figura 1). Sin embargo, sigue siendo controvertido si estos estudios han sido clínica y/o terapéuticamente útiles o no. [6]
(A) Mapeo de asociaciones en una población donde se supone que los miembros son independientes.
Varios métodos estándar para probar la asociación. Estudios de casos y controles: los estudios de casos y controles fueron uno de los primeros enfoques utilizados para determinar si una variante genética particular está asociada con un mayor riesgo de enfermedad en humanos. Woofle, en 1955, propuso una estadística de riesgo relativo que podría usarse para evaluar el riesgo dependiente del genotipo. Sin embargo, la preocupación persistente con respecto a estos estudios es la adecuación de los emparejamientos de casos y controles. En particular, la estratificación de la población puede producir asociaciones de falsos positivos. En respuesta a esta preocupación, Falk y Rubenstein (1987) sugirieron un método para evaluar el riesgo relativo que utiliza controles basados en la familia, obviando esta fuente de error potencial. Básicamente, el método utiliza una muestra de control de los alelos o haplotipos parentales no transmitidos a la descendencia afectada.
(B) Mapeo de asociaciones en una población donde se supone que los miembros están relacionados
En el mundo real es muy difícil encontrar individuos independientes (no relacionados). El mapeo de asociación basado en la población se ha modificado para controlar la estratificación de la población o el parentesco en el mapeo de asociación anidada . Sin embargo, existe otra limitación en el mapeo de QTL basado en la población; cuando la frecuencia del alelo favorable debe ser relativamente alta para ser detectado. Por lo general, los alelos favorables son alelos mutantes raros (por ejemplo, generalmente un progenitor resistente puede ser 1 de cada 10000 genotipos). Otra variante del mapeo de asociación en poblaciones relacionadas es el mapeo de asociación basado en la familia. En el mapeo de asociación basado en la familia, en lugar de múltiples individuos no relacionados, se utilizan múltiples familias o pedigríes no relacionados. El mapeo de asociación basado en la familia [7] se puede utilizar en situaciones en las que los alelos mutantes se han introgresado en poblaciones. Un mapeo de asociación basado en la familia popular es la prueba de desequilibrio de transmisión. Para obtener más detalles, consulte Mapeo de QTL basado en la familia .
Las ventajas del mapeo de asociaciones basado en la población, utilizando una muestra de individuos de las colecciones de germoplasma o una población natural, sobre el mapeo tradicional de QTL en cruces biparentales, se deben principalmente a la disponibilidad de variaciones genéticas más amplias con un fondo más amplio para correlaciones de marcadores y rasgos. La ventaja del mapeo de asociaciones es que puede mapear rasgos cuantitativos con alta resolución de una manera que es estadísticamente muy poderosa. La resolución del mapeo depende del grado de LD , o asociación no aleatoria de marcadores, que ha ocurrido a lo largo del genoma. El mapeo de asociaciones ofrece la oportunidad de investigar material genético diverso y potencialmente identificar múltiples alelos y mecanismos de rasgos subyacentes. Utiliza eventos de recombinación que han ocurrido durante un período prolongado de tiempo. El mapeo de asociaciones permite la posibilidad de explotar datos de rasgos medidos históricamente para la asociación y, por último, no necesita el desarrollo de poblaciones biparentales costosas y tediosas, lo que hace que el enfoque ahorre tiempo y sea rentable. [8] [9]
Un problema importante de los estudios de asociación es la tendencia a encontrar falsos positivos. Las poblaciones que muestran un rasgo deseado también son portadoras de una variante genética específica, no porque la variante controle realmente el rasgo, sino debido a la relación genética. En particular, las asociaciones indirectas que no son causales no se eliminarán aumentando el tamaño de la muestra o el número de marcadores. Las principales fuentes de estos falsos positivos son la vinculación entre sitios causales y no causales, más de un sitio causal y la epistasis. Estas asociaciones indirectas no se distribuyen aleatoriamente por todo el genoma y son menos comunes que los falsos positivos que surgen de la estructura de la población. [10]
De la misma manera, la estructura de la población siempre ha sido un problema constante. La estructura de la población conduce a asociaciones espurias entre los marcadores y el rasgo. Esto generalmente no es un problema en el análisis de ligamiento porque los investigadores conocen la estructura genética de la familia que crearon. Pero en el mapeo de asociaciones, donde las relaciones entre poblaciones diversas no se entienden necesariamente bien, las asociaciones entre marcadores y rasgos que surgen del parentesco y la historia evolutiva pueden confundirse fácilmente con asociaciones causales. Esto se puede explicar con modelos mixtos MLM. También llamado modelo Q+K, fue desarrollado para reducir aún más la tasa de falsos positivos al controlar tanto la estructura de la población como la relación familiar críptica. [11]