stringtranslate.com

Teoría coalescente

La teoría coalescente es un modelo de cómo los alelos muestreados de una población pueden haberse originado a partir de un ancestro común . En el caso más simple, la teoría coalescente supone que no hay recombinación , ni selección natural , ni flujo de genes ni estructura poblacional , lo que significa que es igualmente probable que cada variante haya pasado de una generación a la siguiente. El modelo mira hacia atrás en el tiempo, fusionando alelos en una única copia ancestral según un proceso aleatorio en eventos de coalescencia. Según este modelo, el tiempo esperado entre eventos de coalescencia sucesivos aumenta casi exponencialmente en el tiempo (con una amplia variación ). La variación en el modelo proviene tanto del paso aleatorio de alelos de una generación a la siguiente como de la aparición aleatoria de mutaciones en estos alelos.

La teoría matemática del coalescente fue desarrollada de forma independiente por varios grupos a principios de la década de 1980 como una extensión natural de la teoría y los modelos clásicos de genética de poblaciones , [1] [2] [3] [4] , pero puede atribuirse principalmente a John Kingman . [5] Los avances en la teoría coalescente incluyen la recombinación, la selección, la superposición de generaciones y prácticamente cualquier modelo evolutivo o demográfico arbitrariamente complejo en el análisis genético de poblaciones.

El modelo se puede utilizar para producir muchas genealogías teóricas y luego comparar los datos observados con estas simulaciones para probar suposiciones sobre la historia demográfica de una población. La teoría coalescente se puede utilizar para hacer inferencias sobre parámetros genéticos de poblaciones, como la migración, el tamaño de la población y la recombinación.

Teoría

Es hora de fusionarse

Considere un locus de un solo gen tomado de dos individuos haploides en una población. La ascendencia de esta muestra se rastrea hacia atrás en el tiempo hasta el punto en que estos dos linajes se fusionan en su ancestro común más reciente (MRCA). La teoría coalescente busca estimar la expectativa de este período de tiempo y su varianza.

La probabilidad de que dos linajes se fusionen en la generación inmediatamente anterior es la probabilidad de que compartan una secuencia de ADN parental . En una población con un tamaño de población efectivo constante con 2 N e copias de cada locus, hay 2 N e "padres potenciales" en la generación anterior. Bajo un modelo de apareamiento aleatorio , la probabilidad de que dos alelos se originen a partir de la misma copia parental es, por tanto, 1/(2 N e ) y, correspondientemente, la probabilidad de que no se fusionen es 1 − 1/(2 N e ).

En cada generación anterior sucesiva, la probabilidad de coalescencia se distribuye geométricamente , es decir, es la probabilidad de no coalescencia en las t  − 1 generaciones anteriores multiplicada por la probabilidad de coalescencia en la generación de interés:

Para valores suficientemente grandes de N e , esta distribución se aproxima bien mediante la distribución exponencial definida continuamente

Esto es matemáticamente conveniente, ya que la distribución exponencial estándar tiene tanto el valor esperado como la desviación estándar iguales a 2 N e . Por lo tanto, aunque el tiempo esperado para la coalescencia es 2 N e , los tiempos de coalescencia reales tienen un amplio rango de variación. Nótese que el tiempo de coalescencia es el número de generaciones precedentes donde tuvo lugar la coalescencia y no el tiempo calendario, aunque se puede hacer una estimación de este último multiplicando 2 N e por el tiempo medio entre generaciones. Los cálculos anteriores se aplican igualmente a una población diploide de tamaño efectivo N e (en otras palabras, para un segmento de ADN que no se recombina, cada cromosoma puede tratarse como equivalente a un individuo haploide independiente ; en ausencia de endogamia, los cromosomas hermanos en un solo individuo no están más estrechamente relacionados que dos cromosomas tomados aleatoriamente de la población). Sin embargo , algunos elementos de ADN efectivamente haploides, como el ADN mitocondrial , solo se transmiten por un sexo y, por lo tanto, tienen una cuarta parte del tamaño efectivo de la población diploide equivalente ( N e /2).

Variación neutra

La teoría coalescente también se puede utilizar para modelar la cantidad de variación en las secuencias de ADN que se espera de la deriva genética y la mutación. Este valor se denomina heterocigosidad media y se representa como . La heterocigosidad media se calcula como la probabilidad de que ocurra una mutación en una generación determinada dividida por la probabilidad de cualquier "evento" en esa generación (ya sea una mutación o una coalescencia). La probabilidad de que el evento sea una mutación es la probabilidad de una mutación en cualquiera de los dos linajes: . Por tanto, la heterocigosidad media es igual a

Para , la gran mayoría de los pares de alelos tienen al menos una diferencia en la secuencia de nucleótidos .

Extensiones

Existen numerosas extensiones del modelo coalescente, como el Λ-coalescente que permite la posibilidad de multifurcaciones [6] .

Representación grafica

Los coalescentes se pueden visualizar utilizando dendrogramas que muestran la relación de las ramas de la población entre sí. El punto donde se encuentran dos ramas indica un evento coalescente.

Aplicaciones

Mapeo de genes de enfermedades

La utilidad de la teoría coalescente en el mapeo de enfermedades está ganando poco a poco más reconocimiento; Aunque la aplicación de la teoría aún está en sus inicios, hay varios investigadores que están desarrollando activamente algoritmos para el análisis de datos genéticos humanos que utilizan la teoría coalescente. [7] [8] [9]

Un número considerable de enfermedades humanas pueden atribuirse a la genética, desde simples enfermedades mendelianas como la anemia falciforme y la fibrosis quística , hasta enfermedades más complicadas como el cáncer y las enfermedades mentales. Estas últimas son enfermedades poligénicas, controladas por múltiples genes que pueden ocurrir en diferentes cromosomas, pero las enfermedades que son precipitadas por una sola anomalía son relativamente simples de identificar y rastrear, aunque no tan simples como para que esto se haya logrado para todas las enfermedades. Es inmensamente útil para comprender estas enfermedades y sus procesos saber dónde se encuentran en los cromosomas y cómo se han heredado a través de generaciones de una familia, como se puede lograr mediante el análisis coalescente. [1]

Las enfermedades genéticas se transmiten de una generación a otra al igual que otros genes. Si bien cualquier gen puede trasladarse de un cromosoma a otro durante la recombinación homóloga , es poco probable que se traslade un solo gen. Por lo tanto, para rastrearlo se pueden utilizar otros genes que estén lo suficientemente cerca del gen de la enfermedad como para vincularse a él. [1]

Las enfermedades poligénicas tienen una base genética aunque no siguen los modelos de herencia mendelianos, y pueden tener una incidencia relativamente alta en las poblaciones y tener efectos graves sobre la salud. Este tipo de enfermedades pueden tener una penetrancia incompleta y tienden a ser poligénicas , lo que complica su estudio. Estos rasgos pueden surgir debido a muchas mutaciones pequeñas, que en conjunto tienen un efecto grave y nocivo en la salud del individuo. [2]

Los métodos de mapeo de vínculos, incluida la teoría coalescente, se pueden utilizar en estas enfermedades, ya que utilizan genealogías familiares para determinar qué marcadores acompañan a una enfermedad y cómo se hereda. Como mínimo, este método ayuda a reducir la porción o porciones del genoma en las que pueden ocurrir mutaciones perjudiciales. Las complicaciones de estos enfoques incluyen efectos epistáticos , la naturaleza poligénica de las mutaciones y factores ambientales. Dicho esto, los genes cuyos efectos son aditivos conllevan un riesgo fijo de desarrollar la enfermedad y, cuando existen en un genotipo de enfermedad, pueden usarse para predecir el riesgo y mapear el gen. [2] Tanto el coalescente regular como el coalescente destrozado (que admite que pueden haber ocurrido múltiples mutaciones en el evento fundador y que la enfermedad puede ocasionalmente ser desencadenada por factores ambientales) se han utilizado para comprender los genes de las enfermedades. [1]

Se han llevado a cabo estudios que correlacionan la aparición de enfermedades en gemelos fraternos e idénticos, y los resultados de estos estudios pueden usarse para informar el modelado coalescente. Dado que los gemelos idénticos comparten todo su genoma, pero los gemelos fraternos solo comparten la mitad de su genoma, la diferencia en la correlación entre los gemelos idénticos y los fraternos se puede utilizar para determinar si una enfermedad es hereditaria y, de ser así, con qué intensidad. [2]

La distribución genómica de la heterocigosidad.

El mapa del polimorfismo de un solo nucleótido (SNP) humano ha revelado grandes variaciones regionales en la heterocigosidad, más de las que pueden explicarse sobre la base del azar ( distribuido por Poisson ). [10] En parte, estas variaciones podrían explicarse sobre la base de los métodos de evaluación, la disponibilidad de secuencias genómicas y posiblemente el modelo genético de población coalescente estándar. Las influencias genéticas de la población podrían tener una influencia importante en esta variación: algunos loci presumiblemente tendrían ancestros comunes comparativamente recientes, otros podrían tener genealogías mucho más antiguas, por lo que la acumulación regional de SNP a lo largo del tiempo podría ser bastante diferente. La densidad local de SNP a lo largo de los cromosomas parece agruparse de acuerdo con una variación de la ley de potencia media y obedecer a la distribución de Poisson del compuesto de Tweedie . [11] En este modelo, las variaciones regionales en el mapa de SNP se explicarían por la acumulación de múltiples segmentos genómicos pequeños mediante recombinación, donde el número medio de SNP por segmento se distribuiría gamma en proporción al tiempo distribuido gamma hasta el más reciente. ancestro común de cada segmento. [12]

Historia

La teoría coalescente es una extensión natural del concepto más clásico de evolución neutral de la genética de poblaciones y es una aproximación al modelo de Fisher-Wright (o Wright-Fisher) para poblaciones grandes. Fue descubierto de forma independiente por varios investigadores en la década de 1980. [13] [14] [15] [16]

Software

Existe una gran cantidad de software tanto para simular conjuntos de datos bajo el proceso de fusión como para inferir parámetros como el tamaño de la población y las tasas de migración a partir de datos genéticos.

Referencias

  1. ^ abc Morris, A., Whittaker, J. y Balding, D. (2002). Mapeo a escala fina de loci de enfermedades mediante modelado coalescente destrozado de genealogías. La Revista Estadounidense de Genética Humana, 70 (3), 686–707. doi :10.1086/339271
  2. ^ a b C Rannala, B. (2001). Encontrar genes que influyan en la susceptibilidad a enfermedades complejas en la era posgenoma. Revista estadounidense de farmacogenómica , 1 (3), 203–221.

Fuentes

Artículos

Libros

enlaces externos