stringtranslate.com

Índice de fijación

Valores Fst entre poblaciones europeas

El índice de fijación ( F ST ) es una medida de diferenciación de la población debido a la estructura genética . Se estima con frecuencia a partir de datos de polimorfismos genéticos , como polimorfismos de un solo nucleótido (SNP) o microsatélites . Desarrollado como un caso especial de la estadística F de Wright , es una de las estadísticas más utilizadas en genética de poblaciones . Sus valores varían de 0 a 1, donde 0 es ninguna diferenciación y 1 es diferenciación completa.

Interpretación

Esta comparación de la variabilidad genética dentro y entre poblaciones se utiliza con frecuencia en genética de poblaciones aplicada . Los valores varían de 0 a 1. Un valor de cero implica panmixia completa ; es decir, que las dos poblaciones se cruzan libremente. Un valor de uno implica que toda la variación genética se explica por la estructura de la población y que las dos poblaciones no comparten ninguna diversidad genética.

Para modelos idealizados como el modelo de isla finita de Wright , F ST se puede utilizar para estimar las tasas de migración. En ese modelo, la tasa de migración es

,

donde m es la tasa de migración por generación y es la tasa de mutación por generación. [1]

La interpretación de F ST puede resultar difícil cuando los datos analizados son altamente polimórficos. En este caso, la probabilidad de identidad por descendencia es muy baja y F ST puede tener un límite superior arbitrariamente bajo, lo que podría llevar a una interpretación errónea de los datos. Además, estrictamente hablando, F ST no es una distancia en el sentido matemático, ya que no satisface la desigualdad triangular .

Definición

Dos de las definiciones más comúnmente utilizadas para F ST en un locus determinado se basan en 1) la varianza de las frecuencias de los alelos entre poblaciones y en 2) la probabilidad de identidad por descendencia .

Si es la frecuencia media de un alelo en la población total, es la varianza en la frecuencia del alelo entre diferentes subpoblaciones, ponderada por los tamaños de las subpoblaciones, y es la varianza del estado alélico en la población total, F ST se define como [2]

La definición de Wright ilustra que F ST mide la cantidad de varianza genética que se puede explicar por la estructura de la población. Esto también se puede considerar como la fracción de la diversidad total que no es una consecuencia de la diversidad promedio dentro de las subpoblaciones, donde la diversidad se mide por la probabilidad de que dos alelos seleccionados al azar sean diferentes, es decir . Si la frecuencia de alelos en la población n es y el tamaño relativo de la población n es , entonces

Alternativamente, [3]

donde es la probabilidad de identidad por descendencia de dos individuos dado que los dos individuos están en la misma subpoblación, y es la probabilidad de que dos individuos de la población total sean idénticos por descendencia. Usando esta definición, F ST puede interpretarse como la medición de cuánto más cerca están dos individuos de la misma subpoblación, en comparación con la población total. Si la tasa de mutación es pequeña, esta interpretación puede hacerse más explícita vinculando la probabilidad de identidad por descendencia a los tiempos de coalescencia : Sea T 0 y T el tiempo promedio hasta la coalescencia para individuos de la misma subpoblación y la población total, respectivamente. Entonces,

Esta formulación tiene la ventaja de que el tiempo esperado hasta la coalescencia se puede estimar fácilmente a partir de datos genéticos, lo que llevó al desarrollo de varios estimadores para F ST .

Estimación

En la práctica, ninguna de las magnitudes utilizadas para las definiciones se puede medir fácilmente. En consecuencia, se han propuesto varios estimadores. Un estimador particularmente simple aplicable a los datos de secuencias de ADN es: [4]

donde y representan el número promedio de diferencias por pares entre dos individuos muestreados de diferentes subpoblaciones ( ) o de la misma subpoblación ( ). La diferencia por pares promedio dentro de una población se puede calcular como la suma de las diferencias por pares dividida por el número de pares. Sin embargo, este estimador está sesgado cuando los tamaños de muestra son pequeños o si varían entre poblaciones. Por lo tanto, se utilizan métodos más elaborados para calcular F ST en la práctica. Dos de los procedimientos más utilizados son el estimador de Weir & Cockerham (1984), [5] o realizar un Análisis de varianza molecular . Una lista de implementaciones está disponible al final de este artículo.

FCALLEEn humanos

Valores de FST en poblaciones seleccionadas

Los valores de F ST dependen en gran medida de la elección de las poblaciones. Grupos étnicos estrechamente relacionados, como los daneses frente a los holandeses , o los portugueses frente a los españoles, muestran valores significativamente inferiores al 1%, indistinguibles de la panmixia. Dentro de Europa, se ha descubierto que los grupos étnicos más divergentes tienen valores del orden del 7% ( sami frente a sardos ).

Se encuentran valores mayores si se comparan grupos homogéneos altamente divergentes: el valor más alto encontrado fue cercano al 46%, entre los mbuti y los papúes . [6]

Una distancia genética de 0,125 implica que el parentesco entre individuos no emparentados de la misma ascendencia en relación con la población mundial es equivalente al parentesco entre medios hermanos en una población que se aparea al azar. Esto también implica que si un humano de una población ancestral dada tiene un medio hermano mestizo, ese humano está genéticamente más cerca de un individuo no emparentado de su población ancestral que de su medio hermano mestizo. [7]

Distancias genéticas en poblaciones humanas

Distancias genéticas autosómicas basadas en marcadores clásicos

En su estudio The History and Geography of Human Genes (1994) , Cavalli-Sforza, Menozzi y Piazza proporcionan algunas de las estimaciones más detalladas y completas de las distancias genéticas entre poblaciones humanas, dentro y entre continentes. Su base de datos inicial contiene 76.676 frecuencias genéticas (utilizando 120 polimorfismos sanguíneos), correspondientes a 6.633 muestras en diferentes lugares. Al seleccionar y agrupar dichas muestras, restringen su análisis a 491 poblaciones.

Las 42 poblaciones mundiales utilizadas por los autores y sus FST informados.

Se centran en las poblaciones aborígenes que se encontraban en su ubicación actual a finales del siglo XV cuando comenzaron las grandes migraciones europeas. [8] Al estudiar la diferencia genética a nivel mundial, el número se reduce a 42 poblaciones representativas, agregando subpoblaciones caracterizadas por un alto nivel de similitud genética. Para estas 42 poblaciones, Cavalli-Sforza y ​​coautores informan distancias bilaterales calculadas a partir de 120 alelos. Entre este conjunto de 42 poblaciones mundiales, la mayor distancia genética observada es entre los pigmeos mbuti y los papúa nueva guineanos, donde la distancia Fst es 0,4573, mientras que la distancia genética más pequeña (0,0021) es entre los daneses y los ingleses.

Al considerar datos más desagregados para 26 poblaciones europeas, la distancia genética más pequeña (0,0009) es entre los holandeses y los daneses, y la más grande (0,0667) es entre los lapones y los sardos. La distancia genética media entre las 861 parejas disponibles de las 42 poblaciones seleccionadas fue de 0,1338. [ página necesaria ] .

La siguiente tabla muestra el Fst calculado por Cavalli-Sforza (1994) para algunas poblaciones:

Distancias genéticas autosómicas basadas en SNP

Un estudio de 2012 basado en datos del Proyecto Internacional HapMap estimó la F ST entre las tres principales poblaciones "continentales" de europeos (combinados de residentes de Utah de ascendencia del norte y oeste de Europa de la colección CEPH e italianos de Toscana), asiáticos orientales (combinando chinos han de Pekín, chinos del área metropolitana de Denver y japoneses de Tokio, Japón) y africanos subsaharianos (combinando luhya de Webuye, Kenia, masái de Kinyawa, Kenia y yoruba de Ibadan, Nigeria). Informó un valor cercano al 12% entre las poblaciones continentales y valores cercanos a la panmixia (menores del 1%) dentro de las poblaciones continentales. [9]

Distancias genéticas autosómicas basadas en la secuenciación del exoma completo (WES)

Valores Fst por pares entre varias poblaciones basados ​​en la secuenciación del exoma completo (WES) en 2016: [12]

Programas para calcular FCALLE

Módulos para calcular FCALLE

Referencias

  1. ^ Peter Beerli, Estimación de tasas de migración y tamaños de población en poblaciones estructuradas geográficamente (1998), Avances en ecología molecular (ed. G. Carvalho). NATO Science Series A: Life Sciences, IOS Press, Ámsterdam, 39-53.
  2. ^ Holsinger, Kent E.; Bruce S. Weir (2009). "Genética en poblaciones geográficamente estructuradas: definición, estimación e interpretación de FST". Nat Rev Genet . 10 (9): 639–650. doi :10.1038/nrg2611. ISSN  1471-0056. PMC  4687486 . PMID  19687804.
  3. ^ Richard Durrett (12 de agosto de 2008). Modelos de probabilidad para la evolución de secuencias de ADN. Springer. ISBN 978-0-387-78168-6. Recuperado el 25 de octubre de 2012 .
  4. ^ Hudson, RR.; Slatkin, M.; Maddison, WP. (octubre de 1992). "Estimación de los niveles de flujo genético a partir de datos de secuencias de ADN". Genética . 132 (2): 583–9. doi :10.1093/genetics/132.2.583. PMC 1205159 . PMID  1427045. 
  5. ^ Weir, BS; Cockerham, C. Clark (1984). "Estimación de estadísticas F para el análisis de la estructura de la población". Evolución . 38 (6): 1358–1370. doi :10.2307/2408641. ISSN  0014-3820. JSTOR  2408641. PMID  28563791.
  6. ^ Cavalli-Sforza et al. (1994), citado después de V. Ginsburgh, S. Weber, The Palgrave Handbook of Economics and Language , Springer (2016), pág. 182.
  7. ^ Harpending, Henry (2002). "Parentesco y subdivisión de la población". Población y medio ambiente . 24 (2): 141–147. doi :10.1023/A:1020815420693. S2CID  15208802.
  8. ^ Cavalli-Sforza y ​​otros, 1994, pág. 24
  9. ^ Elhaik, Eran (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala". PLOS ONE . ​​7 (11): e49837. Bibcode :2012PLoSO...749837E. doi : 10.1371/journal.pone.0049837 . PMC 3504095 . PMID  23185452. 
  10. ^ ab Nelis, Mari; et al. (8 de mayo de 2009). Fleischer, Robert C. (ed.). "Estructura genética de los europeos: una visión desde el noreste". PLOS ONE . ​​4 (5): e5472. Bibcode :2009PLoSO...4.5472N. doi : 10.1371/journal.pone.0005472 . PMC 2675054 . PMID  19424496. , ver tabla
  11. ^ Tian, ​​Chao; et al. (noviembre de 2009). "Subestructura genética de la población europea: definición adicional de marcadores informativos de ascendencia para distinguir entre diversos grupos étnicos europeos". Medicina molecular . 15 (11–12): 371–383. doi :10.2119/molmed.2009.00094. ISSN  1076-1551. PMC 2730349 . PMID  19707526. , ver tabla
  12. ^ Scott, E., Halees, A., Itan, Y. et al. Caracterización de la variación genética del Gran Oriente Medio para un mejor descubrimiento de genes de enfermedades . Nat Genet 48, 1071–1076 (2016). https://doi.org/10.1038/ng.3592. Figura complementaria 6: El mapa de calor de los valores FST por pares entre todas las poblaciones del Proyecto 1000 Genomas y GME identifica tres grupos con un bajo grado de diferenciación.
  13. ^ Crawford, Nicholas G. (2010). " smogd : software para la medición de la diversidad genética". Recursos de ecología molecular . 10 (3): 556–557. doi :10.1111/j.1755-0998.2009.02801.x. PMID  21565057. S2CID  205970662.
  14. ^ Kitada S, Kitakado T, Kishino H (2007). "Inferencia empírica de Bayes de F (ST) por pares y su distribución en el genoma". Genética . 177 (2): 861–73. doi :10.1534/genética.107.077263. PMC 2034649 . PMID  17660541. 

Lectura adicional

Véase también

Enlaces externos