stringtranslate.com

Estadística F

En genética de poblaciones , las estadísticas F (también conocidas como índices de fijación ) describen el nivel estadísticamente esperado de heterocigosidad en una población; más específicamente, el grado esperado (generalmente) de reducción en la heterocigosidad en comparación con la expectativa de Hardy-Weinberg .

Las estadísticas F también pueden considerarse como una medida de la correlación entre genes extraídos en diferentes niveles de una población subdividida (jerárquicamente). Esta correlación está influenciada por varios procesos evolutivos , como la deriva genética , el efecto fundador , el cuello de botella , el autostop genético , el impulso meiótico , la mutación , el flujo genético , la endogamia , la selección natural o el efecto Wahlund , pero originalmente fue diseñada para medir la cantidad de fijación alélica debido a la deriva genética .

El concepto de estadística F fue desarrollado durante la década de 1920 por el genetista estadounidense Sewall Wright , [1] [2] que estaba interesado en la endogamia en el ganado . Sin embargo, debido a que la dominancia completa hace que los fenotipos de los dominantes homocigotos y los heterocigotos sean los mismos, no fue hasta la llegada de la genética molecular a partir de la década de 1960 que se pudo medir la heterocigosidad en las poblaciones.

F se puede utilizar para definir el tamaño efectivo de la población . [ se necesita más explicación ]

Definiciones y ecuaciones

Las medidas F IS , F ST y F IT están relacionadas con las cantidades de heterocigosidad en varios niveles de la estructura de la población. En conjunto, se denominan estadísticas F y se derivan de F , el coeficiente de endogamia . En un sistema simple de dos alelos con endogamia, las frecuencias genotípicas son:

El valor de se obtiene al resolver la ecuación para el uso de heterocigotos en la población endogámica anterior. Esto se convierte en uno menos la frecuencia observada de heterocigotos en una población dividida por la frecuencia esperada de heterocigotos en el equilibrio de Hardy-Weinberg :

donde la frecuencia esperada en el equilibrio de Hardy-Weinberg está dada por

donde y son las frecuencias alélicas de y , respectivamente. También es la probabilidad de que en cualquier locus , dos alelos de un individuo aleatorio de la población sean idénticos por descendencia .

Por ejemplo, consideremos los datos de EB Ford (1971) sobre una sola población de la polilla tigre escarlata :

A partir de esto, se pueden calcular las frecuencias de los alelos y derivar la expectativa de:

Las diferentes estadísticas F analizan diferentes niveles de la estructura de la población. F IT es el coeficiente de endogamia de un individuo ( I ) en relación con la población total ( T ), como se indicó anteriormente; F IS es el coeficiente de endogamia de un individuo ( I ) en relación con la subpoblación ( S ), utilizando lo anterior para las subpoblaciones y promediándolos; y F ST es el efecto de las subpoblaciones ( S ) en comparación con la población total ( T ), y se calcula resolviendo la ecuación:

como se muestra en la siguiente sección.

Partición debido a la estructura de la población

se puede dividir en debido al efecto Wahlund y debido a la endogamia .

Consideremos una población que tiene una estructura poblacional de dos niveles: uno desde el individuo (I) hasta la subpoblación (S) y otro desde la subpoblación hasta el total (T). Entonces el total , conocido aquí como , se puede dividir en y :

Esto se puede dividir aún más en subestructuras de población y se expande de acuerdo con las reglas de expansión binomial , de modo que para I particiones:

Índice de fijación

Una reformulación de la definición de sería la relación entre el número promedio de diferencias entre pares de cromosomas muestreados en individuos diploides y el número promedio obtenido al muestrear cromosomas aleatoriamente de la población (excluyendo la agrupación por individuo). Se puede modificar esta definición y considerar una agrupación por subpoblación en lugar de por individuo. Los genetistas de poblaciones han utilizado esa idea para medir el grado de estructura en una población.

Lamentablemente, existe una gran cantidad de definiciones de , lo que genera cierta confusión en la literatura científica. Una definición común es la siguiente:

donde la varianza de se calcula entre subpoblaciones y es la frecuencia esperada de heterocigotos.

Índice de fijación en poblaciones humanas

Está bien establecido que la diversidad genética entre las poblaciones humanas es baja, [3] aunque la distribución de la diversidad genética solo se estimó de manera aproximada. Los primeros estudios sostuvieron que el 85-90% de la variación genética se encuentra dentro de los individuos que residen en las mismas poblaciones dentro de los continentes (poblaciones intracontinentales) y solo un 10-15% adicional se encuentra entre poblaciones de diferentes continentes (poblaciones continentales). [4] [5] [6] [7] [8] Estudios posteriores basados ​​en cientos de miles de polimorfismos de un solo nucleótido (SNP) sugirieron que la diversidad genética entre poblaciones continentales es incluso menor y representa entre el 3 y el 7% [9] [10] [11] [12] [13] [14] Un estudio posterior basado en tres millones de SNP encontró que el 12% de la variación genética se encuentra entre poblaciones continentales y solo el 1% dentro de ellas. [15] La mayoría de estos estudios han utilizado las estadísticas F ST [16] o estadísticas estrechamente relacionadas. [17] [18]

Véase también

Referencias

  1. ^ Wright, S (1950). "Estructura genética de las poblaciones". Nature . 166 (4215): 247–9. Bibcode :1950Natur.166..247W. doi :10.1038/166247a0. PMID  15439261. S2CID  36311175.
  2. ^ Kulig, K (1985). "Utilización de pruebas toxicológicas de emergencia". The American Journal of Emergency Medicine . 3 (6): 573–4. doi :10.1016/0735-6757(85)90177-9. LCCN  67025533. PMID  4063030.
  3. ^ Holsinger, Kent E.; Weir, Bruce S. (2009). "Genética en poblaciones geográficamente estructuradas: definición, estimación e interpretación de FST". Nature Reviews Genetics . 10 (9): 639–50. doi :10.1038/nrg2611. PMC 4687486 . PMID  19687804. 
  4. ^ Lewontin (1972). "La distribución de la diversidad humana". Biología evolutiva . Vol. 6. págs. 381–98. doi :10.1007/978-1-4684-9063-3_14. ISBN . 978-1-4684-9065-7.
  5. ^ Bowcock, Anne M.; Kidd, Judith R.; Mountain, Joanna L.; Herbert, Joan M.; Carotenuto, Luciano; Kidd, Kenneth K.; Cavalli-Sforza, Luca (1991). "Deriva, mezcla y selección en la evolución humana: un estudio con polimorfismos de ADN". Actas de la Academia Nacional de Ciencias . 88 (3): 839–43. Bibcode :1991PNAS...88..839B. doi : 10.1073/pnas.88.3.839 . JSTOR  2356081. PMC 50909 . PMID  1992475. 
  6. ^ Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "Una distribución de la diversidad del ADN humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 94 (9): 4516–9. Código bibliográfico : 1997PNAS...94.4516B. doi : 10.1073/pnas.94.9.4516 . JSTOR  42042. PMC 20754 . PMID  9114021. 
  7. ^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). "La distribución de la diversidad genética humana: una comparación de datos mitocondriales, autosómicos y del cromosoma Y". The American Journal of Human Genetics . 66 (3): 979–88. doi :10.1086/302825. PMC 1288178 . PMID  10712212. 
  8. ^ Jorde, Lynn B; Wooding, Stephen P (2004). "Variación genética, clasificación y 'raza'". Nature Genetics . 36 (11s): S28-33. doi : 10.1038/ng1435 . PMID  15508000.
  9. ^ Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similitud de la frecuencia de alelos y el patrón de desequilibrio de ligamiento de polimorfismos de un solo nucleótido en loci de genes relacionados con fármacos entre poblaciones tailandesas y del norte de Asia oriental: implicaciones para la selección de SNP de etiquetado en tailandeses". Journal of Human Genetics . 51 (10): 896–904. doi : 10.1007/s10038-006-0041-1 . PMID  16957813.
  10. ^ Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Subestructura poblacional en Finlandia y Suecia revelada por el uso de coordenadas espaciales y un pequeño número de SNP autosómicos no ligados". BMC Genetics . 9 : 54. doi : 10.1186/1471-2156-9-54 . PMC 2527025 . PMID  18713460. 
  11. ^ Laos, Óscar; Lu, Timothy T.; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlación entre estructura genética y geográfica en Europa". Biología actual . 18 (16): 1241–8. Código Bib : 2008CBio...18.1241L. doi : 10.1016/j.cub.2008.07.049 . PMID  18691889.
  12. ^ Biswas, Shameek; Scheinfeldt, Laura B.; Akey, Joshua M. (2009). "Información genómica sobre los patrones y determinantes de la estructura poblacional a escala fina en humanos". The American Journal of Human Genetics . 84 (5): 641–650. doi :10.1016/j.ajhg.2009.04.015. PMC 2681007 . PMID  19442770. 
  13. ^ Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Estructura genética de los europeos: una visión desde el noreste". PLOS ONE . ​​4 (5): e5472. Bibcode :2009PLoSO...4.5472N. doi : 10.1371/journal.pone.0005472 . PMC 2675054 . PMID  19424496. 
  14. ^ Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L.; et al. (2009). "Reconstrucción de la historia de la población india". Nature . 461 (7263): 489–94. Bibcode :2009Natur.461..489R. doi :10.1038/nature08365. PMC 2842210 . PMID  19779445. 
  15. ^ Elhaik, E (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala". PLOS ONE . ​​7 (11): e49837. Bibcode :2012PLoSO...749837E. doi : 10.1371/journal.pone.0049837 . PMC 3504095 . PMID  23185452. 
  16. ^ Wright, Sewall (1965). "La interpretación de la estructura de la población mediante estadísticas F con especial atención a los sistemas de apareamiento". Evolución . 19 (3): 395–420. doi :10.2307/2406450. JSTOR  2406450.
  17. ^ Shalev, BA; Dvorin, A.; Herman, R.; Katz, Z.; Bornstein, S. (1991). "Cría de gansos a largo plazo para la producción de huevos y el peso del hígado lleno". British Poultry Science . 32 (4): 703–9. doi :10.1080/00071669108417396. PMID  1933444.
  18. ^ Excoffier, L; Smouse, PE; Quattro, JM (1992). "Análisis de la varianza molecular inferida a partir de distancias métricas entre haplotipos de ADN: aplicación a datos de restricción de ADN mitocondrial humano". Genética . 131 (2): 479–91. doi :10.1093/genetics/131.2.479. PMC 1205020 . PMID  1644282. 

Enlaces externos