Nivel de heterocigosidad estadísticamente esperado en una población
En genética de poblaciones , las estadísticas F (también conocidas como índices de fijación ) describen el nivel estadísticamente esperado de heterocigosidad en una población; más específicamente, el grado esperado (generalmente) de reducción en la heterocigosidad en comparación con la expectativa de Hardy-Weinberg .
El concepto de estadística F fue desarrollado durante la década de 1920 por el genetista estadounidense Sewall Wright , [1] [2] que estaba interesado en la endogamia en el ganado . Sin embargo, debido a que la dominancia completa hace que los fenotipos de los dominantes homocigotos y los heterocigotos sean los mismos, no fue hasta la llegada de la genética molecular a partir de la década de 1960 que se pudo medir la heterocigosidad en las poblaciones.
Las medidas F IS , F ST y F IT están relacionadas con las cantidades de heterocigosidad en varios niveles de la estructura de la población. En conjunto, se denominan estadísticas F y se derivan de F , el coeficiente de endogamia . En un sistema simple de dos alelos con endogamia, las frecuencias genotípicas son:
Las diferentes estadísticas F analizan diferentes niveles de la estructura de la población. F IT es el coeficiente de endogamia de un individuo ( I ) en relación con la población total ( T ), como se indicó anteriormente; F IS es el coeficiente de endogamia de un individuo ( I ) en relación con la subpoblación ( S ), utilizando lo anterior para las subpoblaciones y promediándolos; y F ST es el efecto de las subpoblaciones ( S ) en comparación con la población total ( T ), y se calcula resolviendo la ecuación:
como se muestra en la siguiente sección.
Partición debido a la estructura de la población
Consideremos una población que tiene una estructura poblacional de dos niveles: uno desde el individuo (I) hasta la subpoblación (S) y otro desde la subpoblación hasta el total (T). Entonces el total , conocido aquí como , se puede dividir en y :
Esto se puede dividir aún más en subestructuras de población y se expande de acuerdo con las reglas de expansión binomial , de modo que para I particiones:
Índice de fijación
Una reformulación de la definición de sería la relación entre el número promedio de diferencias entre pares de cromosomas muestreados en individuos diploides y el número promedio obtenido al muestrear cromosomas aleatoriamente de la población (excluyendo la agrupación por individuo). Se puede modificar esta definición y considerar una agrupación por subpoblación en lugar de por individuo. Los genetistas de poblaciones han utilizado esa idea para medir el grado de estructura en una población.
Lamentablemente, existe una gran cantidad de definiciones de , lo que genera cierta confusión en la literatura científica. Una definición común es la siguiente:
donde la varianza de se calcula entre subpoblaciones y es la frecuencia esperada de heterocigotos.
Índice de fijación en poblaciones humanas
Está bien establecido que la diversidad genética entre las poblaciones humanas es baja, [3] aunque la distribución de la diversidad genética solo se estimó de manera aproximada. Los primeros estudios sostuvieron que el 85-90% de la variación genética se encuentra dentro de los individuos que residen en las mismas poblaciones dentro de los continentes (poblaciones intracontinentales) y solo un 10-15% adicional se encuentra entre poblaciones de diferentes continentes (poblaciones continentales). [4] [5] [6] [7] [8] Estudios posteriores basados en cientos de miles de polimorfismos de un solo nucleótido (SNP) sugirieron que la diversidad genética entre poblaciones continentales es incluso menor y representa entre el 3 y el 7% [9] [10] [11] [12] [13] [14] Un estudio posterior basado en tres millones de SNP encontró que el 12% de la variación genética se encuentra entre poblaciones continentales y solo el 1% dentro de ellas. [15] La mayoría de estos estudios han utilizado las estadísticas F ST [16] o estadísticas estrechamente relacionadas. [17] [18]
^ Wright, S (1950). "Estructura genética de las poblaciones". Nature . 166 (4215): 247–9. Bibcode :1950Natur.166..247W. doi :10.1038/166247a0. PMID 15439261. S2CID 36311175.
^ Kulig, K (1985). "Utilización de pruebas toxicológicas de emergencia". The American Journal of Emergency Medicine . 3 (6): 573–4. doi :10.1016/0735-6757(85)90177-9. LCCN 67025533. PMID 4063030.
^ Holsinger, Kent E.; Weir, Bruce S. (2009). "Genética en poblaciones geográficamente estructuradas: definición, estimación e interpretación de FST". Nature Reviews Genetics . 10 (9): 639–50. doi :10.1038/nrg2611. PMC 4687486 . PMID 19687804.
^ Lewontin (1972). "La distribución de la diversidad humana". Biología evolutiva . Vol. 6. págs. 381–98. doi :10.1007/978-1-4684-9063-3_14. ISBN .978-1-4684-9065-7.
^ Bowcock, Anne M.; Kidd, Judith R.; Mountain, Joanna L.; Herbert, Joan M.; Carotenuto, Luciano; Kidd, Kenneth K.; Cavalli-Sforza, Luca (1991). "Deriva, mezcla y selección en la evolución humana: un estudio con polimorfismos de ADN". Actas de la Academia Nacional de Ciencias . 88 (3): 839–43. Bibcode :1991PNAS...88..839B. doi : 10.1073/pnas.88.3.839 . JSTOR 2356081. PMC 50909 . PMID 1992475.
^ Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "Una distribución de la diversidad del ADN humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 94 (9): 4516–9. Código bibliográfico : 1997PNAS...94.4516B. doi : 10.1073/pnas.94.9.4516 . JSTOR 42042. PMC 20754 . PMID 9114021.
^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). "La distribución de la diversidad genética humana: una comparación de datos mitocondriales, autosómicos y del cromosoma Y". The American Journal of Human Genetics . 66 (3): 979–88. doi :10.1086/302825. PMC 1288178 . PMID 10712212.
^ Jorde, Lynn B; Wooding, Stephen P (2004). "Variación genética, clasificación y 'raza'". Nature Genetics . 36 (11s): S28-33. doi : 10.1038/ng1435 . PMID 15508000.
^ Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similitud de la frecuencia de alelos y el patrón de desequilibrio de ligamiento de polimorfismos de un solo nucleótido en loci de genes relacionados con fármacos entre poblaciones tailandesas y del norte de Asia oriental: implicaciones para la selección de SNP de etiquetado en tailandeses". Journal of Human Genetics . 51 (10): 896–904. doi : 10.1007/s10038-006-0041-1 . PMID 16957813.
^ Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Subestructura poblacional en Finlandia y Suecia revelada por el uso de coordenadas espaciales y un pequeño número de SNP autosómicos no ligados". BMC Genetics . 9 : 54. doi : 10.1186/1471-2156-9-54 . PMC 2527025 . PMID 18713460.
^ Laos, Óscar; Lu, Timothy T.; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlación entre estructura genética y geográfica en Europa". Biología actual . 18 (16): 1241–8. Código Bib : 2008CBio...18.1241L. doi : 10.1016/j.cub.2008.07.049 . PMID 18691889.
^ Biswas, Shameek; Scheinfeldt, Laura B.; Akey, Joshua M. (2009). "Información genómica sobre los patrones y determinantes de la estructura poblacional a escala fina en humanos". The American Journal of Human Genetics . 84 (5): 641–650. doi :10.1016/j.ajhg.2009.04.015. PMC 2681007 . PMID 19442770.
^ Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Estructura genética de los europeos: una visión desde el noreste". PLOS ONE . 4 (5): e5472. Bibcode :2009PLoSO...4.5472N. doi : 10.1371/journal.pone.0005472 . PMC 2675054 . PMID 19424496.
^ Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L.; et al. (2009). "Reconstrucción de la historia de la población india". Nature . 461 (7263): 489–94. Bibcode :2009Natur.461..489R. doi :10.1038/nature08365. PMC 2842210 . PMID 19779445.
^ Elhaik, E (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala". PLOS ONE . 7 (11): e49837. Bibcode :2012PLoSO...749837E. doi : 10.1371/journal.pone.0049837 . PMC 3504095 . PMID 23185452.
^ Wright, Sewall (1965). "La interpretación de la estructura de la población mediante estadísticas F con especial atención a los sistemas de apareamiento". Evolución . 19 (3): 395–420. doi :10.2307/2406450. JSTOR 2406450.
^ Shalev, BA; Dvorin, A.; Herman, R.; Katz, Z.; Bornstein, S. (1991). "Cría de gansos a largo plazo para la producción de huevos y el peso del hígado lleno". British Poultry Science . 32 (4): 703–9. doi :10.1080/00071669108417396. PMID 1933444.
^ Excoffier, L; Smouse, PE; Quattro, JM (1992). "Análisis de la varianza molecular inferida a partir de distancias métricas entre haplotipos de ADN: aplicación a datos de restricción de ADN mitocondrial humano". Genética . 131 (2): 479–91. doi :10.1093/genetics/131.2.479. PMC 1205020 . PMID 1644282.
Enlaces externos
Guía sencilla de Shane sobre la estadística F
Análisis de la estructura genética de las poblaciones
Efecto Wahlund, estadística F de Wright Archivado el 27 de mayo de 2005 en Wayback Machine.
Ejemplo práctico de cálculo de estadísticas F a partir de datos genotípicos
Estadísticas F basadas en IAM
Eco-Tool de estadísticas F para genética de poblaciones