Estadística F

En genética de poblaciones , las estadísticas F (también conocidas como índices de fijación ) describen el nivel estadísticamente esperado de heterocigosidad en una población; más específicamente, el grado esperado (generalmente) de reducción en la heterocigosidad en comparación con la expectativa de Hardy-Weinberg .

Las estadísticas F también pueden considerarse como una medida de la correlación entre genes extraídos en diferentes niveles de una población subdividida (jerárquicamente). Esta correlación está influenciada por varios procesos evolutivos , como la deriva genética , el efecto fundador , el cuello de botella , el autostop genético , el impulso meiótico , la mutación , el flujo genético , la endogamia , la selección natural o el efecto Wahlund , pero originalmente fue diseñada para medir la cantidad de fijación alélica debido a la deriva genética .

El concepto de estadística F fue desarrollado durante la década de 1920 por el genetista estadounidense Sewall Wright , ^[1]^[2] que estaba interesado en la endogamia en el ganado . Sin embargo, debido a que la dominancia completa hace que los fenotipos de los dominantes homocigotos y los heterocigotos sean los mismos, no fue hasta la llegada de la genética molecular a partir de la década de 1960 que se pudo medir la heterocigosidad en las poblaciones.

F se puede utilizar para definir el tamaño efectivo de la población . ^{[ se necesita más explicación ]}

Definiciones y ecuaciones

Las medidas F _IS , F ST y F _IT están relacionadas con las cantidades de heterocigosidad en varios niveles de la estructura de la población. En conjunto, se denominan estadísticas F y se derivan de F , el coeficiente de endogamia . En un sistema simple de dos alelos con endogamia, las frecuencias genotípicas son:

p^{2}(1-F)+pF{\text{ para }}\mathbf {AA} ;\ 2pq(1-F){\text{ para }}\mathbf {Aa} ;{\ texto{ y }}q^{2}(1-F)+qF{\text{ para }}\mathbf {aa} .

El valor de se obtiene al resolver la ecuación para el uso de heterocigotos en la población endogámica anterior. Esto se convierte en uno menos la frecuencia observada de heterocigotos en una población dividida por la frecuencia esperada de heterocigotos en el equilibrio de Hardy-Weinberg : ${\estilo de visualización F}$ ${\estilo de visualización F}$

F=1-{\frac {\operatorname {O} (f(\mathbf {Aa} ))}{\operatorname {E} (f(\mathbf {Aa} ))}}=1-{\ frac {\operatorname {FrecuenciaObservada} (\mathbf {Aa} )}{\operatorname {FrecuenciaEsperada} (\mathbf {Aa} )}},\!

donde la frecuencia esperada en el equilibrio de Hardy-Weinberg está dada por

\operatorname {E} (f(\mathbf {Aa} ))=2pq,\!

donde y son las frecuencias alélicas de y , respectivamente. También es la probabilidad de que en cualquier locus , dos alelos de un individuo aleatorio de la población sean idénticos por descendencia . ${\estilo de visualización p}$ ${\estilo de visualización q}$ $\mathbf {A}$ $\mathbf {a}$

Por ejemplo, consideremos los datos de EB Ford (1971) sobre una sola población de la polilla tigre escarlata :

A partir de esto, se pueden calcular las frecuencias de los alelos y derivar la expectativa de: $f\left(\mathbf {Aa} \right)$

p={2\times \mathrm {obs} (AA)+\mathrm {obs} (Aa) \sobre 2\times (\mathrm {obs} (AA)+\mathrm {obs} (Aa)+ \mathrm {obs} (aa))}=0,954

q=1-p=0,046\,

F=1-{\frac {\mathrm {obs} (Aa)/n}{2pq}}=1-{138/1612 \over 2(0,954)(0,046)}=0,023

Las diferentes estadísticas F analizan diferentes niveles de la estructura de la población. F _IT es el coeficiente de endogamia de un individuo ( I ) en relación con la población total ( T ), como se indicó anteriormente; F _IS es el coeficiente de endogamia de un individuo ( I ) en relación con la subpoblación ( S ), utilizando lo anterior para las subpoblaciones y promediándolos; y F _ST es el efecto de las subpoblaciones ( S ) en comparación con la población total ( T ), y se calcula resolviendo la ecuación:

(1-F_{IS})(1-F_{ST})=1-F_{IT},\,

como se muestra en la siguiente sección.

Partición debido a la estructura de la población

F_{IT}

se puede dividir en debido al efecto Wahlund y debido a la endogamia .

Estilo de visualización F_ {ST}}

F_{IS}

Consideremos una población que tiene una estructura poblacional de dos niveles: uno desde el individuo (I) hasta la subpoblación (S) y otro desde la subpoblación hasta el total (T). Entonces el total , conocido aquí como , se puede dividir en y : ${\estilo de visualización F}$ $F_{IT}$ $F_{IS}$ $Estilo de visualización F_ {ST}}$

1-F_{IT}=(1-F_{IS})\,(1-F_{ST}).\!

Esto se puede dividir aún más en subestructuras de población y se expande de acuerdo con las reglas de expansión binomial , de modo que para I particiones:

1-F=\prod _{i=0}^{i=I}(1-F_{i,i+1})\!

Índice de fijación

Una reformulación de la definición de sería la relación entre el número promedio de diferencias entre pares de cromosomas muestreados en individuos diploides y el número promedio obtenido al muestrear cromosomas aleatoriamente de la población (excluyendo la agrupación por individuo). Se puede modificar esta definición y considerar una agrupación por subpoblación en lugar de por individuo. Los genetistas de poblaciones han utilizado esa idea para medir el grado de estructura en una población. ${\estilo de visualización F}$

Lamentablemente, existe una gran cantidad de definiciones de , lo que genera cierta confusión en la literatura científica. Una definición común es la siguiente: $Estilo de visualización F_ {ST}}$

F_{ST}={\frac {\operatorname {var} (\mathbf {p} )}{p\,(1-p)}}\!

donde la varianza de se calcula entre subpoblaciones y es la frecuencia esperada de heterocigotos. $\mathbf {p}$ ${\estilo de visualización p\,(1-p)}$

Índice de fijación en poblaciones humanas

Está bien establecido que la diversidad genética entre las poblaciones humanas es baja, ^[3] aunque la distribución de la diversidad genética solo se estimó de manera aproximada. Los primeros estudios sostuvieron que el 85-90% de la variación genética se encuentra dentro de los individuos que residen en las mismas poblaciones dentro de los continentes (poblaciones intracontinentales) y solo un 10-15% adicional se encuentra entre poblaciones de diferentes continentes (poblaciones continentales). ^[4]^[5]^[6]^[7]^[8] Estudios posteriores basados en cientos de miles de polimorfismos de un solo nucleótido (SNP) sugirieron que la diversidad genética entre poblaciones continentales es incluso menor y representa entre el 3 y el 7% ^[9]^[10]^[11]^[12]^[13]^[14] Un estudio posterior basado en tres millones de SNP encontró que el 12% de la variación genética se encuentra entre poblaciones continentales y solo el 1% dentro de ellas. ^[15] La mayoría de estos estudios han utilizado las estadísticas F ST^[16] o estadísticas estrechamente relacionadas. ^[17]^[18]

Véase también

Referencias

^ Wright, S (1950). "Estructura genética de las poblaciones". Nature . 166 (4215): 247–9. Bibcode :1950Natur.166..247W. doi :10.1038/166247a0. PMID 15439261. S2CID 36311175.
^ Kulig, K (1985). "Utilización de pruebas toxicológicas de emergencia". The American Journal of Emergency Medicine . 3 (6): 573–4. doi :10.1016/0735-6757(85)90177-9. LCCN 67025533. PMID 4063030.
^ Holsinger, Kent E.; Weir, Bruce S. (2009). "Genética en poblaciones geográficamente estructuradas: definición, estimación e interpretación de FST". Nature Reviews Genetics . 10 (9): 639–50. doi :10.1038/nrg2611. PMC 4687486 . PMID 19687804.
^ Lewontin (1972). "La distribución de la diversidad humana". Biología evolutiva . Vol. 6. págs. 381–98. doi :10.1007/978-1-4684-9063-3_14. ISBN . 978-1-4684-9065-7.
^ Bowcock, Anne M.; Kidd, Judith R.; Mountain, Joanna L.; Herbert, Joan M.; Carotenuto, Luciano; Kidd, Kenneth K.; Cavalli-Sforza, Luca (1991). "Deriva, mezcla y selección en la evolución humana: un estudio con polimorfismos de ADN". Actas de la Academia Nacional de Ciencias . 88 (3): 839–43. Bibcode :1991PNAS...88..839B. doi : 10.1073/pnas.88.3.839 . JSTOR 2356081. PMC 50909 . PMID 1992475.
^ Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "Una distribución de la diversidad del ADN humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 94 (9): 4516–9. Código bibliográfico : 1997PNAS...94.4516B. doi : 10.1073/pnas.94.9.4516 . JSTOR 42042. PMC 20754 . PMID 9114021.
^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). "La distribución de la diversidad genética humana: una comparación de datos mitocondriales, autosómicos y del cromosoma Y". The American Journal of Human Genetics . 66 (3): 979–88. doi :10.1086/302825. PMC 1288178 . PMID 10712212.
^ Jorde, Lynn B; Wooding, Stephen P (2004). "Variación genética, clasificación y 'raza'". Nature Genetics . 36 (11s): S28-33. doi : 10.1038/ng1435 . PMID 15508000.
^ Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similitud de la frecuencia de alelos y el patrón de desequilibrio de ligamiento de polimorfismos de un solo nucleótido en loci de genes relacionados con fármacos entre poblaciones tailandesas y del norte de Asia oriental: implicaciones para la selección de SNP de etiquetado en tailandeses". Journal of Human Genetics . 51 (10): 896–904. doi : 10.1007/s10038-006-0041-1 . PMID 16957813.
^ Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Subestructura poblacional en Finlandia y Suecia revelada por el uso de coordenadas espaciales y un pequeño número de SNP autosómicos no ligados". BMC Genetics . 9 : 54. doi : 10.1186/1471-2156-9-54 . PMC 2527025 . PMID 18713460.
^ Laos, Óscar; Lu, Timothy T.; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlación entre estructura genética y geográfica en Europa". Biología actual . 18 (16): 1241–8. Código Bib : 2008CBio...18.1241L. doi : 10.1016/j.cub.2008.07.049 . PMID 18691889.
^ Biswas, Shameek; Scheinfeldt, Laura B.; Akey, Joshua M. (2009). "Información genómica sobre los patrones y determinantes de la estructura poblacional a escala fina en humanos". The American Journal of Human Genetics . 84 (5): 641–650. doi :10.1016/j.ajhg.2009.04.015. PMC 2681007 . PMID 19442770.
^ Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Estructura genética de los europeos: una visión desde el noreste". PLOS ONE . 4 (5): e5472. Bibcode :2009PLoSO...4.5472N. doi : 10.1371/journal.pone.0005472 . PMC 2675054 . PMID 19424496.
^ Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L.; et al. (2009). "Reconstrucción de la historia de la población india". Nature . 461 (7263): 489–94. Bibcode :2009Natur.461..489R. doi :10.1038/nature08365. PMC 2842210 . PMID 19779445.
^ Elhaik, E (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala". PLOS ONE . 7 (11): e49837. Bibcode :2012PLoSO...749837E. doi : 10.1371/journal.pone.0049837 . PMC 3504095 . PMID 23185452.
^ Wright, Sewall (1965). "La interpretación de la estructura de la población mediante estadísticas F con especial atención a los sistemas de apareamiento". Evolución . 19 (3): 395–420. doi :10.2307/2406450. JSTOR 2406450.
^ Shalev, BA; Dvorin, A.; Herman, R.; Katz, Z.; Bornstein, S. (1991). "Cría de gansos a largo plazo para la producción de huevos y el peso del hígado lleno". British Poultry Science . 32 (4): 703–9. doi :10.1080/00071669108417396. PMID 1933444.
^ Excoffier, L; Smouse, PE; Quattro, JM (1992). "Análisis de la varianza molecular inferida a partir de distancias métricas entre haplotipos de ADN: aplicación a datos de restricción de ADN mitocondrial humano". Genética . 131 (2): 479–91. doi :10.1093/genetics/131.2.479. PMC 1205020 . PMID 1644282.

Enlaces externos

Guía sencilla de Shane sobre la estadística F
Análisis de la estructura genética de las poblaciones
Efecto Wahlund, estadística F de Wright Archivado el 27 de mayo de 2005 en Wayback Machine.
Ejemplo práctico de cálculo de estadísticas F a partir de datos genotípicos
Estadísticas F basadas en IAM
Eco-Tool de estadísticas F para genética de poblaciones
Estructura de la población (diapositivas)