stringtranslate.com

Principio de Hardy-Weinberg

Proporciones de Hardy-Weinberg para dos alelos : el eje horizontal muestra las frecuencias de los dos alelos p y q y el eje vertical muestra las frecuencias genotípicas esperadas . Cada línea muestra uno de los tres genotipos posibles.

En genética de poblaciones , el principio de Hardy-Weinberg , también conocido como equilibrio , modelo , teorema o ley de Hardy-Weinberg , establece que las frecuencias de alelos y genotipos en una población permanecerán constantes de generación en generación en ausencia de otras influencias evolutivas. Estas influencias incluyen la deriva genética , la elección de pareja , el apareamiento selectivo , la selección natural , la selección sexual , la mutación , el flujo genético , el impulso meiótico , el autostop genético , el cuello de botella poblacional , el efecto fundador , la endogamia y la depresión por exogamiasmia .

En el caso más simple de un solo locus con dos alelos denominados A y a con frecuencias f (A) = p y f (a) = q , respectivamente, las frecuencias genotípicas esperadas en caso de apareamiento aleatorio son f (AA) = p 2 para los homocigotos AA , f (aa) = q 2 para los homocigotos aa y f (Aa) = 2 pq para los heterocigotos . En ausencia de selección, mutación, deriva genética u otras fuerzas, las frecuencias alélicas p y q son constantes entre generaciones, por lo que se alcanza el equilibrio.

El principio recibe su nombre de GH Hardy y Wilhelm Weinberg , quienes lo demostraron matemáticamente por primera vez. El artículo de Hardy se centró en desacreditar la idea de que un alelo dominante tendería automáticamente a aumentar su frecuencia (una idea posiblemente basada en una pregunta malinterpretada en una conferencia [1] ). Hoy en día, las pruebas para las frecuencias genotípicas de Hardy-Weinberg se utilizan principalmente para probar la estratificación de la población y otras formas de apareamiento no aleatorio.

Derivación

Consideremos una población de diploides monoicos , donde cada organismo produce gametos masculinos y femeninos con la misma frecuencia, y tiene dos alelos en cada locus genético. Suponemos que la población es tan grande que puede tratarse como infinita. Los organismos se reproducen por unión aleatoria de gametos (el modelo de población del "acervo genético"). Un locus en esta población tiene dos alelos, A y a, que aparecen con frecuencias iniciales f 0 (A) = p y f 0 (a) = q , respectivamente. [nota 1] Las frecuencias alélicas en cada generación se obtienen agrupando los alelos de cada genotipo de la misma generación de acuerdo con la contribución esperada de los genotipos homocigoto y heterocigoto, que son 1 y 1/2, respectivamente:

La longitud de p , q corresponde a las frecuencias alélicas (aquí p = 0,6, q = 0,4 ). El área del rectángulo representa las frecuencias genotípicas (por lo tanto, AA: Aa: aa = 0,36: 0,48: 0,16 ).

Las diferentes formas de formar genotipos para la próxima generación se pueden mostrar en un cuadro de Punnett , donde la proporción de cada genotipo es igual al producto de las frecuencias alélicas de fila y columna de la generación actual.

La suma de las entradas es p 2 + 2 pq + q 2 = 1 , ya que las frecuencias genotípicas deben sumar uno.

Nótese nuevamente que como p + q = 1 , la expansión binomial de ( p + q ) 2 = p 2 + 2 pq + q 2 = 1 da las mismas relaciones.

Sumando los elementos del cuadro de Punnett o de la expansión binomial, obtenemos las proporciones genotípicas esperadas entre la descendencia después de una sola generación:

Estas frecuencias definen el equilibrio de Hardy-Weinberg. Cabe mencionar que las frecuencias genotípicas después de la primera generación no necesitan ser iguales a las frecuencias genotípicas de la generación inicial, p. ej. f 1 (AA) ≠ f 0 (AA) . Sin embargo, las frecuencias genotípicas para todos los tiempos futuros serán iguales a las frecuencias de Hardy-Weinberg, p. ej. f t (AA) = f 1 (AA) para t > 1 . Esto se deduce ya que las frecuencias genotípicas de la próxima generación dependen solo de las frecuencias alélicas de la generación actual que, como se calcula mediante las ecuaciones ( 1 ) y ( 2 ), se conservan de la generación inicial:

Para el caso más general de diploides dioicos [los organismos son masculinos o femeninos] que se reproducen mediante apareamiento aleatorio de individuos, es necesario calcular las frecuencias genotípicas de los nueve apareamientos posibles entre cada genotipo parental ( AA , Aa y aa ) en cada sexo, ponderados por las contribuciones genotípicas esperadas de cada uno de esos apareamientos. [2] De manera equivalente, se consideran las seis combinaciones únicas diploide-diploide:

y construye un cuadro de Punnett para cada uno, de modo de calcular su contribución a los genotipos de la siguiente generación. Estas contribuciones se ponderan de acuerdo con la probabilidad de cada combinación diploide-diploide, que sigue una distribución multinomial con k = 3 . Por ejemplo, la probabilidad de la combinación de apareamiento (AA,aa) es 2 f t (AA) f t (aa) y solo puede dar como resultado el genotipo Aa : [0,1,0] . En general, las frecuencias genotípicas resultantes se calculan como:

Como antes, se puede demostrar que las frecuencias alélicas en el momento t + 1 son iguales a las del momento t y, por lo tanto, son constantes en el tiempo. De manera similar, las frecuencias genotípicas dependen únicamente de las frecuencias alélicas y, por lo tanto, después del momento t  = 1 también son constantes en el tiempo.

Si en organismos monoicos o dioicos , las proporciones de alelos o genotipos son inicialmente desiguales en cualquiera de los sexos, se puede demostrar que se obtienen proporciones constantes después de una generación de apareamiento aleatorio. Si los organismos dioicos son heterogaméticos y el locus del gen está ubicado en el cromosoma X , se puede demostrar que si las frecuencias de alelos son inicialmente desiguales en los dos sexos [ p . ej ., hembras XX y machos XY, como en los humanos], f ′(a) en el sexo heterogamético 'persigue' a f (a) en el sexo homogamético de la generación anterior, hasta que se alcanza un equilibrio en el promedio ponderado de las dos frecuencias iniciales.

Desviaciones del equilibrio de Hardy-Weinberg

Los siete supuestos que sustentan el equilibrio de Hardy-Weinberg son los siguientes: [3]

Las violaciones de los supuestos de Hardy-Weinberg pueden provocar desviaciones de las expectativas. La forma en que esto afecta a la población depende de los supuestos que se violen.

Si una población viola uno de los siguientes cuatro supuestos, la población puede seguir teniendo proporciones de Hardy-Weinberg cada generación, pero las frecuencias alélicas cambiarán con el tiempo.

En los datos de genotipo del mundo real, las desviaciones del equilibrio de Hardy-Weinberg pueden ser un signo de error de genotipificación. [4] [5] [6]

Vinculación sexual

Cuando el gen A está ligado al sexo , el sexo heterogamético ( p. ej ., machos de mamíferos; hembras de aves) tiene solo una copia del gen (y se denominan hemicigotos), mientras que el sexo homogamético ( p. ej. , hembras humanas ) tiene dos copias. Las frecuencias genotípicas en equilibrio son p y q para el sexo heterogamético, pero p 2 , 2 pq y q 2 para el sexo homogamético.

Por ejemplo, en los humanos , el daltonismo rojo-verde es un rasgo recesivo ligado al cromosoma X. En los varones de Europa occidental, el rasgo afecta a aproximadamente 1 de cada 12 ( q  = 0,083), mientras que afecta a aproximadamente 1 de cada 200 mujeres (0,005, en comparación con q2  = 0,007), una proporción muy cercana a la de Hardy-Weinberg .

Si se reúne una población con machos y hembras con una frecuencia alélica diferente en cada subpoblación (machos o hembras), la frecuencia alélica de la población masculina en la siguiente generación seguirá a la de la población femenina porque cada hijo recibe su cromosoma X de su madre. La población converge al equilibrio muy rápidamente.

Generalizaciones

La simple derivación anterior se puede generalizar para más de dos alelos y poliploidía .

Generalización para más de dos alelos

Cuadro de Punnett para el caso de tres alelos (izquierda) y el caso de cuatro alelos (derecha). Las áreas blancas son homocigotas. Las áreas coloreadas son heterocigotas.

Consideremos una frecuencia alélica adicional,  r . El caso de dos alelos es la expansión binomial de ( p  +  q ) 2 , y por lo tanto el caso de tres alelos es la expansión trinomial de ( p  +  q  +  r ) 2 .

De manera más general, considérense los alelos A 1 , ..., A n dados por las frecuencias alélicas p 1 a p n ;

dando para todos los homocigotos :

y para todos los heterocigotos :

Generalización para la poliploidía

El principio de Hardy-Weinberg también se puede generalizar a sistemas poliploides , es decir, a organismos que tienen más de dos copias de cada cromosoma. Consideremos nuevamente sólo dos alelos. El caso diploide es la expansión binomial de:

y por lo tanto el caso poliploide es la expansión binomial de:

donde c es la ploidía , por ejemplo con tetraploide ( c = 4):

El tiempo que tardará la población en alcanzar el equilibrio de Hardy-Weinberg dependerá de si el organismo es un tetraploide "verdadero" o un anfidiploide.

Generalización completa

Para alelos distintos en -ploides, las frecuencias genotípicas en el equilibrio de Hardy-Weinberg están dadas por términos individuales en la expansión multinomial de :

Pruebas de significación para la desviación

La prueba de desviación de la distribución de genotipos de Pearson se realiza generalmente utilizando la prueba de chi-cuadrado de Pearson , utilizando las frecuencias genotípicas observadas obtenidas de los datos y las frecuencias genotípicas esperadas obtenidas utilizando la distribución de genotipos de Pearson. Para sistemas donde hay una gran cantidad de alelos, esto puede dar como resultado datos con muchos genotipos posibles vacíos y recuentos bajos de genotipos, porque a menudo no hay suficientes individuos presentes en la muestra para representar adecuadamente todas las clases de genotipos. Si este es el caso, entonces el supuesto asintótico de la distribución de chi-cuadrado ya no se cumplirá, y puede ser necesario utilizar una forma de prueba exacta de Fisher , que requiere una computadora para resolverla. Más recientemente, se han propuesto varios métodos MCMC para probar las desviaciones de la distribución de genotipos de Pearson (Guo y Thompson, 1992; Wigginton et al. 2005).

Ejemplo de prueba de chi-cuadrado para la desviación

Estos datos son de EB Ford (1971) sobre la polilla tigre escarlata , para la cual se registraron los fenotipos de una muestra de la población. Se supone que la distinción entre genotipo y fenotipo es insignificante. La hipótesis nula es que la población está en proporciones de Hardy-Weinberg, y la hipótesis alternativa es que la población no está en proporciones de Hardy-Weinberg.

A partir de esto, se pueden calcular las frecuencias alélicas:

y

Por lo tanto, la expectativa de Hardy-Weinberg es:

La prueba de chi-cuadrado de Pearson establece:

Hay 1 grado de libertad (los grados de libertad para la prueba de proporciones de Hardy-Weinberg son # genotipos − # alelos). El nivel de significancia del 5 % para 1 grado de libertad es 3,84 y, dado que el valor de χ 2 es menor que este, no se rechaza la hipótesis nula de que la población se encuentra en frecuencias de Hardy-Weinberg .

Prueba exacta de Fisher (prueba de probabilidad)

La prueba exacta de Fisher se puede aplicar para comprobar las proporciones de Hardy-Weinberg. Dado que la prueba está condicionada a las frecuencias de los alelos, p y q , el problema puede considerarse como una prueba del número adecuado de heterocigotos. De esta manera, la hipótesis de las proporciones de Hardy-Weinberg se rechaza si el número de heterocigotos es demasiado grande o demasiado pequeño. Las probabilidades condicionales para el heterocigoto, dadas las frecuencias de los alelos, se dan en Emigh (1980) como

donde n 11 , n 12 , n 22 son los números observados de los tres genotipos, AA, Aa y aa, respectivamente, y n 1 es el número de alelos A, donde .

Un ejemplo Utilizando uno de los ejemplos de Emigh (1980), [7] podemos considerar el caso donde n  = 100 y p  = 0,34. Los posibles heterocigotos observados y su nivel de significación exacto se dan en la Tabla 4.

Utilizando esta tabla, se debe buscar el nivel de significancia de la prueba en función del número observado de heterocigotos. Por ejemplo, si se observaron 20 heterocigotos, el nivel de significancia de la prueba es 0,007. Como es habitual en la prueba exacta de Fisher para muestras pequeñas, la gradación de los niveles de significancia es bastante burda.

Sin embargo, se debe crear una tabla como ésta para cada experimento, ya que las tablas dependen tanto de n como de p .

Pruebas de equivalencia

Las pruebas de equivalencia se desarrollan para establecer un acuerdo suficientemente bueno entre las frecuencias genotípicas observadas y el equilibrio de Hardy Weinberg. Sea la familia de distribuciones genotípicas bajo el supuesto de equilibrio de Hardy Weinberg. La distancia entre una distribución genotípica y el equilibrio de Hardy Weinberg se define por , donde es cierta distancia. El problema de la prueba de equivalencia está dado por y , donde es un parámetro de tolerancia. Si la hipótesis puede rechazarse, entonces la población está cerca del equilibrio de Hardy Weinberg con una alta probabilidad. Las pruebas de equivalencia para el caso bialélico se desarrollan, entre otros, en Wellek (2004). [8] Las pruebas de equivalencia para el caso de alelos múltiples se proponen en Ostrovski (2020). [9]

Coeficiente de endogamia

El coeficiente de endogamia (ver también estadística F ) es uno menos la frecuencia observada de heterocigotos sobre la esperada a partir del equilibrio de Hardy-Weinberg.

donde el valor esperado del equilibrio de Hardy-Weinberg viene dado por

Por ejemplo, para los datos de Ford anteriores:

Para dos alelos, la prueba de bondad de ajuste de chi-cuadrado para las proporciones de Hardy-Weinberg es equivalente a la prueba de endogamia,  .

El coeficiente de endogamia es inestable a medida que el valor esperado se acerca a cero y, por lo tanto, no es útil para alelos raros y muy comunes. Para: ; no está definido.

Historia

La genética mendeliana fue redescubierta en 1900. Sin embargo, siguió siendo algo controvertida durante varios años ya que no se sabía entonces cómo podía causar características continuas. Udny Yule (1902) argumentó en contra del mendelismo porque pensaba que los alelos dominantes aumentarían en la población. [10] El estadounidense William E. Castle (1903) demostró que sin selección , las frecuencias genotípicas permanecerían estables. [11] Karl Pearson (1903) encontró una posición de equilibrio con valores de p  =  q  = 0,5. [12] Reginald Punnett , incapaz de refutar el punto de Yule, presentó el problema a GH Hardy , un matemático británico , con quien jugaba al cricket . Hardy era un matemático puro y despreciaba las matemáticas aplicadas ; su visión del uso de las matemáticas por parte de los biólogos se refleja en su artículo de 1908, donde describe esto como "muy simple": [13]

Al editor de Science: Me resisto a entrometerme en una discusión sobre cuestiones de las que no tengo conocimientos especializados, y esperaba que el punto muy simple que deseo plantear fuera familiar para los biólogos. Sin embargo, algunas observaciones del Sr. Udny Yule, sobre las que el Sr. RC Punnett me ha llamado la atención, sugieren que todavía puede valer la pena hacer...
Supongamos que Aa es un par de caracteres mendelianos, siendo A dominante, y que en cualquier generación dada el número de dominantes puros (AA), heterocigotos (Aa) y recesivos puros (aa) es como p :2 q : r . Finalmente, supongamos que los números son bastante grandes, de modo que el apareamiento puede considerarse aleatorio, que los sexos están distribuidos uniformemente entre las tres variedades y que todos son igualmente fértiles. Un poco de matemáticas del tipo de las tablas de multiplicar es suficiente para mostrar que en la próxima generación los números serán como ( p  +  q ) 2 :2( p  +  q )( q  +  r ):( q  +  r ) 2 , o como p 1 :2 q 1 : r 1 , digamos.
La pregunta interesante es: ¿en qué circunstancias esta distribución será la misma que en la generación anterior? Es fácil ver que la condición para esto es q 2  =  pr . Y como q 1 2  =  p 1 r 1 , cualesquiera que sean los valores de p , q y r , la distribución en cualquier caso continuará sin cambios después de la segunda generación .

El principio fue conocido como ley de Hardy en el mundo angloparlante hasta 1943, cuando Curt Stern señaló que había sido formulado por primera vez de forma independiente en 1908 por el médico alemán Wilhelm Weinberg . [14] [15] William Castle en 1903 también derivó las proporciones para el caso especial de frecuencias alélicas iguales, y a veces (pero rara vez) se le llama ley de Hardy-Weinberg-Castle.

Derivación de las ecuaciones de Hardy

La afirmación de Hardy comienza con una relación de recurrencia para las frecuencias p , 2 q y r . Estas relaciones de recurrencia se derivan de conceptos fundamentales en probabilidad, específicamente independencia y probabilidad condicional . Por ejemplo, considere la probabilidad de que un descendiente de la generación sea homocigoto dominante. Los alelos se heredan independientemente de cada progenitor. Un alelo dominante puede heredarse de un progenitor homocigoto dominante con probabilidad 1, o de un progenitor heterocigoto con probabilidad 0,5. Para representar este razonamiento en una ecuación, sea que represente la herencia de un alelo dominante de un progenitor. Además, sea que y represente los genotipos parentales potenciales en la generación precedente.

El mismo razonamiento, aplicado a los demás genotipos, produce las dos relaciones de recurrencia restantes. El equilibrio se produce cuando cada proporción es constante entre generaciones posteriores. Más formalmente, una población está en equilibrio en una generación cuando

, , y

Al resolver estas ecuaciones se pueden determinar las condiciones necesarias y suficientes para que se produzca el equilibrio. De nuevo, considere la frecuencia de animales dominantes homocigotos. El equilibrio implica

Consideremos primero el caso, donde , y observemos que implica que y . Ahora consideremos el caso restante, donde :

donde la igualdad final se cumple porque las proporciones de los alelos deben sumar uno. En ambos casos, . Se puede demostrar que las otras dos condiciones de equilibrio implican la misma ecuación. Juntas, las soluciones de las tres ecuaciones de equilibrio implican la suficiencia de la condición de Hardy para el equilibrio. Dado que la condición siempre se cumple para la segunda generación, todas las generaciones sucesivas tienen las mismas proporciones.

Ejemplo numérico

Estimación de la distribución de genotipos

Resulta ilustrativo un ejemplo de cálculo de la distribución de genotipos dada por las ecuaciones originales de Hardy. La distribución de fenotipos de la Tabla 3 anterior se utilizará para calcular la distribución de genotipos inicial de Hardy. Obsérvese que los valores p y q utilizados por Hardy no son los mismos que los utilizados anteriormente.

Como comprobaciones de la distribución, calcular

y

Para la próxima generación, las ecuaciones de Hardy dan

Nuevamente, como comprobaciones de la distribución, calcule

y

cuáles son los valores esperados. El lector puede demostrar que el uso posterior de los valores de segunda generación para una tercera generación arrojará resultados idénticos.

Estimación de la frecuencia portadora

El principio de Hardy-Weinberg también se puede utilizar para estimar la frecuencia de portadores de una enfermedad autosómica recesiva en una población basándose en la frecuencia de quienes la padecen.

Supongamos que nacen aproximadamente bebés con fibrosis quística , que es aproximadamente la frecuencia de individuos homocigotos observada en las poblaciones del norte de Europa. Podemos utilizar las ecuaciones de Hardy-Weinberg para estimar la frecuencia de portadores, la frecuencia de individuos heterocigotos .

Como es pequeño podemos tomar p , , como 1.

Por lo tanto, estimamos que la tasa de portadores es , que es aproximadamente la frecuencia observada en las poblaciones del norte de Europa.

Esto se puede simplificar diciendo que la frecuencia portadora es aproximadamente el doble de la raíz cuadrada de la frecuencia de nacimiento.

Representación gráfica

Diagrama de De Finetti que representa una distribución de frecuencias genotípicas.

Es posible representar gráficamente la distribución de frecuencias genotípicas para un locus bialélico dentro de una población utilizando un diagrama de De Finetti . Este utiliza un gráfico triangular (también conocido como gráfico trilineal, triaxial o ternario ) para representar la distribución de las tres frecuencias genotípicas en relación entre sí. Se diferencia de muchos otros gráficos similares en que se ha invertido la dirección de uno de los ejes. [16] La línea curva en el diagrama es la parábola de Hardy-Weinberg y representa el estado en el que los alelos están en equilibrio de Hardy-Weinberg. Es posible representar los efectos de la selección natural y su efecto sobre la frecuencia de los alelos en dichos gráficos. [17] El diagrama de De Finetti fue desarrollado y utilizado ampliamente por AWF Edwards en su libro Foundations of Mathematical Genetics . [18]

Véase también

Notas

  1. ^ El término frecuencia generalmente se refiere a un número o recuento, pero en este contexto es sinónimo de probabilidad .

Referencias

Citas

  1. ^ Edwards, AWF (2008). "GH Hardy (1908) y equilibrio Hardy–Weinberg". Genética . 179 (3): 1143–1150. doi :10.1534/genetics.104.92940. ISSN  0016-6731. PMC  2475721 . PMID  18645201.
  2. ^ Carr, Dr. Steven M. "Hardy–Weinberg en organismos dioicos". www.mun.ca .
  3. ^ Hartl DL, Clarke AG (2007) Principios de genética de poblaciones. Sunderland, MA: Sinauer
  4. ^ Hosking, Louise; Lumsden, Sheena; Lewis, Karen; Yeo, Astrid; McCarthy, Linda; Bansal, Aruna; Riley, John; Purvis, Ian; Xu, Chun-Fang (mayo de 2004). "Detección de errores de genotipado mediante pruebas de equilibrio de Hardy-Weinberg". Revista Europea de Genética Humana . 12 (5): 395–399. doi : 10.1038/sj.ejhg.5201164 . ISSN  1018-4813. PMID  14872201.
  5. ^ Pompanon, François; Bonin, Aurélie; Bellemain, Eva; Taberlet, Pierre (noviembre de 2005). "Errores de genotipado: causas, consecuencias y soluciones". Nature Reviews Genetics . 6 (11): 847–859. doi :10.1038/nrg1707. ISSN  1471-0064. PMID  16304600. S2CID  14031116.
  6. ^ Cox, David G.; Kraft, Peter (2006). "Cuantificación del poder de las pruebas de equilibrio de Hardy-Weinberg para detectar errores de genotipado". Herencia humana . 61 (1): 10–14. doi :10.1159/000091787. ISSN  0001-5652. PMID  16514241. S2CID  37599930.
  7. ^ ab Emigh, Ted H. (1980). "Una comparación de pruebas para el equilibrio de Hardy-Weinberg". Biometrics . 36 (4): 627–642. doi :10.2307/2556115. JSTOR  2556115. PMID  25856832.
  8. ^ Wellek, Stefan (septiembre de 2004). "Pruebas para establecer la compatibilidad de una distribución de genotipos observada con el equilibrio de Hardy-Weinberg en el caso de un locus bialélico". Biometrics . 60 (3): 694–703. doi :10.1111/j.0006-341X.2004.00219.x. PMID  15339292. S2CID  12028776.Enlace web oficial (requiere suscripción)
  9. ^ Ostrovski, Vladimir (febrero de 2020). "Nuevas pruebas de equivalencia para el equilibrio de Hardy-Weinberg y alelos múltiples". Estadísticas . 3 : 34–39. doi : 10.3390/stats3010004 .Enlace web oficial
  10. ^ Navidad, 1902
  11. ^ Castillo, 1903
  12. ^ Pearson, 1903
  13. ^ Hardy, 1908
  14. ^ Crow, James F. (1999). "Hardy, Weinberg y los impedimentos del lenguaje". Genética . 152 (3): 821–825. doi :10.1093/genetics/152.3.821. PMC 1460671 . PMID  10388804. 
  15. ^ Stern, Curt (1962). "Wilhelm Weinberg". Genética . 47 : 1–5.
  16. ^ Cannings, C.; Edwards, AWF (1968). "Selección natural y el diagrama de De Finetti". Anales de genética humana . 31 (4): 421–428. doi :10.1111/j.1469-1809.1968.tb00575.x. PMID  5673165. S2CID  8863631.
  17. ^ Véase, por ejemplo, Ineichen y Batschelet, 1975.
  18. ^ Edwards, 1977

Fuentes

Enlaces externos