stringtranslate.com

Genética cuantitativa

La genética cuantitativa es el estudio de los rasgos cuantitativos , que son fenotipos que varían continuamente (como la altura o la masa), a diferencia de los fenotipos y productos genéticos que son discretamente identificables (como el color de los ojos o la presencia de una sustancia bioquímica particular).

Ambas ramas de la genética utilizan las frecuencias de diferentes alelos de un gen en poblaciones de reproducción (gamodemas) y las combinan con conceptos de la herencia mendeliana simple para analizar los patrones de herencia a lo largo de generaciones y líneas de descendencia. Mientras que la genética de poblaciones puede centrarse en genes concretos y sus productos metabólicos posteriores, la genética cuantitativa se centra más en los fenotipos externos y solo hace resúmenes de la genética subyacente.

Debido a la distribución continua de los valores fenotípicos, la genética cuantitativa debe emplear muchos otros métodos estadísticos (como el tamaño del efecto , la media y la varianza ) para vincular los fenotipos (atributos) a los genotipos. Algunos fenotipos pueden analizarse como categorías discretas o como fenotipos continuos, dependiendo de la definición de los puntos de corte o de la métrica utilizada para cuantificarlos. [1] : 27–69  El propio Mendel tuvo que discutir este asunto en su famoso artículo, [2] especialmente con respecto al atributo de sus guisantes alto/enano , que en realidad se derivó añadiendo un punto de corte a la "longitud del tallo". [3] [4] El análisis de loci de rasgos cuantitativos , o QTL, [5] [6] [7] es una adición más reciente a la genética cuantitativa, vinculándola más directamente a la genética molecular .

Efectos genéticos

En los organismos diploides , el "valor" genotípico medio (valor del locus) puede definirse por el "efecto" del alelo junto con un efecto de dominancia , y también por cómo interactúan los genes con los genes en otros loci ( epistasia ). El fundador de la genética cuantitativa, Sir Ronald Fisher , percibió mucho de esto cuando propuso las primeras matemáticas de esta rama de la genética. [8]

Efectos genéticos y valores fenotípicos.

Como estadístico, definió los efectos genéticos como desviaciones de un valor central, lo que permitió el uso de conceptos estadísticos como la media y la varianza, que utilizan esta idea. [9] El valor central que eligió para el gen fue el punto medio entre los dos homocigotos opuestos en un locus. La desviación desde allí hasta el genotipo homocigoto "mayor" se puede llamar " +a "; y por lo tanto es " -a " desde ese mismo punto medio hasta el genotipo homocigoto "menor". Este es el efecto "alelo" mencionado anteriormente. La desviación del heterocigoto desde el mismo punto medio se puede llamar " d ", siendo este el efecto de "dominancia" al que se hizo referencia anteriormente. [10] El diagrama representa la idea. Sin embargo, en realidad medimos fenotipos, y la figura también muestra cómo los fenotipos observados se relacionan con los efectos genéticos. Las definiciones formales de estos efectos reconocen este enfoque fenotípico. [11] [12] La epistasis se ha abordado estadísticamente como interacción (es decir, inconsistencias), [13] pero la epigenética sugiere que puede ser necesario un nuevo enfoque.

Si 0 < d < a , la dominancia se considera parcial o incompleta , mientras que d = a indica dominancia completa o clásica . Anteriormente, d > a se conocía como "sobredominancia". [14]

El atributo de Mendel del guisante "longitud del tallo" nos proporciona un buen ejemplo. [3] Mendel afirmó que los padres altos de raza pura tenían una longitud de tallo de entre 6 y 7 pies (183-213 cm), lo que da una mediana de 198 cm (= P1). Los padres bajos tenían una longitud de tallo de entre 0,75 y 1,25 pies (23-46 cm), con una mediana redondeada de 34 cm (= P2). Su híbrido tenía una longitud de entre 6 y 7,5 pies (183-229 cm), con una mediana de 206 cm (= F1). La media de P1 y P2 es 116 cm, siendo este el valor fenotípico del punto medio (mp) de los homocigotos. El efecto del alelo ( a ) es [P1-mp] = 82 cm = -[P2-mp]. El efecto de dominancia ( d ) es [F1-mp] = 90 cm. [15] Este ejemplo histórico ilustra claramente cómo se vinculan los valores del fenotipo y los efectos de los genes.

Frecuencias de alelos y genotipos

Para obtener medias, varianzas y otras estadísticas, se requieren tanto cantidades como sus ocurrencias . Los efectos genéticos (arriba) proporcionan el marco para las cantidades , y las frecuencias de los alelos contrastantes en el conjunto de gametos de la fertilización proporcionan la información sobre las ocurrencias .

Análisis de la reproducción sexual.

Comúnmente, la frecuencia del alelo que causa "más" en el fenotipo (incluyendo la dominancia) se le da el símbolo p , mientras que la frecuencia del alelo contrastante es q . Una suposición inicial hecha al establecer el álgebra fue que la población parental era infinita y el apareamiento aleatorio, lo que se hizo simplemente para facilitar la derivación. El desarrollo matemático posterior también implicó que la distribución de frecuencia dentro del conjunto efectivo de gametos era uniforme: no había perturbaciones locales donde p y q variaban. Mirando el análisis diagramático de la reproducción sexual, esto es lo mismo que declarar que p P = p g = p ; y similarmente para q . [14] Este sistema de apareamiento, dependiente de estas suposiciones, se conoció como "panmixia".

En la naturaleza, la panmixia rara vez ocurre, [16] : 152–180  [17], ya que la distribución de gametos puede estar limitada, por ejemplo, por restricciones de dispersión o por el comportamiento, o por muestreo aleatorio (esas perturbaciones locales mencionadas anteriormente). Es bien sabido que hay un enorme desperdicio de gametos en la naturaleza, por lo que el diagrama representa un grupo de gametos potencial separado del grupo de gametos real . Solo este último establece las frecuencias definitivas para los cigotos: este es el verdadero "gamodema" ("gamo" se refiere a los gametos, y "deme" deriva del griego para "población"). Pero, bajo los supuestos de Fisher, el gamodema puede extenderse efectivamente de regreso al grupo de gametos potencial , e incluso de regreso a la población base parental (la población "fuente"). El muestreo aleatorio que surge cuando se muestrean pequeños grupos de gametos "reales" de un gran grupo de gametos "potencial" se conoce como deriva genética , y se considera posteriormente.

Aunque la panmixia puede no estar ampliamente extendida, el potencial para que ocurra sí ocurre, aunque puede ser solo efímero debido a esas perturbaciones locales. Se ha demostrado, por ejemplo, que la F2 derivada de la fertilización aleatoria de individuos F1 (una F2 alógama ), después de la hibridación, es un origen de una nueva población potencialmente panmíctica. [18] [19] También se ha demostrado que si la fertilización aleatoria panmíctica ocurriera continuamente, mantendría las mismas frecuencias de alelos y genotipos a lo largo de cada generación sexual panmíctica sucesiva, siendo este el equilibrio de Hardy Weinberg . [13] : 34–39  [20] [21] [22] [23] Sin embargo, tan pronto como se iniciara la deriva genética mediante un muestreo aleatorio local de gametos, el equilibrio cesaría.

Fertilización aleatoria

Se considera que los gametos masculinos y femeninos dentro del pool de fertilización real tienen usualmente las mismas frecuencias para sus alelos correspondientes. (Se han considerado excepciones.) Esto significa que cuando p gametos masculinos que llevan el alelo A fertilizan aleatoriamente p gametos femeninos que llevan ese mismo alelo, el cigoto resultante tiene genotipo AA , y, bajo fertilización aleatoria, la combinación ocurre con una frecuencia de p x p (= p 2 ). De manera similar, el cigoto aa ocurre con una frecuencia de q 2 . Los heterocigotos ( Aa ) pueden surgir de dos maneras: cuando p gametos masculinos ( alelo A ) fertilizan aleatoriamente q gametos femeninos ( alelo a ), y viceversa . La frecuencia resultante para los cigotos heterocigotos es entonces 2pq . [13] : 32  Nótese que tal población nunca es más de la mitad heterocigota, este máximo ocurre cuando p = q = 0.5.

En resumen, en el caso de la fecundación aleatoria, las frecuencias del cigoto (genotipo) son la expansión cuadrática de las frecuencias gaméticas (alélicas): . (El "=1" indica que las frecuencias están expresadas en forma de fracción, no de porcentaje; y que no hay omisiones dentro del marco propuesto).

Tenga en cuenta que “fertilización aleatoria” y “panmixia” no son sinónimos.

La cruz de investigación de Mendel: un contraste

Los experimentos de Mendel con guisantes se construyeron estableciendo progenitores de raza pura con fenotipos "opuestos" para cada atributo. [3] Esto significaba que cada progenitor opuesto era homocigoto solo para su alelo respectivo. En nuestro ejemplo, "alto vs enano", el progenitor alto sería el genotipo TT con p = 1 (y q = 0 ); mientras que el progenitor enano sería el genotipo tt con q = 1 (y p = 0 ). Después del cruce controlado, su híbrido es Tt , con p = q = 1/2 . Sin embargo, la frecuencia de este heterocigoto = 1 , porque se trata de la F1 de un cruce artificial: no ha surgido mediante fertilización aleatoria. [24] La generación F2 se produjo por autopolinización natural de la F1 (con monitoreo contra contaminación por insectos), lo que resultó en p = q =1/2 manteniéndose. Se dice que una F2 de este tipo es "autógama". Sin embargo, las frecuencias genotípicas (0,25 TT , 0,5 Tt , 0,25 tt ) han surgido a través de un sistema de apareamiento muy diferente de la fecundación aleatoria, y por lo tanto se ha evitado el uso de la expansión cuadrática. Los valores numéricos obtenidos fueron los mismos que los de la fecundación aleatoria solo porque este es el caso especial de haber cruzado originalmente progenitores opuestos homocigotos. [25] Podemos notar que, debido al predominio de T- [frecuencia (0,25 + 0,5)] sobre tt [frecuencia 0,25], todavía se obtiene la relación 3:1.

Un cruce como el de Mendel, en el que padres opuestos de raza pura (en gran medida homocigotos) se cruzan de manera controlada para producir una F1, es un caso especial de estructura híbrida. La F1 se considera a menudo como "enteramente heterocigota" para el gen en cuestión. Sin embargo, esto es una simplificación excesiva y no se aplica de manera general, por ejemplo, cuando los padres individuales no son homocigotos o cuando las poblaciones se hibridan entre sí para formar enjambres híbridos . [24] Las propiedades generales de los híbridos intraespecíficos (F1) y F2 (tanto "autógamos" como "alógamos") se consideran en una sección posterior.

La autofecundación, una alternativa

Habiendo observado que el guisante se autopoliniza naturalmente, no podemos seguir usándolo como ejemplo para ilustrar las propiedades de la fertilización aleatoria. La autofecundación ("autofecundación") es una alternativa importante a la fertilización aleatoria, especialmente dentro de las plantas. La mayoría de los cereales de la Tierra se autopolinizan naturalmente (arroz, trigo, cebada, por ejemplo), así como las legumbres. Considerando los millones de individuos de cada uno de ellos en la Tierra en cualquier momento, es obvio que la autofecundación es al menos tan significativa como la fertilización aleatoria. La autofecundación es la forma más intensiva de endogamia , que surge siempre que hay una independencia restringida en los orígenes genéticos de los gametos. Tal reducción en la independencia surge si los padres ya están relacionados, y/o por deriva genética u otras restricciones espaciales en la dispersión de gametos. El análisis de trayectorias demuestra que estas son equivalentes a la misma cosa. [26] [27] Partiendo de estos antecedentes, el coeficiente de endogamia (a menudo simbolizado como F o f ) cuantifica el efecto de la endogamia por cualquier causa. Hay varias definiciones formales de f , y algunas de ellas se consideran en secciones posteriores. Por el momento, tenga en cuenta que para una especie autofecundada a largo plazo f = 1 . Sin embargo, las poblaciones autofecundadas naturales no son " líneas puras " individuales, sino mezclas de dichas líneas. Esto se vuelve particularmente obvio cuando se considera más de un gen a la vez. Por lo tanto, las frecuencias alélicas ( p y q ) distintas de 1 o 0 siguen siendo relevantes en estos casos (consulte de nuevo la sección transversal de Mendel). Sin embargo, las frecuencias genotípicas toman una forma diferente.

En general, las frecuencias genotípicas se convierten en para AA y para Aa y para aa . [13] : 65 

Nótese que la frecuencia del heterocigoto disminuye en proporción a f . Cuando f = 1 , estas tres frecuencias se convierten respectivamente en p , 0 y q . Por el contrario, cuando f = 0 , se reducen a la expansión cuadrática de fertilización aleatoria mostrada anteriormente.

Media poblacional

La media poblacional desplaza el punto de referencia central desde el punto medio homocigoto ( mp ) a la media de una población reproducida sexualmente. Esto es importante no sólo para trasladar el foco al mundo natural, sino también para utilizar una medida de tendencia central utilizada en estadística/biometría. En particular, el cuadrado de esta media es el factor de corrección, que se utiliza para obtener las varianzas genotípicas más adelante. [9]

Media poblacional para todos los valores de p, para varios efectos d.

Para cada genotipo, a su vez, el efecto de su alelo se multiplica por su frecuencia genotípica y los productos se acumulan en todos los genotipos del modelo. Generalmente, se realiza una simplificación algebraica para llegar a un resultado conciso.

La media después de la fertilización aleatoria

La contribución de AA es , la de Aa es , y la de aa es . Al reunir los dos términos a y acumularlos en total, el resultado es: . La simplificación se logra notando que , y recordando que , reduciendo así el término de la derecha a .

El resultado sucinto es, por tanto , [14] : 110 

Esto define la media de la población como un "desplazamiento" respecto del punto medio del homocigoto (recuerde que a y d se definen como desviaciones respecto de ese punto medio). La figura representa G en todos los valores de p para varios valores de d , incluido un caso de ligera dominancia excesiva. Observe que G es a menudo negativo, lo que enfatiza que es en sí mismo una desviación (respecto de mp ).

Finalmente, para obtener la media poblacional real en el "espacio fenotípico", el valor del punto medio se suma a este desplazamiento: .

Un ejemplo surge de los datos sobre la longitud de la mazorca del maíz. [28] : 103  Suponiendo por ahora que sólo está representado un gen, a = 5,45 cm, d = 0,12 cm [prácticamente "0", en realidad], mp = 12,05 cm. Suponiendo además que p = 0,6 y q = 0,4 en esta población de ejemplo, entonces:

G = 5,45 (0,6 − 0,4) + (0,48)0,12 = 1,15 cm (redondeado); y

P = 1,15 + 12,05 = 13,20 cm (redondeado).

La media después de la autofecundación a largo plazo

La contribución de AA es , mientras que la de aa es . [Véase más arriba las frecuencias.] La unión de estos dos términos a conduce a un resultado final inmediatamente muy simple:

. Como antes, .

A menudo, "G (f=1) " se abrevia como "G 1 ".

Los guisantes de Mendel pueden proporcionarnos los efectos de los alelos y el punto medio (ver anteriormente); y una población mixta autopolinizada con p = 0,6 y q = 0,4 proporciona frecuencias de ejemplo. Por lo tanto:

G (f=1) = 82 (0,6 − ,04) = 59,6 cm (redondeado); y

P (f=1) = 59,6 + 116 = 175,6 cm (redondeado).

La media – fecundación generalizada

Una fórmula general incorpora el coeficiente de endogamia f y puede adaptarse a cualquier situación. El procedimiento es exactamente el mismo que antes, utilizando las frecuencias genotípicas ponderadas que se dieron anteriormente. Después de la traducción a nuestros símbolos y una nueva reorganización: [13] : 77–78 

Aquí, G 0 es G , que se indicó anteriormente. (A menudo, cuando se trata de endogamia, se prefiere "G 0 " a "G").

Suponiendo que el ejemplo del maíz [dado anteriormente] hubiera estado restringido a un holme (una pradera ribereña angosta) y hubiera tenido endogamia parcial hasta el punto de f = 0,25 , entonces, utilizando la tercera versión (arriba) de G f :

G 0,25 = 1,15 − 0,25 (0,48) 0,12 = 1,136 cm (redondeado), con P 0,25 = 13,194 cm (redondeado).

En este ejemplo, la endogamia prácticamente no tiene ningún efecto, ya que prácticamente no hay dominancia en este atributo ( d → 0). El análisis de las tres versiones de G f revela que esto daría lugar a un cambio insignificante en la media de la población. Sin embargo, en los casos en que la dominancia fuera notable, habría un cambio considerable.

Deriva genética

La deriva genética se introdujo al discutir la probabilidad de que la panmixia exista ampliamente como un patrón de fertilización natural. [Véase la sección sobre frecuencias de alelos y genotipos.] Aquí se discute con más detalle el muestreo de gametos del gamodema potencial . El muestreo implica la fertilización aleatoria entre pares de gametos aleatorios, cada uno de los cuales puede contener un alelo A o un a . El muestreo es, por tanto, un muestreo binomial. [13] : 382–395  [14] : 49–63  [29] : 35  [30] : 55  Cada "paquete" de muestreo implica 2N alelos y produce N cigotos (una "progenie" o una "línea") como resultado. Durante el transcurso del período reproductivo, este muestreo se repite una y otra vez, de modo que el resultado final es una mezcla de progenies de muestra. El resultado es la fertilización aleatoria dispersa . Estos eventos, y el resultado final general, se examinan aquí con un ejemplo ilustrativo.

Las frecuencias alélicas "base" del ejemplo son las del gamodema potencial : la frecuencia de A es p g = 0,75 , mientras que la frecuencia de a es q g = 0,25 . [ Etiqueta blanca " 1 " en el diagrama.] Se toman muestras binomiales de cinco gamodemas reales de ejemplo de esta base ( s = el número de muestras = 5), y cada muestra se designa con un "índice" k : con k = 1 .... s secuencialmente. (Estos son los "paquetes" de muestreo a los que se hace referencia en el párrafo anterior.) El número de gametos involucrados en la fertilización varía de una muestra a otra, y se da como 2N k [en la etiqueta blanca " 2 " en el diagrama]. El número total (Σ) de gametos muestreados en general es 52 [ etiqueta blanca " 3 " en el diagrama]. Debido a que cada muestra tiene su propio tamaño, se necesitan ponderaciones para obtener promedios (y otras estadísticas) al obtener los resultados generales. Estos son y se dan en la etiqueta blanca " 4 " en el diagrama.

Ejemplo de análisis de deriva genética.

Los gamodemos de muestra: deriva genética

Una vez completados estos cinco eventos de muestreo binomial, los gamodemas reales resultantes contenían cada uno frecuencias alélicas diferentes ( p k y q k ). [Estas se dan en la etiqueta blanca " 5 " en el diagrama.] Este resultado es en realidad la deriva genética en sí misma. Observe que dos muestras (k = 1 y 5) tienen las mismas frecuencias que el gamodema base ( potencial ). Otra (k = 3) tiene p y q "invertidas". La muestra (k = 2) es un caso "extremo", con p k = 0,9 y q k = 0,1 ; mientras que la muestra restante (k = 4) está "en la mitad del rango" en sus frecuencias alélicas. Todos estos resultados han surgido solo por "casualidad", a través del muestreo binomial. Sin embargo, una vez que se produjeron, establecieron todas las propiedades posteriores de las progenies.

Debido a que el muestreo implica azar, las probabilidades ( k ) de obtener cada una de estas muestras se vuelven de interés. Estas probabilidades binomiales dependen de las frecuencias iniciales ( p g y q g ) y del tamaño de la muestra ( 2N k ). Son tediosas de obtener, [13] : 382–395  [30] : 55  pero son de considerable interés. [Véase la etiqueta blanca " 6 " en el diagrama.] Las dos muestras (k = 1, 5), con las frecuencias de los alelos iguales a las del gamodema potencial , tenían "posibilidades" más altas de ocurrir que las otras muestras. Sin embargo, sus probabilidades binomiales diferían debido a sus diferentes tamaños de muestra (2N k ). La muestra "invertida" (k = 3) tenía una probabilidad de ocurrir muy baja, lo que confirma quizás lo que podría esperarse. Sin embargo, el gamodema de frecuencia alélica "extrema" (k = 2) no era "raro"; y la muestra "media del rango" (k=4) era rara. Estas mismas probabilidades se aplican también a la progenie de estas fecundaciones.

Aquí, se puede comenzar a hacer un resumen . Las frecuencias alélicas generales en el conjunto de las progenies se obtienen mediante promedios ponderados de las frecuencias apropiadas de las muestras individuales. Es decir: y . (Observe que k se reemplaza por para el resultado general, una práctica común). [9] Los resultados para el ejemplo son p = 0,631 y q = 0,369 [ etiqueta negra " 5 " en el diagrama]. Estos valores son bastante diferentes a los iniciales ( p g y q g ) [ etiqueta blanca " 1 "]. Las frecuencias alélicas de la muestra también tienen varianza, así como un promedio. Esto se ha obtenido utilizando el método de suma de cuadrados (SS) [31] [Vea a la derecha de la etiqueta negra " 5 " en el diagrama]. [Se ofrece una discusión más detallada sobre esta varianza en la sección siguiente sobre Deriva genética extensa].

Las líneas de progenie – dispersión

Las frecuencias genotípicas de las cinco progenies de muestra se obtienen a partir de la expansión cuadrática habitual de sus respectivas frecuencias alélicas ( fecundación aleatoria ). Los resultados se dan en la etiqueta blanca del diagrama " 7 " para los homocigotos, y en la etiqueta blanca " 8 " para los heterocigotos. La reorganización de esta manera prepara el camino para monitorear los niveles de endogamia. Esto se puede hacer examinando el nivel de homocigosis total [( p 2 k + q 2 k ) = ( 1 − 2p k q k )], o examinando el nivel de heterocigosis ( 2p k q k ), ya que son complementarios. [32] Nótese que las muestras k = 1, 3, 5 tenían todas el mismo nivel de heterocigosis, a pesar de que una era la "imagen especular" de las otras con respecto a las frecuencias alélicas. El caso de frecuencia alélica "extrema" (k = 2 ) tuvo la mayor homocigosis (menor heterocigosis) de todas las muestras. El caso "medio del rango" (k = 4 ) tuvo la menor homocigosidad (mayor heterocigosidad): de hecho, ambos eran iguales en 0,50.

El resumen general puede continuar obteniendo el promedio ponderado de las frecuencias de genotipo respectivas para la progenie en masa. Por lo tanto, para AA , es , para Aa , es y para aa , es . Los resultados del ejemplo se dan en la etiqueta negra " 7 " para los homocigotos, y en la etiqueta negra " 8 " para los heterocigotos. Tenga en cuenta que la media de heterocigosidad es 0,3588 , que la siguiente sección utiliza para examinar la endogamia resultante de esta deriva genética.

El siguiente foco de interés es la dispersión en sí, que se refiere a la "separación" de las medias poblacionales de las progenies . Estas se obtienen como [ver sección sobre la media poblacional], para cada progenie de muestra a su vez, utilizando los efectos genéticos de ejemplo dados en la etiqueta blanca " 9 " en el diagrama. Luego, cada uno se obtiene también [en la etiqueta blanca " 10 " en el diagrama]. Observe que la línea "mejor" (k = 2) tuvo la frecuencia alélica más alta para el alelo "más" ( A ) (también tuvo el nivel más alto de homocigosidad). La peor progenie (k = 3) tuvo la frecuencia más alta para el alelo "menos" ( a ), lo que explica su bajo rendimiento. Esta línea "mala" era menos homocigótica que la línea "mejor"; y compartía el mismo nivel de homocigosidad, de hecho, que las dos segundas mejores líneas (k = 1, 5). La línea de progenie con los alelos "más" y "menos" presentes en igual frecuencia (k = 4) tuvo una media inferior a la media general (véase el párrafo siguiente) y tuvo el nivel más bajo de homocigosidad. Estos resultados revelan el hecho de que los alelos más prevalentes en el "acervo genético" (también llamado "germoplasma") determinan el rendimiento, no el nivel de homocigosidad per se. El muestreo binomial por sí solo afecta a esta dispersión.

El resumen general ahora se puede concluir obteniendo y . El resultado de ejemplo para P es 36,94 ( etiqueta negra " 10 " en el diagrama). Esto se utiliza más adelante para cuantificar la depresión endogámica en general, a partir del muestreo de gametos. [Véase la siguiente sección.] Sin embargo, recuerde que ya se han identificado algunas medias de progenie "no deprimidas" (k = 1, 2, 5). Este es un enigma de la endogamia: si bien puede haber "depresión" en general, normalmente hay líneas superiores entre los muestreos de gamodemas.

El equivalente panmíctico posterior a la dispersión: la endogamia

Incluidas en el resumen general estaban las frecuencias alélicas promedio en la mezcla de líneas de progenie ( p y q ). Estas ahora pueden usarse para construir un equivalente panmíctico hipotético. [13] : 382–395  [14] : 49–63  [29] : 35  Esto puede considerarse como una "referencia" para evaluar los cambios producidos por el muestreo de gametos. El ejemplo agrega dicho panmíctico a la derecha del Diagrama. La frecuencia de AA es, por lo tanto, (p ) 2 = 0,3979. Esto es menor que el encontrado en la masa dispersa (0,4513 en la etiqueta negra " 7 "). De manera similar, para aa , (q ) 2 = 0,1303, nuevamente menor que el equivalente en la masa de progenies (0,1898). Claramente, la deriva genética ha aumentado el nivel general de homocigosis en la cantidad (0,6411 − 0,5342) = 0,1069. En un enfoque complementario, se podría utilizar la heterocigosidad en su lugar. El equivalente panmíctico para Aa es 2 p q = 0,4658, que es mayor que el del total muestreado (0,3588) [ etiqueta negra " 8 "]. El muestreo ha provocado que la heterocigosidad disminuya en 0,1070, lo que difiere trivialmente de la estimación anterior debido a errores de redondeo.

El coeficiente de endogamia ( f ) se introdujo en la primera sección sobre autofecundación. Aquí se considera una definición formal del mismo: f es la probabilidad de que dos alelos "iguales" (es decir, A y A , o a y a ), que se fecundan juntos, sean de origen ancestral común o (más formalmente) f es la probabilidad de que dos alelos homólogos sean autocigotos. [14] [27] Consideremos cualquier gameto aleatorio en el gamodema potencial que tiene su pareja de singamia restringida por muestreo binomial. La probabilidad de que ese segundo gameto sea autocigoto homólogo al primero es 1/(2N) , el recíproco del tamaño del gamodema. Para las cinco progenies de ejemplo, estas cantidades son 0,1, 0,0833, 0,1, 0,0833 y 0,125 respectivamente, y su media ponderada es 0,0961 . Este es el coeficiente de endogamia de la progenie de ejemplo en masa, siempre que sea imparcial con respecto a la distribución binomial completa. Sin embargo, es probable que un ejemplo basado en s = 5 esté sesgado cuando se lo compara con una distribución binomial completa apropiada basada en que el número de muestra ( s ) se acerque al infinito ( s → ∞ ). Otra definición derivada de f para la distribución completa es que f también es igual al aumento en homocigosidad, que es igual a la caída en heterocigosidad. [33] Para el ejemplo, estos cambios de frecuencia son 0,1069 y 0,1070 , respectivamente. Este resultado es diferente al anterior, lo que indica que en el ejemplo hay sesgo con respecto a la distribución subyacente completa. Para el ejemplo en sí , estos últimos valores son los mejores para usar, es decir, f = 0,10695 .

La media poblacional del panmíctico equivalente se encuentra como [a (p -q ) + 2 p q d] + mp . Usando los efectos genéticos del ejemplo ( etiqueta blanca " 9 " en el diagrama), esta media es 37.87. La media equivalente en la masa dispersa es 36.94 ( etiqueta negra " 10 "), que está deprimida en la cantidad 0.93 . Esta es la depresión endogámica de esta Deriva Genética. Sin embargo, como se señaló anteriormente, tres progenies no estaban deprimidas (k = 1, 2, 5), y tenían medias incluso mayores que la del equivalente panmíctico. Estas son las líneas que un fitomejorador busca en un programa de selección de líneas. [34]

Muestreo binomial extenso: ¿se ha restablecido la panmixia?

Si el número de muestras binomiales es grande ( s → ∞ ), entonces p → p g y q → q g . Podría cuestionarse si la panmixia efectivamente reaparecería bajo estas circunstancias. Sin embargo, el muestreo de frecuencias alélicas todavía ha ocurrido , con el resultado de que σ 2 p, q0 . [35] De hecho, como s → ∞ , el , que es la varianza de toda la distribución binomial . [13] : 382–395  [14] : 49–63  Además, las "ecuaciones de Wahlund" muestran que las frecuencias homocigóticas de la progenie en masa se pueden obtener como las sumas de sus respectivos valores promedio ( p 2 o q 2 ) más σ 2 p, q . [13] : 382–395  Asimismo, la frecuencia de heterocigotos en masa es (2 p q ) menos el doble de σ 2 p, q . La varianza que surge del muestreo binomial está notoriamente presente. Por lo tanto, incluso cuando s → ∞ , las frecuencias de genotipos en masa de la progenie aún revelan una mayor homocigosis y una menor heterocigosis , todavía hay dispersión de las medias de la progenie y todavía endogamia y depresión endogámica . Es decir, la panmixia no se recupera una vez perdida debido a la deriva genética (muestreo binomial). Sin embargo, se puede iniciar una nueva panmixia potencial a través de una F2 alógama después de la hibridación. [36]

Deriva genética continua: aumento de la dispersión y la endogamia

En la discusión previa sobre la deriva genética se examinó sólo un ciclo (generación) del proceso. Cuando el muestreo continúa a lo largo de generaciones sucesivas, se producen cambios notables en σ 2 p , q y f . Además, se necesita otro "índice" para llevar un registro del "tiempo": t = 1 .... y donde y = el número de "años" (generaciones) considerados. La metodología a menudo consiste en añadir el incremento binomial actual ( Δ = " de novo ") a lo que ha ocurrido previamente. [13] Aquí se examina toda la distribución binomial. [No se obtiene ningún beneficio adicional de un ejemplo abreviado.]

Dispersión vía σ2p,q

Anteriormente se vio que esta varianza (σ 2 p,q [35] ) era:

Con la extensión en el tiempo, este es también el resultado del primer ciclo, y así es (para abreviar). En el ciclo 2, esta varianza se genera nuevamente (esta vez convirtiéndose en la varianza de novo ( )) y se acumula hasta lo que ya estaba presente (la varianza de "arrastre"). La varianza del segundo ciclo ( ) es la suma ponderada de estos dos componentes, siendo los pesos para la de novo y = para el "arrastre".

De este modo,

La extensión para generalizar a cualquier tiempo t , después de una simplificación considerable, se convierte en: [13] : 328  -

Debido a que fue esta variación en las frecuencias alélicas lo que causó la "separación" de las medias de las progenies ( dispersión ), el cambio en σ 2 t a lo largo de las generaciones indica el cambio en el nivel de dispersión .

Dispersión víaF

El método para examinar el coeficiente de endogamia es similar al utilizado para σ 2 p,q . Se utilizan los mismos pesos que antes, respectivamente, para f de novo ( Δ f ) [recuerde que es 1/(2N) ] y f de arrastre . Por lo tanto, , que es similar a la ecuación (1) en la subsección anterior.

Endogamia resultante de la deriva genética en la fertilización aleatoria.

En general, después del reordenamiento, [13] Los gráficos de la izquierda muestran los niveles de endogamia a lo largo de veinte generaciones que surgen de la deriva genética para varios tamaños de gamodema reales (2N).

Aún otros reordenamientos de esta ecuación general revelan algunas relaciones interesantes.

(A) Después de cierta simplificación, [13] . El lado izquierdo es la diferencia entre los niveles actuales y anteriores de endogamia: el cambio en la endogamia ( δf t ). Nótese que este cambio en la endogamia ( δf t ) es igual a la endogamia de novo ( Δf ) solo para el primer ciclo, cuando f t-1 es cero .

(B) Un elemento a destacar es el (1-f t-1 ) , que es un "índice de no endogamia ". Se lo conoce como el índice panmíctico . [13] [14] .

(C) Surgen otras relaciones útiles que involucran al índice panmíctico . [13] [14] . (D) Surge un vínculo clave entre σ 2 p,q y f . En primer lugar... [13] En segundo lugar, suponiendo que f 0 = 0 , el lado derecho de esta ecuación se reduce a la sección dentro de los corchetes de la ecuación (2) al final de la última subsección. Es decir, si inicialmente no hay endogamia, ! Además, si esto luego se reordena, . Es decir, cuando la endogamia inicial es cero, los dos puntos de vista principales del muestreo binomial de gametos (deriva genética) son directamente interconvertibles.

Autofecundación mediante fecundación aleatoria

Fecundación aleatoria en comparación con fecundación cruzada

Es fácil pasar por alto que la fertilización aleatoria incluye la autofecundación. Sewall Wright demostró que una proporción 1/N de fertilizaciones aleatorias es en realidad autofecundación , y el resto (N-1)/N es fertilización cruzada . Tras el análisis de trayectorias y la simplificación, se encontró que la nueva visión de la endogamia de la fertilización aleatoria era: . [27] [37] Tras un reordenamiento adicional, se confirmaron los resultados anteriores del muestreo binomial, junto con algunos nuevos arreglos. Dos de estos fueron potencialmente muy útiles, a saber: (A) ; y (B) .

El reconocimiento de que la autofecundación puede ser intrínsecamente parte de la fertilización aleatoria conduce a algunos problemas sobre el uso del "coeficiente de endogamia" de fertilización aleatoria anterior . Claramente, entonces, es inadecuado para cualquier especie incapaz de autofecundación , lo que incluye plantas con mecanismos de autoincompatibilidad, plantas dioicas y animales bisexuales . La ecuación de Wright se modificó más tarde para proporcionar una versión de fertilización aleatoria que involucraba solo fertilización cruzada sin autofecundación . La proporción 1/N anteriormente debida a la autofecundación ahora definía la endogamia por deriva genética de arrastre que surgía del ciclo anterior. La nueva versión es: [13] : 166  .

Los gráficos de la derecha muestran las diferencias entre la fertilización aleatoria estándar RF y la fertilización aleatoria ajustada para "fecundación cruzada únicamente" CF. Como se puede ver, el problema no es trivial para muestras de gamodema de pequeño tamaño.

Ahora es necesario señalar que no sólo "panmixia" no es sinónimo de "fertilización aleatoria", sino también que "fertilización aleatoria" no es sinónimo de "fertilización cruzada".

Homocigosidad y heterocigosidad

En la subsección sobre "Los gamodemas de muestra - Deriva genética", se siguió una serie de muestreos de gametos, cuyo resultado fue un aumento de la homocigosidad a expensas de la heterocigosidad. Desde este punto de vista, el aumento de la homocigosidad se debió a los muestreos de gametos. Los niveles de homocigosidad también se pueden ver según si los homocigotos surgieron de forma alocigota o autocigota. Recordemos que los alelos autocigotos tienen el mismo origen alélico, cuya probabilidad (frecuencia) es el coeficiente de endogamia ( f ) por definición. La proporción que surge de forma alocigota es, por tanto, (1-f) . Para los gametos portadores de A , que están presentes con una frecuencia general de p , la frecuencia general de los que son autocigotos es, por tanto, ( f p ). De forma similar, para los gametos portadores de a , la frecuencia autocigota es ( f q ). [38] Estos dos puntos de vista sobre las frecuencias de los genotipos deben conectarse para establecer la coherencia.

Siguiendo en primer lugar el punto de vista auto/alo , considere el componente alocigótico . Esto ocurre con la frecuencia de (1-f) , y los alelos se unen de acuerdo con la expansión cuadrática de fertilización aleatoria . Por lo tanto: Considere a continuación el componente autocigótico . Como estos alelos son autocigotos , son efectivamente autofecundaciones y producen genotipos AA o aa , pero no heterocigotos. Por lo tanto, producen homocigotos "AA" más homocigotos "aa" . La suma de estos dos componentes da como resultado: para el homocigoto AA ; para el homocigoto aa ; y para el heterocigoto Aa . [13] : 65  [14] Esta es la misma ecuación que la presentada anteriormente en la sección sobre "Autofecundación: una alternativa". Aquí se aclara la razón de la disminución de la heterocigosidad. Los heterocigotos sólo pueden surgir del componente alocigoto, y su frecuencia en la muestra es sólo (1-f) : por lo tanto, este también debe ser el factor que controle la frecuencia de los heterocigotos.

En segundo lugar, se vuelve a examinar el punto de vista del muestreo . Anteriormente, se observó que la disminución de los heterocigotos era . Esta disminución se distribuye de manera uniforme entre cada homocigoto y se suma a sus expectativas básicas de fertilización aleatoria . Por lo tanto, las frecuencias genotípicas son: para el homocigoto "AA" ; para el homocigoto "aa" ; y para el heterocigoto.

En tercer lugar, es necesario establecer la coherencia entre los dos puntos de vista anteriores. Es evidente de inmediato [a partir de las ecuaciones correspondientes anteriores] que la frecuencia de heterocigotos es la misma en ambos puntos de vista. Sin embargo, un resultado tan sencillo no es inmediatamente evidente para los homocigotos. Comience por considerar la ecuación final del homocigoto AA en el párrafo auto/alo anterior: . Expanda los corchetes y continúe reuniendo [dentro del resultado] los dos términos nuevos con el factor común f en ellos. El resultado es: . A continuación, para el " p 2 0 " entre paréntesis, se sustituye a (1-q) por a p , y el resultado se convierte en . Después de esa sustitución, es una cuestión sencilla de multiplicar, simplificar y observar los signos. El resultado final es , que es exactamente el resultado para AA en el párrafo de muestreo . Por lo tanto, los dos puntos de vista son consistentes para el homocigoto AA . De manera similar, también se puede demostrar la coherencia de los puntos de vista aa . Los dos puntos de vista son consistentes para todas las clases de genotipos.

Principios ampliados

Otros patrones de fertilización

Patrones de fertilización espacial

En secciones anteriores, se ha considerado exhaustivamente la fertilización aleatoria dispersiva ( deriva genética ), y se han examinado la autofecundación y la hibridación en diversos grados. El diagrama de la izquierda representa los dos primeros de estos, junto con otro patrón "basado espacialmente": islas . Este es un patrón de fertilización aleatoria que presenta gamodemas dispersos , con la adición de "superposiciones" en las que ocurre la fertilización aleatoria no dispersiva . Con el patrón de islas , los tamaños individuales de los gamodemas ( 2N ) son observables y las superposiciones ( m ) son mínimas. Esta es una de las posibilidades de Sewall Wright. [37] Además de los patrones de fertilización basados ​​"espacialmente", existen otros basados ​​en criterios "fenotípicos" o "de relación". Las bases fenotípicas incluyen la fertilización selectiva (entre fenotipos similares) y la fertilización desasortativa (entre fenotipos opuestos). Los patrones de parentesco incluyen el cruce entre hermanos , el cruce entre primos y el retrocruzamiento , y se tratan en una sección aparte. La autofecundación puede considerarse tanto desde un punto de vista espacial como de parentesco.

Fertilización aleatoria de "Islas"

La población de cría consiste en s pequeños gamódicos dispersos de fertilización aleatoria de tamaño de muestra ( k = 1 ... s ) con " superposiciones " de proporción en la que ocurre la fertilización aleatoria no dispersiva . La proporción dispersiva es, por lo tanto , . La población en masa consiste en promedios ponderados de tamaños de muestra, frecuencias de alelos y genotipos y medias de progenie, como se hizo para la deriva genética en una sección anterior. Sin embargo, cada tamaño de muestra de gametos se reduce para permitir las superposiciones , encontrando así un efectivo para .

Fertilización aleatoria de "Islas"

Para abreviar, se continúa con el argumento omitiendo los subíndices. Recordemos que es en general. [Aquí y en adelante, 2N se refiere al tamaño de muestra definido previamente , no a ninguna versión "ajustada a islas".]

Después de la simplificación, [37] Nótese que cuando m = 0 esto se reduce al Δ f anterior . El recíproco de esto proporciona una estimación del " efectivo para ", mencionado anteriormente.

Este Δf también se sustituye en el coeficiente de endogamia anterior para obtener [37] donde t es el índice a lo largo de generaciones, como antes.

La proporción de superposición efectiva también se puede obtener, [37] como

Los gráficos de la derecha muestran la endogamia para un tamaño de gamodema de 2N = 50 para la fertilización aleatoria dispersa ordinaria (RF) (m=0) y para cuatro niveles de superposición (m = 0,0625, 0,125, 0,25, 0,5) de fertilización aleatoria de islas . De hecho, ha habido una reducción en la endogamia resultante de la fertilización aleatoria no dispersa en las superposiciones. Es particularmente notable cuando m → 0,50 . Sewall Wright sugirió que este valor debería ser el límite para el uso de este enfoque. [37]

Mezcla de alelos – sustitución de alelos

El modelo genético examina la vía de la herencia desde el punto de vista de las "entradas" (alelos/gametos) y las "salidas" (genotipos/cigotos), siendo la fertilización el "proceso" que convierte uno en otro. Un punto de vista alternativo se concentra en el "proceso" en sí mismo y considera que los genotipos del cigoto surgen de la mezcla de alelos. En particular, considera los resultados como si un alelo hubiera "sustituido" al otro durante la mezcla, junto con un residuo que se desvía de esta visión. Esto formó parte integral del método de Fisher [8], además de su uso de frecuencias y efectos para generar sus estadísticas genéticas [14] . A continuación se presenta una derivación discursiva de la alternativa de sustitución de alelos . [14] : 113 

Análisis de sustitución de alelos

Supongamos que la fertilización aleatoria habitual de gametos en un gamodema "base" (que consta de gametos p ( A ) y gametos q ( a )) se reemplaza por la fertilización con un "aluvión" de gametos que contienen todos un solo alelo ( A o a , pero no ambos). Los resultados cigóticos pueden interpretarse en términos de que el alelo del "aluvión" ha "sustituido" al alelo alternativo en el gamodema "base" subyacente. El diagrama ayuda a seguir este punto de vista: la parte superior muestra una sustitución A , mientras que la parte inferior muestra una sustitución a . (El "alelo RF" del diagrama es el alelo en el gamodema "base").

Consideremos primero la parte superior. Como la base A está presente con una frecuencia de p , el sustituto A la fertiliza con una frecuencia de p, lo que da como resultado un cigoto AA con un efecto alélico de a . Por lo tanto, su contribución al resultado es el producto . De manera similar, cuando el sustituto fertiliza la base a (lo que da como resultado Aa con una frecuencia de q y un efecto heterocigoto de d ), la contribución es . El resultado general de la sustitución por A es, por lo tanto, . Esto ahora está orientado hacia la media de la población [ver sección anterior] expresándola como una desviación de esa media :

Después de una simplificación algebraica, esto se convierte en el efecto de sustitución de A.

Se puede aplicar un razonamiento paralelo a la parte inferior del diagrama, teniendo cuidado con las diferencias en frecuencias y efectos genéticos. El resultado es el efecto de sustitución de a , que es El factor común dentro de los corchetes es el efecto de sustitución de alelo promedio , [14] : 113  y es También se puede derivar de una manera más directa, pero el resultado es el mismo. [39]

En las secciones siguientes, estos efectos de sustitución ayudan a definir los genotipos del modelo genético como compuestos por una partición predicha por estos nuevos efectos ( expectativas de sustitución ) y un residuo ( desviaciones de sustitución ) entre estas expectativas y los efectos del modelo genético anterior. Las expectativas también se denominan valores de reproducción y las desviaciones también se denominan desviaciones de dominancia .

En última instancia, la varianza que surge de las expectativas de sustitución se convierte en la denominada varianza genética aditiva (σ 2 A ) [14] (también la varianza génica [40] ), mientras que la que surge de las desviaciones de sustitución se convierte en la denominada varianza de dominancia (σ 2 D ) . Es notable que ninguno de estos términos refleja los verdaderos significados de estas varianzas. La "varianza génica" es menos dudosa que la varianza genética aditiva y más acorde con el propio nombre de Fisher para esta partición. [8] [29] : 33  Un nombre menos engañoso para la varianza de las desviaciones de dominancia es la "varianza de cuasi dominancia" [ver las siguientes secciones para una discusión más detallada]. Estos últimos términos son los preferidos en este documento.

Los efectos genéticos redefinidos

Los efectos del modelo genético ( a , d y -a ) son importantes en la derivación de las desviaciones de la sustitución , que se analizaron por primera vez en la sección anterior Sustitución de alelos . Sin embargo, deben redefinirse antes de que resulten útiles en ese ejercicio. En primer lugar, deben recentralizarse alrededor de la media de la población ( G ) y, en segundo lugar, deben reorganizarse como funciones de β , el efecto promedio de la sustitución de alelos .

Consideremos en primer lugar la recentralización. El efecto recentralizado para AA es a• = a - G que, después de la simplificación, se convierte en a• = 2 q (a- p d) . El efecto similar para Aa es d• = d - G = a( q - p ) + d(1-2 pq ) , después de la simplificación. Finalmente, el efecto recentralizado para aa es (-a)• = -2 p (a+ q d) . [14] : 116–119 

En segundo lugar, considere la reorganización de estos efectos recentralizados como funciones de β . Recordando de la sección "Sustitución de alelos" que β = [a + (qp)d], la reorganización da a = [β - (qp)d] . Después de sustituir esto por a en a• y simplificar, la versión final se convierte en a•• = 2q(β-qd) . De manera similar, d• se convierte en d•• = β(qp) + 2pqd ; y (-a)• se convierte en (-a)•• = -2p(β+pd) . [14] : 118 

Sustitución de genotipos: expectativas y desviaciones

Los genotipos cigotos son el objetivo de toda esta preparación. El genotipo homocigoto AA es una unión de dos efectos de sustitución de A , uno de cada sexo. Su expectativa de sustitución es por lo tanto β AA = 2β A = 2 q β (ver secciones anteriores). De manera similar, la expectativa de sustitución de Aa es β Aa = β A + β a = ( q - p ; y para aa , β aa = 2β a = -2 p β . Estas expectativas de sustitución de los genotipos también se denominan valores de cría . [14] : 114–116 

Las desviaciones de sustitución son las diferencias entre estas expectativas y los efectos genéticos después de su redefinición en dos etapas en la sección anterior. Por lo tanto, d AA = a•• - β AA = -2 q 2 d después de la simplificación. De manera similar, d Aa = d•• - β Aa = 2 pq d después de la simplificación. Finalmente, d aa = (-a)•• - β aa = -2 p 2 d después de la simplificación. [14] : 116–119  Nótese que todas estas desviaciones de sustitución en última instancia son funciones del efecto genético d —lo que explica el uso de ["d" más subíndice] como sus símbolos. Sin embargo, es un grave non sequitur en lógica considerarlas como explicadoras de la dominancia (heterocigosis) en todo el modelo genético: son simplemente funciones de "d" y no una auditoría de la "d" en el sistema. Son como se derivan: ¡desviaciones de las expectativas de sustitución !

Las "expectativas de sustitución" dan lugar, en última instancia, a σ 2 A (la denominada varianza genética "aditiva"); y las "desviaciones de sustitución" dan lugar a σ 2 D (la denominada varianza genética "dominante"). Sin embargo, tenga en cuenta que el efecto de sustitución promedio (β) también contiene "d" [consulte las secciones anteriores], lo que indica que la dominancia también está incorporada en la varianza "aditiva" [consulte las secciones siguientes sobre la varianza genotípica para obtener sus derivaciones]. Recuerde también [consulte el párrafo anterior] que las "desviaciones de sustitución" no explican la dominancia en el sistema (que no es más que desviaciones de las expectativas de sustitución ), sino que consisten algebraicamente en funciones de "d". Nombres más apropiados para estas respectivas varianzas podrían ser σ 2 B (la varianza de las "expectativas de reproducción") y σ 2 δ (la varianza de las "desviaciones de reproducción"). Sin embargo, como se señaló anteriormente, en el presente documento se preferirán "Génico" (σ 2 A ) y "Cuasi-Dominancia" (σ 2 D ), respectivamente.

Variación genotípica

Existen dos enfoques principales para definir y dividir la varianza genotípica . Uno se basa en los efectos del modelo genético [40] , mientras que el otro se basa en los efectos de sustitución del genotipo [14]. Son algebraicamente interconvertibles entre sí. [36] En esta sección, se considera la derivación básica de la fertilización aleatoria , dejando de lado los efectos de la endogamia y la dispersión. Esto se trata más adelante para llegar a una solución más general. Hasta que este tratamiento monogénico sea reemplazado por uno multigénico , y hasta que la epistasis se resuelva a la luz de los hallazgos de la epigenética , la varianza genotípica solo tiene los componentes considerados aquí.

Enfoque basado en modelos genéticos – Mather Jinks Hayman

Componentes de la varianza genotípica utilizando los efectos del modelo genético.

Es conveniente seguir el enfoque biométrico, que se basa en corregir la suma de cuadrados no ajustada (USS) restando el factor de corrección (CF) . Debido a que todos los efectos se han examinado a través de frecuencias, la USS se puede obtener como la suma de los productos de la frecuencia de cada genotipo por el cuadrado de su efecto genético . El CF en este caso es el cuadrado medio. El resultado es la SS, que, nuevamente debido al uso de frecuencias, también es inmediatamente la varianza . [9]

El , y el . El

Después de una simplificación parcial, la última línea está en la terminología de Mather. [40] : 212  [41] [42]

Aquí, σ 2 a es la varianza homocigota o alélica , y σ 2 d es la varianza heterocigota o de dominancia . La varianza de las desviaciones por sustitución ( σ 2 D ) también está presente. La (covarianza ponderada) ad [43] se abrevia en adelante como " cov ad ".

Estos componentes se representan gráficamente en todos los valores de p en la figura adjunta. Observe que cov ad es negativo para p > 0,5 .

La mayoría de estos componentes se ven afectados por el cambio del foco central del punto medio homocigoto ( mp ) a la media poblacional ( G ), siendo este último la base del Factor de Corrección . Las varianzas de desviación de cov ad y de sustitución son simplemente artefactos de este cambio. Las varianzas alélicas y de dominancia son particiones genéticas genuinas del modelo genético original, y son los únicos componentes eugenéticos. Incluso entonces, la fórmula algebraica para la varianza alélica se ve afectada por la presencia de G : es solo la varianza de dominancia (es decir, σ 2 d ) la que no se ve afectada por el cambio de mp a G . [36] Estos conocimientos comúnmente no se aprecian.

Una mayor recopilación de términos [en formato Mather] conduce a , donde . Es útil más adelante en el análisis dialélico, que es un diseño experimental para estimar estas estadísticas genéticas. [44]

Si, después de los últimos reordenamientos dados, los primeros tres términos se fusionan, se reordenan aún más y se simplifican, el resultado es la varianza de la expectativa de sustitución fisheriana .

Eso es:

Nótese en particular que σ 2 A no es σ 2 a . La primera es la varianza de las expectativas de sustitución , mientras que la segunda es la varianza alélica . [45] Nótese también que σ 2 D (la varianza de las desviaciones de sustitución ) no es σ 2 d (la varianza de dominancia ), y recuerde que es un artefacto que surge del uso de G para el Factor de Corrección. [Véase el "párrafo azul" más arriba.] Ahora se hará referencia a ella como la varianza de "cuasi-dominancia".

Obsérvese también que σ 2 D < σ 2 d ("2pq" es siempre una fracción); y nótese que (1) σ 2 D = 2pq σ 2 d , y que (2) σ 2 d = σ 2 D / (2pq) . Es decir: se confirma que σ 2 D no cuantifica la varianza de dominancia en el modelo. Es σ 2 d el que lo hace. Sin embargo, la varianza de dominancia (σ 2 d ) se puede estimar fácilmente a partir de σ 2 D si 2pq está disponible.

A partir de la Figura, estos resultados se pueden visualizar como la acumulación de σ 2 a , σ 2 d y cov ad para obtener σ 2 A , mientras que se deja σ 2 D aún separado. También queda claro en la Figura que σ 2 D < σ 2 d , como se esperaba a partir de las ecuaciones.

El resultado general (en formato de Fisher) es Los componentes fisherianos acaban de derivarse, pero su derivación a través de los propios efectos de sustitución también se da en la siguiente sección.

Enfoque de sustitución de alelos – Fisher

Componentes de la varianza genotípica utilizando los efectos de sustitución de alelos.

La referencia a las diversas secciones anteriores sobre la sustitución de alelos revela que los dos efectos finales son las expectativas de sustitución de genotipo y las desviaciones de sustitución de genotipo . Nótese que cada una de ellas ya está definida como desviaciones de la media de la población de fertilización aleatoria ( G ). Por lo tanto, para cada genotipo a su vez, se obtiene el producto de la frecuencia y el cuadrado del efecto relevante, y estos se acumulan para obtener directamente una SS y σ 2 . [46] A continuación se ofrecen los detalles.

σ 2 A = p 2 β AA 2 + 2 pq β Aa 2 + q 2 β aa 2 , que se simplifica a σ 2 A = 2 pq β 2 : la varianza genérica.

σ 2 D = p 2 d AA 2 + 2 pq d Aa 2 + q d aa 2 , lo que se simplifica a σ 2 D = (2 pq ) 2 d 2 —la varianza cuasi-Dominancia.

Al sumar estos resultados, σ 2 G = σ 2 A + σ 2 D . Estos componentes se visualizan en los gráficos de la derecha. El efecto de sustitución de alelos promedio también se representa gráficamente, pero el símbolo es "α" (como es común en las citas) en lugar de "β" (como se usa aquí).

Una vez más, sin embargo, remitimos a las discusiones anteriores sobre los verdaderos significados e identidades de estos componentes. El propio Fisher no utilizó estos términos modernos para sus componentes. A la varianza de las expectativas de sustitución la llamó varianza "genética" ; y a la varianza de las desviaciones de sustitución la consideró simplemente como el residuo sin nombre entre la varianza "genotípica" (su nombre para ella) y su varianza "genética". [8] [29] : 33  [47] [48] [La terminología y la derivación utilizadas en este artículo concuerdan completamente con las del propio Fisher.] El término de Mather para la varianza de las expectativas - "génica" [40] - se deriva obviamente del término de Fisher, y evita utilizar "genético" (que se ha vuelto demasiado generalizado en su uso para ser de valor en el presente contexto). El origen es oscuro de los términos modernos engañosos de varianzas "aditivas" y "de dominancia".

Obsérvese que este enfoque de sustitución de alelos definió los componentes por separado y luego los totalizó para obtener la varianza genotípica final. Por el contrario, el enfoque del modelo genético derivó toda la situación (componentes y total) como un solo ejercicio. Las bonificaciones que surgieron de esto fueron (a) las revelaciones sobre la estructura real de σ 2 A , y (b) los significados reales y tamaños relativos de σ 2 d y σ 2 D (véase la subsección anterior). También es evidente que un análisis "Mather" es más informativo y que siempre se puede construir un análisis "Fisher" a partir de él. Sin embargo, la conversión opuesta no es posible, porque faltaría información sobre cov ad .

Dispersión y varianza genotípica

En la sección sobre deriva genética, y en otras secciones que tratan sobre endogamia, un resultado importante del muestreo de frecuencias alélicas ha sido la dispersión de las medias de la progenie. Esta colección de medias tiene su propio promedio, y también tiene una varianza: la varianza interlineal . (Esta es una varianza del atributo en sí, no de las frecuencias alélicas .) A medida que la dispersión se desarrolla más en las generaciones sucesivas, se esperaría que esta varianza interlineal aumentara. Por el contrario, a medida que aumenta la homocigosidad, se esperaría que la varianza intralineal disminuyera. Por lo tanto, surge la pregunta de si la varianza total está cambiando y, de ser así, en qué dirección. Hasta la fecha, estas cuestiones se han presentado en términos de las varianzas génicas (σ 2 A ) y cuasi-dominancia (σ 2 D ) en lugar de los componentes del modelo genético. Esto también se hará en este artículo.

La ecuación general crucial proviene de Sewall Wright, [13] : 99, 130  [37] y es el esquema de la varianza genotípica endogámica basada en un promedio ponderado de sus extremos , siendo los pesos cuadráticos con respecto al coeficiente de endogamia . Esta ecuación es:

donde es el coeficiente de endogamia, es la varianza genotípica en f=0 , es la varianza genotípica en f=1 , es la media poblacional en f=0 , y es la media poblacional en f=1 .

El componente [en la ecuación anterior] describe la reducción de la varianza dentro de las líneas de progenie. El componente aborda el aumento de la varianza entre las líneas de progenie. Por último, se observa que el componente (en la siguiente línea) aborda la varianza de cuasidominancia . [13] : 99 y 130  Estos componentes se pueden expandir aún más, revelando así información adicional. Por lo tanto:

En primer lugar, σ 2 G(0) [en la ecuación anterior] se ha ampliado para mostrar sus dos subcomponentes [véase la sección sobre "Varianza genotípica"]. A continuación, σ 2 G(1) se ha convertido en 4pqa 2 y se deriva en una sección siguiente. La sustitución del tercer componente es la diferencia entre los dos "extremos de endogamia" de la media de la población [véase la sección sobre la "Media de la población"]. [36]

Dispersión y componentes de la varianza genotípica

Resumiendo: los componentes dentro de la línea son y ; y los componentes entre líneas son y . [36]

Desarrollo de la dispersión de varianza

La reorganización da como resultado lo siguiente: La versión de la última línea se analiza con más detalle en una sección posterior.

Similarmente,

Los gráficos de la izquierda muestran estas tres varianzas génicas, junto con las tres varianzas de cuasi-dominancia, en todos los valores de f , para p = 0,5 (en el que la varianza de cuasi-dominancia es máxima). Los gráficos de la derecha muestran las particiones de varianza genotípica (que son las sumas de las particiones génicas y de cuasi-dominancia respectivas ) que cambian a lo largo de diez generaciones con un ejemplo f = 0,10 .

Respondiendo, en primer lugar, a las preguntas planteadas al principio sobre las varianzas totales [los Σ en los gráficos]: la varianza génica aumenta linealmente con el coeficiente de endogamia , maximizando al doble de su nivel inicial. La varianza de cuasi-dominancia declina a una tasa de (1 − f 2 ) hasta terminar en cero. En niveles bajos de f , la disminución es muy gradual, pero se acelera con niveles más altos de f .

En segundo lugar, observe las otras tendencias. Probablemente sea intuitivo que las varianzas dentro de la línea disminuyen a cero con la endogamia continua, y se ve que este es el caso (ambas a la misma tasa lineal (1-f) ). Las varianzas entre líneas aumentan con la endogamia hasta f = 0,5 , la varianza génica a la tasa de 2f , y la varianza de cuasi-dominancia a la tasa de (f − f 2 ) . Sin embargo, en f > 0,5 , las tendencias cambian. La varianza génica entre líneas continúa su aumento lineal hasta que es igual a la varianza génica total . Pero, la varianza de cuasi-dominancia entre líneas ahora disminuye hacia cero , porque (f − f 2 ) también disminuye con f > 0,5 . [36]

Derivación deσ2G (1 )

Recordemos que cuando f=1 , la heterocigosidad es cero, la varianza dentro de la línea es cero y toda la varianza genotípica es, por lo tanto, varianza entre líneas y varianza de agotamiento de dominancia. En otras palabras, σ 2 G(1) es la varianza entre las medias de las líneas completamente endogámicas. Recordemos además [de la sección "La media después de la autofecundación"] que dichas medias (G 1 , de hecho) son G = a(pq) . Sustituyendo (1-q) por p , obtenemos G 1 = a (1 − 2q) = a − 2aq . [14] : 265  Por lo tanto, σ 2 G(1) es en realidad σ 2 (a-2aq) . Ahora bien, en general, la varianza de una diferencia (xy) es [ σ 2 x + σ 2 y − 2 cov xy ] . [49] : 100  [50] : 232  Por lo tanto, σ 2 G(1) = [ σ 2 a + σ 2 2aq − 2 cov (a, 2aq) ] . Pero a (un efecto de alelo ) y q (una frecuencia de alelo ) son independientes , por lo que esta covarianza es cero. Además, a es una constante de una línea a la siguiente, por lo que σ 2 a también es cero. Además, 2a es otra constante (k), por lo que σ 2 2aq es del tipo σ 2 k X . En general, la varianza σ 2 k X es igual a k 2 σ 2 X . [50] : 232  Juntando todo esto se revela que σ 2 (a-2aq) = (2a) 2 σ 2 q . Recordemos [de la sección sobre "Continuación de la deriva genética"] que σ 2 q = pq f . Con f = 1 aquí dentro de esta derivación actual, esto se convierte en pq 1 (es decir, pq ), y esto se sustituye en el anterior.

El resultado final es: σ 2 G(1) = σ 2 (a-2aq) = 4a 2 pq = 2(2pq a 2 ) = 2 σ 2 a .

De ello se deduce inmediatamente que f σ 2 G(1) = f 2 σ 2 a . [Esta última f proviene de la ecuación inicial de Sewall Wright : no  es la f simplemente establecida en "1" en la derivación concluida dos líneas más arriba.]

Varianza génica dispersa total – σ2Una(f)y βF

En secciones anteriores se encontró que la varianza génica dentro de la línea se basa en la varianza génica derivada de la sustitución ( σ 2 A ) —pero la varianza génica entre líneas se basa en la varianza alélica del modelo genético ( σ 2 a ) . Estos dos no pueden simplemente sumarse para obtener la varianza génica total . Un enfoque para evitar este problema fue revisar la derivación del efecto de sustitución de alelos promedio , y construir una versión, ( β f ) , que incorpora los efectos de la dispersión. Crow y Kimura lograron esto [13] : 130–131  utilizando los efectos de alelos re-centrados ( a•, d•, (-a)• ) discutidos previamente ["Efectos genéticos redefinidos"]. Sin embargo, se encontró posteriormente que esto subestimaba ligeramente la varianza génica total , y una nueva derivación basada en la varianza condujo a una versión refinada. [36]

La versión refinada es: β f = { a 2 + [(1− f ) / (1 + f )] 2(q − p ) ad + [(1- f ) / (1 + f )] (q − p ) 2 d 2 } (1/2)

En consecuencia, σ 2 A(f) = (1 + f ) 2pq β f 2 ahora concuerda exactamente con [ (1-f) σ 2 A(0) + 2f σ 2 a(0) ] .

Varianzas de cuasi-dominancia dispersa total y particionada

La varianza génica total es de interés intrínseco por derecho propio. Pero, antes de los refinamientos de Gordon, [36] había tenido también otro uso importante. No existían estimadores existentes para la cuasi-dominancia "dispersa". Esta se había estimado como la diferencia entre la varianza genotípica endogámica de Sewall Wright [37] y la varianza génica "dispersa" total [véase la subsección anterior]. Sin embargo, apareció una anomalía, porque la varianza de la cuasi-dominancia total pareció aumentar al principio de la endogamia a pesar de la disminución de la heterocigosidad. [14] : 128  : 266 

Los refinamientos de la subsección anterior corrigieron esta anomalía. [36] Al mismo tiempo, se obtuvo una solución directa para la varianza de cuasidominancia total , evitando así la necesidad del método de "sustracción" de ocasiones anteriores. Además, también se obtuvieron, por primera vez, soluciones directas para las particiones intralineales y entre líneas de la varianza de cuasidominancia . [Estas se han presentado en la sección "Dispersión y varianza genotípica".]

Variación ambiental

La varianza ambiental es la variabilidad fenotípica, que no se puede atribuir a la genética. Esto parece simple, pero el diseño experimental necesario para separar ambos requiere una planificación muy cuidadosa. Incluso el entorno "externo" se puede dividir en componentes espaciales y temporales ("Sitios" y "Años"); o en particiones como "camada" o "familia", y "cultura" o "historia". Estos componentes dependen en gran medida del modelo experimental real utilizado para realizar la investigación. Estas cuestiones son muy importantes cuando se realiza la investigación en sí, pero en este artículo sobre genética cuantitativa esta descripción general puede ser suficiente.

Es un lugar apropiado, sin embargo, para un resumen:

Varianza fenotípica = variaciones genotípicas + variaciones ambientales + interacción genotipo-ambiente + varianza de "error" experimental

es decir, σ 2 P = σ 2 G + σ 2 E + σ 2 GE + σ 2

o σ 2 P = σ 2 A + σ 2 D + σ 2 I + σ 2 E + σ 2 GE + σ 2

después de dividir la varianza genotípica (G) en varianzas componentes "génica" (A), "cuasi-dominancia" (D) y "epistásica" (I). [51]

La variación ambiental aparecerá en otras secciones, como "Herencia" y "Atributos correlacionados".

Heredabilidad y repetibilidad

La heredabilidad de un rasgo es la proporción de la varianza total (fenotípica) (σ 2 P ) que es atribuible a la varianza genética, ya sea la varianza genotípica completa o algún componente de ella. Cuantifica el grado en que la variabilidad fenotípica se debe a la genética, pero el significado preciso depende de qué partición de varianza genética se utiliza en el numerador de la proporción. [52] Las estimaciones de investigación de la heredabilidad tienen errores estándar, al igual que todos los estadísticos estimados. [53]

Cuando la varianza del numerador es la varianza genotípica total ( σ 2 G ), la heredabilidad se conoce como heredabilidad de "sentido amplio" ( H 2 ). Cuantifica el grado en que la variabilidad de un atributo está determinada por la genética en su conjunto. [Véase la sección sobre la varianza genotípica.]

Si sólo se utiliza la varianza génica ( σ 2 A ) en el numerador, la heredabilidad puede llamarse "sentido estricto" (h 2 ). Cuantifica el grado en que la varianza fenotípica está determinada por la varianza de las expectativas de sustitución de Fisher . Fisher propuso que esta heredabilidad en sentido estricto podría ser apropiada al considerar los resultados de la selección natural, centrándose como lo hace en la capacidad de cambio, es decir , en la "adaptación". [29] La propuso con respecto a la cuantificación de la evolución darwiniana.

Recordando que la varianza alélica ( σ 2 a ) y la varianza de dominancia ( σ 2 d ) son componentes eugenéticos del modelo genético [ver sección sobre la varianza genotípica], y que σ 2 D (las desviaciones de sustitución o varianza de "cuasi-dominancia" ) y cov ad se deben al cambio del punto medio del homocigoto ( mp ) a la media poblacional ( G ), se puede ver que los significados reales de estas heredabilidades son oscuros. Las heredabilidades y tienen un significado inequívoco.

La heredabilidad en sentido estricto también se ha utilizado para predecir en general los resultados de la selección artificial . En este último caso, sin embargo, la heredabilidad en sentido amplio puede ser más apropiada, ya que se altera el atributo completo: no solo la capacidad adaptativa. En general, el avance a partir de la selección es más rápido cuanto mayor es la heredabilidad. [Véase la sección sobre "Selección".] En los animales, la heredabilidad de los rasgos reproductivos es típicamente baja, mientras que la heredabilidad de la resistencia a las enfermedades y la producción son moderadamente bajas a moderadas, y la heredabilidad de la conformación corporal es alta.

La repetibilidad (r 2 ) es la proporción de varianza fenotípica atribuible a diferencias en medidas repetidas del mismo sujeto, que surgen de registros posteriores. Se utiliza particularmente para especies de larga vida. Este valor solo se puede determinar para rasgos que se manifiestan varias veces en la vida del organismo, como la masa corporal adulta, la tasa metabólica o el tamaño de la camada. La masa individual al nacer, por ejemplo, no tendría un valor de repetibilidad, pero sí un valor de heredabilidad. Generalmente, pero no siempre, la repetibilidad indica el nivel superior de heredabilidad. [54]

r2 = ( s2G + s2PE ) / s2P

donde s 2 PE = interacción fenotipo-ambiente = repetibilidad.

Sin embargo, el concepto de repetibilidad antes mencionado es problemático en el caso de rasgos que necesariamente cambian mucho entre mediciones. Por ejemplo, la masa corporal aumenta mucho en muchos organismos entre el nacimiento y la edad adulta. No obstante, dentro de un rango de edad determinado (o etapa del ciclo de vida), se podrían realizar mediciones repetidas y la repetibilidad sería significativa dentro de esa etapa.

Relación

Conexión entre los coeficientes de endogamia y coascendencia.

Desde la perspectiva de la herencia, los parientes son individuos que heredan genes de uno o más ancestros comunes. Por lo tanto, su "relación" se puede cuantificar sobre la base de la probabilidad de que cada uno de ellos haya heredado una copia de un alelo del ancestro común. En secciones anteriores, el coeficiente de endogamia se ha definido como "la probabilidad de que dos alelos iguales ( A y A , o a y a ) tengan un origen común" o, más formalmente, "la probabilidad de que dos alelos homólogos sean autocigotos". Anteriormente, el énfasis estaba en la probabilidad de que un individuo tuviera dos de esos alelos, y el coeficiente se formuló en consecuencia. Sin embargo, es obvio que esta probabilidad de autocigosidad para un individuo también debe ser la probabilidad de que cada uno de sus dos progenitores tuviera este alelo autocigoto. En esta forma reorientada, la probabilidad se denomina coeficiente de coascendencia para los dos individuos i y j ( f ij ). De esta forma, se puede utilizar para cuantificar la relación entre dos individuos, y también puede conocerse como coeficiente de parentesco o coeficiente de consanguinidad . [13] : 132–143  [14] : 82–92 

Análisis de pedigrí

Pedigrí ilustrativo.

Los pedigríes son diagramas de conexiones familiares entre individuos y sus ancestros, y posiblemente entre otros miembros del grupo que comparten herencia genética con ellos. Son mapas de relaciones. Por lo tanto, se puede analizar un pedigrí para revelar coeficientes de endogamia y coascendencia. Dichos pedigríes en realidad son representaciones informales de diagramas de trayectorias como los utilizados en el análisis de trayectorias , que fue inventado por Sewall Wright cuando formuló sus estudios sobre endogamia. [55] : 266–298  Usando el diagrama adyacente, la probabilidad de que los individuos "B" y "C" hayan recibido alelos autocigotos del ancestro "A" es 1/2 (uno de los dos alelos diploides). Esta es la endogamia "de novo" ( Δf Ped ) en este paso. Sin embargo, el otro alelo puede haber tenido autocigosidad "de arrastre" de generaciones anteriores, por lo que la probabilidad de que esto ocurra es ( complemento de novo multiplicado por la endogamia del ancestro A ), es decir (1 − Δf Ped ) f A = (1/2) f A . Por lo tanto, la probabilidad total de autocigosidad en B y C, después de la bifurcación del pedigrí, es la suma de estos dos componentes, es decir (1/2) + (1/2)f A = (1/2) (1+f A ) . Esto puede verse como la probabilidad de que dos gametos aleatorios del ancestro A porten alelos autocigotos, y en ese contexto se llama coeficiente de paternidad ( f AA ). [13] : 132–143  [14] : 82–92  Aparece a menudo en los siguientes párrafos.

Siguiendo la ruta "B", la probabilidad de que cualquier alelo autócigoto se "transmita" a cada progenitor sucesivo es de nuevo (1/2) en cada paso (incluido el último al "objetivo" X ). La probabilidad global de transferencia por la "ruta B" es, por tanto, (1/2) 3 . La potencia a la que se eleva (1/2) puede considerarse como "el número de intermediarios en la ruta entre A y X ", n B = 3 . De forma similar, para la "ruta C", n C = 2 , y la "probabilidad de transferencia" es (1/2) 2 . La probabilidad combinada de transferencia autócigota de A a X es, por tanto, [ f AA (1/2) (n B ) (1/2) (n C ) ] . Recordando que f AA = (1/2) (1+f A ) , f X = f PQ = (1/2) (n B + n C + 1) (1 + f A ) . En este ejemplo, asumiendo que f A = 0, f X = 0,0156 (redondeado) = f PQ , una medida de la "relación" entre P y Q .

En esta sección se utilizaron potencias de ( 1/2 ) para representar la "probabilidad de autocigosidad". Más adelante, este mismo método se utilizará para representar las proporciones de los acervos genéticos ancestrales que se heredan a lo largo de un árbol genealógico [la sección sobre "Relación entre parientes"].

Reglas de multiplicación cruzada.

Reglas de multiplicación cruzada

En las siguientes secciones sobre cruces entre hermanos y temas similares, son útiles varias "reglas de promediado". Estas se derivan del análisis de trayectorias . [55] Las reglas muestran que cualquier coeficiente de co-ascendencia se puede obtener como el promedio de co-ascendencias cruzadas entre combinaciones apropiadas de abuelos y progenitores. Por lo tanto, en referencia al diagrama adyacente, el multiplicador cruzado 1 es que f PQ = promedio de ( f AC , f AD , f BC , f BD ) = (1/4) [ f AC + f AD + f BC + f BD ] = f Y . De manera similar, el multiplicador cruzado 2 establece que f PC = (1/2) [ f AC + f BC ] —mientras que el multiplicador cruzado 3 establece que f PD = (1/2) [ f AD + f BD ] . Volviendo al primer multiplicador, ahora también se puede ver que es f PQ = (1/2) [ f PC + f PD ] , que, después de sustituir los multiplicadores 2 y 3, retoma su forma original.

En gran parte de lo que sigue, la generación de los abuelos se denomina (t-2) , la generación de los padres se denomina (t-1) y la generación "objetivo" se denomina t .

Cruce de hermanos completos (FS)

Endogamia en las relaciones entre hermanos

El diagrama de la derecha muestra que el cruce de hermanos completos es una aplicación directa del multiplicador cruzado 1 , con la ligera modificación de que los padres A y B se repiten (en lugar de C y D ) para indicar que los individuos P1 y P2 tienen a ambos padres en común, es decir, son hermanos completos . El individuo Y es el resultado del cruce de dos hermanos completos. Por lo tanto, f Y = f P1,P2 = (1/4) [ f AA + 2 f AB + f BB ] . Recordemos que f AA y f BB se definieron anteriormente (en el análisis de pedigrí) como coeficientes de paternidad , iguales a (1/2)[1+f A ] y (1/2)[1+f B ] respectivamente, en el presente contexto. Reconozca que, en esta forma, los abuelos A y B representan la generación (t-2) . Por lo tanto, asumiendo que en cualquier generación todos los niveles de endogamia son los mismos, estos dos coeficientes de paternidad representan cada uno (1/2) [1 + f (t-2) ] .

Endogamia a partir de cruces entre hermanos completos y medios hermanos, y a partir de autofecundación.

Ahora, examinemos f AB . Recordemos que esto también es f P1 o f P2 , y por lo tanto representa su generación - f (t-1) . Poniendo todo junto, f t = (1/4) [ 2 f AA + 2 f AB ] = (1/4) [ 1 + f (t-2) + 2 f (t-1) ] . Ese es el coeficiente de endogamia para el cruce de hermanos completos . [13] : 132–143  [14] : 82–92  El gráfico de la izquierda muestra la tasa de esta endogamia a lo largo de veinte generaciones repetitivas. La "repetición" significa que la progenie después del ciclo t se convierte en los padres del cruce que generan el ciclo ( t+1 ), y así sucesivamente. Los gráficos también muestran la endogamia para la fertilización aleatoria 2N=20 para comparación. Recordemos que este coeficiente de endogamia para la progenie Y es también el coeficiente de coascendencia para sus padres, y por tanto es una medida del parentesco de los dos hermanos Fill .

Cruce de medios hermanos (HS)

La derivación del cruce de medios hermanos toma un camino ligeramente diferente al de los hermanos completos. En el diagrama adyacente, los dos medios hermanos en la generación (t-1) tienen solo un progenitor en común: el progenitor "A" en la generación (t-2). Se utiliza nuevamente el multiplicador cruzado 1 , lo que da f Y = f (P1,P2) = (1/4) [ f AA + f AC + f BA + f BC ] . Esta vez solo hay un coeficiente de filiación , pero tres coeficientes de coascendencia en el nivel (t-2) (uno de ellos, f BC, es un "dummy" y no representa a un individuo real en la generación (t-1)). Como antes, el coeficiente de filiación es (1/2)[1+f A ] , y las tres coascendencias representan cada una f (t-1) . Recordando que f A representa f (t-2) , la recopilación y simplificación final de términos da f Y = f t = (1/8) [ 1 + f (t-2) + 6 f (t-1) ] . [13] : 132–143  [14] : 82–92  Los gráficos de la izquierda incluyen esta endogamia entre medios hermanos (HS) a lo largo de veinte generaciones sucesivas.

Autofecundación endogámica

Como antes, esto también cuantifica el parentesco de los dos medios hermanos en la generación (t-1) en su forma alternativa de f (P1, P2) .

Autofecundación (AF)

A la derecha se muestra un diagrama de pedigrí para la autofecundación. Es tan sencillo que no requiere ninguna regla de multiplicación cruzada. Emplea simplemente la yuxtaposición básica del coeficiente de endogamia y su alternativa, el coeficiente de coascendencia ; seguido del reconocimiento de que, en este caso, este último también es un coeficiente de paternidad . Por lo tanto, f Y = f (P1, P1) = f t = (1/2) [ 1 + f (t-1) ] . [13] : 132–143  [14] : 82–92  Esta es la tasa más rápida de endogamia de todos los tipos, como se puede ver en los gráficos anteriores. La curva de autofecundación es, de hecho, un gráfico del coeficiente de paternidad .

Cruces de primos

Análisis de pedigrí de primos hermanos

Estos se derivan con métodos similares a los de los hermanos. [13] : 132–143  [14] : 82–92  Como antes, el punto de vista de co-ascendencia del coeficiente de endogamia proporciona una medida de "parentesco" entre los padres P1 y P2 en estas expresiones de primos.

El pedigrí de los primos hermanos (PC) se muestra a la derecha. La ecuación principal es f Y = f t = f P1,P2 = (1/4) [ f 1D + f 12 + f CD + f C2 ] . Después de la sustitución con los coeficientes de endogamia correspondientes, la recopilación de términos y la simplificación, esto se convierte en f t = (1/4) [ 3 f (t-1) + (1/4) [2 f (t-2) + f (t-3) + 1 ]] , que es una versión para iteración, útil para observar el patrón general y para la programación informática. Una versión "final" es f t = (1/16) [ 12 f (t-1) + 2 f (t-2) + f (t-3) + 1 ] .

Análisis de pedigrí de primos segundos

El árbol genealógico de los primos segundos (SC) se encuentra a la izquierda. Los padres en el árbol genealógico que no están relacionados con el antepasado común se indican con números en lugar de letras. Aquí, la ecuación principal es f Y = f t = f P1,P2 = (1/4) [ f 3F + f 34 + f EF + f E4 ] . Después de trabajar con el álgebra adecuada, esto se convierte en f t = (1/4) [ 3 f (t-1) + (1/4) [3 f (t-2) + (1/4) [2 f (t-3) + f (t-4) + 1 ]]] , que es la versión de iteración. Una versión "final" es f t = (1/64) [ 48 f (t-1) + 12 f (t-2) + 2 f (t-3) + f (t-4) + 1 ] .

Endogamia a partir de varios niveles de cruce entre primos.

Para visualizar el patrón en ecuaciones de primos completos, comience la serie con la ecuación de hermanos completos reescrita en forma de iteración: f t = (1/4)[2 f (t-1) + f (t-2) + 1 ] . Nótese que este es el "plan esencial" del último término en cada una de las formas iterativas de primos: con la pequeña diferencia de que los índices de generación se incrementan en "1" en cada "nivel" de primo. Ahora, defina el nivel de primo como k = 1 (para primos hermanos), = 2 (para primos segundos), = 3 (para primos terceros), etc., etc.; y = 0 (para hermanos completos, que son "primos de nivel cero"). El último término puede escribirse ahora como: (1/4) [ 2 f (t-(1+k)) + f (t-(2+k)) + 1] . Delante de este último término se apilan uno o más incrementos de iteración en la forma (1/4) [ 3 f (tj) + ... , donde j es el índice de iteración y toma valores de 1 ... k a lo largo de las iteraciones sucesivas según sea necesario. Poniendo todo esto junto se obtiene una fórmula general para todos los niveles de primos completos posibles, incluidos los hermanos completos . Para los primos completos de nivel k , f{k} t = Ιter j = 1 k { (1/4) [ 3 f (tj) + } j + (1/4) [ 2 f (t-(1+k)) + f (t-(2+k)) + 1] . Al comienzo de la iteración, todos los f (t- x ) se establecen en "0", y cada uno tiene su valor sustituido a medida que se calcula a través de las generaciones. Los gráficos a la derecha muestran la endogamia sucesiva para varios niveles de primos completos.

Análisis de pedigrí de primos medios

Para los primos en primer grado (FHC) , el pedigrí está a la izquierda. Observe que solo hay un ancestro común (individuo A ). Además, en cuanto a los primos en segundo grado , los padres no relacionados con el ancestro común se indican con números. Aquí, la ecuación principal es f Y = f t = f P1,P2 = (1/4) [ f 3D + f 34 + f CD + f C4 ] . Después de trabajar con el álgebra adecuada, esto se convierte en f t = (1/4) [ 3 f (t-1) + (1/8) [6 f (t-2) + f (t-3) + 1 ]] , que es la versión de iteración. Una versión "final" es f t = (1/32) [ 24 f (t-1) + 6 f (t-2) + f (t-3) + 1 ] . El algoritmo de iteración es similar al de los primos completos , excepto que el último término es (1/8) [ 6 f (t-(1+k)) + f (t-(2+k)) + 1 ] . Observe que este último término es básicamente similar a la ecuación de los medios hermanos, en paralelo al patrón para primos completos y hermanos completos. En otras palabras, los medios hermanos son medios primos de "nivel cero".

Existe una tendencia a considerar el cruzamiento entre primos desde un punto de vista orientado hacia los humanos, posiblemente debido a un amplio interés en la genealogía. El uso de pedigríes para derivar la endogamia quizás refuerce esta visión de la "historia familiar". Sin embargo, este tipo de cruzamiento también se da en poblaciones naturales, especialmente en aquellas que son sedentarias o tienen una "zona de reproducción" que vuelven a visitar de una estación a otra. El grupo de progenie de un harén con un macho dominante, por ejemplo, puede contener elementos de cruzamiento entre hermanos, cruzamiento entre primos y retrocruzamiento, así como deriva genética, especialmente del tipo "isleño". Además de eso, el "cruzamiento externo" ocasional agrega un elemento de hibridación a la mezcla. No es panmixia.

Retrocruzamiento (BC)

Análisis de pedigrí: retrocruzamiento
Retrocruzamiento: niveles básicos de endogamia

Después de la hibridación entre A y R , el F1 (individuo B ) se cruza de nuevo ( BC1 ) con un progenitor original ( R ) para producir la generación BC1 (individuo C ). [Es habitual utilizar la misma etiqueta para el acto de realizar el retrocruzamiento y para la generación producida por él. El acto de retrocruzamiento está aquí en cursiva .] El progenitor R es el progenitor recurrente . Se representan dos retrocruces sucesivos, siendo el individuo D la generación BC2 . A estas generaciones también se les han dado índices t , como se indicó. Como antes, f D = f t = f CR = (1/2) [ f RB + f RR ] , utilizando el multiplicador cruzado 2 dado previamente. El f RB que se acaba de definir es el que implica la generación (t-1) con (t-2) . Sin embargo, existe otro f RB contenido totalmente dentro de la generación (t-2) también, y es este el que se utiliza ahora: como la co-ascendencia de los padres del individuo C en la generación (t-1) . Como tal, también es el coeficiente de endogamia de C , y por lo tanto es f (t-1) . El f RR restante es el coeficiente de paternidad del padre recurrente , y por lo tanto es (1/2) [1 + f R ] . Poniendo todo esto junto : f t = (1/2) [ (1/2) [ 1 + f R ] + f (t-1) ] = (1/4) [ 1 + f R + 2 f (t-1) ] . Los gráficos de la derecha ilustran la endogamia por retrocruzamiento en veinte retrocruces para tres niveles diferentes de endogamia (fija) en el padre recurrente.

Esta rutina se utiliza comúnmente en programas de mejoramiento genético de animales y plantas. A menudo, después de hacer el híbrido (especialmente si los individuos tienen una vida corta), el progenitor recurrente necesita una "mejora en línea" separada para su mantenimiento como progenitor recurrente futuro en el retrocruzamiento. Este mantenimiento puede ser a través de la autofecundación, o a través del cruzamiento entre hermanos completos o medios hermanos, o a través de poblaciones fertilizadas aleatoriamente y restringidas, dependiendo de las posibilidades reproductivas de la especie. Por supuesto, este aumento incremental en f R se traslada al f t del retrocruzamiento. El resultado es una curva más gradual que asciende hacia las asíntotas que la que se muestra en los gráficos actuales, porque f R no está en un nivel fijo desde el principio.

Contribuciones de los acervos genéticos ancestrales

En la sección sobre "Análisis de pedigrí", se utilizó para representar las probabilidades de descendencia de alelos autocigóticos a lo largo de n generaciones a lo largo de las ramas del pedigrí. Esta fórmula surgió debido a las reglas impuestas por la reproducción sexual: (i) dos progenitores que contribuyen con proporciones prácticamente iguales de genes autosómicos, y (ii) dilución sucesiva para cada generación entre el cigoto y el nivel de "foco" de paternidad. Estas mismas reglas se aplican también a cualquier otro punto de vista de la descendencia en un sistema reproductivo de dos sexos. Uno de ellos es la proporción de cualquier acervo genético ancestral (también conocido como "germoplasma") que está contenido dentro del genotipo de cualquier cigoto.

Por lo tanto, la proporción de un acervo genético ancestral en un genotipo es: donde n = número de generaciones sexuales entre el cigoto y el ancestro foco.

Por ejemplo, cada progenitor define un acervo genético que contribuye a su descendencia, mientras que cada bisabuelo contribuye a su bisnieto.

El acervo genético total del cigoto ( Γ ) es, por supuesto, la suma de las contribuciones sexuales a su descendencia.

Relación a través de acervos genéticos ancestrales

Los individuos que descienden de un acervo genético ancestral común obviamente están emparentados. Esto no quiere decir que sean idénticos en sus genes (alelos), porque, en cada nivel de ancestro, habrá ocurrido segregación y selección en la producción de gametos. Pero se habrán originado a partir del mismo acervo de alelos disponibles para estas meiosis y fertilizaciones subsiguientes. [Esta idea se encontró por primera vez en las secciones sobre análisis de pedigrí y relaciones]. Por lo tanto, las contribuciones al acervo genético [ver sección anterior] de su acervo genético ancestral común más cercano (un nodo ancestral ) se pueden utilizar para definir su relación. Esto conduce a una definición intuitiva de relación que se ajusta bien a las nociones familiares de "parentesco" que se encuentran en la historia familiar; y permite comparaciones del "grado de parentesco" para patrones complejos de relaciones que surgen de dicha genealogía.

Las únicas modificaciones necesarias (para cada individuo a su vez) están en Γ y se deben al cambio a " ancestro común compartido " en lugar de " ancestro total individual". Para esto, defina Ρ (en lugar de Γ ); m = número de ancestros en común en el nodo (es decir, m = 1 o 2 solamente); y un "índice individual" k . Por lo tanto:

donde, como antes, n = número de generaciones sexuales entre el individuo y el nodo ancestral.

Un ejemplo lo proporcionan dos primos hermanos. Su nodo ancestral común más cercano son sus abuelos, que dieron origen a sus dos padres hermanos, y tienen a ambos abuelos en común. [Véase el árbol genealógico anterior.] Para este caso, m=2 y n=2 , por lo que para cada uno de ellos

En este caso simple, cada primo tiene numéricamente el mismo Ρ.

Un segundo ejemplo podría ser entre dos primos completos, pero uno ( k=1 ) tiene tres generaciones hasta el nodo ancestral (n=3), y el otro ( k=2 ) solo dos (n=2) [es decir, una relación de primo segundo y primo hermano]. Para ambos, m=2 (son primos completos).

y

Observe que cada primo tiene un Ρ k diferente .

GRC – coeficiente de relación del acervo genético

En cualquier estimación de relación por pares, hay un Ρ k para cada individuo: solo queda promediarlos para combinarlos en un único "coeficiente de relación". Debido a que cada Ρ es una fracción de un acervo genético total , el promedio apropiado para ellos es la media geométrica [56] [57] : 34–55  Este promedio es su coeficiente de relación del acervo genético , el "GRC".

Para el primer ejemplo (dos primos hermanos), su GRC = 0,5; para el segundo caso (un primo hermano y un primo segundo), su GRC = 0,3536.

Todas estas relaciones (GRC) son aplicaciones del análisis de trayectorias. [55] : 214–298  A continuación se presenta un resumen de algunos niveles de relación (GRC).

Semejanzas entre parientes

Estas, al igual que las variaciones genotípicas, se pueden obtener mediante el método del modelo genético ("Mather") o el método de sustitución de alelos ("Fisher"). Aquí, cada método se demuestra para casos alternativos.

Covarianza entre padres e hijos

Estos pueden verse como la covarianza entre cualquier descendencia y cualquiera de sus padres ( PO ), o como la covarianza entre cualquier descendencia y el valor del "padre medio" de ambos padres ( MPO ).

Monoparental y descendencia (PO)

Esto se puede derivar como la suma de los productos cruzados entre los efectos genéticos parentales y la mitad de las expectativas de progenie utilizando el enfoque de sustitución de alelos. La mitad de la expectativa de progenie explica el hecho de que solo se está considerando uno de los dos progenitores . Por lo tanto, los efectos genéticos parentales apropiados son los efectos genéticos redefinidos de segunda etapa utilizados para definir las varianzas genotípicas anteriormente, es decir: a″ = 2q(a − qd) y d″ = (qp)a + 2pqd y también (-a)″ = -2p(a + pd) [ver la sección "Efectos genéticos redefinidos"]. De manera similar, los efectos de progenie apropiados, para las expectativas de sustitución de alelos son la mitad de los valores de cría anteriores , siendo estos últimos: a AA = 2qa , y a Aa = (qp)a y también a aa = -2pa [ver la sección sobre "Sustitución de genotipos: expectativas y desviaciones"].

Como todos estos efectos ya están definidos como desviaciones de la media genotípica, la suma de productos cruzados que utiliza { frecuencia del genotipo * efecto del gen parental * valor de reproducción a la mitad } proporciona inmediatamente la covarianza de la expectativa de sustitución de alelos entre cualquier progenitor y su descendencia. Después de una cuidadosa recopilación de términos y una simplificación, esto se convierte en cov(PO) A = pqa 2 = 1/2 s 2 A . [13] : 132–141  [14] : 134–147 

Desafortunadamente, las desviaciones por sustitución de alelos suelen pasarse por alto, ¡pero no han "dejado de existir" de todos modos! Recordemos que estas desviaciones son: d AA = -2q 2 d , y d Aa = 2pq d y también d aa = -2p 2 d [ver la sección sobre "Sustitución de genotipos: expectativas y desviaciones"]. En consecuencia, la suma de productos cruzados que utiliza { frecuencia de genotipo * efecto del gen parental * desviaciones por semi-sustitución } también proporciona inmediatamente la covarianza de las desviaciones por sustitución de alelos entre cualquier progenitor y su descendencia. Una vez más, después de una cuidadosa recopilación de términos y simplificación, esto se convierte en cov(PO) D = 2p 2 q 2 d 2 = 1/2 s 2 D .

Se deduce por tanto que: cov(PO) = cov(PO) A + cov(PO) D = 1/2 s 2 A + 1/2 s 2 D , ¡cuando el dominio no se pasa por alto!

Progenitor intermedio y descendencia (MPO)

Debido a que existen muchas combinaciones de genotipos parentales, hay muchas medias diferentes de progenitores intermedios y descendencia a considerar, junto con las frecuencias variables de obtención de cada emparejamiento parental. El enfoque del modelo genético es el más conveniente en este caso. Por lo tanto, una suma no ajustada de productos cruzados (USCP) —utilizando todos los productos { frecuencia de pares parentales * efecto del gen progenitor intermedio * media del genotipo de la descendencia }— se ajusta restando la {media genotípica general} 2 como factor de corrección (CF) . Después de multiplicar todas las diversas combinaciones, reunir cuidadosamente los términos, simplificar, factorizar y cancelar cuando corresponda, esto se convierte en:

cov(MPO) = pq [a + (qp)d ] 2 = pq a 2 = 1/2 s 2 A , sin que en este caso se haya pasado por alto ningún dominio, ya que se había utilizado al definir el a . [13] : 132–141  [14] : 134–147 

Aplicaciones (padre-hijo)

La aplicación más obvia es un experimento que contiene todos los padres y su descendencia, con o sin cruces recíprocos, preferiblemente replicados sin sesgo, lo que permite la estimación de todas las medias, varianzas y covarianzas apropiadas, junto con sus errores estándar. Estas estadísticas estimadas se pueden utilizar luego para estimar las varianzas genéticas. El doble de la diferencia entre las estimaciones de las dos formas de covarianza padre-descendencia (corregida) proporciona una estimación de s 2 D ; y el doble de las estimaciones de cov(MPO) s 2 A . Con un diseño y análisis experimental apropiados, [9] [49] [50] también se pueden obtener errores estándar para estas estadísticas genéticas. Este es el núcleo básico de un experimento conocido como análisis dialélico , cuya versión de Mather, Jinks y Hayman se analiza en otra sección.

Una segunda aplicación implica el uso del análisis de regresión , que estima a partir de las estadísticas la ordenada (estimación de Y), la derivada (coeficiente de regresión) y la constante (intersección con Y) del cálculo. [9] [49] [58] [59] El coeficiente de regresión estima la tasa de cambio de la función que predice Y a partir de X , basándose en la minimización de los residuos entre la curva ajustada y los datos observados (MINRES). Ningún método alternativo para estimar dicha función satisface este requisito básico de MINRES. En general, el coeficiente de regresión se estima como la relación entre la covarianza (XY) y la varianza del determinador (X) . En la práctica, el tamaño de la muestra suele ser el mismo para X e Y, por lo que puede escribirse como SCP(XY) / SS(X) , donde todos los términos se han definido previamente. [9] [58] [59] En el presente contexto, los padres son vistos como la "variable determinante" (X), y la descendencia como la "variable determinada" (Y), y el coeficiente de regresión como la "relación funcional" (ß PO ) entre los dos. Tomando cov(MPO) = 1/2 s 2 A como cov(XY) , y s 2 P / 2 (la varianza de la media de dos padres—el padre intermedio) como s 2 X , se puede ver que ß MPO = [ 1/2 s 2 A ] / [ 1/2 s 2 P ] = h 2 . [60] A continuación, utilizando cov(PO) = [ 1/2 s 2 A + 1/2 s 2 D ] como cov(XY) , y s 2 P como s 2 X , se ve que 2 ß PO = [ 2 ( 1/2 s 2 A + 1/2 s 2 D )] / s 2 P = H 2 .

El análisis de la epistasis se ha intentado previamente a través de un enfoque de varianza de interacción del tipo s 2 AA , s 2 AD y también s 2 DD . Esto se ha integrado con estas covarianzas actuales en un esfuerzo por proporcionar estimadores para las varianzas de la epistasis. Sin embargo, los hallazgos de la epigenética sugieren que esta puede no ser una forma adecuada de definir la epistasis.

Covarianzas entre hermanos

La covarianza entre medios hermanos ( HS ) se define fácilmente utilizando métodos de sustitución de alelos; pero, una vez más, la contribución de la dominancia se ha omitido históricamente. Sin embargo, al igual que con la covarianza entre progenitores intermedios/descendientes, la covarianza entre hermanos completos ( FS ) requiere un enfoque de "combinación de progenitores", lo que hace necesario el uso del método de producto cruzado corregido del modelo genético; y la contribución de la dominancia no se ha pasado por alto históricamente. La superioridad de las derivaciones del modelo genético es tan evidente aquí como lo fue para las varianzas genotípicas.

Medios hermanos del mismo progenitor común (HS)

La suma de los productos cruzados {frecuencia de progenitor común * valor de reproducción a la mitad de un medio hermano * valor de reproducción a la mitad de cualquier otro medio hermano en ese mismo grupo de progenitores comunes} proporciona inmediatamente una de las covarianzas requeridas, porque los efectos utilizados [ valores de reproducción —que representan las expectativas de sustitución de alelos] ya están definidos como desviaciones de la media genotípica [ver la sección sobre "Sustitución de alelos: expectativas y desviaciones"]. Después de la simplificación, esto se convierte en: cov(HS) A = 1/2 pq a 2 = 1/4 s 2 A . [13] : 132–141  [14] : 134–147  Sin embargo, las desviaciones de sustitución también existen, definiendo la suma de los productos cruzados { frecuencia del padre común * desviación de la semisustitución de un medio hermano * desviación de la semisustitución de cualquier otro medio hermano en ese mismo grupo del padre común } , lo que finalmente conduce a: cov (HS) D = p 2 q 2 d 2 =1/4 s 2 D . Sumando los dos componentes se obtiene:

cov(HS) = cov(HS) A + cov(HS) D = 1/4 s 2 A + 1/4 s 2 D .

Hermanos completos (FS)

Como se explicó en la introducción, se utiliza un método similar al que se utiliza para la covarianza entre progenitores y progenie. Por lo tanto, se ajusta una suma no ajustada de productos cruzados (USCP) que utiliza todos los productos ({ frecuencia de pares de progenitores * el cuadrado de la media del genotipo de la progenie }) restando la {media genotípica general} 2 como factor de corrección (CF) . En este caso, multiplicar todas las combinaciones, reunir cuidadosamente los términos, simplificar, factorizar y cancelar es un proceso muy prolongado. Al final, se convierte en:

cov(FS) = pq a 2 + p 2 q 2 d 2 = 1/2 s 2 A + 1/4 s 2 D , sin que se haya pasado por alto ningún dominio. [13] : 132–141  [14] : 134–147 

Aplicaciones (hermanos)

La aplicación más útil aquí para las estadísticas genéticas es la correlación entre medios hermanos . Recordemos que el coeficiente de correlación ( r ) es la relación entre la covarianza y la varianza [véase la sección sobre "Atributos asociados", por ejemplo]. Por lo tanto, r HS = cov(HS) / s 2 todos los HS juntos = [ 1/4 s 2 A + 1/4s 2 D ] / s 2 P =1/4 H 2 . [61] La correlación entre hermanos completos es de poca utilidad, siendo r FS = cov(FS) / s 2 todos los FS juntos = [ 1/2 s 2 A + 1/4 s 2 D ] / s 2 P . La sugerencia de que "se aproxima" (1/2 h 2 ) es un mal consejo.

Por supuesto, las correlaciones entre hermanos son de interés intrínseco en sí mismas, independientemente de cualquier utilidad que puedan tener para estimar heredabilidades o variaciones genotípicas.

Puede que valga la pena señalar que [ cov(FS) − cov(HS)] = 1/4 s 2 A . Los experimentos que consisten en familias FS y HS podrían utilizar esto mediante el uso de correlación intraclase para equiparar los componentes de varianza del experimento a estas covarianzas [ver la sección sobre "Coeficiente de relación como correlación intraclase" para conocer la razón detrás de esto].

Los comentarios anteriores sobre la epistasis se aplican nuevamente aquí [ver sección sobre "Aplicaciones (padre-hijo"].

Selección

Principios básicos

Avance genético y presión de selección repetidos

La selección opera sobre el atributo (fenotipo), de modo que los individuos que igualan o superan un umbral de selección (z P ) se convierten en padres efectivos para la siguiente generación. La proporción que representan de la población base es la presión de selección . Cuanto menor sea la proporción, más fuerte será la presión. La media del grupo seleccionado (P s ) es superior a la media de la población base (P 0 ) por la diferencia llamada diferencial de selección (S) . Todas estas cantidades son fenotípicas. Para "vincular" a los genes subyacentes, se utiliza una heredabilidad (h 2 ) , que cumple el papel de un coeficiente de determinación en el sentido biométrico. El cambio genético esperado —aún expresado en unidades de medida fenotípicas— se llama avance genético (ΔG) , y se obtiene por el producto del diferencial de selección (S) y su coeficiente de determinación (h 2 ) . La media esperada de la progenie (P 1 ) se encuentra sumando el avance genético (ΔG) a la media base (P 0 ) . Los gráficos de la derecha muestran cómo el avance genético (inicial) es mayor cuanto mayor es la presión de selección (menor probabilidad ). También muestran cómo el progreso a partir de sucesivos ciclos de selección (incluso con la misma presión de selección) disminuye de manera constante, porque la varianza fenotípica y la heredabilidad se ven disminuidas por la propia selección. Esto se analiza más adelante.

Así . [14] : 1710–181  y . [14] : 1710–181 

Generalmente se utiliza la heredabilidad en sentido estricto (h 2 ) , con lo que se vincula a la varianza génica (σ 2 A ) . Sin embargo, si fuera apropiado, se podría utilizar la heredabilidad en sentido amplio (H 2 ) con la varianza genotípica (σ 2 G ) ; e incluso podría contemplarse una heredabilidad alélica [ h 2 eu = (σ 2 a ) / (σ 2 P ) ] , con lo que se vincularía a ( σ 2 a ). [Véase la sección sobre heredabilidad.]

Para aplicar estos conceptos antes de que la selección realmente tenga lugar, y así predecir el resultado de las alternativas (como la elección del umbral de selección , por ejemplo), estas estadísticas fenotípicas se reconsideran en relación con las propiedades de la distribución normal, especialmente las relativas al truncamiento de la cola superior de la distribución. En tal consideración, se utilizan el diferencial de selección estandarizado (i)″ y el umbral de selección estandarizado (z)″ en lugar de las versiones "fenotípicas" anteriores. También se necesita la desviación estándar fenotípica (σ P(0) ) . Esto se describe en una sección posterior.

Por lo tanto, ΔG = (i σ P ) h 2 , donde (i σ P(0) ) = S anteriormente. [14] : 1710–181 

Cambios que surgen de la selección repetida

El texto anterior señaló que los sucesivos ΔG disminuyen porque la "entrada" [la varianza fenotípica ( σ 2 P ) ] se reduce por la selección anterior. [14] : 1710–181  La heredabilidad también se reduce. Los gráficos a la izquierda muestran estas disminuciones a lo largo de diez ciclos de selección repetida durante los cuales se afirma la misma presión de selección. El avance genético acumulado ( ΣΔG ) prácticamente ha alcanzado su asíntota en la generación 6 en este ejemplo. Esta reducción depende en parte de las propiedades de truncamiento de la distribución normal y en parte de la heredabilidad junto con la determinación de la meiosis ( b 2 ) . Los dos últimos elementos cuantifican el grado en que el truncamiento se "compensa" por la nueva variación que surge de la segregación y el surtido durante la meiosis. [14] : 1710–181  [27] Esto se analiza pronto, pero aquí nótese el resultado simplificado para la fertilización aleatoria no dispersa (f = 0) .

Así: σ 2 P(1) = σ 2 P(0) [1 − i ( iz) 1/2 h 2 ] , donde i ( iz) = K = coeficiente de truncamiento y1/2 h 2 = R = coeficiente de reproducción [14] : 1710–181  [27] Esto también se puede escribir como σ 2 P(1) = σ 2 P(0) [1 − KR ] , lo que facilita un análisis más detallado de los problemas de selección.

Aquí ya se han definido i y z .1/2 es la determinación de la meiosis ( b 2 ) para f=0 , y el símbolo restante es la heredabilidad. Estos se analizan con más detalle en las siguientes secciones. Observe también que, de forma más general, R = b 2 h 2 . Si se utiliza la determinación general de la meiosis ( b 2 ) , los resultados de la endogamia previa se pueden incorporar a la selección. La ecuación de varianza fenotípica se convierte entonces en:

σ 2 P(1) = σ 2 P(0) [1 − i ( iz ) b 2 h 2 ] .

La varianza fenotípica truncada por el grupo seleccionado ( σ 2 P(S) ) es simplemente σ 2 P(0) [1 − K] , y su varianza génica contenida es (h 2 0 σ 2 P(S) ). Suponiendo que la selección no ha alterado la varianza ambiental , la varianza génica para la progenie puede aproximarse por σ 2 A(1) = ( σ 2 P(1) − σ 2 E ) . A partir de esto, h 2 1 = ( σ 2 A(1) / σ 2 P(1) ) . Se podrían hacer estimaciones similares para σ 2 G(1) y H 2 1 , o para σ 2 a(1) y h 2 eu(1) si fuera necesario.

ΔG alternativa

La siguiente reorganización es útil para considerar la selección en múltiples atributos (caracteres). Comienza expandiendo la heredabilidad en sus componentes de varianza. ΔG = i σ P ( σ 2 A / σ 2 P ) . σ P y σ 2 P se cancelan parcialmente, dejando un solo σ P . A continuación, el σ 2 A dentro de la heredabilidad se puede expandir como ( σ A × σ A ), lo que conduce a:

Diferencial de selección y distribución normal

ΔG = i σ A ( σ A / σ P ) = i σ Ah .

Se podrían realizar reordenamientos correspondientes utilizando las heredabilidades alternativas, dando ΔG = i σ G H o ΔG = i σ a h eu .

Modelos de adaptación poligénica en genética de poblaciones

Esta visión tradicional de la adaptación en genética cuantitativa proporciona un modelo de cómo el fenotipo seleccionado cambia con el tiempo, como una función del diferencial de selección y la heredabilidad. Sin embargo, no proporciona información sobre (ni depende de) ninguno de los detalles genéticos, en particular, el número de loci involucrados, sus frecuencias alélicas y tamaños de efecto, y los cambios de frecuencia impulsados ​​por la selección. Esto, en contraste, es el foco del trabajo sobre adaptación poligénica [62] dentro del campo de la genética de poblaciones . Estudios recientes han demostrado que rasgos como la altura han evolucionado en humanos durante los últimos miles de años como resultado de pequeños cambios de frecuencia alélica en miles de variantes que afectan la altura. [63] [64] [65]

Fondo

Selección estandarizada – la distribución normal

La población base completa está delineada por la curva normal [59] : 78–89  a la derecha. A lo largo del eje Z está cada valor del atributo de menor a mayor, y la altura desde este eje hasta la curva misma es la frecuencia del valor en el eje de abajo. La ecuación para encontrar estas frecuencias para la curva "normal" (la curva de la "experiencia común") se da en la elipse. Observe que incluye la media ( μ ) y la varianza ( σ 2 ). Moviéndose infinitesimalmente a lo largo del eje z, las frecuencias de los valores vecinos se pueden "apilar" junto a los anteriores, acumulando así un área que representa la probabilidad de obtener todos los valores dentro de la pila. [Eso es integración del cálculo.] La selección se centra en dicha área de probabilidad, siendo la sombreada desde el umbral de selección (z) hasta el final de la cola superior de la curva. Esta es la presión de selección . El grupo seleccionado (los padres efectivos de la próxima generación) incluye todos los valores fenotípicos desde z hasta el "final" de la cola. [66] La media del grupo seleccionado es μ s , y la diferencia entre ella y la media base ( μ ) representa el diferencial de selección (S) . Al tomar integraciones parciales sobre secciones de curva de interés y algún reordenamiento del álgebra, se puede demostrar que el "diferencial de selección" es S = [ y (σ / Prob.)] , donde y es la frecuencia del valor en el "umbral de selección" z (la ordenada de z ). [13] : 226–230  Al reordenar esta relación se obtiene S / σ = y / Prob. , cuyo lado izquierdo es, de hecho, el diferencial de selección dividido por la desviación estándar —es decir, el diferencial de selección estandarizado (i) . El lado derecho de la relación proporciona un "estimador" para i —la ordenada del umbral de selección dividido por la presión de selección . Se pueden utilizar las tablas de la distribución normal [49] : 547–548  , pero también están disponibles tabulaciones de i en sí. [67] : 123–124  La última referencia también proporciona valores de i ajustados para poblaciones pequeñas (400 y menos), [67] : 111–122 donde no se puede suponer que exista un "cuasi-infinito" (pero se presupuso en el esquema de "Distribución Normal" anterior). El diferencial de selección estandarizado ( i ) también se conoce como la intensidad de la selección . [14] : 174, 186 

Finalmente, puede ser útil un enlace cruzado con la terminología diferente de la subsección anterior: μ (aquí) = "P 0 " (allí), μ S = "P S " y σ 2 = "σ 2 P ".

Determinación de la meiosis – análisis de la vía reproductiva

Coeficientes de determinación reproductiva y endogamia
Análisis de trayectoria de la reproducción sexual.

La determinación de la meiosis (b 2 ) es el coeficiente de determinación de la meiosis, que es la división celular por la que los progenitores generan gametos. Siguiendo los principios de la regresión parcial estandarizada , de la que el análisis de trayectorias es una versión orientada pictóricamente, Sewall Wright analizó las trayectorias del flujo genético durante la reproducción sexual y estableció las "fuerzas de contribución" ( coeficientes de determinación ) de varios componentes al resultado general. [27] [37] El análisis de trayectorias incluye correlaciones parciales así como coeficientes de regresión parcial (estos últimos son los coeficientes de trayectoria ). Las líneas con una sola punta de flecha son trayectorias determinantes direccionales , y las líneas con dos puntas de flecha son conexiones de correlación . El trazado de varias rutas según las reglas del análisis de trayectorias emula el álgebra de la regresión parcial estandarizada. [55]

El diagrama de trayectorias de la izquierda representa este análisis de la reproducción sexual. De sus elementos interesantes, el importante en el contexto de la selección es la meiosis . Allí es donde se producen la segregación y la distribución, los procesos que mejoran parcialmente el truncamiento de la varianza fenotípica que surge de la selección. Los coeficientes de trayectoria b son las trayectorias de la meiosis. Las marcadas con a son las trayectorias de la fecundación. La correlación entre gametos del mismo progenitor ( g ) es la correlación meiótica . La correlación entre progenitores dentro de la misma generación es r A . La correlación entre gametos de diferentes progenitores ( f ) se conoció posteriormente como coeficiente de endogamia . [13] : 64  Los primos ( ' ) indican la generación (t-1) , y los no primos indican la generación t . Aquí se dan algunos resultados importantes del presente análisis. Sewall Wright interpretó muchos en términos de coeficientes de endogamia. [27] [37]

La determinación de la meiosis ( b 2 ) es 1/2 (1+g) y es igual a1/2 (1 + f (t-1) ) , lo que implica que g = f (t-1) . [68] Con fertilización aleatoria no dispersa, f (t-1) ) = 0, dando b 2 = 1/2 , como se utiliza en la sección de selección anterior. Sin embargo, al ser conscientes de sus antecedentes, se pueden utilizar otros patrones de fertilización según sea necesario. Otra determinación también implica endogamia: la determinación de fertilización ( a 2 ) es igual a 1 / [ 2 ( 1 + f t ) ] . También otra correlación es un indicador de endogamia: r A = 2 f t / ( 1 + f (t-1) ) , también conocido como coeficiente de parentesco . [No confunda esto con el coeficiente de parentesco , un nombre alternativo para el coeficiente de coascendencia . Consulte la introducción a la sección "Relación".] Este r A vuelve a aparecer en la subsección sobre dispersión y selección.

Estos vínculos con la endogamia revelan facetas interesantes sobre la reproducción sexual que no son inmediatamente aparentes. Los gráficos a la derecha representan los coeficientes de determinación de la meiosis y la singamia (fertilización) en relación con el coeficiente de endogamia. Allí se revela que a medida que aumenta la endogamia, la meiosis se vuelve más importante (el coeficiente aumenta), mientras que la singamia se vuelve menos importante. El papel general de la reproducción [el producto de los dos coeficientes anteriores, r 2 ] sigue siendo el mismo. [69] Este aumento en b 2 es particularmente relevante para la selección porque significa que el truncamiento de la selección de la varianza fenotípica se compensa en menor medida durante una secuencia de selecciones cuando se acompaña de endogamia (que es frecuentemente el caso).

Deriva genética y selección

En las secciones anteriores se trató la dispersión como un "asistente" de la selección , y se hizo evidente que ambos funcionan bien juntos. En genética cuantitativa, la selección suele examinarse de esta manera "biométrica", pero los cambios en las medias (monitoreados por ΔG) reflejan los cambios en las frecuencias de alelos y genotipos por debajo de esta superficie. La referencia a la sección sobre "deriva genética" nos recuerda que también afecta a los cambios en las frecuencias de alelos y genotipos, y las medias asociadas; y que este es el aspecto complementario de la dispersión considerada aquí ("la otra cara de la misma moneda"). Sin embargo, estas dos fuerzas de cambio de frecuencia rara vez están en concierto, y a menudo pueden actuar en sentido contrario. Una (la selección) es "direccional" y está impulsada por la presión de selección que actúa sobre el fenotipo: la otra (la deriva genética) está impulsada por la "casualidad" en la fertilización (probabilidades binomiales de muestras de gametos). Si los dos tienden hacia la misma frecuencia alélica, su "coincidencia" es la probabilidad de obtener esa muestra de frecuencias en la deriva genética: la probabilidad de que estén "en conflicto", sin embargo, es la suma de las probabilidades de todas las muestras de frecuencias alternativas . En casos extremos, un solo muestreo de singamia puede deshacer lo que la selección ha logrado, y las probabilidades de que esto suceda están disponibles. Es importante tener esto en cuenta. Sin embargo, la deriva genética que da como resultado frecuencias de muestra similares a las del objetivo de selección no conduce a un resultado tan drástico, sino que ralentiza el progreso hacia los objetivos de selección.

Atributos correlacionados

Al observar conjuntamente dos (o más) atributos ( por ejemplo, altura y masa), se puede notar que varían juntos a medida que se alteran los genes o los entornos. Esta covariación se mide por la covarianza , que puede representarse por " cov " o por θ . [43] Será positiva si varían juntos en la misma dirección; o negativa si varían juntos pero en dirección opuesta. Si los dos atributos varían independientemente uno del otro, la covarianza será cero. El grado de asociación entre los atributos se cuantifica por el coeficiente de correlación (símbolo r o ρ ). En general, el coeficiente de correlación es la relación entre la covarianza y la media geométrica [70] de las dos varianzas de los atributos. [59] : 196–198  Las observaciones generalmente ocurren en el fenotipo, pero en la investigación también pueden ocurrir en el "haplotipo efectivo" (producto génico efectivo) [ver Figura a la derecha]. Por lo tanto, la covarianza y la correlación pueden ser "fenotípicas" o "moleculares", o cualquier otra designación que permita un modelo de análisis. La covarianza fenotípica es la capa "más externa" y corresponde a la covarianza "habitual" en biometría/estadística. Sin embargo, puede dividirse mediante cualquier modelo de investigación adecuado de la misma manera que se hizo con la varianza fenotípica. Para cada división de la covarianza, existe una división correspondiente de la correlación. Algunas de estas divisiones se dan a continuación. El primer subíndice (G, A, etc.) indica la división. Los subíndices de segundo nivel (X, Y) son "guarda-lugares" para dos atributos cualesquiera.

Fuentes de correlación fenotípica.

El primer ejemplo es el fenotipo no particionado .

Las particiones genéticas son (a) "genotípica" (genotipo general), (b) "génica" (expectativas de sustitución) y (c) "alélica" (homocigoto).

(a)

(b)

(do)

Con un experimento diseñado adecuadamente también se podría obtener una partición no genética (ambiental).

Causas subyacentes de la correlación

Existen varias formas diferentes en las que puede surgir una correlación fenotípica. El diseño del estudio, el tamaño de la muestra, las estadísticas de la muestra y otros factores pueden influir en la capacidad de distinguir entre ellos con mayor o menor confianza estadística. Cada uno de ellos tiene diferente importancia científica y es relevante para diferentes campos de trabajo.

Causalidad directa

Un fenotipo puede afectar directamente a otro fenotipo, influyendo en el desarrollo, el metabolismo o el comportamiento.

Vías genéticas

Un gen o factor de transcripción común en las vías biológicas de los dos fenotipos puede generar correlación.

Vías metabólicas

Las vías metabólicas que van del gen al fenotipo son complejas y variadas, pero las causas de la correlación entre los atributos se encuentran dentro de ellas.

Factores ambientales y de desarrollo

Los mismos factores pueden afectar a varios fenotipos. Por ejemplo, hay muchos atributos fenotípicos correlacionados con la edad, por lo que la altura, el peso, la ingesta calórica, la función endocrina y otros factores tienen una correlación. Un estudio que busque otros factores comunes debe descartarlos primero.

Genotipos correlacionados y presiones selectivas

Las diferencias entre subgrupos de una población, entre poblaciones o los sesgos selectivos pueden hacer que algunas combinaciones de genes estén sobrerrepresentadas en comparación con lo que se esperaría. Aunque los genes pueden no tener una influencia significativa entre sí, puede haber una correlación entre ellos, especialmente cuando no se permite que ciertos genotipos se mezclen. Las poblaciones en proceso de divergencia genética o que ya lo han experimentado pueden tener diferentes fenotipos característicos, [71] lo que significa que cuando se consideran en conjunto, aparece una correlación. Las cualidades fenotípicas en humanos que dependen predominantemente de la ascendencia también producen correlaciones de este tipo. Esto también se puede observar en razas de perros donde varias características físicas conforman la distinción de una raza dada y, por lo tanto, están correlacionadas. [72] El apareamiento selectivo , que es la presión sexualmente selectiva para aparearse con un fenotipo similar, puede dar como resultado que los genotipos permanezcan correlacionados más de lo esperado. [73]

Véase también

Notas a pie de página y referencias

  1. ^ Anderberg, Michael R. (1973). Análisis de conglomerados para aplicaciones . Nueva York: Academic Press.
  2. ^ Mendel, Gregor (1866). "Versuche über Pflanzen Hybriden". Verhandlungen Naturforschender Verein en Brünn . IV .
  3. ^ abc Mendel, Gregor (1891). "Experimentos en hibridación de plantas". J. Roy. Hort. Soc. (Londres) . XXV . Traducido por Bateson, William: 54–78.
  4. ^ El artículo de Mendel G. y Bateson W. (1891), con comentarios adicionales de Bateson, se reimprime en: Sinnott EW; Dunn LC; Dobzhansky T. (1958). "Principles of genetically"; Nueva York, McGraw-Hill: 419-443. La nota al pie 3, página 422, identifica a Bateson como el traductor original y proporciona la referencia para esa traducción.
  5. ^ Un QTL es una región en el genoma del ADN que afecta o está asociada con rasgos fenotípicos cuantitativos.
  6. ^ Watson, James D.; Gilman, Michael; Witkowski, Jan; Zoller, Mark (1998). ADN recombinante (segunda edición [7.ª edición]). Nueva York: WH Freeman (Scientific American Books). ISBN 978-0-7167-1994-6.
  7. ^ Jain, HK; Kharkwal, MC, eds. (2004). Fitomejoramiento: enfoques mendelianos y moleculares . Boston Dordecht Londres: Kluwer Academic Publishers. ISBN 978-1-4020-1981-4.
  8. ^ abcd Fisher, RA (1918). «La correlación entre parientes en el supuesto de herencia mendeliana». Transactions of the Royal Society of Edinburgh . 52 (2): 399–433. doi :10.1017/s0080456800012163. S2CID  181213898. Archivado desde el original el 8 de octubre de 2020. Consultado el 7 de septiembre de 2020 .
  9. ^ abcdefg Steel, RGD; Torrie, JH (1980). Principios y procedimientos de estadística (2.ª ed.). Nueva York: McGraw-Hill. ISBN 0-07-060926-8.
  10. ^ A veces se utilizan otros símbolos, pero estos son comunes.
  11. ^ El efecto del alelo es la desviación fenotípica promedio del homocigoto con respecto al punto medio de los dos fenotipos homocigóticos contrastantes en un locus, cuando se observa en la infinidad de genotipos y entornos de fondo. En la práctica, las estimaciones a partir de muestras grandes e imparciales sustituyen al parámetro.
  12. ^ El efecto de dominancia es la desviación fenotípica promedio del heterocigoto con respecto al punto medio de los dos homocigotos en un locus, cuando se observa en la infinidad de genotipos y entornos de fondo. En la práctica, las estimaciones a partir de muestras grandes e imparciales sustituyen al parámetro.
  13. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah Crow, JF; Kimura, M. (1970). Una introducción a la teoría de la genética de poblaciones . Nueva York: Harper & Row.
  14. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah ai aj ak al Falconer, DS; Mackay, Trudy FC (1996). Introducción a la genética cuantitativa (Cuarta edición). Harlow: Longman. ISBN 978-0582-24302-6.
    • William G Hill; Trudy FC Mackay (agosto de 2004). "DS Falconer e introducción a la genética cuantitativa". Genética . 167 (4): 1529–1536. doi : 10.1093/genetics/167.4.1529 . PMC  1471025 . PMID  15342495.
  15. ^ Mendel comentó sobre esta tendencia particular para F1 > P1, es decir, evidencia de vigor híbrido en la longitud del tallo. Sin embargo, la diferencia puede no ser significativa. (La relación entre el rango y la desviación estándar es conocida [Steel y Torrie (1980): 576], lo que permite realizar una prueba de significancia aproximada para esta diferencia actual).
  16. ^ Richards, AJ (1986). Sistemas de mejoramiento de plantas . Boston: George Allen & Unwin. ISBN 0-04-581020-6.
  17. ^ Instituto Jane Goodall. «Estructura social de los chimpancés». Chimp Central . Archivado desde el original el 3 de julio de 2008. Consultado el 20 de agosto de 2014 .
  18. ^ Gordon, Ian L. (2000). "Genética cuantitativa de la F2 alógama: un origen de poblaciones fertilizadas aleatoriamente". Heredity . 85 : 43–52. doi : 10.1046/j.1365-2540.2000.00716.x . PMID  10971690.
  19. ^ Sin embargo, una F2 derivada de individuos F1 autofecundados (una F2 autógama ) no es el origen de una estructura poblacional fecundada aleatoriamente. Véase Gordon (2001).
  20. ^ Castle, WE (1903). "La ley de la herencia de Galton y Mendel y algunas leyes que rigen el mejoramiento de las razas por selección". Actas de la Academia Estadounidense de Artes y Ciencias . 39 (8): 233–242. doi :10.2307/20021870. hdl : 2027/hvd.32044106445109 . JSTOR  20021870.
  21. ^ Hardy, GH (1908). "Proporciones mendelianas en una población mixta". Science . 28 (706): 49–50. Bibcode :1908Sci....28...49H. doi :10.1126/science.28.706.49. PMC 2582692 . PMID  17779291. 
  22. ^ Weinberg, W. (1908). "Über den Nachweis der Verebung beim Menschen". Jahresh. Verein F. Vaterl. Naturk, Wurtem . 64 : 368–382.
  23. ^ En la ética científica, por lo general, un descubrimiento recibe el nombre de la primera persona que lo propuso. Sin embargo, parece que se pasó por alto el título de Castle: y, cuando se lo recuperó, el título de "Hardy Weinberg" era tan omnipresente que parecía demasiado tarde para actualizarlo. ¿Quizás el equilibrio de "Castle Hardy Weinberg" sería un buen compromiso?
  24. ^ ab Gordon, Ian L. (1999). "Genética cuantitativa de híbridos intraespecíficos". Heredity . 83 (6): 757–764. doi : 10.1046/j.1365-2540.1999.00634.x . PMID  10651921.
  25. ^ Gordon, Ian L. (2001). "Genética cuantitativa de la F2 autógama". Hereditas . 134 (3): 255–262. doi : 10.1111/j.1601-5223.2001.00255.x . PMID  11833289.
  26. ^ Wright, S. (1917). "La correlación media dentro de los subgrupos de una población". J. Wash. Acad. Sci . 7 : 532–535.
  27. ^ abcdefg Wright, S. (1921). "Sistemas de apareamiento. I. Las relaciones biométricas entre progenitores y descendencia". Genética . 6 (2): 111–123. doi :10.1093/genetics/6.2.111. PMC 1200501 . PMID  17245958. 
  28. ^ Sinnott, Edmund W.; Dunn, LC; Dobzhansky, Theodosius (1958). Principios de genética . Nueva York: McGraw-Hill.
  29. ^ ABCDE Fisher, RA (1999). La teoría genética de la selección natural (variorum ed.). Oxford: Prensa de la Universidad de Oxford. ISBN 0-19-850440-3.
  30. ^ ab Cochran, William G. (1977). Técnicas de muestreo (tercera edición). Nueva York: John Wiley & Sons.
  31. ^ Esto se describe más adelante en la sección de variaciones genotípicas.
  32. ^ Ambos se utilizan comúnmente.
  33. ^ Véanse las citas anteriores.
  34. ^ Allard, RW (1960). Principios de fitomejoramiento . Nueva York: John Wiley & Sons.
  35. ^ ab Esto se lee como "σ 2 p y/o σ 2 q ". Como p y q son complementarios, σ 2 p ≡ σ 2 q y σ 2 p = σ 2 q .
  36. ^ abcdefghi Gordon, IL (2003). "Refinamientos en la partición de la varianza genotípica endogámica". Heredity . 91 (1): 85–89. doi : 10.1038/sj.hdy.6800284 . PMID  12815457.
  37. ^ abcdefghij Wright, Sewall (1951). "La estructura genética de las poblaciones". Anales de eugenesia . 15 (4): 323–354. doi :10.1111/j.1469-1809.1949.tb02451.x. PMID  24540312.
  38. ^ Recuerde que la cuestión de la auto/alocigosidad puede surgir solo para alelos homólogos (es decir, A y A , o a y a ), y no para alelos no homólogos ( A y a ), que no pueden tener el mismo origen alélico .
  39. ^ Es habitual utilizar "α" en lugar de "β" para esta cantidad (por ejemplo, en las referencias ya citadas). En este caso, se utiliza este último término para minimizar cualquier confusión con "a", que también aparece con frecuencia en estas mismas ecuaciones.
  40. ^ abcd Mather, Kenneth; Jinks, John L. (1971). Genética biométrica . Vol. 26 (2.ª ed.). Londres: Chapman & Hall. págs. 349–364. doi :10.1038/hdy.1971.47. ISBN 0-412-10220-X. Número de identificación personal  5285746. Número de identificación personal  46065232. {{cite book}}: |journal=ignorado ( ayuda )
  41. ^ En la terminología de Mather, la fracción delante de la letra es parte de la etiqueta del componente.
  42. ^ En cada línea de estas ecuaciones, los componentes se presentan en el mismo orden. Por lo tanto, la comparación vertical por componente proporciona la definición de cada uno en diversas formas. Los componentes de Mather se han traducido de este modo a símbolos fisherianos, lo que facilita su comparación. La traducción también se ha derivado formalmente. Véase Gordon 2003.
  43. ^ ab La covarianza es la covariabilidad entre dos conjuntos de datos. De manera similar a la varianza, se basa en una suma de productos cruzados (SCP) en lugar de una SS. De esto se desprende claramente que la varianza no es más que una forma especial de la covarianza.
  44. ^ Hayman, BI (1960). "La teoría y el análisis del cruzamiento dialélico. III". Genética . 45 (2): 155–172. doi :10.1093/genetics/45.2.155. PMC 1210041 . PMID  17247915. 
  45. ^ Se ha observado que cuando p = q , o cuando d = 0 , β [= a+(qp)d] "se reduce" a a . En tales circunstancias, σ 2 A = σ 2 a —pero sólo numéricamente . Todavía no se han convertido en la misma identidad. Esto sería un non sequitur similar al que se señaló anteriormente para las "desviaciones de sustitución" consideradas como la "dominancia" para el modelo genético.
  46. ^ Ya se han proporcionado citas de apoyo en las secciones anteriores.
  47. ^ Fisher observó que estos residuos surgían a través de los efectos de la dominancia, pero se abstuvo de definirlos como la "variación de dominancia" (véanse las citas anteriores). Vuelve a consultar los análisis anteriores en este artículo.
  48. ^ Al considerar los orígenes de los términos, Fisher también propuso la palabra "varianza" para esta medida de variabilidad. Véase Fisher (1999), pág. 311 y Fisher (1918).
  49. ^ abcd Snedecor, George W.; Cochran, William G. (1967). Métodos estadísticos (sexta edición). Ames: Iowa State University Press. ISBN 0-8138-1560-6.
  50. ^ abc Kendall, MG; Stuart, A. (1958). La teoría avanzada de la estadística. Volumen 1 (2.ª ed.). Londres: Charles Griffin.
  51. ^ Es una práctica común no tener un subíndice en la varianza del "error" experimental.
  52. ^ En biometría, es una relación de varianza en la que una parte se expresa como una fracción del todo: es decir, un coeficiente de determinación . Dichos coeficientes se utilizan particularmente en el análisis de regresión . Una versión estandarizada del análisis de regresión es el análisis de trayectoria . Aquí, estandarizar significa que los datos se dividieron primero por sus propios errores estándar experimentales para unificar las escalas para todos los atributos. Este uso genético es otra aparición importante de los coeficientes de determinación.
  53. ^ Gordon, IL; Byth, DE; Balaam, LN (1972). "Varianza de los índices de heredabilidad estimados a partir de los componentes de la varianza fenotípica". Biometrics . 28 (2): 401–415. doi :10.2307/2556156. JSTOR  2556156. PMID  5037862.
  54. ^ Dohm, MR (2002). "Las estimaciones de repetibilidad no siempre establecen un límite superior para la heredabilidad". Ecología funcional . 16 (2): 273–280. Bibcode :2002FuEco..16..273M. doi : 10.1046/j.1365-2435.2002.00621.x .
  55. ^ abcd Li, Ching Chun (1977). Análisis de trayectorias: una introducción (segunda edición con correcciones). Pacific Grove: Boxwood Press. ISBN 0-910286-40-X.
  56. ^ la raíz cuadrada de su producto
  57. ^ Moroney, MJ (1956). Datos a partir de cifras (tercera edición). Harmondsworth: Penguin Books.
  58. ^ ab Draper, Norman R.; Smith, Harry (1981). Análisis de regresión aplicada (segunda edición). Nueva York: John Wiley & Sons. ISBN 0-471-02995-5.
  59. ^ abcd Balaam, LN (1972). Fundamentos de biometría . Londres: George Allen & Unwin. ISBN 0-04-519008-9.
  60. ^ En el pasado, ambas formas de covarianza padre-hijo se han aplicado a esta tarea de estimación de h 2 , pero, como se señaló en la subsección anterior, solo una de ellas ( cov(MPO) ) es realmente apropiada. Sin embargo, cov(PO) es útil para estimar H 2 como se ve en el texto principal a continuación.
  61. ^ Nótese que los textos que ignoran el componente de dominancia de cov(HS) sugieren erróneamente que r HS "se aproxima" a ( 1/4 h2 ) .
  62. ^ Pritchard, Jonathan K.; Pickrell, Joseph K.; Coop, Graham (23 de febrero de 2010). "La genética de la adaptación humana: barridos duros, barridos suaves y adaptación poligénica". Current Biology . 20 (4): R208–215. Bibcode :2010CBio...20.R208P. doi :10.1016/j.cub.2009.11.055. ISSN  1879-0445. PMC 2994553 . PMID  20178769. 
  63. ^ Turchin, Michael C.; Chiang, Charleston WK; Palmer, Cameron D.; Sankararaman, Sriram; Reich, David; Consorcio de Investigación Genética de Rasgos Antropométricos (GIANT); Hirschhorn, Joel N. (septiembre de 2012). "Evidencia de selección generalizada en variación de posición en Europa en SNP asociados a la altura". Nature Genetics . 44 (9): 1015–1019. doi :10.1038/ng.2368. ISSN  1546-1718. PMC 3480734 . PMID  22902787. 
  64. ^ Berg, Jeremy J.; Coop, Graham (agosto de 2014). "Una señal genética poblacional de adaptación poligénica". PLOS Genetics . 10 (8): e1004412. doi : 10.1371/journal.pgen.1004412 . ISSN  1553-7404. PMC 4125079 . PMID  25102153. 
  65. ^ Field, Yair; Boyle, Evan A.; Telis, Natalie; Gao, Ziyue; Gaulton, Kyle J.; Golan, David; Yengo, Loic; Rocheleau, Ghislain; Froguel, Philippe (11 de noviembre de 2016). "Detección de la adaptación humana durante los últimos 2000 años". Science . 354 (6313): 760–764. Bibcode :2016Sci...354..760F. doi :10.1126/science.aag0776. ISSN  0036-8075. PMC 5182071 . PMID  27738015. 
  66. ^ Teóricamente la cola es infinita , pero en la práctica hay un cuasi-fin .
  67. ^ ab Becker, Walter A. (1967). Manual de procedimientos en genética cuantitativa (Segunda ed.). Pullman: Washington State University.
  68. ^ Nótese que este b 2 es el coeficiente de paternidad ( f AA ) del análisis de pedigrí reescrito con un "nivel de generación" en lugar de una "A" dentro de los paréntesis.
  69. ^ Hay un pequeño "bamboleo" que surge del hecho de que b 2 se altera una generación detrás de a 2 —examine sus ecuaciones de endogamia.
  70. ^ Estimado como la raíz cuadrada de su producto.
  71. ^ "Aislamiento reproductivo". Entendiendo la evolución . Berkeley. 16 de abril de 2021.
  72. ^ Serres-Armero, A; Davis, BW; Povolotskaya, IS; Morcillo-Suarez, C; Plassais, J; Juan, D; Ostrander, EA; Marques-Bonet, T (mayo de 2021). "La variación del número de copias subyace a fenotipos complejos en razas de perros domésticos y otros cánidos". Genome Research . 31 (5): 762–774. doi :10.1101/gr.266049.120. PMC 8092016 . PMID  33863806. 
  73. ^ Jiang, Yuexin; Bolnick, Daniel I.; Kirkpatrick, Mark (2013). "Apareamiento selectivo en animales" (PDF) . The American Naturalist . 181 (6): E125–E138. doi :10.1086/670160. hdl : 2152/31270 . PMID  23669548. S2CID  14484725.

Lectura adicional

Enlaces externos