La heredabilidad es una estadística utilizada en los campos de la crianza y la genética que estima el grado de variación en un rasgo fenotípico en una población que se debe a la variación genética entre los individuos de esa población. [1] El concepto de heredabilidad puede expresarse en forma de la siguiente pregunta: "¿Cuál es la proporción de la variación en un rasgo dado dentro de una población que no se explica por el medio ambiente o el azar?" [2]
Otras causas de variación medida en un rasgo se caracterizan como factores ambientales , incluido el error de observación . En los estudios humanos sobre la heredabilidad, estos factores se suelen clasificar en factores de "entorno compartido" y "entorno no compartido" en función de si tienden a dar como resultado que las personas criadas en el mismo hogar sean más o menos similares a las personas que no lo fueron.
La heredabilidad se estima comparando la variación fenotípica individual entre individuos relacionados en una población, examinando la asociación entre los datos de fenotipo y genotipo individuales, [3] [4] o incluso modelando datos a nivel de resumen de estudios de asociación de todo el genoma (GWAS). [5] La heredabilidad es un concepto importante en genética cuantitativa , particularmente en la crianza selectiva y la genética del comportamiento (por ejemplo, estudios de gemelos ). Es fuente de mucha confusión debido al hecho de que su definición técnica es diferente de su definición popular comúnmente entendida. Por lo tanto, su uso transmite la impresión incorrecta de que los rasgos conductuales se "heredan" o se transmitan específicamente a través de los genes. [6] Los genetistas conductuales también realizan análisis de heredabilidad basados en el supuesto de que los genes y los entornos contribuyen de manera separada y aditiva a los rasgos conductuales. [7]
La heredabilidad mide la fracción de variabilidad del fenotipo que se puede atribuir a la variación genética . Esto no es lo mismo que decir que esta fracción del fenotipo de un individuo es causada por la genética. Por ejemplo, es incorrecto decir que, dado que la heredabilidad de los rasgos de personalidad es de aproximadamente 0,6, eso significa que el 60% de su personalidad se hereda de sus padres y el 40% proviene del medio ambiente. Además, la heredabilidad puede cambiar sin que se produzca ningún cambio genético, como cuando el medio ambiente comienza a contribuir a una mayor variación. Como ejemplo, considere que tanto los genes como el medio ambiente tienen el potencial de influir en la inteligencia. La heredabilidad podría aumentar si aumenta la variación genética, lo que hace que los individuos muestren más variación fenotípica, como mostrar diferentes niveles de inteligencia. Por otro lado, la heredabilidad también podría aumentar si la variación ambiental disminuye, lo que hace que los individuos muestren menos variación fenotípica, como mostrar niveles de inteligencia más similares. La heredabilidad aumenta cuando la genética contribuye a una mayor variación o porque los factores no genéticos contribuyen a una menor variación; lo que importa es la contribución relativa. La heredabilidad es específica de una población particular en un ambiente particular. Por consiguiente, una alta heredabilidad de un rasgo no significa necesariamente que el rasgo no sea muy susceptible a las influencias ambientales. [8] La heredabilidad también puede cambiar como resultado de cambios en el ambiente, la migración, la endogamia o la forma en que se mide la heredabilidad en la población en estudio. [9] La heredabilidad de un rasgo no debe interpretarse como una medida del grado en que dicho rasgo está determinado genéticamente en un individuo. [10] [11]
El grado de dependencia del fenotipo con respecto al medio ambiente también puede ser una función de los genes implicados. Las cuestiones de heredabilidad son complicadas porque los genes pueden canalizar un fenotipo, haciendo que su expresión sea casi inevitable en todos los entornos en los que se dé. Los individuos con el mismo genotipo también pueden exhibir diferentes fenotipos a través de un mecanismo llamado plasticidad fenotípica , lo que hace que la heredabilidad sea difícil de medir en algunos casos. Los conocimientos recientes en biología molecular han identificado cambios en la actividad transcripcional de genes individuales asociados con cambios ambientales. Sin embargo, hay una gran cantidad de genes cuya transcripción no se ve afectada por el medio ambiente. [12]
Las estimaciones de la heredabilidad utilizan análisis estadísticos para ayudar a identificar las causas de las diferencias entre individuos. Dado que la heredabilidad se ocupa de la varianza, es necesariamente una explicación de las diferencias entre individuos de una población. La heredabilidad puede ser univariante (examinando un solo rasgo) o multivariante (examinando las asociaciones genéticas y ambientales entre múltiples rasgos a la vez). Esto permite una prueba de la superposición genética entre diferentes fenotipos: por ejemplo, el color del pelo y el color de los ojos . El medio ambiente y la genética también pueden interactuar, y los análisis de heredabilidad pueden probar y examinar estas interacciones (modelos GxE).
Un requisito previo para los análisis de heredabilidad es que exista alguna variación poblacional que deba tenerse en cuenta. Este último punto destaca el hecho de que la heredabilidad no puede tener en cuenta el efecto de factores que son invariantes en la población. Los factores pueden ser invariantes si están ausentes y no existen en la población, como cuando nadie tiene acceso a un antibiótico en particular , o porque son omnipresentes, como cuando todo el mundo bebe café . En la práctica, todos los rasgos de comportamiento humano varían y casi todos los rasgos muestran cierta heredabilidad. [13]
Cualquier fenotipo particular puede modelarse como la suma de efectos genéticos y ambientales: [14]
De la misma manera, la varianza fenotípica del rasgo – Var (P) – es la suma de los efectos como sigue:
En un experimento planificado, Cov( G , E ) se puede controlar y mantener en 0. En este caso, la heredabilidad se define como [15]
H 2 es la heredabilidad en sentido amplio. Refleja todas las contribuciones genéticas a la variación fenotípica de una población, incluidas las interacciones aditivas, dominantes y epistáticas (multigénicas), así como los efectos maternos y paternos , en los que los individuos se ven afectados directamente por el fenotipo de sus padres, como ocurre con la producción de leche en los mamíferos.
Un componente particularmente importante de la varianza genética es la varianza aditiva, Var(A), que es la varianza debida a los efectos promedio (efectos aditivos) de los alelos . Dado que cada progenitor transmite un único alelo por locus a cada descendencia, la semejanza entre progenitores y descendencia depende del efecto promedio de los alelos individuales. La varianza aditiva representa, por tanto, el componente genético de la varianza responsable de la semejanza entre progenitores y descendencia. La parte genética aditiva de la varianza fenotípica se conoce como heredabilidad en sentido estricto y se define como
Se utiliza una H2 mayúscula para indicar un sentido amplio, y una h2 minúscula para un sentido estricto.
En el caso de rasgos que no son continuos sino dicotómicos, como un dedo adicional o ciertas enfermedades, la contribución de los distintos alelos puede considerarse una suma que, más allá de un umbral, se manifiesta como el rasgo, dando lugar al modelo de umbral de responsabilidad en el que se puede estimar la heredabilidad y modelar la selección.
La varianza aditiva es importante para la selección . Si se ejerce una presión selectiva, como la mejora del ganado, la respuesta del rasgo está directamente relacionada con la heredabilidad en sentido estricto. La media del rasgo aumentará en la siguiente generación en función de cuánto difiere la media de los progenitores seleccionados de la media de la población de la que se eligieron los progenitores seleccionados. La respuesta observada a la selección conduce a una estimación de la heredabilidad en sentido estricto (denominada heredabilidad realizada ). Este es el principio subyacente a la selección artificial o cría.
El modelo genético más simple implica un solo locus con dos alelos (b y B) que afectan un fenotipo cuantitativo.
El número de alelos B puede ser 0, 1 o 2. Para cualquier genotipo ( B i , B j ), donde B i y B j son 0 o 1, el fenotipo esperado puede escribirse como la suma de la media general, un efecto lineal y una desviación de dominancia (se puede pensar en el término de dominancia como una interacción entre B i y B j ):
La varianza genética aditiva en este locus es el promedio ponderado de los cuadrados de los efectos aditivos:
dónde
Existe una relación similar para la varianza de las desviaciones de dominancia:
dónde
La regresión lineal del fenotipo sobre el genotipo se muestra en la Figura 1.
Las estimaciones de la heredabilidad total de los rasgos humanos presuponen la ausencia de epistasis, lo que se ha denominado "suposición de aditividad". Aunque algunos investigadores han citado dichas estimaciones en apoyo de la existencia de una " heredabilidad faltante " que no se explica por los loci genéticos conocidos, la suposición de aditividad puede invalidar estas estimaciones. [16] También hay cierta evidencia empírica de que la suposición de aditividad se viola con frecuencia en los estudios genéticos de la conducta sobre la inteligencia y el rendimiento académico de los adolescentes . [17]
Dado que solo P puede observarse o medirse directamente, la heredabilidad debe estimarse a partir de las similitudes observadas en sujetos que varían en su nivel de similitud genética o ambiental. Los análisis estadísticos necesarios para estimar los componentes genéticos y ambientales de la varianza dependen de las características de la muestra. En resumen, se obtienen mejores estimaciones utilizando datos de individuos con niveles muy variables de relación genética, como gemelos , hermanos, padres e hijos, en lugar de sujetos más distantes (y, por lo tanto, menos similares). El error estándar para las estimaciones de heredabilidad mejora con tamaños de muestra grandes.
En poblaciones no humanas, a menudo es posible recopilar información de forma controlada. Por ejemplo, entre los animales de granja es fácil conseguir que un toro produzca crías de un gran número de vacas y controlar el entorno. Este tipo de control experimental no suele ser posible cuando se recopilan datos humanos, ya que se depende de relaciones y entornos que se dan de forma natural.
En la genética cuantitativa clásica, había dos escuelas de pensamiento respecto a la estimación de la heredabilidad.
Una escuela de pensamiento fue desarrollada por Sewall Wright en la Universidad de Chicago , y popularizada por CC Li ( Universidad de Chicago ) y JL Lush ( Universidad Estatal de Iowa ). Se basa en el análisis de correlaciones y, por extensión, de regresión. El análisis de trayectorias fue desarrollado por Sewall Wright como una forma de estimar la heredabilidad.
El segundo fue desarrollado originalmente por RA Fisher y ampliado en la Universidad de Edimburgo , la Universidad Estatal de Iowa y la Universidad Estatal de Carolina del Norte , así como en otras escuelas. Se basa en el análisis de varianza de estudios de crianza, utilizando la correlación intraclase de parientes. En estos análisis se utilizan varios métodos para estimar los componentes de varianza (y, por lo tanto, la heredabilidad) a partir del ANOVA .
Hoy en día, la heredabilidad puede estimarse a partir de pedigríes generales utilizando modelos lineales mixtos y a partir de la relación genómica estimada a partir de marcadores genéticos.
Los estudios de heredabilidad humana suelen utilizar diseños de estudios de adopción, a menudo con gemelos idénticos que han sido separados a temprana edad y criados en diferentes entornos. Estos individuos tienen genotipos idénticos y pueden utilizarse para separar los efectos del genotipo y el entorno. Una limitación de este diseño es el entorno prenatal común y el número relativamente bajo de gemelos criados por separado. Un segundo diseño, más común, es el estudio de gemelos en el que se utiliza la similitud de los gemelos idénticos y fraternos para estimar la heredabilidad. Estos estudios pueden verse limitados por el hecho de que los gemelos idénticos no son completamente idénticos genéticamente , lo que potencialmente da como resultado una subestimación de la heredabilidad.
En estudios observacionales , o debido a efectos evocativos (donde un genoma evoca entornos por su efecto sobre ellos), G y E pueden covariar: correlación gen-ambiente . Dependiendo de los métodos utilizados para estimar la heredabilidad, las correlaciones entre factores genéticos y entornos compartidos o no compartidos pueden o no confundirse con la heredabilidad. [18]
La primera escuela de estimación utiliza regresión y correlación para estimar la heredabilidad.
En la comparación de parientes, encontramos que en general,
donde r puede considerarse como el coeficiente de parentesco , b es el coeficiente de regresión y t es el coeficiente de correlación.
La heredabilidad puede estimarse comparando los rasgos de los padres y los de los hijos (como en la figura 2). La pendiente de la línea (0,57) aproxima la heredabilidad del rasgo cuando los valores de los hijos se regresionan contra el rasgo promedio en los padres. Si solo se utiliza el valor de un padre, entonces la heredabilidad es el doble de la pendiente. (Esta es la fuente del término " regresión ", ya que los valores de los hijos siempre tienden a regresar al valor medio de la población, es decir , la pendiente es siempre menor que uno). Este efecto de regresión también subyace al método DeFries-Fulker para analizar gemelos seleccionados por un miembro afectado. [19]
Un enfoque básico de la heredabilidad se puede adoptar utilizando diseños de hermanos completos: comparando la similitud entre hermanos que comparten una madre y un padre biológicos. [20] Cuando solo hay acción genética aditiva, esta correlación fenotípica entre hermanos es un índice de familiaridad : la suma de la mitad de la varianza genética aditiva más el efecto completo del entorno común. Por lo tanto, establece un límite superior en la heredabilidad aditiva del doble de la correlación fenotípica de hermanos completos. Los diseños de medios hermanos comparan los rasgos fenotípicos de los hermanos que comparten un progenitor con otros grupos de hermanos.
La heredabilidad de los rasgos en los humanos se estima con mayor frecuencia comparando las semejanzas entre gemelos. "La ventaja de los estudios con gemelos es que la varianza total se puede dividir en componentes genéticos, ambientales compartidos o comunes y ambientales únicos, lo que permite una estimación precisa de la heredabilidad". [21] Los gemelos fraternos o dicigóticos (DZ) comparten en promedio la mitad de sus genes (suponiendo que no haya apareamiento selectivo para el rasgo), y por lo tanto los gemelos idénticos o monocigóticos (MZ) en promedio son dos veces más similares genéticamente que los gemelos DZ. Una estimación cruda de la heredabilidad, entonces, es aproximadamente el doble de la diferencia en la correlación entre gemelos MZ y DZ, es decir, la fórmula de Falconer H 2 = 2 (r (MZ) - r (DZ)).
El efecto del entorno compartido, c 2 , contribuye a la similitud entre hermanos debido a la similitud del entorno en el que se crían. El entorno compartido se aproxima mediante la correlación DZ menos la mitad de la heredabilidad, que es el grado en el que los gemelos DZ comparten los mismos genes, c 2 = DZ-1/2 h 2 . La varianza ambiental única, e 2 , refleja el grado en el que los gemelos idénticos criados juntos son diferentes, e 2 = 1-r(MZ).
El segundo conjunto de métodos de estimación de la heredabilidad implica ANOVA y la estimación de los componentes de varianza.
Utilizamos la discusión básica de Kempthorne. [14] Considerando solo el más básico de los modelos genéticos, podemos observar la contribución cuantitativa de un solo locus con genotipo G i como
donde es el efecto del genotipo G i y es el efecto ambiental.
Consideremos un experimento con un grupo de machos y su progenie de madres elegidas al azar. Dado que la progenie obtiene la mitad de sus genes del padre y la otra mitad de su madre (al azar), la ecuación de la progenie es
Consideremos el experimento anterior. Tenemos dos grupos de progenie que podemos comparar. El primero es comparar las distintas progenies de un padre individual (denominado grupo de padres internos ). La varianza incluirá términos de varianza genética (ya que no todos obtuvieron el mismo genotipo) y varianza ambiental. Esto se considera un término de error .
El segundo grupo de progenie son comparaciones de medias de medios hermanos entre sí (llamado grupo entre padres ). Además del término de error como en los grupos dentro de padres, tenemos un término adicional debido a las diferencias entre las diferentes medias de los medios hermanos. La correlación intraclase es
ya que los efectos ambientales son independientes entre sí.
En un experimento con sementales y progenie por semental, podemos calcular el siguiente ANOVA, utilizando como varianza genética y como varianza ambiental:
El término es la correlación intraclase entre medios hermanos. Podemos calcularlo fácilmente . El cuadrado medio esperado se calcula a partir de la relación de los individuos (la progenie de un padre son todos medios hermanos, por ejemplo) y una comprensión de las correlaciones intraclase.
El uso de ANOVA para calcular la heredabilidad a menudo no tiene en cuenta la presencia de interacciones entre genes y ambiente , porque ANOVA tiene un poder estadístico mucho menor para probar los efectos de interacción que para los efectos directos. [22]
Para un modelo con términos aditivos y de dominancia, pero no otros, la ecuación para un solo locus es
dónde
es el efecto aditivo del alelo i , es el efecto aditivo del alelo j , es la desviación de dominancia para el genotipo ij , y es el ambiente.
Los experimentos se pueden realizar con una configuración similar a la que se muestra en la Tabla 1. Utilizando diferentes grupos de parentesco, podemos evaluar diferentes correlaciones intraclase. Utilizando como varianza genética aditiva y como varianza de desviación de dominancia, las correlaciones intraclase se convierten en funciones lineales de estos parámetros. En general,
donde y se encuentran como
P[ los alelos extraídos al azar del par de parentesco son idénticos por descendencia ], y
P[ los genotipos extraídos al azar del par de parentesco son idénticos por descendencia ].
En la Tabla 2 se presentan algunas relaciones comunes y sus coeficientes.
En la literatura se han publicado numerosos métodos que utilizan modelos lineales mixtos. Mediante estos métodos, la varianza fenotípica se divide en varianzas genéticas, ambientales y de diseño experimental para estimar la heredabilidad. La varianza ambiental se puede modelar explícitamente estudiando individuos en una amplia gama de entornos, aunque la inferencia de la varianza genética a partir de la varianza fenotípica y ambiental puede llevar a una subestimación de la heredabilidad debido al desafío de capturar la gama completa de influencia ambiental que afecta a un rasgo. Otros métodos para calcular la heredabilidad utilizan datos de estudios de asociación de todo el genoma para estimar la influencia de factores genéticos en un rasgo, lo que se refleja en la tasa y la influencia de loci genéticos supuestamente asociados (generalmente polimorfismos de un solo nucleótido ) en el rasgo. Sin embargo, esto puede llevar a una subestimación de la heredabilidad. Esta discrepancia se conoce como "heredabilidad faltante" y refleja el desafío de modelar con precisión la varianza genética y ambiental en los modelos de heredabilidad. [23]
Cuando se dispone de un pedigrí grande y complejo u otro tipo de datos antes mencionados, la heredabilidad y otros parámetros genéticos cuantitativos se pueden estimar mediante métodos de máxima verosimilitud restringida (REML) o bayesianos . Los datos brutos generalmente tendrán tres o más puntos de datos para cada individuo: un código para el padre, un código para la madre y uno o varios valores de rasgos. Los diferentes valores de rasgos pueden corresponder a diferentes rasgos o a diferentes puntos temporales de medición.
La metodología actualmente popular se basa en altos grados de certeza sobre las identidades del padre y la madre; no es común tratar la identidad del padre de manera probabilística. Esto no suele ser un problema, ya que la metodología rara vez se aplica a poblaciones silvestres (aunque se ha utilizado para varias poblaciones de ungulados y aves silvestres), y los padres se conocen invariablemente con un alto grado de certeza en los programas de cría. También hay algoritmos que tienen en cuenta la paternidad incierta.
Los pedigríes pueden visualizarse utilizando programas como Pedigree Viewer [1], y analizarse con programas como ASReml , VCE [2], WOMBAT [3], MCMCglmm dentro del entorno R [4] o la familia de programas BLUPF90 [5].
Los modelos de pedigrí son útiles para desenredar factores de confusión como la causalidad inversa , los efectos maternos como el entorno prenatal y los factores de confusión de la dominancia genética , el entorno compartido y los efectos de los genes maternos. [24] [9]
Cuando se dispone de datos de genotipos y fenotipos de todo el genoma de grandes muestras de población, se pueden estimar las relaciones entre individuos en función de sus genotipos y utilizar un modelo lineal mixto para estimar la varianza explicada por los marcadores genéticos. Esto proporciona una estimación de la heredabilidad genómica basada en la varianza capturada por variantes genéticas comunes. [4] Existen múltiples métodos que realizan diferentes ajustes para la frecuencia de alelos y el desequilibrio de ligamiento . En particular, el método llamado High-Definition Likelihood (HDL) puede estimar la heredabilidad genómica utilizando solo estadísticas de resumen de GWAS, [5] lo que facilita la incorporación de un gran tamaño de muestra disponible en varios metanálisis de GWAS.
En la crianza selectiva de plantas y animales, la respuesta esperada a la selección de un rasgo con heredabilidad en sentido estricto conocida se puede estimar utilizando la ecuación del criador : [25]
En esta ecuación, la Respuesta a la Selección (R) se define como la diferencia promedio realizada entre la generación parental y la siguiente generación, y el Diferencial de Selección (S) se define como la diferencia promedio entre la generación parental y los padres seleccionados. [14] : 1957 [26]
Por ejemplo, imaginemos que un fitomejorador participa en un proyecto de cría selectiva con el objetivo de aumentar el número de granos por mazorca de maíz. A modo de ejemplo, supongamos que la mazorca de maíz promedio de la generación de los padres tiene 100 granos. Supongamos también que los padres seleccionados producen maíz con un promedio de 120 granos por mazorca. Si h2 es igual a 0,5, entonces la siguiente generación producirá maíz con un promedio de 0,5(120-100) = 10 granos adicionales por mazorca. Por lo tanto, el número total de granos por mazorca de maíz será, en promedio, de 110.
La observación de la respuesta a la selección en un experimento de selección artificial permitirá calcular la heredabilidad realizada como en la Figura 4.
La heredabilidad en la ecuación anterior es igual a la relación sólo si el genotipo y el ruido ambiental siguen distribuciones gaussianas .
Los críticos prominentes de las estimaciones de heredabilidad, como Steven Rose , [27] Jay Joseph , [28] y Richard Bentall , se centran principalmente en las estimaciones de heredabilidad en las ciencias del comportamiento y las ciencias sociales . Bentall ha afirmado que dichas puntuaciones de heredabilidad se calculan típicamente de manera contraria a la intuición para derivar puntuaciones numéricamente altas, que la heredabilidad se malinterpreta como determinación genética y que este supuesto sesgo distrae de otros factores que las investigaciones han encontrado más importantes causalmente, como el abuso infantil que causa psicosis posterior. [29] [30] Las estimaciones de heredabilidad también son inherentemente limitadas porque no transmiten ninguna información sobre si los genes o el entorno juegan un papel más importante en el desarrollo del rasgo en estudio. Por esta razón, David Moore y David Shenk describen el término "heredabilidad" en el contexto de la genética del comportamiento como "... uno de los más engañosos en la historia de la ciencia" y argumentan que no tiene valor excepto en casos muy raros. [31] Al estudiar rasgos humanos complejos, es imposible utilizar el análisis de heredabilidad para determinar las contribuciones relativas de los genes y el medio ambiente, ya que dichos rasgos son resultado de múltiples causas que interactúan. [32] En particular, Feldman y Lewontin enfatizan que la heredabilidad es en sí misma una función de la variación ambiental. [33] Sin embargo, algunos investigadores sostienen que es posible separar las dos. [34]
La controversia sobre las estimaciones de heredabilidad se debe en gran medida a su base en estudios con gemelos . El escaso éxito de los estudios genético-moleculares para corroborar las conclusiones de dichos estudios genético-poblacionales es el problema de la heredabilidad que falta . [35] Eric Turkheimer ha argumentado que los métodos moleculares más nuevos han reivindicado la interpretación convencional de los estudios con gemelos, [35] aunque sigue siendo poco claro cómo explicar las relaciones entre genes y comportamientos. [36] Según Turkheimer, tanto los genes como el medio ambiente son heredables, la contribución genética varía según el medio ambiente y un enfoque en la heredabilidad distrae de otros factores importantes. [37] Sin embargo, en general, la heredabilidad es un concepto ampliamente aplicable. [9]
{{cite book}}
: CS1 maint: location missing publisher (link)...todos los rasgos humanos complejos son resultado de una combinación de causas. Si estas causas interactúan, es imposible asignar valores cuantitativos a la fracción de un rasgo debido a cada una, así como no podemos decir qué parte del área de un rectángulo se debe, por separado, a cada una de sus dos dimensiones. Por lo tanto, en los análisis de fenotipos humanos complejos... no podemos encontrar realmente 'la importancia relativa de los genes y el entorno en la determinación del fenotipo'.