El ligamiento genético es la tendencia de las secuencias de ADN que están cerca unas de otras en un cromosoma a heredarse juntas durante la fase de meiosis de la reproducción sexual . Es poco probable que dos marcadores genéticos que están físicamente cerca uno del otro se separen en diferentes cromátidas durante el entrecruzamiento cromosómico y, por lo tanto, se dice que están más ligados que los marcadores que están muy separados. En otras palabras, cuanto más cerca estén dos genes en un cromosoma, menor será la posibilidad de recombinación entre ellos y más probable es que se hereden juntos. Los marcadores en diferentes cromosomas están perfectamente desligados , aunque la penetración de alelos potencialmente deletéreos puede verse influenciada por la presencia de otros alelos, y estos otros alelos pueden estar ubicados en otros cromosomas que aquel en el que se encuentra un alelo potencialmente deletéreo en particular. [1]
El ligamiento genético es la excepción más destacada a la Ley de distribución independiente de Gregor Mendel . El primer experimento que demostró el ligamiento se llevó a cabo en 1905. En ese momento, se desconocía la razón por la que ciertos rasgos tienden a heredarse juntos. Trabajos posteriores revelaron que los genes son estructuras físicas relacionadas por la distancia física.
La unidad típica de ligamiento genético es el centimorgan (cM). Una distancia de 1 cM entre dos marcadores significa que los marcadores se separan en cromosomas diferentes en promedio una vez cada 100 productos meióticos, es decir, una vez cada 50 meiosis.
La ley de la distribución independiente de Gregor Mendel establece que cada rasgo se hereda independientemente de todos los demás rasgos. Pero poco después de que se redescubriera el trabajo de Mendel , se encontraron excepciones a esta regla. En 1905, los genetistas británicos William Bateson , Edith Rebecca Saunders y Reginald Punnett cruzaron plantas de guisante en experimentos similares a los de Mendel. [2] [3] Estaban interesados en la herencia de rasgos en el guisante de olor y estaban estudiando dos genes: el gen del color de la flor ( P , púrpura y p , rojo) y el gen que afecta la forma de los granos de polen ( L , largo y l , redondo). Cruzaron las líneas puras PPLL y ppll y luego autocruzaron las líneas PpLl resultantes .
Según la genética mendeliana , los fenotipos esperados se darían en una proporción de 9:3:3:1 de PL:Pl:pL:pl. Para su sorpresa, observaron una mayor frecuencia de PL y pl y una menor frecuencia de Pl y pL:
Su experimento reveló un vínculo entre los alelos P y L y los alelos p y l . La frecuencia de P que aparece junto con L y p que aparece junto con l es mayor que la de los recombinantes Pl y pL . La frecuencia de recombinación es más difícil de calcular en un cruce F2 que en un retrocruce, [4] pero la falta de ajuste entre los números observados y esperados de progenie en la tabla anterior indica que es inferior al 50%. Esto indicó que dos factores interactuaron de alguna manera para crear esta diferencia al enmascarar la apariencia de los otros dos fenotipos. Esto llevó a la conclusión de que algunos rasgos están relacionados entre sí debido a su proximidad entre sí en un cromosoma.
La comprensión del ligamiento se amplió gracias al trabajo de Thomas Hunt Morgan . La observación de Morgan de que la cantidad de entrecruzamiento entre genes ligados difiere condujo a la idea de que la frecuencia de entrecruzamiento podría indicar la distancia que separa a los genes en el cromosoma . El centimorgan , que expresa la frecuencia de entrecruzamiento, recibe su nombre en su honor.
Un mapa de ligamiento (también conocido como mapa genético ) es una tabla para una especie o población experimental que muestra la posición de sus genes conocidos o marcadores genéticos entre sí en términos de frecuencia de recombinación, en lugar de una distancia física específica a lo largo de cada cromosoma. Los mapas de ligamiento fueron desarrollados por primera vez por Alfred Sturtevant , un estudiante de Thomas Hunt Morgan .
Un mapa de ligamiento es un mapa basado en las frecuencias de recombinación entre marcadores durante el cruce de cromosomas homólogos . Cuanto mayor sea la frecuencia de recombinación (segregación) entre dos marcadores genéticos, se supone que están más separados. Por el contrario, cuanto menor sea la frecuencia de recombinación entre los marcadores, menor será la distancia física entre ellos. Históricamente, los marcadores utilizados originalmente eran fenotipos detectables (producción de enzimas, color de ojos) derivados de secuencias de ADN codificantes ; con el tiempo, se han utilizado secuencias de ADN no codificantes confirmadas o supuestas, como microsatélites o aquellas que generan polimorfismos de longitud de fragmentos de restricción ( RFLP ).
Los mapas de ligamiento ayudan a los investigadores a localizar otros marcadores, como otros genes, al comprobar el ligamiento genético de los marcadores ya conocidos. En las primeras etapas del desarrollo de un mapa de ligamiento, los datos se utilizan para ensamblar grupos de ligamiento , un conjunto de genes que se sabe que están ligados. A medida que avanza el conocimiento, se pueden agregar más marcadores a un grupo, hasta que el grupo cubra un cromosoma entero. [6] En los organismos bien estudiados, los grupos de ligamiento se corresponden uno a uno con los cromosomas.
Un mapa de ligamiento no es un mapa físico (como un mapa híbrido con radiación reducida ) ni un mapa genético .
El análisis de ligamiento es un método genético que busca segmentos cromosómicos que cosegregan con el fenotipo de la enfermedad a través de las familias. [7] Puede utilizarse para mapear genes tanto para rasgos binarios como cuantitativos. [7] El análisis de ligamiento puede ser paramétrico (si conocemos la relación entre similitud fenotípica y genética) o no paramétrico. El análisis de ligamiento paramétrico es el enfoque tradicional, mediante el cual se estudia la probabilidad de que un gen importante para una enfermedad esté ligado a un marcador genético a través de la puntuación LOD, que evalúa la probabilidad de que un pedigrí dado, donde la enfermedad y el marcador están cosegregando, se deba a la existencia de ligamiento (con un valor de ligamiento dado) o al azar. El análisis de ligamiento no paramétrico, a su vez, estudia la probabilidad de que un alelo sea idéntico por descendencia consigo mismo.
La puntuación LOD (logaritmo (base 10) de probabilidades), desarrollada por Newton Morton , [8] es una prueba estadística que se utiliza a menudo para el análisis de ligamiento en poblaciones humanas, animales y vegetales. La puntuación LOD compara la probabilidad de obtener los datos de prueba si los dos loci están efectivamente vinculados, con la probabilidad de observar los mismos datos puramente por casualidad. Las puntuaciones LOD positivas favorecen la presencia de ligamiento, mientras que las puntuaciones LOD negativas indican que el ligamiento es menos probable. El análisis de la puntuación LOD computarizada es una forma sencilla de analizar pedigríes familiares complejos para determinar el vínculo entre rasgos mendelianos (o entre un rasgo y un marcador, o dos marcadores).
Strachan y Read describen el método con mayor detalle.[1] En resumen, funciona de la siguiente manera:
La puntuación LOD se calcula de la siguiente manera:
NR denota el número de descendientes no recombinantes, y R denota el número de descendientes recombinantes. La razón por la que se utiliza 0,5 en el denominador es que cualquier alelo que esté completamente desligado (por ejemplo, alelos en cromosomas separados) tiene una probabilidad del 50% de recombinación, debido a la distribución independiente. θ es la fracción recombinante, es decir, la fracción de nacimientos en los que se ha producido la recombinación entre el marcador genético estudiado y el gen putativo asociado a la enfermedad. Por tanto, es igual a R / ( NR + R ) .
Por convención, una puntuación LOD mayor de 3,0 se considera evidencia de ligamiento, ya que indica una probabilidad de 1000 a 1 de que el ligamiento observado no ocurrió por casualidad. Por otro lado, una puntuación LOD menor de −2,0 se considera evidencia para excluir el ligamiento. Aunque es muy improbable que se obtenga una puntuación LOD de 3 a partir de un solo pedigrí, las propiedades matemáticas de la prueba permiten combinar datos de varios pedigríes sumando sus puntuaciones LOD. Una puntuación LOD de 3 se traduce en un valor p de aproximadamente 0,05, [9] y no se requiere ninguna corrección de pruebas múltiples (por ejemplo, corrección de Bonferroni ). [10]
El análisis de ligamiento tiene una serie de limitaciones metodológicas y teóricas que pueden aumentar significativamente la tasa de error de tipo 1 y reducir el poder para mapear loci de rasgos cuantitativos (QTL) humanos. [11] Si bien el análisis de ligamiento se utilizó con éxito para identificar variantes genéticas que contribuyen a trastornos raros como la enfermedad de Huntington , no funcionó tan bien cuando se aplicó a trastornos más comunes, como enfermedades cardíacas o diferentes formas de cáncer . [12] Una explicación para esto es que los mecanismos genéticos que afectan a los trastornos comunes son diferentes de los que causan algunos trastornos raros. [13]
La frecuencia de recombinación es una medida del ligamiento genético y se utiliza para crear un mapa de ligamiento genético. La frecuencia de recombinación ( θ ) es la frecuencia con la que se produce un único cruce cromosómico entre dos genes durante la meiosis . Un centimorgan (cM) es una unidad que describe una frecuencia de recombinación del 1%. De esta forma, podemos medir la distancia genética entre dos loci, en función de su frecuencia de recombinación. Esta es una buena estimación de la distancia real. Los cruces dobles se convertirían en ausencia de recombinación. En este caso, no podemos saber si se produjeron cruces. Si los loci que estamos analizando están muy cerca (menos de 7 cM), es muy poco probable que se produzca un cruce doble. Cuando las distancias se hacen mayores, aumenta la probabilidad de un cruce doble. A medida que aumenta la probabilidad de un cruce doble, se podría subestimar sistemáticamente la distancia genética entre dos loci, a menos que se utilice un modelo matemático adecuado.
El doble ligamiento es una preocupación histórica más importante en el caso de las plantas. En los animales, el doble entrecruzamiento ocurre raramente. En los seres humanos, por ejemplo, un cromosoma tiene dos entrecruzamientos en promedio durante la meiosis. Además, los genetistas modernos tienen suficientes genes como para que solo sea necesario analizar el ligamiento de los genes cercanos, a diferencia de lo que ocurría en los primeros tiempos, cuando solo se conocían unos pocos genes. [14]
Durante la meiosis, los cromosomas se distribuyen aleatoriamente en gametos , de modo que la segregación de alelos de un gen es independiente de la de los alelos de otro gen. Esto se establece en la segunda ley de Mendel y se conoce como la ley de la distribución independiente . La ley de la distribución independiente siempre es válida para los genes que se encuentran en cromosomas diferentes, pero no siempre es válida para los genes que se encuentran en el mismo cromosoma.
Como ejemplo de surtido independiente, considere el cruce de la cepa parental homocigota de raza pura con genotipo AABB con una cepa de raza pura diferente con genotipo aabb . A y a y B y b representan los alelos de los genes A y B. El cruce de estas cepas parentales homocigotas dará como resultado descendientes de la generación F1 que son doblemente heterocigotos con genotipo AaBb. La descendencia F1 AaBb produce gametos que son AB , Ab , aB y ab con frecuencias iguales (25%) porque los alelos del gen A se clasifican independientemente de los alelos del gen B durante la meiosis. Nótese que 2 de los 4 gametos (50%) —Ab y aB— no estaban presentes en la generación parental. Estos gametos representan gametos recombinantes . Los gametos recombinantes son aquellos gametos que difieren de ambos gametos haploides que formaban la célula diploide original . En este ejemplo, la frecuencia de recombinación es del 50% ya que 2 de los 4 gametos fueron gametos recombinantes.
La frecuencia de recombinación será del 50% cuando dos genes se encuentran en cromosomas diferentes o cuando están muy separados en el mismo cromosoma. Esto es consecuencia de la distribución independiente.
Cuando dos genes están muy juntos en el mismo cromosoma, no se combinan de forma independiente y se dice que están ligados. Mientras que los genes ubicados en cromosomas diferentes se combinan de forma independiente y tienen una frecuencia de recombinación del 50%, los genes ligados tienen una frecuencia de recombinación inferior al 50%.
Como ejemplo de ligamiento, considere el experimento clásico de William Bateson y Reginald Punnett . [15] Estaban interesados en la herencia de rasgos en el guisante de olor y estaban estudiando dos genes: el gen del color de la flor ( P , púrpura, y p , rojo) y el gen que afecta la forma de los granos de polen ( L , largo, y l , redondo). Cruzaron las líneas puras PPLL y ppll y luego autocruzaron las líneas PpLl resultantes . Según la genética mendeliana , los fenotipos esperados ocurrirían en una proporción 9:3:3:1 de PL:Pl:pL:pl. Para su sorpresa, observaron una mayor frecuencia de PL y pl y una menor frecuencia de Pl y pL (ver la tabla a continuación).
Su experimento reveló un vínculo entre los alelos P y L y los alelos p y l . La frecuencia de aparición de P junto con L y de p junto con l es mayor que la de los recombinantes Pl y pL . La frecuencia de recombinación es más difícil de calcular en un cruce F2 que en un retrocruzamiento, [4] pero la falta de ajuste entre los números observados y esperados de progenie en la tabla anterior indica que es inferior al 50%.
En este caso, la progenie recibió dos alelos dominantes unidos en un cromosoma (lo que se denomina acoplamiento o disposición cis ). Sin embargo, después del cruzamiento, alguna progenie podría haber recibido un cromosoma parental con un alelo dominante para un rasgo (p. ej., morado) unido a un alelo recesivo para un segundo rasgo (p. ej., redondo), siendo lo opuesto cierto para el otro cromosoma parental (p. ej., rojo y largo). Esto se denomina repulsión o disposición trans . El fenotipo aquí seguiría siendo morado y largo, pero un cruce de prueba de este individuo con el progenitor recesivo produciría progenie con una proporción mucho mayor de los dos fenotipos cruzados. Si bien tal problema puede no parecer probable a partir de este ejemplo, aparecen vínculos de repulsión desfavorables cuando se realiza el cruzamiento para la resistencia a enfermedades en algunos cultivos.
Las dos posibles disposiciones, cis y trans, de los alelos en un heterocigoto doble se denominan fases gaméticas , y la fase es el proceso de determinar cuál de las dos está presente en un individuo determinado.
Cuando dos genes se encuentran en el mismo cromosoma, la probabilidad de que se produzca un cruce que produzca una recombinación entre los genes está relacionada con la distancia entre ambos genes. Por ello, el uso de frecuencias de recombinación se ha utilizado para desarrollar mapas de ligamiento o mapas genéticos .
Sin embargo, es importante señalar que la frecuencia de recombinación tiende a subestimar la distancia entre dos genes vinculados. Esto se debe a que, a medida que los dos genes se encuentran más separados, también aumenta la probabilidad de que se produzcan el doble o incluso más cruces entre ellos. El doble o incluso más cruces entre los dos genes hace que se cosegreguen en el mismo gameto, lo que produce una progenie parental en lugar de la progenie recombinante esperada. Como se mencionó anteriormente, las transformaciones de Kosambi y Haldane intentan corregir los cruces múltiples. [16]
A principios de la década de 1950, la opinión predominante era que los genes de un cromosoma son entidades discretas, indivisibles por recombinación genética y dispuestas como cuentas en un collar. Durante 1955 a 1959, Benzer realizó experimentos de recombinación genética utilizando mutantes rII del bacteriófago T4 . Descubrió que, sobre la base de pruebas de recombinación, los sitios de mutación podían mapearse en un orden lineal. [17] [18] Este resultado proporcionó evidencia de la idea clave de que el gen tiene una estructura lineal equivalente a una longitud de ADN con muchos sitios que pueden mutar independientemente.
Edgar et al. [19] realizaron experimentos de mapeo con mutantes r del bacteriófago T4 mostrando que las frecuencias de recombinación entre mutantes rII no son estrictamente aditivas. La frecuencia de recombinación de un cruce de dos mutantes rII (axd) es usualmente menor que la suma de las frecuencias de recombinación para subintervalos internos adyacentes (axb) + (bxc) + (cxd). Aunque no es estrictamente aditiva, se observó una relación sistemática [20] que probablemente refleja el mecanismo molecular subyacente de la recombinación genética .
Si bien la recombinación de cromosomas es un proceso esencial durante la meiosis, existe una amplia gama de frecuencias de entrecruzamientos entre organismos y dentro de las especies. Las tasas de recombinación sexualmente dimórficas se denominan heteroquiasmia y se observan con mayor frecuencia que una tasa común entre machos y hembras. En los mamíferos, las hembras suelen tener una tasa de recombinación más alta en comparación con los machos. Se teoriza que existen selecciones únicas que actúan o impulsores meióticos que influyen en la diferencia en las tasas. La diferencia en las tasas también puede reflejar los entornos y condiciones enormemente diferentes de la meiosis en la ovogénesis y la espermatogénesis. [21]
Las mutaciones en genes que codifican proteínas involucradas en el procesamiento del ADN a menudo afectan la frecuencia de recombinación . En el bacteriófago T4 , las mutaciones que reducen la expresión de la ADN polimerasa replicativa [producto génico 43 (gp43)] aumentan la recombinación (disminuyen el ligamiento) varias veces. [22] [23] El aumento en la recombinación puede deberse a errores de replicación por la ADN polimerasa defectuosa que son en sí mismos eventos de recombinación tales como cambios de plantilla, es decir, eventos de recombinación de elección de copia. [24] La recombinación también aumenta por mutaciones que reducen la expresión de la ADN ligasa (gp30) [25] [23] y la dCMP hidroximetilasa (gp42), [22] [23] dos enzimas empleadas en la síntesis de ADN .
La recombinación se reduce (el enlace aumenta) por mutaciones en genes que codifican proteínas con funciones de nucleasa (gp46 y gp47) [25] [23] y una proteína de unión al ADN (gp32) [23]. La mutación en el gen uvsX del bacteriófago también reduce sustancialmente la recombinación. [26] El gen uvsX es análogo al gen recA bien estudiado de Escherichia coli que juega un papel central en la recombinación. [27]
En el caso de árboles genealógicos muy grandes o de datos de marcadores genéticos muy densos, como los de la secuenciación del genoma completo, es posible localizar con precisión las recombinaciones. Con este tipo de análisis genético, se asigna un indicador de meiosis a cada posición del genoma para cada meiosis de un árbol genealógico. El indicador indica qué copia del cromosoma parental contribuye al gameto transmitido en esa posición. Por ejemplo, si se transmite el alelo de la "primera" copia del cromosoma parental, se podría asignar un "0" a esa meiosis. Si se transmite el alelo de la "segunda" copia del cromosoma parental, se asignaría un "1" a esa meiosis. Los dos alelos del progenitor proceden, uno de cada uno, de dos abuelos. Estos indicadores se utilizan entonces para determinar estados de identidad por descendencia (IBD) o estados de herencia, que a su vez se utilizan para identificar genes responsables de enfermedades.