Un haplotipo ( genotipo haploide ) es un grupo de alelos de un organismo que se heredan juntos de un solo progenitor. [1] [2]
Muchos organismos contienen material genético ( ADN ) que se hereda de dos progenitores. Normalmente, estos organismos tienen su ADN organizado en dos conjuntos de cromosomas similares por pares . La descendencia obtiene un cromosoma de cada par de cada progenitor. Un conjunto de pares de cromosomas se denomina diploide y un conjunto de solo la mitad de cada par se denomina haploide. El genotipo haploide (haplotipo) es un genotipo que considera los cromosomas singulares en lugar de los pares de cromosomas. Puede ser todos los cromosomas de uno de los progenitores o una parte menor de un cromosoma, por ejemplo, una secuencia de 9000 pares de bases o un pequeño conjunto de alelos.
Es probable que partes contiguas específicas del cromosoma se hereden juntas y no se dividan por entrecruzamiento cromosómico , un fenómeno llamado ligamiento genético . [3] [4] Como resultado, la identificación de estas asociaciones estadísticas y algunos alelos de una secuencia de haplotipo específica puede facilitar la identificación de todos los demás sitios polimórficos similares que están cerca en el cromosoma ( imputación ). [5] Esta información es fundamental para investigar la genética de enfermedades comunes ; que han sido investigadas en humanos por el Proyecto Internacional HapMap . [6] [7]
Otras partes del genoma son casi siempre haploides y no sufren entrecruzamiento: por ejemplo, el ADN mitocondrial humano se transmite a través de la línea materna y el cromosoma Y se transmite a través de la línea paterna. En estos casos, la secuencia completa se puede agrupar en un árbol evolutivo simple, con cada rama fundada por una mutación de polimorfismo de evento único (a menudo, pero no siempre, un polimorfismo de un solo nucleótido (SNP)). Cada clado bajo una rama, que contiene haplotipos con un solo ancestro compartido, se llama haplogrupo . [8] [9] [10]
El genotipo de un organismo puede no definir su haplotipo de forma única. Por ejemplo, considere un organismo diploide y dos loci bialélicos (como SNP ) en el mismo cromosoma. Suponga que el primer locus tiene alelos A o T y el segundo locus G o C. Ambos loci, entonces, tienen tres genotipos posibles : ( AA , AT y TT ) y ( GG , GC y CC ), respectivamente. Para un individuo dado, hay nueve configuraciones posibles (haplotipos) en estos dos loci (mostrados en el cuadro de Punnett a continuación). Para los individuos que son homocigotos en uno o ambos loci, los haplotipos son inequívocos, lo que significa que no hay ninguna diferenciación del haplotipo T1T2 frente al haplotipo T2T1; donde T1 y T2 están etiquetados para mostrar que son el mismo locus, pero etiquetados como tales para mostrar que no importa en qué orden los considere, el resultado final son dos loci T. Para individuos heterocigotos en ambos loci, la fase gamética es ambigua - en estos casos, un observador no sabe qué haplotipo tiene el individuo, por ejemplo, TA vs AT.
El único método inequívoco para resolver la ambigüedad de fase es mediante la secuenciación . Sin embargo, es posible estimar la probabilidad de un haplotipo particular cuando la fase es ambigua utilizando una muestra de individuos.
Dados los genotipos de un número de individuos, los haplotipos pueden inferirse mediante técnicas de resolución de haplotipos o de fase de haplotipos . Estos métodos funcionan aplicando la observación de que ciertos haplotipos son comunes en ciertas regiones genómicas. Por lo tanto, dado un conjunto de posibles resoluciones de haplotipos, estos métodos eligen aquellos que utilizan menos haplotipos diferentes en general. Los detalles de estos métodos varían: algunos se basan en enfoques combinatorios (por ejemplo, parsimonia ), mientras que otros utilizan funciones de probabilidad basadas en diferentes modelos y supuestos, como el principio de Hardy-Weinberg , el modelo de teoría de coalescencia o la filogenia perfecta. Los parámetros de estos modelos luego se estiman utilizando algoritmos como el algoritmo de maximización de expectativas (EM), el Monte Carlo de cadena de Markov (MCMC) o los modelos ocultos de Markov (HMM).
La haplotipificación microfluídica del genoma completo es una técnica para la separación física de cromosomas individuales de una célula en metafase seguida de la resolución directa del haplotipo de cada alelo.
En genética , una fase gamética representa las combinaciones alélicas originales que un individuo diploide hereda de ambos progenitores. [11] Por lo tanto, se trata de una asociación particular de alelos en diferentes loci del mismo cromosoma . La fase gamética está influenciada por el ligamiento genético . [12]
A diferencia de otros cromosomas, los cromosomas Y generalmente no vienen en pares. Cada hombre humano (excepto aquellos con síndrome XYY ) tiene solo una copia de ese cromosoma. Esto significa que no hay ninguna variación aleatoria de qué copia se hereda, y también (para la mayoría de los cromosomas) no hay ninguna mezcla entre copias por recombinación ; por lo tanto, a diferencia de los haplotipos autosómicos , no hay efectivamente ninguna aleatorización del haplotipo del cromosoma Y entre generaciones. Un hombre humano debería compartir en gran medida el mismo cromosoma Y que su padre, más o menos unas pocas mutaciones; por lo tanto, los cromosomas Y tienden a pasar en gran parte intactos de padre a hijo, con un pequeño pero acumulado número de mutaciones que pueden servir para diferenciar los linajes masculinos. En particular, el ADN-Y representado como los resultados numerados de una prueba de ADN genealógico de ADN-Y debería coincidir, excepto por las mutaciones.
Los polimorfismos de eventos únicos (UEP), como los SNP, representan haplogrupos . Los STR representan haplotipos. Los resultados que comprenden el haplotipo de ADN-Y completo de la prueba de ADN del cromosoma Y se pueden dividir en dos partes: los resultados de los UEP, a veces llamados vagamente resultados de SNP ya que la mayoría de los UEP son polimorfismos de un solo nucleótido , y los resultados de las secuencias de repetición corta en tándem de microsatélites ( Y-STR ).
Los resultados de la UEP representan la herencia de eventos que se cree que se pueden haber dado solo una vez en toda la historia humana. Estos pueden usarse para identificar el haplogrupo de ADN-Y del individuo , su lugar en el "árbol genealógico" de toda la humanidad. Los diferentes haplogrupos de ADN-Y identifican poblaciones genéticas que a menudo están claramente asociadas con regiones geográficas particulares; su aparición en poblaciones más recientes ubicadas en diferentes regiones representa las migraciones hace decenas de miles de años de los antepasados patrilineales directos de los individuos actuales.
Los resultados genéticos también incluyen el haplotipo Y-STR , el conjunto de resultados de los marcadores Y-STR analizados.
A diferencia de los UEP, los Y-STR mutan mucho más fácilmente, lo que permite utilizarlos para distinguir la genealogía reciente. Pero también significa que, en lugar de que la población de descendientes de un evento genético comparta todos el mismo resultado, es probable que los haplotipos Y-STR se hayan dispersado para formar un grupo de resultados más o menos similares. Por lo general, este grupo tendrá un centro más probable definido, el haplotipo modal (presumiblemente similar al haplotipo del evento fundador original) y también una diversidad de haplotipos , es decir, el grado en que se ha dispersado. Cuanto más lejano en el pasado haya ocurrido el evento definitorio y cuanto más temprano haya ocurrido el crecimiento demográfico posterior, mayor será la diversidad de haplotipos para un número particular de descendientes. Sin embargo, si la diversidad de haplotipos es menor para un número particular de descendientes, esto puede indicar un ancestro común más reciente o una expansión poblacional reciente.
Es importante señalar que, a diferencia de lo que ocurre con los UEP, dos individuos con un haplotipo Y-STR similar no necesariamente comparten una ascendencia similar. Los eventos Y-STR no son únicos. En cambio, los grupos de resultados de haplotipos Y-STR heredados de diferentes eventos y diferentes historias tienden a superponerse.
En la mayoría de los casos, ha pasado mucho tiempo desde los eventos que definen los haplogrupos, por lo que, por lo general, el grupo de resultados del haplotipo Y-STR asociado con los descendientes de ese evento se ha vuelto bastante amplio. Estos resultados tenderán a superponerse significativamente con los grupos (similarmente amplios) de haplotipos Y-STR asociados con otros haplogrupos. Esto hace que sea imposible para los investigadores predecir con absoluta certeza a qué haplogrupo de ADN-Y apuntaría un haplotipo Y-STR. Si no se prueban los UEP, los Y-STR pueden usarse solo para predecir probabilidades de ascendencia del haplogrupo, pero no certezas.
Un escenario similar existe cuando se intenta evaluar si los apellidos compartidos indican una ascendencia genética compartida. Un grupo de haplotipos Y-STR similares puede indicar un ancestro común compartido, con un haplotipo modal identificable, pero sólo si el grupo es suficientemente distinto de lo que puede haber sucedido por casualidad entre diferentes individuos que históricamente adoptaron el mismo nombre de forma independiente. Muchos nombres se adoptaron a partir de ocupaciones comunes, por ejemplo, o se asociaron con la habitación en sitios particulares. Se necesita una tipificación de haplotipos más extensa para establecer la genealogía genética. Las empresas comerciales de pruebas de ADN ahora ofrecen a sus clientes pruebas de conjuntos más numerosos de marcadores para mejorar la definición de su ascendencia genética. El número de conjuntos de marcadores probados ha aumentado de 12 durante los primeros años a 111 más recientemente.
Establecer una relación plausible entre los distintos apellidos extraídos de una base de datos es mucho más difícil. El investigador debe establecer que el miembro más cercano de la población en cuestión, elegido deliberadamente de la población por ese motivo, probablemente no coincida por accidente. Esto es más que establecer que es poco probable que un miembro de la población seleccionado al azar tenga una coincidencia tan cercana por accidente. Debido a la dificultad, es probable que sea imposible establecer una relación entre distintos apellidos como en un escenario de este tipo, excepto en casos especiales en los que exista información específica para limitar drásticamente el tamaño de la población de candidatos en consideración.
La diversidad de haplotipos es una medida de la singularidad de un haplotipo particular en una población dada. La diversidad de haplotipos (H) se calcula como: [13]
donde es la frecuencia haplotípica (relativa) de cada haplotipo en la muestra y es el tamaño de la muestra. La diversidad de haplotipos se proporciona para cada muestra.
El término "haplotipo" fue introducido por primera vez por el biólogo del CMH Ruggero Ceppellini durante el Tercer Taller Internacional de Histocompatibilidad para sustituir al término "fenogrupo". [14] [15]