Una familia de genes es un conjunto de genes homólogos dentro de un organismo. Un grupo de genes es un grupo de dos o más genes que se encuentran dentro del ADN de un organismo y que codifican polipéptidos o proteínas similares , que comparten colectivamente una función generalizada y que a menudo se encuentran a unos pocos miles de pares de bases entre sí. El tamaño de los grupos de genes puede variar significativamente, desde unos pocos genes hasta varios cientos de genes. [1] Se descubre que partes de la secuencia de ADN de cada gen dentro de un grupo de genes son idénticas; sin embargo, la proteína resultante de cada gen es distinta de la proteína resultante de otro gen dentro del grupo. Los genes que se encuentran en un grupo de genes pueden observarse cerca uno del otro en el mismo cromosoma o en cromosomas diferentes, pero homólogos . Un ejemplo de un grupo de genes es el gen Hox , que está formado por ocho genes y es parte de la familia de genes Homeobox .
Históricamente, se han propuesto cuatro modelos para la formación y persistencia de grupos de genes.
Este modelo ha sido generalmente aceptado desde mediados de la década de 1970. Postula que los grupos de genes se formaron como resultado de la duplicación y divergencia de genes . [2] Estos grupos de genes incluyen el grupo de genes Hox , el grupo de genes de β-globina humana y cuatro genes agrupados de hormona de crecimiento humana (hGH)/ somatomamotropina coriónica . [3]
Los grupos de genes conservados, como Hox y el grupo de genes de la β-globina humana, pueden formarse como resultado del proceso de duplicación y divergencia de genes . Un gen se duplica durante la división celular , de modo que sus descendientes tienen dos copias de extremo a extremo del gen donde tenía una copia, que inicialmente codificaba la misma proteína o tenía la misma función. En el curso de la evolución posterior, divergen, de modo que los productos que codifican tienen funciones diferentes pero relacionadas, y los genes siguen estando adyacentes en el cromosoma. [4] Ohno teorizó que el origen de nuevos genes durante la evolución dependía de la duplicación de genes. Si solo existiera una única copia de un gen en el genoma de una especie, las proteínas transcritas a partir de este gen serían esenciales para su supervivencia. Debido a que solo existía una única copia del gen, no podían sufrir mutaciones que potencialmente darían lugar a nuevos genes; sin embargo, la duplicación de genes permite que los genes esenciales sufran mutaciones en la copia duplicada, lo que en última instancia daría lugar a nuevos genes a lo largo de la evolución.
[5] Las mutaciones en la copia duplicada fueron toleradas porque la copia original contenía información genética para la función del gen esencial. Las especies que tienen grupos de genes tienen una ventaja evolutiva selectiva porque la selección natural debe mantener los genes juntos. [1] [6] En un corto período de tiempo, la nueva información genética exhibida por la copia duplicada del gen esencial no serviría como una ventaja práctica; sin embargo, durante un largo período de tiempo evolutivo, la información genética en la copia duplicada puede sufrir mutaciones adicionales y drásticas en las que las proteínas del gen duplicado cumplieran una función diferente a las del gen esencial original. [5] Durante el largo período de tiempo evolutivo, los dos genes similares divergirían, por lo que las proteínas de cada gen serían únicas en sus funciones. Los grupos de genes Hox, que varían en varios tamaños, se encuentran entre varios filos .
Cuando se produce una duplicación genética para producir un grupo de genes, uno o varios genes pueden duplicarse a la vez. En el caso del gen Hox, se duplicó un grupo ProtoHox ancestral compartido, lo que dio lugar a grupos genéticos en el gen Hox, así como en el gen ParaHox , un complejo evolutivo hermano del gen Hox. [7] Se desconoce el número exacto de genes contenidos en el grupo Protohox duplicado; sin embargo, existen modelos que sugieren que el grupo Protohox duplicado originalmente contenía cuatro, tres o dos genes. [8]
En el caso de que se duplique un grupo de genes, pueden perderse algunos genes. La pérdida de genes depende de la cantidad de genes que se originan en el grupo de genes. En el modelo de cuatro genes, el grupo ProtoHox contenía cuatro genes que dieron lugar a dos grupos gemelos: el grupo Hox y el grupo ParaHox. [7] Como indica su nombre, el modelo de dos genes dio lugar al grupo Hox y al grupo ParaHox como resultado del grupo ProtoHox que contenía solo dos genes. El modelo de tres genes se propuso originalmente junto con el modelo de cuatro genes; [8] sin embargo, en lugar de que el grupo Hox y el grupo ParaHox resultaran de un grupo que contenía tres genes, el grupo Hox y el grupo ParaHox fueron el resultado de la duplicación en tándem de un solo gen, genes idénticos encontrados adyacentes en el mismo cromosoma. [7] Esto fue independiente de la duplicación del grupo ProtoHox ancestral.
La duplicación de genes puede ocurrir a través de la duplicación cis o trans . La duplicación cis , o duplicación intracromosómica, implica la duplicación de genes dentro del mismo cromosoma, mientras que la duplicación trans , o duplicación intercromosómica, consiste en la duplicación de genes en cromosomas vecinos pero separados. [7] Las formaciones del grupo Hox y del grupo ParaHox fueron resultados de la duplicación intracromosómica, aunque inicialmente se pensó que eran intercromosómicas. [8]
El modelo de Fisher fue propuesto en 1930 por Ronald Fisher . Según el modelo de Fisher, los grupos de genes son el resultado de dos alelos que funcionan bien entre sí. En otras palabras, los grupos de genes pueden exhibir coadaptación . [3] El modelo de Fisher se consideró improbable y luego se descartó como explicación de la formación de grupos de genes. [2] [3]
Según el modelo de corregulación, los genes se organizan en grupos, cada uno de los cuales consta de un único promotor y un grupo de secuencias codificantes, que por lo tanto están corregulados y muestran una expresión genética coordinada . [3] La expresión genética coordinada alguna vez se consideró el mecanismo más común que impulsaba la formación de grupos de genes. [1] Sin embargo, la corregulación y, por lo tanto, la expresión genética coordinada no pueden impulsar la formación de grupos de genes. [3]
El modelo de molaridad tiene en cuenta las limitaciones del tamaño celular. La transcripción y traducción conjunta de genes es beneficiosa para la célula. [9] Por lo tanto, la formación de genes agrupados genera una alta concentración local de productos proteicos citoplasmáticos. Se ha observado segregación espacial de productos proteicos en bacterias; sin embargo, el modelo de molaridad no tiene en cuenta la cotranscripción o la distribución de genes que se encuentran dentro de un operón. [2]
Los genes repetidos pueden presentarse en dos patrones principales: grupos de genes y conjuntos en tándem , o anteriormente denominados genes en disposición en tándem . Aunque son similares, los grupos de genes y los genes en disposición en tándem pueden distinguirse entre sí.
Los grupos de genes se encuentran próximos entre sí cuando se observan en el mismo cromosoma. Están dispersos aleatoriamente; sin embargo, los grupos de genes normalmente están, como máximo, a unos pocos miles de bases entre sí. La distancia entre cada gen en el grupo de genes puede variar. El ADN encontrado entre cada gen repetido en el grupo de genes no está conservado. [10] Se encuentra que partes de la secuencia de ADN de un gen son idénticas en los genes contenidos en un grupo de genes. [5] La conversión genética es el único método en el que los grupos de genes pueden homogeneizarse. Aunque el tamaño de un grupo de genes puede variar, rara vez comprende más de 50 genes, lo que hace que los grupos sean estables en número. Los grupos de genes cambian a lo largo de un largo período evolutivo, lo que no da como resultado complejidad genética. [10]
Las matrices en tándem son un grupo de genes con la misma función o una función similar que se repiten consecutivamente sin espacio entre cada gen. Los genes están organizados en la misma orientación. [10] A diferencia de los grupos de genes, se ha descubierto que los genes dispuestos en tándem consisten en repeticiones consecutivas e idénticas, separadas solo por una región espaciadora no transcrita.
[11] Mientras que los genes contenidos en un grupo de genes codifican proteínas similares, las proteínas idénticas o los ARN funcionales son codificados por genes dispuestos en tándem. Recombinación desigual , que cambia el número de repeticiones al colocar genes duplicados junto al gen original. A diferencia de los grupos de genes, los genes dispuestos en tándem cambian rápidamente en respuesta a las necesidades del entorno, lo que provoca un aumento de la complejidad genética. [11]
La conversión génica permite que los genes dispuestos en tándem se homogeneicen o se vuelvan idénticos. [11] La conversión génica puede ser alélica o ectópica. La conversión génica alélica ocurre cuando un alelo de un gen se convierte en el otro alelo como resultado de un emparejamiento de bases incorrecto durante la recombinación homóloga de la meiosis . [12] La conversión génica ectópica ocurre cuando una secuencia de ADN homóloga es reemplazada por otra. La conversión génica ectópica es la fuerza impulsora de la evolución concertada de las familias de genes. [13]
Los genes dispuestos en tándem son esenciales para mantener grandes familias de genes, como el ARN ribosómico . En el genoma eucariota, los genes dispuestos en tándem forman el ARN ribosómico. Los ARNr repetidos en tándem son esenciales para mantener la transcripción del ARN. Es posible que un gen de ARN no pueda proporcionar una cantidad suficiente de ARN. En esta situación, las repeticiones en tándem del gen permiten que se proporcione una cantidad suficiente de ARN. Por ejemplo, las células embrionarias humanas contienen entre 5 y 10 millones de ribosomas y duplican su número en 24 horas. Para proporcionar una cantidad sustancial de ribosomas, múltiples ARN polimerasas deben transcribir consecutivamente múltiples genes de ARNr. [11]