Una familia de genes es un conjunto de varios genes similares, formados por la duplicación de un único gen original y, en general, con funciones bioquímicas similares. Una de estas familias son los genes de las subunidades de la hemoglobina humana ; los diez genes se encuentran en dos grupos en cromosomas diferentes, llamados loci de α-globina y β-globina . Se cree que estos dos grupos de genes surgieron como resultado de la duplicación de un gen precursor hace aproximadamente 500 millones de años. [1]
Los genes se clasifican en familias en función de las secuencias de nucleótidos o proteínas compartidas . Las técnicas filogenéticas se pueden utilizar como una prueba más rigurosa. Las posiciones de los exones dentro de la secuencia codificante se pueden utilizar para inferir la ascendencia común. Conocer la secuencia de la proteína codificada por un gen puede permitir a los investigadores aplicar métodos que encuentren similitudes entre secuencias de proteínas que proporcionen más información que las similitudes o diferencias entre secuencias de ADN .
Si los genes de una familia de genes codifican proteínas, el término familia de proteínas se utiliza a menudo de manera análoga a familia de genes .
La expansión o contracción de familias de genes a lo largo de un linaje específico puede deberse al azar o puede ser el resultado de la selección natural. [2] Distinguir entre estos dos casos suele ser difícil en la práctica. Trabajos recientes utilizan una combinación de modelos estadísticos y técnicas algorítmicas para detectar familias de genes que están bajo el efecto de la selección natural. [3]
El Comité de Nomenclatura Genética HUGO (HGNC) crea esquemas de nomenclatura utilizando un símbolo de "tallo" (o "raíz") para los miembros de una familia de genes (por homología o función), con un sistema de numeración jerárquico para distinguir a los miembros individuales. [4] [5] Por ejemplo, para la familia de las peroxirredoxinas , PRDX es el símbolo raíz y los miembros de la familia son PRDX1 , PRDX2 , PRDX3 , PRDX4 , PRDX5 y PRDX6 .
Un nivel de organización del genoma es la agrupación de genes en varias familias de genes. [6] [7] Las familias de genes son grupos de genes relacionados que comparten un ancestro común. Los miembros de las familias de genes pueden ser parálogos u ortólogos. Los parálogos de genes son genes con secuencias similares de la misma especie, mientras que los ortólogos de genes son genes con secuencias similares en diferentes especies. Las familias de genes son muy variables en tamaño, diversidad de secuencias y disposición. Dependiendo de la diversidad y las funciones de los genes dentro de la familia, las familias pueden clasificarse como familias multigénicas o superfamilias. [6] [8]
Las familias multigénicas suelen estar formadas por miembros con secuencias y funciones similares, aunque un alto grado de divergencia (a nivel de secuencia y/o funcional) no conduce a la eliminación de un gen de una familia genética. Los genes individuales de la familia pueden estar dispuestos muy juntos en el mismo cromosoma o dispersos por todo el genoma en diferentes cromosomas. Debido a la similitud de sus secuencias y sus funciones superpuestas, los genes individuales de la familia a menudo comparten elementos de control regulador. [6] [8] En algunos casos, los miembros de los genes tienen secuencias idénticas (o casi idénticas). Estas familias permiten que se expresen cantidades masivas de producto génico en un corto período de tiempo según sea necesario. Otras familias permiten que se expresen productos similares pero específicos en diferentes tipos de células o en diferentes etapas del desarrollo de un organismo. [6]
Las superfamilias son mucho más numerosas que las familias multigénicas individuales. Las superfamilias contienen hasta cientos de genes, incluidas varias familias multigénicas, así como miembros de un solo gen individual. La gran cantidad de miembros permite que las superfamilias estén ampliamente dispersas, con algunos genes agrupados y otros muy separados. Los genes son diversos en secuencia y función, y muestran varios niveles de expresión y controles de regulación separados. [6] [8]
Algunas familias de genes también contienen pseudogenes , secuencias de ADN que se parecen mucho a las secuencias de genes establecidas pero que no son funcionales. [9] Existen diferentes tipos de pseudogenes. Los pseudogenes no procesados son genes que adquirieron mutaciones con el tiempo y se volvieron no funcionales. Los pseudogenes procesados son genes que han perdido su función después de ser movidos alrededor del genoma por retrotransposición. [8] [9] Los pseudogenes que se han aislado de la familia de genes en la que se originaron se denominan huérfanos . [6]
Las familias de genes surgieron a partir de múltiples duplicaciones de un gen ancestral, seguidas de mutación y divergencia. [6] Las duplicaciones pueden ocurrir dentro de un linaje (por ejemplo, los humanos pueden tener dos copias de un gen que se encuentra solo una vez en los chimpancés) o son el resultado de la especiación. Por ejemplo, un solo gen en el ancestro de los humanos y los chimpancés ahora se presenta en ambas especies y se puede pensar que se ha "duplicado" a través de la especiación. Como resultado de la duplicación por especiación, una familia de genes puede incluir 15 genes, una copia en cada una de 15 especies diferentes.
En la formación de familias de genes, existen cuatro niveles de duplicación: 1) duplicación y mezcla de exones , 2) duplicación de genes completos , 3) duplicación de familias multigénicas y 4) duplicación de todo el genoma . La duplicación y mezcla de exones da lugar a variación y nuevos genes. Luego, los genes se duplican para formar familias multigénicas que se duplican para formar superfamilias que abarcan múltiples cromosomas. La duplicación del genoma completo duplica el número de copias de cada gen y familia de genes. [6] La duplicación o poliploidización del genoma completo puede ser autopoliploidización o aloploidización. La autopoliploidización es la duplicación del mismo genoma y la alopoliploidización es la duplicación de dos genomas estrechamente relacionados o genomas hibridados de diferentes especies. [8]
La duplicación se produce principalmente a través de eventos de entrecruzamiento desigual en la meiosis de las células germinales. (1,2) Cuando dos cromosomas no se alinean, el entrecruzamiento (el intercambio de alelos genéticos) da como resultado que un cromosoma se expanda o aumente el número de genes y el otro se contraiga o disminuya el número de genes. La expansión de un grupo de genes es la duplicación de genes que conduce a familias de genes más grandes. [6] [8]
Los genes miembros de una familia multigénica o de familias multigénicas dentro de superfamilias existen en cromosomas diferentes debido a la reubicación de esos genes después de la duplicación del gen ancestral. Los elementos transponibles desempeñan un papel en el movimiento de los genes. Los elementos transponibles se reconocen por repeticiones invertidas en sus extremos 5' y 3'. Cuando dos elementos transponibles están lo suficientemente cerca en la misma región de un cromosoma, pueden formar un transposón compuesto. La proteína transposasa reconoce las repeticiones invertidas más externas, cortando el segmento de ADN. Cualquier gen entre los dos elementos transponibles se reubica a medida que el transposón compuesto salta a una nueva área del genoma. [6]
La transcripción inversa es otro método de movimiento de genes. Una transcripción de ARNm de un gen se vuelve a transcribir, o copiar, en ADN. Esta nueva copia de ADN del ARNm se integra en otra parte del genoma, lo que da como resultado la dispersión de los miembros de la familia de genes. [8]
Un tipo especial de familia multigénica está implicada en el movimiento de las familias de genes y de los miembros de las mismas. Las familias LINE (elementos intercalados largos ) y SINE ( elementos intercalados cortos ) son secuencias de ADN altamente repetitivas distribuidas por todo el genoma. Las LINE contienen una secuencia que codifica una proteína transcriptasa inversa. Esta proteína ayuda a copiar las transcripciones de ARN de las LINE y las SINE de nuevo en el ADN y las integra en diferentes áreas del genoma. Esto perpetúa por sí mismo el crecimiento de las familias LINE y SINE. Debido a la naturaleza altamente repetitiva de estos elementos, las LINE y las SINE, cuando están cerca unas de otras, también desencadenan eventos de entrecruzamiento desigual que resultan en duplicaciones de un solo gen y la formación de familias de genes. [6] [8]
Las mutaciones no sinónimas que dan lugar a la sustitución de aminoácidos aumentan la cantidad de copias de genes duplicados. La duplicación da lugar a múltiples copias del mismo gen, lo que da un nivel de redundancia en el que se toleran las mutaciones. Con una copia funcional del gen, otras copias pueden adquirir mutaciones sin resultar extremadamente perjudiciales para los organismos. Las mutaciones permiten que los genes duplicados adquieran funciones nuevas o diferentes. [8]
Algunas familias multigénicas son extremadamente homogéneas, con miembros de genes individuales que comparten secuencias idénticas o casi idénticas. El proceso por el cual las familias genéticas mantienen una alta homogeneidad es la evolución concertada . La evolución concertada ocurre a través de ciclos repetidos de eventos de entrecruzamiento desigual y ciclos repetidos de transferencia y conversión genética. El entrecruzamiento desigual conduce a la expansión y contracción de las familias genéticas. Las familias genéticas tienen un rango de tamaño óptimo hacia el cual actúa la selección natural. La contracción elimina copias genéticas divergentes y evita que las familias genéticas se vuelvan demasiado grandes. La expansión reemplaza copias genéticas perdidas y evita que las familias genéticas se vuelvan demasiado pequeñas. Los ciclos repetidos de transferencia y conversión genética hacen que los miembros de la familia genética sean cada vez más similares. [6]
En el proceso de transferencia de genes, la conversión de genes alélicos está sesgada. La propagación de alelos mutantes en una familia de genes hacia la homogeneidad es el mismo proceso que la propagación de un alelo ventajoso en una población hacia la fijación. La conversión de genes también ayuda a crear variación genética en algunos casos. [10]
Las familias de genes, parte de una jerarquía de almacenamiento de información en un genoma, desempeñan un papel importante en la evolución y diversidad de los organismos multicelulares. Las familias de genes son grandes unidades de información y variabilidad genética. [6] A lo largo del tiempo evolutivo, las familias de genes se han expandido y contraído, con genes dentro de una familia duplicándose y diversificándose en nuevos genes, y genes perdiéndose. Una familia de genes entera también puede perderse, o ganarse a través del nacimiento de genes de novo , por una divergencia tan extensa que un gen se considera parte de una nueva familia, o por transferencia horizontal de genes . Cuando el número de genes por genoma permanece relativamente constante, esto implica que los genes se ganan y pierden a tasas relativamente iguales. Hay algunos patrones en los que los genes tienen más probabilidades de perderse frente a los que tienen más probabilidades de duplicarse y diversificarse en múltiples copias. [11]
La expansión adaptativa de un único gen en muchas copias inicialmente idénticas se produce cuando la selección natural favorece la creación de copias adicionales de genes. Este es el caso cuando un factor de estrés ambiental actúa sobre una especie. La amplificación de genes es más común en bacterias y es un proceso reversible. La contracción de familias de genes suele ser resultado de la acumulación de mutaciones de pérdida de función. Una mutación sin sentido que detiene prematuramente la transcripción de genes se fija en la población, lo que conduce a la pérdida de genes. Este proceso ocurre cuando los cambios en el entorno hacen que un gen sea redundante. [7]
Además de la clasificación por evolución (familia de genes estructurales), el HGNC también hace "familias de genes" por función en su nomenclatura de raíz. [12] Como resultado, una raíz también puede referirse a genes que tienen la misma función, a menudo parte del mismo complejo proteico . Por ejemplo, BRCA1 y BRCA2 son genes no relacionados que reciben su nombre por su papel en el cáncer de mama y RPS2 y RPS3 son proteínas ribosómicas no relacionadas que se encuentran en la misma subunidad pequeña.
El HGNC también mantiene una clasificación de "grupos de genes" (anteriormente "familias de genes"). Un gen puede ser miembro de varios grupos, y todos los grupos forman una jerarquía. Al igual que con la clasificación de células madre, existen grupos tanto estructurales como funcionales. [4] [5]