Los genes huérfanos , ORF ans, [1] [2] o genes taxonómicamente restringidos (TRG) [3] son genes que carecen de un homólogo detectable fuera de una especie o linaje determinado. [2] La mayoría de los genes tienen homólogos conocidos. Dos genes son homólogos cuando comparten una historia evolutiva, y el estudio de grupos de genes homólogos permite comprender su historia evolutiva y divergencia. Los mecanismos comunes que se han descubierto como fuentes de nuevos genes a través de estudios de homólogos incluyen duplicación de genes , redistribución de exones , fusión y fisión de genes, etc. [4] [5] Estudiar los orígenes de un gen se vuelve más difícil cuando no hay un homólogo evidente. [6] El descubrimiento de que aproximadamente el 10% o más de los genes de la especie microbiana promedio está constituido por genes huérfanos plantea preguntas sobre los orígenes evolutivos de diferentes especies, así como sobre cómo estudiar y descubrir los orígenes evolutivos de los genes huérfanos.
En algunos casos, un gen puede clasificarse como un gen huérfano debido a un muestreo insuficiente del espacio genómico existente. Si bien es posible que existan homólogos para un gen determinado, ese gen seguirá clasificándose como huérfano si los organismos que albergan homólogos aún no se han descubierto y sus genomas no se han secuenciado y anotado adecuadamente . Por ejemplo, un estudio de genes huérfanos en 119 genomas de arqueas y bacterias pudo identificar que al menos el 56% se adquirieron recientemente a partir de elementos integrativos (o elementos genéticos móviles ) de fuentes no celulares como virus y plásmidos que aún deben explorarse y caracterizarse, y otro 7% surge a través de la transferencia horizontal de genes de fuentes celulares distantes (con una proporción desconocida del 37% restante que potencialmente proviene de familias aún desconocidas de elementos integrativos). [7] En otros casos, las limitaciones en los métodos computacionales para detectar homólogos pueden dar como resultado secuencias homólogas omitidas y, por lo tanto, la clasificación de un gen como huérfano. La falla en la detección de homología parece explicar la mayoría, pero no todos los genes huérfanos. [8] En otros casos, la homología entre genes puede pasar desapercibida debido a la rápida evolución y divergencia de uno o ambos genes entre sí hasta el punto en que no cumplen los criterios utilizados para clasificar a los genes como evidentemente homólogos mediante métodos computacionales. Un análisis sugiere que la divergencia explica un tercio de las identificaciones de genes huérfanos en eucariotas. [9] Cuando existen genes homólogos pero simplemente no se detectan, la aparición de estos genes huérfanos puede explicarse por fenómenos bien caracterizados como la recombinación genómica, la redistribución de exones, la duplicación y divergencia de genes, etc. Los genes huérfanos también pueden simplemente carecer de homólogos verdaderos y en tales casos tienen un origen independiente a través del nacimiento de genes de novo , que tiende a ser un evento más reciente. [2] Estos procesos pueden actuar a diferentes ritmos en insectos, primates y plantas. [10] A pesar de su origen relativamente reciente, los genes huérfanos pueden codificar proteínas funcionalmente importantes. [11] [12] Las características de los genes huérfanos incluyen riqueza de AT, orígenes relativamente recientes, restricción taxonómica a un solo genoma, tasas de evolución elevadas y secuencias más cortas. [13]
Algunos enfoques caracterizan a todos los genes microbianos como parte de una de dos clases de genes. Una clase se caracteriza por la conservación total o parcial a través de linajes, mientras que la otra (representada por los genes huérfanos) se caracteriza por tasas evolutivamente instantáneas de recambio/reemplazo de genes con un efecto insignificante en la aptitud cuando dichos genes se ganan o se pierden. Estos genes huérfanos se derivan principalmente de elementos genéticos móviles y tienden a ser "pasivamente egoístas", a menudo desprovistos de funciones celulares (razón por la cual experimentan poca presión selectiva en su ganancia o pérdida de los genomas), pero persisten en la biosfera debido a su movimiento transitorio a través de los genomas. [14] [15]
Los genes huérfanos evolucionan más rápidamente que otros genes. Suelen originarse a través de dos mecanismos principales: el nacimiento de genes de novo , en el que surgen nuevos genes a partir de secuencias no codificantes dentro del genoma, y la transferencia horizontal de genes , la adquisición de material genético de otro organismo.
Los biólogos creen que los genes huérfanos pueden desempeñar un papel crucial en el desarrollo de rasgos específicos de las especies, adaptaciones ambientales o respuestas a nichos ecológicos cambiantes. Estas innovaciones funcionales requieren cambios evolutivos rápidos para optimizar su eficacia dentro de la biología del organismo.
Múltiples estudios han apoyado estas teorías evolutivas sobre los genes huérfanos. Domazet-Loso y Tautz [16] llevaron a cabo un estudio centrado en los genes huérfanos en Drosophila, revelando que estos genes evolucionan a un ritmo más rápido en comparación con los genes conservados. Este hallazgo sugiere una posible correlación entre la tasa evolutiva y la novedad genética. De manera similar, Tautz y Domazet-Loso [17] presentaron evidencia que indica una contribución sustancial de los genes huérfanos a la diversidad fenotípica y la adaptación en diferentes especies. Su investigación subraya el papel crucial de los genes huérfanos en el impulso de la innovación evolutiva y la conformación de la diversidad biológica.
Los genes huérfanos se descubrieron por primera vez cuando comenzó el proyecto de secuenciación del genoma de la levadura en 1996. [2] Se estima que los genes huérfanos representaban un 26% del genoma de la levadura, pero se creía que estos genes podrían clasificarse con homólogos cuando se secuenciaran más genomas. [3] En ese momento, la duplicación de genes se consideraba el único modelo serio de evolución genética [2] [4] [18] y había pocos genomas secuenciados para comparar, por lo que se pensó que la falta de homólogos detectables probablemente se debía a una falta de datos de secuenciación y no a una verdadera falta de homología. [3] Sin embargo, los genes huérfanos continuaron persistiendo a medida que crecía la cantidad de genomas secuenciados, [3] [19] lo que finalmente llevó a la conclusión de que los genes huérfanos son omnipresentes en todos los genomas. [2] Las estimaciones del porcentaje de genes que son huérfanos varían enormemente entre especies y entre estudios; 10-30% es una cifra citada comúnmente. [3]
El estudio de los genes huérfanos surgió en gran medida después del cambio de siglo. En 2003, un estudio de Caenorhabditis briggsae y especies relacionadas comparó más de 2000 genes. [3] Propusieron que estos genes deben estar evolucionando demasiado rápido para ser detectados y, en consecuencia, son sitios de evolución muy rápida. [3] En 2005, Wilson examinó 122 especies bacterianas para tratar de examinar si la gran cantidad de genes huérfanos en muchas especies era legítima. [19] El estudio encontró que era legítimo y desempeñaba un papel en la adaptación bacteriana. La definición de genes taxonómicamente restringidos se introdujo en la literatura para hacer que los genes huérfanos parecieran menos "misteriosos". [19]
En 2008, se descubrió que una proteína de levadura de funcionalidad establecida, BSC4, había evolucionado de novo a partir de secuencias no codificantes cuya homología aún era detectable en especies hermanas. [20]
En 2009, se descubrió un gen huérfano que regula una red biológica interna: el gen huérfano QQS de Arabidopsis thaliana modifica la composición de la planta. [21] La proteína huérfana QQS interactúa con un factor de transcripción conservado; estos datos explican los cambios de composición (aumento de la proteína) que se inducen cuando se diseña QQS en diversas especies. [22] En 2011, se realizó un estudio exhaustivo de todo el genoma sobre la extensión y los orígenes evolutivos de los genes huérfanos en las plantas en la planta modelo Arabidopsis thaliana " [23]
Los genes pueden clasificarse tentativamente como huérfanos si no se pueden encontrar proteínas ortólogas en especies cercanas. [10]
Un método utilizado para estimar la similitud de secuencias de nucleótidos o proteínas que indica homología (es decir, similitud debido a un origen común) es la herramienta de búsqueda de alineamiento local básico (BLAST). BLAST permite buscar rápidamente secuencias de consulta en bases de datos de secuencias grandes. [24] [25] Las simulaciones sugieren que, en determinadas condiciones, BLAST es adecuado para detectar parientes lejanos de un gen. [26] Sin embargo, BLAST puede pasar por alto fácilmente genes que son cortos y evolucionan rápidamente. [27]
La detección sistemática de homología para anotar genes huérfanos se llama filoestratigrafía. [28] La filoestratigrafía genera un árbol filogenético en el que se calcula la homología entre todos los genes de una especie focal y los genes de otras especies. El ancestro común más antiguo de un gen determina la edad, o filoestrato , del gen. El término "huérfano" a veces se usa solo para el filoestrato más joven que contiene solo una sola especie, pero cuando se interpreta ampliamente como un gen taxonómicamente restringido, puede referirse a todos los filoestratos excepto al más antiguo, con el gen huérfano dentro de un clado más grande.
La mayoría de los genes huérfanos clasificados se deben a fallos en la detección de homología. [8] Algunos científicos han intentado recuperar cierta homología mediante métodos más sensibles, como la detección de homología remota. En un estudio, se utilizaron técnicas de detección de homología remota para demostrar que una fracción considerable de genes huérfanos (más del 15%) todavía presentaban homología remota a pesar de que las técnicas de detección de homología convencionales no los detectaron, y que sus funciones a menudo estaban relacionadas con las funciones de genes cercanos en loci genómicos. [29]
Los genes huérfanos surgen de múltiples fuentes, predominantemente a través del origen de novo , la duplicación y la divergencia rápida, y la transferencia horizontal de genes. [2]
Los nuevos genes huérfanos surgen continuamente de novo a partir de secuencias no codificantes. [30] Estos nuevos genes pueden ser lo suficientemente beneficiosos como para ser arrastrados a la fijación por selección. O, más probablemente, se desvanecerán en el fondo no génico. Esta última opción está respaldada por la investigación en Drosophila que muestra que los genes jóvenes tienen más probabilidades de extinguirse. [31]
En el pasado, se creía que los genes de novo eran casi imposibles debido a las complejidades y potencialmente frágiles de la creación y el mantenimiento de polipéptidos funcionales, [18] pero las investigaciones de los últimos 10 años aproximadamente han encontrado múltiples ejemplos de genes de novo , algunos de los cuales están asociados con importantes procesos biológicos, en particular la función de los testículos en animales. También se encontraron genes de novo en hongos y plantas. [20] [32] [33] [5] [34] [35] [11] [36]
En el caso de genes huérfanos jóvenes, a veces es posible encontrar secuencias de ADN homólogas no codificantes en taxones hermanos, lo que generalmente se acepta como una prueba sólida de origen de novo . Sin embargo, la contribución del origen de novo a genes taxonómicamente restringidos de origen más antiguo, particularmente en relación con la teoría tradicional de duplicación génica de la evolución génica, sigue siendo controvertida. [37] [38] Desde el punto de vista logístico, el origen de novo es mucho más fácil para los genes de ARN que para los que codifican proteínas y Nathan H. Lents y sus colegas informaron recientemente de la existencia de varios genes de microARN jóvenes en el cromosoma humano 21. [ 39]
El modelo de duplicación y divergencia para genes huérfanos implica la creación de un nuevo gen a partir de algún evento de duplicación o divergencia y su paso por un período de rápida evolución en el que se pierde toda similitud detectable con el gen originalmente duplicado. [2] Si bien esta explicación es coherente con los conocimientos actuales sobre los mecanismos de duplicación, [2] la cantidad de mutaciones necesarias para perder la similitud detectable es lo suficientemente grande como para ser un evento raro, [2] [26] y el mecanismo evolutivo por el cual un gen duplicado podría ser secuestrado y divergir tan rápidamente sigue sin estar claro. [2] [40]
Otra explicación de cómo surgen los genes huérfanos es a través de un mecanismo de duplicación llamado transferencia horizontal de genes , donde el gen duplicado original deriva de un linaje separado y desconocido. [2] Esta explicación del origen de los genes huérfanos es especialmente relevante en bacterias y arqueas, donde la transferencia horizontal de genes es común.
Los genes huérfanos tienden a ser muy cortos (~6 veces más cortos que los genes maduros), y algunos se expresan débilmente, son específicos de tejido y más simples en el uso de codones y la composición de aminoácidos. [41] Los genes huérfanos tienden a codificar más proteínas intrínsecamente desordenadas , [42] [43] [44] aunque se ha encontrado cierta estructura en uno de los genes huérfanos mejor caracterizados. [45] De las decenas de miles de enzimas del metabolismo primario o especializado que se han caracterizado hasta la fecha, ninguna es huérfana, o incluso de linaje restringido; aparentemente, la catálisis requiere cientos de millones de años de evolución. [41]
Los genes huérfanos, que no tienen homólogos detectables en otras especies, representan un área fascinante de estudio en genómica. Su papel evolutivo y su importancia biológica siguen siendo temas de investigación y debate en curso. Los genes huérfanos son importantes en la evolución y la especiación debido al potencial para la producción de genes y funciones nuevos. [46] Se cree que los genes huérfanos desempeñan un papel crítico en la evolución de las especies, ya que permiten a los organismos responder a los cambios en su entorno y desarrollar nuevas adaptaciones rápidamente. [47]
Los genes huérfanos pueden tener diversas funciones, que van desde funciones metabólicas básicas hasta procesos reguladores complejos. Por ejemplo, algunos genes huérfanos están involucrados en la regulación del crecimiento y el desarrollo, mientras que otros desempeñan un papel en la respuesta a las tensiones ambientales. [48] Su papel evolutivo y su importancia biológica siguen siendo temas de investigación y debate en curso.
Algunos científicos proponen que muchos genes huérfanos podrían no desempeñar un papel evolutivo directo. Sostienen que los genomas contienen marcos de lectura abiertos (ORF) no funcionales que podrían producir polipéptidos espurios que no se mantienen mediante la selección natural. Es probable que dichos genes sean exclusivos de una especie porque no experimentan conservación entre especies, por lo que se los clasifica como genes huérfanos. [49]
Contrariamente a la opinión de que son ruido evolutivo, estudios emergentes han ilustrado la importancia funcional de los genes huérfanos:
Estos ejemplos confirman la funcionalidad de algunos genes huérfanos pero también sugieren su posible participación en el surgimiento de nuevos fenotipos, contribuyendo así a adaptaciones específicas de las especies.
Los genes huérfanos han despertado interés en múltiples disciplinas científicas, como la biología evolutiva y la medicina, debido a su naturaleza y sus posibles implicaciones. [52]
En biología evolutiva , los genes huérfanos divergen de los modelos tradicionales de evolución genética y proporcionan información valiosa sobre el proceso de origen de genes de novo y la adaptación específica de linaje. El término "gen de novo" denota específicamente la aparición de un gen funcional sin material genético ancestral, ya sea como un gen codificador de proteínas o una molécula de ARN funcional . [53] Esta comprensión de los genes de novo, junto con el estudio de los genes huérfanos, enriquece el modelo tradicional de evolución de Charles Darwin , también llamado darwinismo o teoría darwiniana, al revelar mecanismos adicionales a través de los cuales puede ocurrir la diversidad genética y la adaptación. Al aclarar que los genes de novo pueden surgir de secuencias no génicas y contribuir a la adaptación específica de linaje, esta investigación expande nuestra comprensión de las fuerzas creativas de la evolución, agregando profundidad y complejidad a los principios fundacionales de Darwin.
En medicina , los genes huérfanos representan un recurso rico aunque relativamente inexplorado que promete comprender la salud humana y abordar las enfermedades. Estos genes, que carecen de homólogos detectables en otros linajes, ofrecen oportunidades únicas para la investigación biomédica. [52] Al dilucidar las funciones y los mecanismos reguladores de los genes huérfanos, los investigadores pueden obtener conocimientos sobre varios aspectos de la salud humana. Los genes huérfanos pueden desempeñar papeles cruciales en enfermedades que se entienden poco o tienen orígenes genéticos desconocidos. El estudio de estos genes puede descubrir nuevos mecanismos de enfermedad y objetivos terapéuticos, allanando el camino para el desarrollo de estrategias de tratamiento innovadoras. Por nombrar algunos, el gen huérfano Gpr49 , identificado en humanos, se presenta como un posible objetivo terapéutico novedoso para combatir el carcinoma hepatocelular , la forma predominante de cáncer de hígado . [52] Además, el gen C19orf12 está implicado en la manifestación de un subtipo clínico particular de neurodegeneración caracterizada por la acumulación de hierro en el cerebro. [52] Se muestra un extracto de una tabla que enumera varios genes huérfanos en diversas especies junto con sus respectivas funciones. [52]
Los genes huérfanos tienen el potencial de servir como biomarcadores para el diagnóstico de enfermedades, el pronóstico y la respuesta al tratamiento. Su naturaleza específica de linaje y sus patrones de expresión pueden proporcionar información valiosa para los enfoques de medicina personalizada, lo que permite intervenciones más precisas y específicas para las personas afectadas por diversas enfermedades. Por lo tanto, aprovechar el potencial de los genes huérfanos para comprender la salud humana tiene implicaciones significativas para el avance de la investigación biomédica y la mejora de los resultados clínicos.