stringtranslate.com

Nacimiento de genes de novo

Los genes nuevos pueden surgir de regiones ancestrales no génicas a través de mecanismos poco comprendidos. (A) Una región no génica primero obtiene transcripción y un marco de lectura abierto (ORF), en cualquier orden, facilitando el nacimiento de un gen de novo . El ORF es solo para fines ilustrativos, ya que los genes de novo también pueden ser multiexónicos o carecer de un ORF, como ocurre con los genes de ARN . (B) Sobreimpresión. Se crea un ORF nuevo que se superpone con un ORF existente, pero en un marco diferente. (C) Exonización. Una región anteriormente intrónica se empalma alternativamente como un exón, como cuando se adquieren secuencias repetitivas a través de retroposición y se crean nuevos sitios de empalme a través de procesos mutacionales . La sobreimpresión y la exonización pueden considerarse casos especiales de nacimiento de genes de novo.
Los genes nuevos se pueden formar a partir de genes ancestrales mediante una variedad de mecanismos. [1] (A) Duplicación y divergencia. Después de la duplicación, una copia experimenta una selección relajada y gradualmente adquiere funciones nuevas. (B) Fusión génica. Un gen híbrido formado a partir de algunos o todos los dos genes previamente separados. Las fusiones génicas pueden ocurrir por diferentes mecanismos; aquí se muestra una deleción intersticial. (C) Fisión génica. Un solo gen se separa para formar dos genes distintos, como por duplicación y degeneración diferencial de las dos copias. [2] (D) Transferencia génica horizontal . Los genes adquiridos de otras especies por transferencia horizontal experimentan divergencia y neofuncionalización. (E) Retroposición. Las transcripciones pueden transcribirse de forma inversa e integrarse como un gen sin intrones en otra parte del genoma. Este nuevo gen puede luego experimentar divergencia.

El nacimiento de genes de novo es el proceso por el cual nuevos genes evolucionan a partir de ADN no codificante . [1] [3] Los genes de novo representan un subconjunto de genes nuevos y pueden codificar proteínas o, en cambio, actuar como genes de ARN. [4] Los procesos que gobiernan el nacimiento de genes de novo no se comprenden bien, aunque existen varios modelos que describen posibles mecanismos por los cuales puede ocurrir el nacimiento de genes de novo .

Aunque el nacimiento de genes de novo puede haber ocurrido en cualquier punto de la historia evolutiva de un organismo, los eventos de nacimiento de genes de novo antiguos son difíciles de detectar. La mayoría de los estudios de genes de novo hasta la fecha se han centrado en genes jóvenes, típicamente genes taxonómicamente restringidos (TRG) que están presentes en una sola especie o linaje, incluidos los llamados genes huérfanos , definidos como genes que carecen de cualquier homólogo identificable. Sin embargo, es importante señalar que no todos los genes huérfanos surgen de novo , y en su lugar pueden surgir a través de mecanismos bastante bien caracterizados, como la duplicación de genes (incluida la retroposición) o la transferencia horizontal de genes seguida de divergencia de secuencias, o por fisión/fusión de genes . [5] [6]

Aunque alguna vez se consideró que el nacimiento de genes de novo era un suceso altamente improbable, [7] ahora se han descrito varios ejemplos inequívocos, [8] y algunos investigadores especulan que el nacimiento de genes de novo podría desempeñar un papel importante en la innovación evolutiva, la especificación morfológica y la adaptación, [9] [10] probablemente promovido por su bajo nivel de pleiotropía .

Historia

Ya en la década de 1930, JBS Haldane y otros sugirieron que las copias de genes existentes pueden dar lugar a nuevos genes con funciones novedosas. [6] En 1970, Susumu Ohno publicó el texto seminal Evolution by Gene Duplication ( Evolución por duplicación de genes) . [11] Durante algún tiempo después, la opinión consensuada fue que prácticamente todos los genes se derivaban de genes ancestrales, [12] y François Jacob comentó en un ensayo de 1977 que "la probabilidad de que una proteína funcional aparezca de novo por asociación aleatoria de aminoácidos es prácticamente cero". [7]

Sin embargo, en el mismo año, Pierre-Paul Grassé acuñó el término " sobreimpresión " para describir la aparición de genes a través de la expresión de marcos de lectura abiertos alternativos (ORF) que se superponen a genes preexistentes. [13] Estos nuevos ORF pueden estar fuera de marco con el gen preexistente o ser antisentido con respecto a él. También pueden estar en marco con el ORF existente, creando una versión truncada del gen original, o representar extensiones 3' de un ORF existente en un ORF cercano. Los dos primeros tipos de sobreimpresión pueden considerarse un subtipo particular de nacimiento de genes de novo ; aunque se superponen con una región codificante previa del genoma, la secuencia primaria de aminoácidos de la nueva proteína es completamente nueva y se deriva de un marco que previamente no contenía un gen. Los primeros ejemplos de este fenómeno en bacteriófagos se informaron en una serie de estudios entre 1976 y 1978, [14] [15] [16] y desde entonces se han identificado numerosos otros ejemplos en virus, bacterias y varias especies eucariotas. [17] [18] [19] [20] [21] [22]

El fenómeno de la exonización también representa un caso especial de nacimiento de genes de novo , en el que, por ejemplo, secuencias intrónicas a menudo repetitivas adquieren sitios de empalme a través de la mutación, lo que da lugar a exones de novo . Esto se describió por primera vez en 1994 en el contexto de las secuencias Alu encontradas en las regiones codificantes de los ARNm de primates. [23] Curiosamente, dichos exones de novo se encuentran con frecuencia en variantes de empalme menores, lo que puede permitir la “prueba” evolutiva de secuencias nuevas al tiempo que se conserva la funcionalidad de la(s) variante(s) de empalme mayor. [24]

Aun así, algunos pensaban que la mayoría o todas las proteínas eucariotas se construían a partir de un grupo restringido de exones de "tipo inicial". [25] Utilizando los datos de secuencia disponibles en ese momento, una revisión de 1991 estimó que el número de exones eucariotas ancestrales únicos era < 60.000, [25] mientras que en 1992 se publicó un artículo que estimaba que la gran mayoría de las proteínas pertenecían a no más de 1.000 familias. [26] Sin embargo, casi al mismo tiempo, se publicó la secuencia del cromosoma III de la levadura en ciernes Saccharomyces cerevisiae , [27] lo que representó la primera vez que se había secuenciado un cromosoma completo de cualquier organismo eucariota. La secuenciación de todo el genoma nuclear de la levadura se completó a principios de 1996 mediante un esfuerzo internacional masivo y colaborativo. [28] En su revisión del proyecto del genoma de la levadura, Bernard Dujon señaló que la abundancia inesperada de genes que carecían de homólogos conocidos fue quizás el hallazgo más sorprendente de todo el proyecto. [28]

En 2006 y 2007, una serie de estudios proporcionaron posiblemente los primeros ejemplos documentados de nacimiento de genes de novo que no implicaron sobreimpresión. [29] [30] [31] Estos estudios se llevaron a cabo utilizando los transcriptomas de glándulas accesorias de Drosophila yakuba y Drosophila erecta e identificaron 20 genes putativos restringidos al linaje que parecían poco probables de haber resultado de la duplicación genética. [31] Levine y colegas identificaron y confirmaron cinco genes candidatos de novo específicos de Drosophila melanogaster y/o la estrechamente relacionada Drosophila simulans a través de un enfoque riguroso que combinó técnicas bioinformáticas y experimentales. [30]

Desde estos estudios iniciales, muchos grupos han identificado casos específicos de eventos de nacimiento de genes de novo en diversos organismos. [32] El primer gen de novo identificado en levadura, el gen BSC4, fue identificado en S. cerevisiae en 2008. Este gen muestra evidencia de selección purificadora, se expresa tanto a nivel de ARNm como de proteína, y cuando se elimina es sintéticamente letal con otros dos genes de levadura, todo lo cual indica un papel funcional para el producto del gen BSC4 . [33] Históricamente, un argumento en contra de la noción de nacimiento generalizado de genes de novo es la complejidad evolucionada del plegamiento de proteínas. Curiosamente, más tarde se demostró que Bsc4 adopta un estado parcialmente plegado que combina propiedades de plegamiento de proteínas nativas y no nativas. [34] En plantas, el primer gen de novo en ser caracterizado funcionalmente fue QQS , un gen de Arabidopsis thaliana identificado en 2009 que regula el metabolismo del carbono y el nitrógeno. [35] El primer gen de novo caracterizado funcionalmente identificado en ratones, un gen de ARN no codificante, también se describió en 2009. [36] En primates, un análisis informático de 2008 estimó que 15/270 genes huérfanos de primates se habían formado de novo . [37] Un informe de 2009 identificó los primeros tres genes humanos de novo , uno de los cuales es un objetivo terapéutico en la leucemia linfocítica crónica. [38] Desde entonces, una plétora de estudios a nivel del genoma han identificado grandes cantidades de genes huérfanos en muchos organismos, aunque el grado en el que surgieron de novo y el grado en el que pueden considerarse funcionales siguen siendo objeto de debate.

Identificación

Identificación deDe nuevosecuencias emergentes

Existen dos enfoques principales para la identificación sistemática de genes nuevos: la filoestratigrafía genómica [39] y los métodos basados ​​en la sintenia . [40] Ambos enfoques se utilizan ampliamente, de forma individual o de forma complementaria.

Filostratigrafía genómica

La filoestratigrafía genómica implica examinar cada gen en una especie focal o de referencia e inferir la presencia o ausencia de homólogos ancestrales mediante el uso de los algoritmos de alineamiento de secuencias BLAST [41] o herramientas relacionadas. A cada gen en la especie focal se le puede asignar una edad (también conocida como “nivel de conservación” o “filoestrato genómico”) que se basa en una filogenia predeterminada, con la edad correspondiente a la especie más distantemente relacionada en la que se detecta un homólogo. [39] Cuando un gen carece de cualquier homólogo detectable fuera de su propio genoma, o parientes cercanos, se dice que es un gen nuevo, taxonómicamente restringido o huérfano.

La filoestratigrafía está limitada por el conjunto de genomas estrechamente relacionados que están disponibles, y los resultados dependen de los criterios de búsqueda BLAST. [42] Además, a menudo es difícil determinar en función de la falta de similitud de secuencia observada si un gen nuevo ha surgido de novo o se ha desviado de un gen ancestral más allá del reconocimiento, por ejemplo, después de un evento de duplicación. Esto fue señalado por un estudio que simuló la evolución de genes de igual edad y encontró que los ortólogos distantes pueden ser indetectables para genes de rápida evolución. [43] Por otro lado, al tener en cuenta los cambios en la tasa de evolución en regiones jóvenes de genes, un enfoque filoestratigráfico fue más preciso para asignar edades de genes en datos simulados. [44] Estudios posteriores que utilizaron evolución simulada encontraron que la filoestratigrafía no pudo detectar un ortólogo en las especies más distantemente relacionadas para el 13,9% de los genes de D. melanogaster y el 11,4% de los genes de S. cerevisiae . [45] [46] Sin embargo, un nuevo análisis de estudios que utilizaron filoestratigrafía en levaduras, moscas de la fruta y humanos encontró que incluso al tener en cuenta dichas tasas de error y excluir los genes difíciles de estratificar de los análisis, las conclusiones cualitativas no se vieron afectadas. [47] El impacto del sesgo filoestratigráfico en los estudios que examinan varias características de los genes de novo sigue siendo objeto de debate.

Enfoques basados ​​en Synteny

Los enfoques basados ​​en la sintenia utilizan el orden y el posicionamiento relativo de los genes (u otras características) para identificar los ancestros potenciales de los genes candidatos de novo . [10] [42] Las alineaciones sinténicas están ancladas por "marcadores" conservados. Los genes son el marcador más común para definir los bloques sinténicos, aunque también se utilizan k-meros y exones. [48] [40] La confirmación de que la región sinténica carece de potencial de codificación en especies de grupos externos permite afirmar un origen de novo con mayor confianza. [42] La evidencia más sólida posible para la aparición de novo es la inferencia de la(s) mutación(es) "habilitantes" específicas que crearon el potencial de codificación, típicamente a través del análisis de regiones de secuencia más pequeñas, denominadas regiones microsinténicas, de especies estrechamente relacionadas.

Un desafío en la aplicación de métodos basados ​​en sintenia es que la sintenia puede ser difícil de detectar en escalas de tiempo más largas. Para abordar esto, se han creado varias técnicas de optimización, como el uso de exones agrupados independientemente de su orden específico para definir bloques sinténicos [40] o algoritmos que utilizan regiones genómicas bien conservadas para expandir bloques microsinténicos. [49] También existen dificultades asociadas con la aplicación de enfoques basados ​​en sintenia a ensamblajes genómicos que están fragmentados [50] o en linajes con altas tasas de reordenamientos cromosómicos, como es común en los insectos. [51] Los enfoques basados ​​en sintenia se pueden aplicar a estudios de todo el genoma de genes de novo [37] [38] [52] [53] [54] [55] [56] [57] y representan un área prometedora de desarrollo algorítmico para la datación de nacimiento de genes. Algunos han utilizado enfoques basados ​​en sintenia en combinación con búsquedas de similitud en un intento de desarrollar procesos estandarizados y estrictos [58] que puedan aplicarse a cualquier grupo de genomas en un intento de abordar discrepancias en las diversas listas de genes de novo que se han generado.

Determinación del estatus

Incluso cuando se ha establecido el origen evolutivo de una secuencia codificante particular, todavía no hay consenso sobre lo que constituye un evento genuino de nacimiento de un gen de novo . Una razón para esto es la falta de acuerdo sobre si la totalidad de la secuencia debe ser o no de origen no génico. Para los genes de novo que codifican proteínas , se ha propuesto que los genes de novo se dividan en subtipos en función de la proporción del ORF en cuestión que se derivó de una secuencia no codificante previa. [42] Además, para que se produzca el nacimiento de un gen de novo , la secuencia en cuestión debe ser un gen, lo que ha llevado a cuestionar lo que constituye un gen, con algunos modelos que establecen una dicotomía estricta entre secuencias génicas y no génicas, y otros que proponen un continuo más fluido. [59]

Todas las definiciones de genes están vinculadas a la noción de función, ya que se acepta generalmente que un gen genuino debe codificar un producto funcional, ya sea ARN o proteína. Sin embargo, existen diferentes puntos de vista sobre lo que constituye una función, dependiendo de si una secuencia dada se evalúa utilizando enfoques genéticos, bioquímicos o evolutivos. [42] [60] [61] [62] La ambigüedad del concepto de "función" es especialmente problemática para el campo del nacimiento de genes de novo , donde los objetos de estudio a menudo evolucionan rápidamente. [62] Para abordar estos desafíos, el Modelo de Función de Pittsburgh deconstruye "función" en cinco significados para describir las diferentes propiedades que adquiere un locus que experimenta un nacimiento de genes de novo : expresión, capacidades, interacciones, implicaciones fisiológicas e implicaciones evolutivas. [62]

En general, se acepta que un gen de novo genuino se expresa en al menos algún contexto, [5] lo que permite que opere la selección, y muchos estudios utilizan evidencia de expresión como criterio de inclusión para definir genes de novo . La expresión de secuencias a nivel de ARNm se puede confirmar individualmente a través de técnicas como PCR cuantitativa , o globalmente a través de secuenciación de ARN (RNA-seq) . De manera similar, la expresión a nivel de proteína se puede determinar con alta confianza para proteínas individuales utilizando técnicas como espectrometría de masas o transferencia Western , mientras que el perfil de ribosomas (Ribo-seq) proporciona un estudio global de la traducción en una muestra dada. Idealmente, para confirmar que un gen surgió de novo , también se demostraría una falta de expresión de la región sinténica de especies del grupo externo. [63]

Los enfoques genéticos para detectar un fenotipo específico o un cambio en la aptitud tras la interrupción de una secuencia particular son útiles para inferir una función. [61] También se pueden emplear otros enfoques experimentales, incluidas las pruebas de detección de interacciones proteína-proteína y/o genéticas, para confirmar un efecto biológico para un ORF de novo particular.

Se pueden emplear enfoques evolutivos para inferir la existencia de una función molecular a partir de firmas de selección derivadas computacionalmente. En el caso de los TRG, una firma común de selección es la relación de sustituciones no sinónimas a sinónimas ( relación dN/dS ), calculada a partir de diferentes especies del mismo taxón. De manera similar, en el caso de genes específicos de especies, se pueden utilizar datos de polimorfismo para calcular una relación pN/pS a partir de diferentes cepas o poblaciones de la especie focal. Dado que los genes de novo jóvenes y específicos de especies carecen de una conservación profunda por definición, detectar desviaciones estadísticamente significativas de 1 puede ser difícil sin un número irrealmente grande de cepas/poblaciones secuenciadas. Un ejemplo de esto se puede ver en Mus musculus , donde tres genes de novo muy jóvenes carecen de firmas de selección a pesar de roles fisiológicos bien demostrados. [64] Por esta razón, los enfoques pN/pS a menudo se aplican a grupos de genes candidatos, lo que permite a los investigadores inferir que al menos algunos de ellos están conservados evolutivamente, sin poder especificar cuáles. En cambio, se han empleado otras firmas de selección, como el grado de divergencia de nucleótidos dentro de las regiones sinténicas, la conservación de los límites de ORF o, para los genes codificadores de proteínas, una puntuación de codificación basada en frecuencias de hexámeros de nucleótidos. [65] [66]

Predominio

Estimaciones de números

Las estimaciones de frecuencia y número de genes de novo en varios linajes varían ampliamente y dependen en gran medida de la metodología. Los estudios pueden identificar genes de novo solo mediante métodos basados ​​en filoestratigrafía/BLAST, o pueden emplear una combinación de técnicas computacionales, y pueden o no evaluar evidencia experimental de expresión y/o papel biológico. [10] Además, los análisis a escala del genoma pueden considerar todos o la mayoría de los ORFs en el genoma, [59] o pueden, en cambio, limitar su análisis a genes previamente anotados.

El linaje de D. melanogaster es ilustrativo de estos diferentes enfoques. Un estudio temprano que utilizó una combinación de búsquedas BLAST realizadas en secuencias de ADNc junto con búsquedas manuales e información de sintenia identificó 72 nuevos genes específicos de D. melanogaster y 59 nuevos genes específicos de tres de las cuatro especies en el complejo de especies de D. melanogaster . Este informe encontró que solo 2/72 (~2,8%) de los nuevos genes específicos de D. melanogaster y 7/59 (~11,9%) de los nuevos genes específicos del complejo de especies se derivaron de novo , [56] y el resto surgió a través de duplicación/retroposición. De manera similar, un análisis de 195 genes jóvenes (<35 millones de años) de D. melanogaster identificados a partir de alineamientos sinténicos encontró que solo 16 habían surgido de novo . [54] Por el contrario, un análisis centrado en datos transcriptómicos de los testículos de seis cepas de D. melanogaster identificó 106 genes fijos y 142 segregantes de novo . [55] Para muchos de estos, se identificaron ORFs ancestrales pero no se expresaron. Un estudio más reciente encontró que hasta el 39 % de los genes huérfanos en el clado de Drosophila pueden haber surgido de novo , ya que se superponen con regiones no codificantes del genoma. [67] Destacando las diferencias entre las comparaciones inter e intra-especies, un estudio en poblaciones naturales de Saccharomyces paradoxus encontró que el número de polipéptidos de novo identificados era más del doble cuando se consideraba la diversidad intra-especies. [68] En primates, un estudio temprano identificó 270 genes huérfanos (únicos de humanos, chimpancés y macacos), de los cuales se pensaba que 15 se habían originado de novo . [37] Informes posteriores identificaron muchos más genes de novo solo en humanos que están respaldados por evidencia transcripcional y proteómica. [57] [69] Los estudios realizados en otros linajes/organismos también han llegado a conclusiones diferentes con respecto al número de genes de novo presentes en cada organismo, así como a los conjuntos específicos de genes identificados. En la siguiente tabla se describe una muestra de estos estudios a gran escala.

En términos generales, sigue habiendo debate sobre si la duplicación y divergencia o el nacimiento de genes de novo representan el mecanismo dominante para la aparición de nuevos genes, [54] [56] [59] [70] [71] [72] en parte porque es probable que los genes de novo surjan y se pierdan con mayor frecuencia que otros genes jóvenes. En un estudio sobre el origen de los genes huérfanos en tres linajes eucariotas diferentes, los autores descubrieron que, en promedio, solo alrededor del 30 % de los genes huérfanos se pueden explicar por la divergencia de secuencias. [72]

Dinámica

Es importante distinguir entre la frecuencia de nacimiento de genes de novo y el número de genes de novo en un linaje dado. Si el nacimiento de genes de novo es frecuente, se podría esperar que los genomas tendieran a crecer en su contenido genético con el tiempo; sin embargo, el contenido genético de los genomas suele ser relativamente estable. [10] Esto implica que un proceso frecuente de muerte genética debe equilibrar el nacimiento de genes de novo y, de hecho, los genes de novo se distinguen por su rápida renovación en relación con los genes establecidos. En apoyo de esta noción, los genes de Drosophila recientemente surgidos tienen muchas más probabilidades de perderse, principalmente a través de la pseudogenización , y los huérfanos más jóvenes se pierden a la tasa más alta; [73] esto a pesar del hecho de que se ha demostrado que algunos genes huérfanos de Drosophila se vuelven esenciales rápidamente. [54] Se observó una tendencia similar de pérdida frecuente entre familias de genes jóvenes en el género de nematodos Pristionchus . [74] De manera similar, un análisis de cinco transcriptomas de mamíferos encontró que la mayoría de los ORFs en ratones eran muy antiguos o específicos de la especie, lo que implica el nacimiento y muerte frecuentes de transcripciones de novo . [71] Una tendencia comparable podría mostrarse mediante análisis adicionales de seis transcriptomas de primates. [69] En poblaciones silvestres de S. paradoxus , los ORFs de novo emergen y se pierden a tasas similares. [68] Sin embargo, sigue habiendo una correlación positiva entre el número de genes específicos de la especie en un genoma y la distancia evolutiva desde su ancestro más reciente. [75] [67] También se encontró una rápida ganancia y pérdida de genes de novo a nivel de población al analizar nueve poblaciones naturales de espinosos de tres espinas. [76] Además del nacimiento y muerte de genes de novo a nivel del ORF, los procesos mutacionales y de otro tipo también someten a los genomas a una constante "renovación transcripcional". Un estudio en ratones descubrió que, si bien todas las regiones del genoma ancestral se transcribieron en algún momento en al menos un descendiente, la porción del genoma bajo transcripción activa en una cepa o subespecie dada está sujeta a cambios rápidos. [77] La ​​renovación transcripcional de los genes de ARN no codificantes es particularmente rápida en comparación con los genes codificantes. [78]

EjemplosDe nuevogenes

Características

Características generales

Los genes de novo que han surgido recientemente difieren de los genes establecidos en varias formas. En una amplia gama de especies, se ha informado que los genes jóvenes y/o taxonómicamente restringidos tienen una longitud más corta que los genes establecidos, tienen una carga más positiva, evolucionan más rápido, [88] y se expresan menos. [37] [59] [ 73] [74 ] [ 89] [90] [91] [92] [93] [94] [95] [96] [71 ] [69 ] [67] [76] [ citas excesivas ] Aunque estas tendencias podrían ser el resultado de un sesgo de detección de homología, un nuevo análisis de varios estudios que tuvieron en cuenta este sesgo encontró que las conclusiones cualitativas alcanzadas no se vieron afectadas. [47] Otra característica incluye la tendencia de los genes jóvenes a tener sus aminoácidos hidrofóbicos más agrupados cerca unos de otros a lo largo de la secuencia primaria. [97] [98]

También se ha descubierto que la expresión de genes jóvenes es más específica de tejido o condición que la de genes establecidos. [29] [31] [37] [55] [57] [59] [94] [99] [100] [101] [67] [76] En particular, se observó una expresión relativamente alta de genes de novo en tejidos reproductivos masculinos en Drosophila , espinoso, ratones y humanos, y en el cerebro humano. [57] [102] [67] [76] En animales con sistemas inmunes adaptativos, una mayor expresión en el cerebro y los testículos puede ser una función de la naturaleza inmunológicamente privilegiada de estos tejidos. Un análisis en ratones encontró una expresión específica de transcripciones intergénicas en el timo y el bazo (además del cerebro y los testículos). Se ha propuesto que en vertebrados las transcripciones de novo primero deben expresarse en tejidos que carecen de células inmunes antes de que puedan expresarse en tejidos que tienen vigilancia inmunológica. [101]

Tasa evolutiva

En el caso de la evolución de secuencias, los estudios de análisis dN/dS a menudo indican que los genes de novo evolucionan a un ritmo mayor en comparación con otros genes. [103] [88] En el caso de la evolución de la expresión y la evolución estructural, los estudios cuantitativos en diferentes edades evolutivas o ramas filoestratigráficas son muy pocos.

Características que promuevenDe nuevonacimiento genético

También es interesante comparar las características de los genes de novo recientemente surgidos con el conjunto de ORFs no génicos de los que surgen. El modelado teórico ha demostrado que tales diferencias son el producto tanto de la selección de características que aumentan la probabilidad de funcionalización como de fuerzas evolutivas neutrales que influyen en el recambio alélico. [104] Los experimentos en S. cerevisiae mostraron que los dominios transmembrana predichos estaban fuertemente asociados con efectos beneficiosos de aptitud cuando se sobreexpresaban ORFs jóvenes, pero no cuando se sobreexpresaban ORFs establecidos (más viejos). [105] Los experimentos en E. coli mostraron que los péptidos aleatorios tendían a tener efectos más benignos cuando se enriquecían con aminoácidos que eran pequeños y que promovían el desorden estructural intrínseco. [106]

Características dependientes del linaje

Las características de los genes de novo pueden depender de la especie o el linaje que se esté examinando. Esto parece ser en parte resultado de la variación del contenido de GC en los genomas y de que los genes jóvenes tienen más similitud con las secuencias no génicas del genoma en el que surgieron que los genes establecidos. [107] Las características de la proteína resultante, como el porcentaje de residuos transmembrana y la frecuencia relativa de varias características estructurales secundarias predichas , muestran una fuerte dependencia de GC en los genes huérfanos, mientras que en los genes más antiguos estas características están influenciadas solo débilmente por el contenido de GC. [107]

La relación entre la edad del gen y la cantidad de desorden estructural intrínseco (ISD) predicho en las proteínas codificadas ha sido objeto de un debate considerable. Se ha afirmado que el ISD también es una característica dependiente del linaje, ejemplificada por el hecho de que en organismos con un contenido de GC relativamente alto, que van desde D. melanogaster hasta el parásito Leishmania major , los genes jóvenes tienen un alto ISD, [108] [109] mientras que en un genoma de bajo GC como la levadura en ciernes, varios estudios han demostrado que los genes jóvenes tienen bajo ISD. [59] [89] [96] [107] Sin embargo, un estudio que excluyó genes jóvenes con evidencia dudosa de funcionalidad, definidos en términos binarios como estar bajo selección para retención de genes, encontró que los genes de levadura jóvenes restantes tienen alto ISD, lo que sugiere que el resultado de la levadura puede deberse a la contaminación del conjunto de genes jóvenes con ORFs que no cumplen con esta definición y, por lo tanto, es más probable que tengan propiedades que reflejen el contenido de GC y otras características no génicas del genoma. [110] Más allá de los huérfanos más jóvenes, este estudio encontró que la ISD tiende a disminuir con el aumento de la edad del gen, y que esto se debe principalmente a la composición de aminoácidos en lugar del contenido de GC. [110] Dentro de escalas de tiempo más cortas, el uso de genes de novo que tienen la mayor validación sugiere que los genes más jóvenes están más desordenados en Lachancea , pero menos desordenados en Saccharomyces . [96] El desorden estructural intrínseco y la propensión a la agregación no mostraron diferencias significativas con la edad en algunos estudios de mamíferos [71] y primates, [69] pero sí en otros estudios de mamíferos. [110] Un estudio grande de la base de datos completa del dominio de proteína Pfam mostró un enriquecimiento del dominio de proteína más joven para aminoácidos promotores de desorden en animales, pero un enriquecimiento sobre la base de la disponibilidad de aminoácidos en plantas. [98]

Papel de las modificaciones epigenéticas

Un examen de genes de novo en A. thaliana encontró que ambos están hipermetilados y generalmente desprovistos de modificaciones de histonas . [53] De acuerdo con el modelo proto-gen o la contaminación con no genes, los niveles de metilación de los genes de novo fueron intermedios entre los genes establecidos y las regiones intergénicas. Los patrones de metilación de estos genes de novo se heredan de forma estable, y los niveles de metilación fueron más altos, y más similares a los genes establecidos, en genes de novo con capacidad verificada de codificación de proteínas. [53] En el hongo patógeno Magnaporthe oryzae , los genes menos conservados tienden a tener patrones de metilación asociados con bajos niveles de transcripción. [111] Un estudio en levaduras también encontró que los genes de novo se enriquecen en puntos calientes de recombinación , que tienden a ser regiones libres de nucleosomas. [96]

En Pristionchus pacificus , los genes huérfanos con expresión confirmada muestran estados de cromatina que difieren de los de los genes establecidos expresados ​​de manera similar. [95] Los sitios de inicio de genes huérfanos tienen firmas epigenéticas que son características de los potenciadores, en contraste con los genes conservados que exhiben promotores clásicos. [95] Muchos genes huérfanos no expresados ​​están decorados con modificaciones represivas de histonas, mientras que la falta de tales modificaciones facilita la transcripción de un subconjunto expresado de huérfanos, lo que respalda la noción de que la cromatina abierta promueve la formación de genes nuevos. [95]

Evolución estructural

Las proteínas de novo suelen presentar estructuras secundarias y tridimensionales menos definidas, a menudo sin plegamiento rígido pero con extensas regiones desordenadas. [103] [110] Aún faltan análisis cuantitativos sobre la evolución de los elementos estructurales secundarios y las estructuras terciarias a lo largo del tiempo. Como la estructura suele estar más conservada que la secuencia, la comparación de estructuras entre ortólogos podría proporcionar información más profunda sobre la aparición y evolución de genes de novo y ayudar a confirmar que estos genes son verdaderos genes de novo . [112] Sin embargo, hasta ahora solo se han caracterizado estructural y funcionalmente muy pocas proteínas de novo , especialmente debido a problemas con la purificación de proteínas y la estabilidad posterior. Se han logrado avances utilizando diferentes etiquetas de purificación, tipos de células y chaperonas. [113]

La 'glicoproteína anticongelante' (AFGP) en los bacalaos del Ártico evita que su sangre se congele en aguas árticas. [84] [83] Se ha demostrado que Bsc4, una proteína de novo corta no esencial en la levadura, [33] está construida principalmente por láminas β y tiene un núcleo hidrofóbico. [34] Está asociada a la reparación del ADN en condiciones deficientes de nutrientes. [114] La proteína de novo Goddard de Drosophila se ha caracterizado por primera vez en 2017. Las moscas macho de Knockdown Drosophila melanogaster no pudieron producir esperma. [80] Recientemente, se pudo demostrar que esta falta se debía a un fallo en la individualización de las espermátidas alargadas. Mediante el uso de predicciones filogenómicas y estructurales computacionales, análisis estructurales experimentales y ensayos biológicos celulares, se propuso que la mitad de la estructura de Goddard está desordenada y la otra mitad está compuesta por aminoácidos alfa-helicoidales. Estos análisis también indicaron que los ortólogos de Goddard muestran resultados similares. Por lo tanto, la estructura de Goddard parece haberse conservado principalmente desde su aparición. [81]

Mecanismos

Expresión generalizada

Con el desarrollo de tecnologías como RNA-seq y Ribo-seq, ahora se sabe que los genomas eucariotas se transcriben de manera generalizada [115] [116] [117] [118] y se traducen. [119] Muchos ORFs que no están anotados o están anotados como ARN largos no codificantes (lncRNA), se traducen en algún nivel, ya sea de manera específica de una condición o de un tejido. [59] [119] [120] [121] [122] [123] Aunque poco frecuentes, estos eventos de traducción exponen la secuencia no génica a la selección. Esta expresión generalizada forma la base de varios modelos que describen el nacimiento de genes de novo .

Se ha especulado que el paisaje epigenético de los genes de novo en las primeras etapas de formación puede ser particularmente variable entre poblaciones y entre ellas, lo que resulta en una expresión génica variable que permite que los genes jóvenes exploren el "paisaje de expresión". [124] El gen QQS en A. thaliana es un ejemplo de este fenómeno; su expresión está regulada negativamente por la metilación del ADN que, si bien es hereditaria durante varias generaciones, varía ampliamente en sus niveles tanto entre accesiones naturales como dentro de poblaciones silvestres. [124] La epigenética también es en gran medida responsable del entorno transcripcional permisivo en los testículos, particularmente a través de la incorporación a los nucleosomas de variantes de histonas no canónicas que son reemplazadas por protaminas similares a las histonas durante la espermatogénesis. [125]

ORFs intergénicos como módulos estructurales elementales

El análisis de la diversidad potencial de plegamiento muestra que se predice que la mayoría de las secuencias de aminoácidos codificadas por los ORFs intergénicos de S. cerevisiae son plegables. [126] Más importante aún, estas secuencias de aminoácidos con potencial de plegamiento pueden servir como bloques de construcción elementales para genes de novo o integrarse en genes preexistentes. [126]

Orden de eventos

Para que se produzca el nacimiento de un gen codificador de proteínas de novo , una secuencia no génica debe transcribirse y adquirir un ORF antes de traducirse. Estos eventos podrían ocurrir en cualquier orden, y hay evidencia que respalda tanto un modelo de "ORF primero" como un modelo de "transcripción primero". [5] [127] Un análisis de genes de novo que se segregan en D. melanogaster encontró que las secuencias que se transcriben tenían un potencial de codificación similar a las secuencias ortólogas de líneas que carecen de evidencia de transcripción. [55] Este hallazgo respalda la noción de que pueden existir muchos ORF antes de ser transcritos. El gen de la glucoproteína anticongelante AFGP , que surgió de novo en los bacalaos del Ártico, proporciona un ejemplo más definitivo en el que se demostró que la aparición de novo del ORF precede a la región promotora. [83] Además, los ORF supuestamente no génicos lo suficientemente largos como para codificar péptidos funcionales son numerosos en los genomas eucariotas, y se espera que ocurran con alta frecuencia por casualidad. [55] [59] Mediante el rastreo de la historia evolutiva de las secuencias ORF y la activación de la transcripción de genes humanos de novo , un estudio mostró que algunos ORF estaban listos para conferir importancia biológica desde su nacimiento. [127] Al mismo tiempo, la transcripción de genomas eucariotas es mucho más extensa de lo que se pensaba anteriormente, y hay ejemplos documentados de regiones genómicas que se transcribieron antes de la aparición de un ORF que se convirtió en un gen de novo . [79] La proporción de genes de novo que codifican proteínas es desconocida, pero la aparición de la “transcripción primero” ha llevado a algunos a postular que los genes de novo que codifican proteínas pueden existir primero como intermediarios de genes de ARN. El caso de los ARN bifuncionales, que se traducen y funcionan como genes de ARN, muestra que tal mecanismo es plausible. [128]

Los dos eventos pueden ocurrir simultáneamente cuando el reordenamiento cromosómico es el evento que precipita el nacimiento del gen. [129]

Modelos

Se han descrito varios modelos teóricos y posibles mecanismos de nacimiento de genes de novo . Los modelos generalmente no son mutuamente excluyentes, y es posible que múltiples mecanismos puedan dar lugar a genes de novo . [42] Un ejemplo es el gen de la proteína anticongelante tipo III, que se origina a partir de un antiguo gen de la sintasa del ácido siálico ( SAS ), en un pez zoárcido antártico.

Hipótesis de “fuera de testículo”

Un estudio de caso temprano de nacimiento de genes de novo , que identificó cinco genes de novo en D. melanogaster , notó la expresión preferencial de estos genes en los testículos, [30] y se identificaron varios genes de novo adicionales utilizando datos transcriptómicos derivados de los testículos y las glándulas accesorias masculinas de D. yakuba y D. erecta . [29] [31] Esto concuerda con otros estudios que mostraron que hay una rápida evolución de los genes relacionados con la reproducción en una variedad de linajes, [130] [131] [132] lo que sugiere que la selección sexual puede desempeñar un papel clave en la evolución adaptativa y el nacimiento de genes de novo . Un análisis posterior a gran escala de seis cepas de D. melanogaster identificó 248 genes de novo expresados ​​en los testículos , de los cuales ~57% no estaban fijados. [55] Un estudio reciente sobre doce especies de Drosophila identificó además una mayor proporción de genes de novo con expresión sesgada en los testículos en comparación con el proteoma anotado. [67] Se ha sugerido que la gran cantidad de genes de novo con expresión específica masculina identificados en Drosophila probablemente se debe al hecho de que dichos genes se retienen preferentemente en relación con otros genes de novo , por razones que no están del todo claras. [73] Curiosamente, se demostró que dos supuestos genes de novo en Drosophila ( Goddard y Saturn ) eran necesarios para la fertilidad masculina normal. [80] [81] Una pantalla genética de más de 40 supuestos genes de novo con expresión enriquecida en testículos en Drosophila melanogaster reveló que uno de los genes de novo, atlas , era necesario para la condensación adecuada de la cromatina durante las etapas finales de la espermatogénesis en el macho. atlas evolucionó a partir de la fusión de un gen codificador de proteínas que surgió en la base del género Drosophila y un ARN no codificante conservado. [133] El análisis comparativo de los transcriptomas de los testículos y las glándulas accesorias, un tejido somático de los machos que es importante para la fertilidad, de D. melanogaster sugiere que los genes de novo hacen una mayor contribución a la complejidad transcriptómica de los testículos en comparación con las glándulas accesorias. [134] Secuenciación de ARN de una sola célula de D. melanogasterLos testículos revelaron que el patrón de expresión de genes de novo estaba sesgado hacia la espermatogénesis temprana. [135]

En los seres humanos, un estudio que identificó 60 genes de novo específicos de los humanos descubrió que su expresión promedio, medida por RNA-seq, era más alta en los testículos. [57] Otro estudio que examinó los genes específicos de los mamíferos de manera más general también encontró una expresión enriquecida en los testículos. [136] Se cree que la transcripción en los testículos de los mamíferos es particularmente promiscua, debido en parte a la expresión elevada de la maquinaria de transcripción [137] [138] y un entorno de cromatina abierto. [139] Junto con la naturaleza inmunológicamente privilegiada de los testículos, se cree que esta transcripción promiscua crea las condiciones ideales para la expresión de secuencias no génicas requeridas para el nacimiento de genes de novo . La expresión específica de los testículos parece ser una característica general de todos los genes nuevos, ya que un análisis de Drosophila y especies de vertebrados encontró que los genes jóvenes mostraban una expresión sesgada hacia los testículos independientemente de su mecanismo de origen. [99]

Modelo de preadaptación

El modelo de preadaptación del nacimiento de genes de novo utiliza modelos matemáticos para mostrar que cuando las secuencias que normalmente están ocultas se exponen a una selección débil o protegida, el conjunto resultante de secuencias "crípticas" (es decir, protogenes) se puede purgar de variantes "evidentemente perjudiciales", como las que tienden a conducir a la agregación de proteínas, y así enriquecerse en adaptaciones potenciales en relación con un conjunto de secuencias completamente no expresadas y no purgadas. [140] Esta revelación y purga de secuencias no genéticas deletéreas crípticas es un subproducto de la transcripción y traducción generalizadas de secuencias intergénicas, y se espera que facilite el nacimiento de genes codificadores de proteínas de novo funcionales. [122] Esto se debe a que al eliminar las variantes más perjudiciales, lo que queda es, mediante un proceso de eliminación, más propenso a ser adaptativo de lo esperado a partir de secuencias aleatorias. Utilizando la definición evolutiva de función (es decir, que un gen está por definición bajo selección purificadora contra la pérdida), el modelo de preadaptación supone que “el nacimiento de un gen es una transición repentina a la funcionalidad” [110] que ocurre tan pronto como un ORF adquiere un efecto beneficioso neto. Para evitar ser perjudiciales, se espera que los genes recién nacidos muestren versiones exageradas de las características génicas asociadas con la evitación del daño. Esto contrasta con el modelo de proto-gen, que espera que los genes recién nacidos tengan características intermedias entre los genes antiguos y los no genes. [110]

Las matemáticas del modelo de preadaptación suponen que la distribución de los efectos de la aptitud es bimodal, con nuevas secuencias de mutaciones que tienden a romper algo o a modificarlo, pero rara vez en el medio. [140] [141] Siguiendo esta lógica, las poblaciones pueden desarrollar soluciones locales, en las que la selección opera en cada locus individual y se mantiene una tasa de error relativamente alta, o una solución global con una tasa de error baja que permite la acumulación de secuencias crípticas deletéreas. [140] Se cree que el nacimiento de genes de novo se favorece en poblaciones que desarrollan soluciones locales, ya que la tasa de error relativamente alta dará como resultado un conjunto de variación críptica que se "preadapta" a través de la purga de secuencias deletéreas. Las soluciones locales son más probables en poblaciones con un tamaño de población efectivo alto .

En apoyo del modelo de preadaptación, un análisis de ISD en ratones y levaduras encontró que los genes jóvenes tienen un ISD más alto que los genes viejos, mientras que las secuencias no génicas aleatorias tienden a mostrar los niveles más bajos de ISD. [110] Aunque la tendencia observada puede haber resultado en parte de un subconjunto de genes jóvenes derivados por sobreimpresión, [142] también se observa un ISD más alto en genes jóvenes entre pares de genes virales superpuestos. [143] Con respecto a otras características estructurales predichas, como el contenido de la cadena β y la propensión a la agregación, los péptidos codificados por protogenes son similares a las secuencias no génicas y categóricamente distintos de los genes canónicos. [144]

Modelo protogen

Este modelo de proto-gen concuerda con el modelo de preadaptación sobre la importancia de la expresión generalizada, y se refiere al conjunto de secuencias expresadas de forma generalizada que no cumplen todas las definiciones de un gen como “proto-genes”. [59] En contraste con el modelo de preadaptación, el modelo de proto-gen sugiere que los genes recién nacidos tienen características intermedias entre los genes antiguos y los no genes. [110] Específicamente, este modelo prevé un proceso más gradual bajo selección desde el estado no génico al génico, rechazando la clasificación binaria de gen y no gen.

En una extensión del modelo de protogenes, se ha propuesto que a medida que los protogenes se vuelven más similares a los genes, su potencial para el cambio adaptativo da paso a efectos seleccionados; por lo tanto, el impacto previsto de las mutaciones en la aptitud depende del estado evolutivo del ORF. [105] Esta noción está respaldada por el hecho de que la sobreexpresión de ORFs establecidos en S. cerevisiae tiende a ser menos beneficiosa (y más dañina) que la sobreexpresión de ORFs emergentes. [105]

Varias características de los ORF se correlacionan con la edad de los ORF, determinada mediante análisis filoestratigráficos, y los ORF jóvenes tienen propiedades intermedias entre los ORF antiguos y los no genes; esto se ha tomado como evidencia a favor del modelo protogenético, en el que el estado protogenético es un continuo. [59] Esta evidencia ha sido criticada, porque también se esperan las mismas tendencias aparentes bajo un modelo en el que la identidad como gen es binaria. Bajo este modelo, cuando cada grupo de edad contiene una proporción diferente de genes frente a no genes, la paradoja de Simpson puede generar correlaciones en la dirección equivocada. [110]

Modelo de crecimiento lento y muda

El modelo de “crecimiento lento y muda” describe un mecanismo potencial de nacimiento de genes de novo , particular para los genes codificadores de proteínas. En este escenario, los ORFs codificadores de proteínas existentes se expanden en sus extremos, especialmente sus extremos 3', lo que lleva a la creación de nuevos dominios N- y C-terminales. [145] [146] [147] [148] [149] Los nuevos dominios C-terminales pueden evolucionar primero bajo selección débil a través de la expresión ocasional a través de la traducción de lectura continua, como en el modelo de preadaptación, y luego expresarse de manera constitutiva a través de una mutación que interrumpe el codón de terminación. [140] [146] Los genes que experimentan una alta lectura continua de la traducción tienden a tener C-terminales intrínsecamente desordenados. [150] Además, los genes existentes a menudo están cerca de secuencias repetitivas que codifican dominios desordenados. Estos nuevos dominios desordenados pueden conferir inicialmente cierta capacidad de unión no específica que se refina gradualmente por selección. Las secuencias que codifican estos nuevos dominios pueden ocasionalmente separarse de su ORF original, lo que conduce o contribuye a la creación de un gen de novo . [146] Curiosamente, un análisis de 32 genomas de insectos encontró que los nuevos dominios (es decir, aquellos exclusivos de los insectos) tienden a evolucionar de manera bastante neutral, con solo unos pocos sitios bajo selección positiva, mientras que sus proteínas hospedantes permanecen bajo selección purificadora, lo que sugiere que los nuevos dominios funcionales emergen gradualmente y algo estocásticamente. [151]

Escapar del conflicto adaptativo

El modelo evolutivo de escape del conflicto adaptativo (EAC) propone una forma posible de fijar la nueva duplicación de genes: el conflicto debido a una función contrastante dentro de un solo gen impulsa la fijación de una nueva duplicación. [152] [153]

Modelo de barrera de pleiotropía

El modelo de "barrera de pleiotropía" sugiere que los genes recientemente evolucionados, incluidos los genes de novo y los genes relacionados con la duplicación, podrían facilitar la innovación evolutiva o la evolución de funciones específicas debido a su bajo (o nulo) efecto pleiotrópico , cuando se enfrentan a una nueva fuerza selectiva, según observaciones de datos de genes y enfermedades humanas.

Salud humana

Además de su importancia para el campo de la biología evolutiva, el nacimiento de genes de novo tiene implicaciones para la salud humana. Se ha especulado que los genes nuevos, incluidos los genes de novo , pueden desempeñar un papel descomunal en los rasgos específicos de las especies; [6] [10] [32] [154] sin embargo, muchos genes específicos de las especies carecen de anotación funcional. [136] No obstante, hay evidencia que sugiere que los genes de novo específicos de los humanos están involucrados en enfermedades como el cáncer. NYCM , un gen de novo exclusivo de los humanos y los chimpancés, regula la patogénesis de los neuroblastomas en modelos de ratón, [155] y el PART1 específico de los primates , un gen lncRNA, ha sido identificado como un supresor de tumores y un oncogén en diferentes contextos. [37] [156] [157] Varios otros genes de novo específicos de humanos o primates , incluidos PBOV1 , [158] GR6 , [159] [160] MYEOV , [161] ELFN1-AS1 , [162] y CLLU1 , [38] también están vinculados al cáncer. Algunos incluso han sugerido considerar los genes evolutivamente nuevos expresados ​​específicamente en tumores como su propia clase de elementos genéticos, señalando que muchos de estos genes están bajo selección positiva y pueden ser neofuncionalizados en el contexto de los tumores. [162]

La expresión específica de muchos genes de novo en el cerebro humano [57] también plantea la intrigante posibilidad de que los genes de novo influyan en los rasgos cognitivos humanos. Un ejemplo de ello es FLJ33706 , un gen de novo que se identificó en GWAS y análisis de ligamiento para la adicción a la nicotina y muestra una expresión elevada en los cerebros de pacientes con Alzheimer. [163] En términos generales, la expresión de genes jóvenes específicos de primates se enriquece en el cerebro humano fetal en relación con la expresión de genes igualmente jóvenes en el cerebro del ratón. [164] La mayoría de estos genes jóvenes, varios de los cuales se originaron de novo , se expresan en el neocórtex, que se cree que es responsable de muchos aspectos de la cognición específica humana. Muchos de estos genes jóvenes muestran firmas de selección positiva, y las anotaciones funcionales indican que están involucrados en diversos procesos moleculares, pero están enriquecidos con factores de transcripción. [164]

Además de su papel en los procesos cancerosos, los genes humanos de origen de novo se han visto implicados en el mantenimiento de la pluripotencia [165] y en la función inmunológica. [37] [136] [166] La expresión preferencial de genes de novo en los testículos también sugiere un papel en la reproducción. Dado que la función de muchos genes humanos de novo sigue sin caracterizarse, parece probable que siga aumentando la apreciación de su contribución a la salud y el desarrollo humanos.

Estudios a escala genómica de células huérfanas yDe nuevogenes en varios linajes.

Nota: Para los fines de esta tabla, los genes se definen como genes huérfanos (cuando son específicos de una especie) o TRG (cuando se limitan a un grupo de especies estrechamente relacionadas) cuando no se ha investigado el mecanismo de origen, y como genes de novo cuando se ha inferido el origen de novo , independientemente del método de inferencia. La designación de genes de novo como “candidatos” o “protogenes” refleja el lenguaje utilizado por los autores de los respectivos estudios.

Véase también

Referencias

Este artículo fue adaptado de la siguiente fuente bajo una licencia CC BY 4.0 (2019) (informes de los revisores): Stephen Branden Van Oss; Anne-Ruxandra Carvunis (23 de mayo de 2019). "Nacimiento de genes de novo". PLOS Genetics . 15 (5): e1008160. doi : 10.1371/JOURNAL.PGEN.1008160 . ISSN  1553-7390. PMC  6542195 . PMID  31120894. Wikidata  Q86320144.

  1. ^ ab Long M, Betrán E, Thornton K, Wang W (noviembre de 2003). "El origen de los nuevos genes: visiones desde los jóvenes y los viejos". Nature Reviews Genetics . 4 (11): 865–75. doi :10.1038/nrg1204. PMID  14634634. S2CID  33999892.
  2. ^ Wang W, Yu H, Long M (mayo de 2004). "Duplicación-degeneración como mecanismo de fisión génica y origen de nuevos genes en especies de Drosophila". Nature Genetics . 36 (5): 523–7. doi : 10.1038/ng1338 . PMID  15064762.
  3. ^ Levy A (octubre de 2019). «Cómo la evolución construye genes desde cero». Nature . 574 (7778): 314–316. Bibcode :2019Natur.574..314L. doi : 10.1038/d41586-019-03061-x . PMID  31619796.
  4. ^ Schmitz JF, Bornberg-Bauer E (2017). "Realidad o ficción: actualizaciones sobre cómo los genes codificadores de proteínas podrían surgir de novo a partir de ADN previamente no codificante". F1000Research . 6 : 57. doi : 10.12688/f1000research.10079.1 . PMC 5247788 . PMID  28163910. 
  5. ^ abc Schlötterer C (abril de 2015). "Genes desde cero: el destino evolutivo de los genes de novo". Tendencias en genética . 31 (4): 215–9. doi :10.1016/j.tig.2015.02.007. PMC 4383367 . PMID  25773713. 
  6. ^ abc Kaessmann H (octubre de 2010). "Orígenes, evolución e impacto fenotípico de nuevos genes". Genome Research . 20 (10): 1313–26. doi :10.1101/gr.101386.109. PMC 2945180 . PMID  20651121. 
  7. ^ ab Jacob F (junio de 1977). "Evolución y experimentación". Science . 196 (4295): 1161–1166. Bibcode :1977Sci...196.1161J. doi :10.1126/science.860134. PMID  860134. S2CID  29756896.
  8. ^ Van Oss SB, Carvunis AR (mayo de 2019). "Nacimiento de genes de novo". PLOS Genetics . 15 (5): e1008160. doi : 10.1371/journal.pgen.1008160 . PMC 6542195 . PMID  31120894. 
  9. ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (septiembre de 2009). "Más que huérfanos: ¿son importantes en la evolución los genes taxonómicamente restringidos?". Trends in Genetics . 25 (9): 404–413. doi :10.1016/j.tig.2009.07.006. PMID  19716618.
  10. ^ abcde Tautz D, Domazet-Lošo T (agosto de 2011). "El origen evolutivo de los genes huérfanos". Nature Reviews. Genética . 12 (10): 692–702. doi :10.1038/nrg3053. PMID  21878963. S2CID  31738556.
  11. ^ Ohno S (1970) Evolución por duplicación genética Allen & Unwin ; Springer-Verlag
  12. ^ Tautz D (2014). "El descubrimiento de la evolución de genes de novo". Perspectivas en biología y medicina . 57 (1): 149–61. doi :10.1353/pbm.2014.0006. hdl : 11858/00-001M-0000-0024-3416-1 . PMID  25345708. S2CID  29552265.
  13. ^ Grassé PP (1977) Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación Academic Press
  14. ^ Barrell BG, Air GM, Hutchison CA (noviembre de 1976). "Superposición de genes en el bacteriófago phiX174". Nature . 264 (5581): 34–41. Bibcode :1976Natur.264...34B. doi :10.1038/264034a0. PMID  1004533. S2CID  4264796.
  15. ^ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (abril de 1978). "Gene K, un nuevo gen superpuesto en el bacteriófago G4". Nature . 272 ​​(5653): 510–5. Bibcode :1978Natur.272..510S. doi :10.1038/272510a0. PMID  692656. S2CID  4218777.
  16. ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Nature . 265 (5596): 687–95. Bibcode :1977Natur.265..687S. doi :10.1038/265687a0. PMID  870828. S2CID  4206886.
  17. ^ Keese PK, Gibbs A (octubre de 1992). "Orígenes de los genes: ¿"big bang" o creación continua?". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Bibcode :1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . PMC 50157 . PMID  1329098. 
  18. ^ Ohno S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia codificante internamente repetitiva preexistente". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Bibcode :1984PNAS...81.2421O. doi : 10.1073/pnas.81.8.2421 . PMC 345072 . PMID  6585807. 
  19. ^ Sabath N, Wagner A, Karlin D (diciembre de 2012). "Evolución de proteínas virales originadas de novo por sobreimpresión". Biología molecular y evolución . 29 (12): 3767–80. doi :10.1093/molbev/mss179. PMC 3494269 . PMID  22821011. 
  20. ^ Makałowska I, Lin CF, Hernandez K (octubre de 2007). "Nacimiento y muerte de superposiciones de genes en vertebrados". BMC Evolutionary Biology . 7 (1): 193. Bibcode :2007BMCEE...7..193M. doi : 10.1186/1471-2148-7-193 . PMC 2151771 . PMID  17939861. 
  21. ^ Samandi S, Roy AV, Delcourt V, Lucier JF, Gagnon J, Beaudoin MC, et al. (octubre de 2017). "La anotación profunda del transcriptoma permite el descubrimiento y la caracterización funcional de pequeñas proteínas crípticas". eLife . 6 . doi : 10.7554/eLife.27860 . PMC 5703645 . PMID  29083303. 
  22. ^ ab Khan YA, Jungreis I, Wright JC, Mudge JM, Choudhary JS, Firth AE, Kellis M (marzo de 2020). "Evidencia de una nueva secuencia de codificación superpuesta en POLG iniciada en un codón de inicio CUG". BMC Genetics . 21 (1): 25. doi : 10.1186/s12863-020-0828-7 . PMC 7059407 . PMID  32138667. 
  23. ^ Makałowski W, Mitchell GA, Labuda D (junio de 1994). "Secuencias Alu en las regiones codificantes del ARNm: una fuente de variabilidad proteica". Tendencias en genética . 10 (6): 188–93. doi :10.1016/0168-9525(94)90254-2. PMID  8073532.
  24. ^ Sorek R (octubre de 2007). "El nacimiento de nuevos exones: mecanismos y consecuencias evolutivas". ARN . 13 (10): 1603–8. doi :10.1261/rna.682507. PMC 1986822 . PMID  17709368. 
  25. ^ ab Dorit RL, Gilbert W (diciembre de 1991). "El universo limitado de los exones". Current Opinion in Genetics & Development . 1 (4): 464–9. doi :10.1016/S0959-437X(05)80193-5. PMID  1822278.
  26. ^ Chothia C (junio de 1992). "Proteínas. Mil familias para el biólogo molecular". Nature . 357 (6379): 543–4. Bibcode :1992Natur.357..543C. doi : 10.1038/357543a0 . PMID  1608464. S2CID  4355476.
  27. ^ Oliver SG, van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (mayo de 1992). "La secuencia completa de ADN del cromosoma III de la levadura". Nature . 357 (6373): 38–46. Bibcode :1992Natur.357...38O. doi :10.1038/357038a0. PMID  1574125. S2CID  4271784.
  28. ^ ab Dujon B (julio de 1996). "El proyecto del genoma de la levadura: ¿qué aprendimos?". Trends in Genetics . 12 (7): 263–70. doi :10.1016/0168-9525(96)10027-5. PMID  8763498.
  29. ^ abc Begun DJ, Lindfors HA, Kern AD, Jones CD (junio de 2007). "Evidencia de evolución de novo de genes expresados ​​en testículos en el clado Drosophila yakuba/Drosophila erecta". Genética . 176 (2): 1131–7. doi :10.1534/genetics.106.069245. PMC 1894579 . PMID  17435230. 
  30. ^ abc Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (junio de 2006). "Los genes nuevos derivados del ADN no codificante en Drosophila melanogaster están frecuentemente ligados al cromosoma X y exhiben una expresión sesgada en los testículos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (26): 9935–9. Bibcode :2006PNAS..103.9935L. doi : 10.1073/pnas.0509809103 . PMC 1502557 . PMID  16777968. 
  31. ^ abcd Begun DJ, Lindfors HA, Thompson ME, Holloway AK (marzo de 2006). "Genes recientemente evolucionados identificados a partir de etiquetas de secuencia expresadas en glándulas accesorias de Drosophila yakuba y D. erecta". Genética . 172 (3): 1675–81. doi :10.1534/genetics.105.050336. PMC 1456303 . PMID  16361246. 
  32. ^ ab McLysaght A, Guerzoni D (septiembre de 2015). "Nuevos genes a partir de secuencias no codificantes: el papel de los genes codificantes de proteínas de novo en la innovación evolutiva eucariota". Philosophical Transactions of the Royal Society of London. Serie B, Ciencias Biológicas . 370 (1678): 20140332. doi :10.1098/rstb.2014.0332. PMC 4571571 . PMID  26323763. 
  33. ^ abc Cai J, Zhao R, Jiang H, Wang W (mayo de 2008). "Origen de novo de un nuevo gen codificador de proteínas en Saccharomyces cerevisiae". Genética . 179 (1): 487–96. doi :10.1534/genética.107.084491. PMC 2390625 . PMID  18493065. 
  34. ^ abc Bungard D, Copple JS, Yan J, Chhun JJ, Kumirov VK, Foy SG y otros. (noviembre de 2017). "Plegabilidad de una proteína natural evolucionada de novo". Estructura . 25 (11): 1687–1696.e4. doi :10.1016/j.str.2017.09.006. PMC 5677532 . PMID  29033289. 
  35. ^ ab Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM, et al. (mayo de 2009). "Identificación de la nueva proteína QQS como un componente de la red metabólica del almidón en hojas de Arabidopsis". The Plant Journal . 58 (3): 485–98. doi : 10.1111/j.1365-313X.2009.03793.x . PMID  19154206.
  36. ^ ab Heinen TJ, Staubach F, Häming D, Tautz D (septiembre de 2009). "Aparición de un nuevo gen a partir de una región intergénica". Current Biology . 19 (18): 1527–31. Bibcode :2009CBio...19.1527H. doi : 10.1016/j.cub.2009.07.049 . PMID  19733073. S2CID  12446879.
  37. ^ abcdefgh Toll-Riera M, Bosch N, Bellora N, Castelo R, Armengol L, Estivill X, et al. (Marzo de 2009). "Origen de los genes huérfanos de primates: un enfoque de genómica comparada". Biología Molecular y Evolución . 26 (3): 603–12. doi : 10.1093/molbev/msn281 . PMID  19064677.
  38. ^ abcd Knowles DG, McLysaght A (octubre de 2009). "Origen reciente de novo de genes codificadores de proteínas humanas". Genome Research . 19 (10): 1752–9. doi :10.1101/gr.095026.109. PMC 2765279 . PMID  19726446. 
  39. ^ ab Domazet-Loso T, Brajković J, Tautz D (noviembre de 2007). "Un enfoque filoestratigráfico para descubrir la historia genómica de las principales adaptaciones en los linajes de metazoos". Tendencias en genética . 23 (11): 533–9. doi :10.1016/j.tig.2007.08.014. PMID  18029048.
  40. ^ abc Gehrmann T, Reinders MJ (noviembre de 2015). "Proteny: descubrimiento y visualización de agrupaciones sinténicas estadísticamente significativas a nivel del proteoma". Bioinformática . 31 (21): 3437–44. doi :10.1093/bioinformatics/btv389. PMC 4612220 . PMID  26116928. 
  41. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (octubre de 1990). "Herramienta básica de búsqueda de alineamiento local". Journal of Molecular Biology . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.
  42. ^ abcdef McLysaght A, Hurst LD (septiembre de 2016). "Preguntas abiertas en el estudio de genes de novo: qué, cómo y por qué". Nature Reviews Genetics . 17 (9): 567–78. doi :10.1038/nrg.2016.78. PMID  27452112. S2CID  6033249.[ enlace muerto permanente ]
  43. ^ Elhaik E, Sabath N, Graur D (enero de 2006). "La "relación inversa entre la tasa evolutiva y la edad de los genes de los mamíferos" es un artefacto de la distancia genética aumentada con la tasa de evolución y el tiempo de divergencia". Biología molecular y evolución . 23 (1): 1–3. doi : 10.1093/molbev/msj006 . PMID  16151190.
  44. ^ Albà MM, Castresana J (abril de 2007). "Sobre las búsquedas de homología por la proteína Blast y la caracterización de la edad de los genes". BMC Evolutionary Biology . 7 (1): 53. Bibcode :2007BMCEE...7...53A. doi : 10.1186/1471-2148-7-53 . PMC 1855329 . PMID  17408474. 
  45. ^ Moyers BA, Zhang J (mayo de 2016). "Evaluación de la evidencia filoestratigráfica de un nacimiento de genes de novo generalizado en la evolución del genoma". Biología molecular y evolución . 33 (5): 1245–56. doi :10.1093/molbev/msw008. PMC 5010002 . PMID  26758516. 
  46. ^ Moyers BA, Zhang J (enero de 2015). "El sesgo filoestratigráfico crea patrones espurios de evolución del genoma". Biología molecular y evolución . 32 (1): 258–67. doi :10.1093/molbev/msu286. PMC 4271527 . PMID  25312911. 
  47. ^ ab Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R, et al. (abril de 2017). "No hay evidencia de sesgo filoestratigráfico que afecte las inferencias sobre los patrones de aparición y evolución de genes". Biología molecular y evolución . 34 (4): 843–856. doi :10.1093/molbev/msw284. PMC 5400388 . PMID  28087778. 
  48. ^ Ghiurcuta CG, Moret BM (junio de 2014). "Evaluación de la sintenia para mejorar los estudios comparativos". Bioinformática . 30 (12): i9-18. doi :10.1093/bioinformatics/btu259. PMC 4058928 . PMID  24932010. 
  49. ^ Jean G, Nikolski M (2011). "SyDiG: descubriendo la sintenia en genomas distantes" (PDF) . Revista internacional de investigación y aplicaciones bioinformáticas . 7 (1): 43–62. doi :10.1504/IJBRA.2011.039169. PMID  21441096. S2CID  2644451.
  50. ^ Liu D, Hunt M, Tsai IJ (enero de 2018). "Inferir sintenia entre conjuntos genómicos: una evaluación sistemática". BMC Bioinformatics . 19 (1): 26. doi : 10.1186/s12859-018-2026-4 . PMC 5791376 . PMID  29382321. 
  51. ^ Ranz JM, Casals F, Ruiz A (febrero de 2001). "¿Cuán maleable es el genoma eucariota? Tasa extrema de reordenamiento cromosómico en el género Drosophila". Genome Research . 11 (2): 230–9. doi :10.1101/gr.162901. PMC 311025 . PMID  11157786. 
  52. ^ ab Lu TC, Leu JY, Lin WC (noviembre de 2017). "Un análisis exhaustivo de genes de novo soportados por transcripción en levaduras Saccharomyces sensu stricto". Biología molecular y evolución . 34 (11): 2823–2838. doi :10.1093/molbev/msx210. PMC 5850716 . PMID  28981695. 
  53. ^ abcd Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (agosto de 2016). "Sobre el origen de los genes de novo en las poblaciones de Arabidopsis thaliana". Genome Biology and Evolution . 8 (7): 2190–202. doi :10.1093/gbe/evw164. PMC 4987118 . PMID  27401176. 
  54. ^ abcdefgh Chen S, Zhang YE, Long M (diciembre de 2010). "Nuevos genes en Drosophila se vuelven rápidamente esenciales". Science . 330 (6011): 1682–5. Bibcode :2010Sci...330.1682C. doi :10.1126/science.1196380. PMC 7211344 . PMID  21164016. S2CID  7899890. 
  55. ^ abcdefg Zhao L, Saelao P, Jones CD, Begun DJ (febrero de 2014). "Origen y difusión de genes de novo en poblaciones de Drosophila melanogaster". Ciencia . 343 (6172): 769–72. Código Bib : 2014 Ciencia... 343..769Z. doi : 10.1126/ciencia.1248286. PMC 4391638 . PMID  24457212. 
  56. ^ abcd Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. (septiembre de 2008). "Sobre el origen de nuevos genes en Drosophila". Genome Research . 18 (9): 1446–55. doi :10.1101/gr.076588.108. PMC 2527705 . PMID  18550802. 
  57. ^ abcdefg Wu DD, Irwin DM, Zhang YP (noviembre de 2011). "Origen de novo de genes codificadores de proteínas humanas". PLOS Genética . 7 (11): e1002379. doi : 10.1371/journal.pgen.1002379 . PMC 3213175 . PMID  22102831. 
  58. ^ Vakirlis N, McLysaght A (2019). "Predicción computacional de genes codificadores de proteínas emergentes de novo". Métodos computacionales en evolución de proteínas . Métodos en biología molecular. Vol. 1851. Springer. págs. 63–81. doi :10.1007/978-1-4939-8736-8_4. ISBN 978-1-4939-8735-1. Número de identificación personal  30298392. Número de identificación personal  52942639.
  59. ^ abcdefghijkl Carvunis AR, Rolland T, Wapinski I, Calderwood MA, Yildirim MA, Simonis N, et al. (julio de 2012). "Protogenes y nacimiento de genes de novo". Nature . 487 (7407): 370–374. Bibcode :2012Natur.487..370C. doi :10.1038/nature11184. PMC 3401362 . PMID  22722833. 
  60. ^ Doolittle WF, Brunet TD, Linquist S, Gregory TR (mayo de 2014). "Distinguir entre "función" y "efecto" en la biología del genoma". Genome Biology and Evolution . 6 (5): 1234–1237. doi :10.1093/gbe/evu098. PMC 4041003 . PMID  24814287. 
  61. ^ ab Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (abril de 2014). "Definición de elementos funcionales del ADN en el genoma humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (17): 6131–6138. Bibcode :2014PNAS..111.6131K. doi : 10.1073/pnas.1318948111 . PMC 4035993 . PMID  24753594. 
  62. ^ abc Keeling DM, Garza P, Nartey CM, Carvunis AR (noviembre de 2019). "Los significados de 'función' en biología y el caso problemático de la aparición de genes de novo". eLife . 8 . doi : 10.7554/eLife.47014 . PMC 6824840 . PMID  31674305. 
  63. ^ Andersson DI, Jerlström-Hultqvist J, Näsvall J (junio de 2015). "Evolución de nuevas funciones de novo y a partir de genes preexistentes". Cold Spring Harbor Perspectives in Biology . 7 (6): a017996. doi :10.1101/cshperspect.a017996. PMC 4448608 . PMID  26032716. 
  64. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (enero de 2019). "Estudiar el comienzo de la aparición de genes de novo en ratones revela una rápida integración de nuevos genes en redes funcionales". bioRxiv . bioRxiv 10.1101/510214 . doi : 10.1101/510214 . 
  65. ^ Ruiz-Orera J, Hernández-Rodríguez J, Chiva C, Sabidó E, Kondova I, Bontrop R, et al. (Diciembre de 2015). "Orígenes de los genes de novo en humanos y chimpancés". PLOS Genética . 11 (12): e1005721. arXiv : 1507.07744 . Código Bib : 2015arXiv150707744R. doi : 10.1371/journal.pgen.1005721 . PMC 4697840 . PMID  26720152. 
  66. ^ MIYATA, TAKASHI; YASUNAGA, TERUO; NISHIDA, TOSHIRŌ (1980). "Divergencia de secuencias de nucleótidos y restricción funcional en la evolución del ARNm". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 77 (12): 7328–7332. Bibcode :1980PNAS...77.7328M. doi : 10.1073/pnas.77.12.7328 . PMC 350496 . PMID  6938980. 
  67. ^ abcdefg Heames B, Schmitz J, Bornberg-Bauer E (mayo de 2020). "Un continuo de genes de novo en evolución impulsa la novedad en la codificación de proteínas en Drosophila". Journal of Molecular Evolution . 88 (4): 382–398. Bibcode :2020JMolE..88..382H. doi :10.1007/s00239-020-09939-z. PMC 7162840 . PMID  32253450. 
  68. ^ abc Durand É, Gagnon-Arsenault I, Hallin J, Hatin I, Dubé AK, Nielly-Thibault L, et al. (junio de 2019). "La renovación de las transcripciones asociadas a los ribosomas a partir de los ORF de novo produce características similares a las de los genes disponibles para la aparición de genes de novo en poblaciones de levaduras silvestres". Genome Research . 29 (6): 932–943. doi : 10.1101/gr.239822.118 . PMC 6581059 . PMID  31152050. 
  69. ^ abcde Dowling D, Schmitz JF, Bornberg-Bauer E (noviembre de 2020). "Ganancia y pérdida estocástica de nuevos marcos de lectura abiertos transcritos en el linaje humano". Genome Biology and Evolution . 12 (11): 2183–2195. doi :10.1093/gbe/evaa194. PMC 7674706 . PMID  33210146. 
  70. ^ ab Neme R, Tautz D (febrero de 2013). "Los patrones filogenéticos de la aparición de nuevos genes respaldan un modelo de evolución frecuente de novo". BMC Genomics . 14 : 117. doi : 10.1186/1471-2164-14-117 . PMC 3616865 . PMID  23433480. 
  71. ^ abcde Schmitz JF, Ullrich KK, Bornberg-Bauer E (octubre de 2018). "Los genes de novo incipientes pueden evolucionar a partir de accidentes congelados que escaparon a una rápida renovación de la transcripción". Nature Ecology & Evolution . 2 (10): 1626–1632. Bibcode :2018NatEE...2.1626S. doi :10.1038/s41559-018-0639-7. PMID  30201962. S2CID  52181376.
  72. ^ ab Vakirlis N, Carvunis AR, McLysaght A (febrero de 2020). "Los análisis basados ​​en Synteny indican que la divergencia de secuencias no es la principal fuente de genes huérfanos". eLife . 9 . doi : 10.7554/eLife.53500 . PMC 7028367 . PMID  32066524. 
  73. ^ abc Palmieri N, Kosiol C, Schlötterer C (febrero de 2014). "El ciclo de vida de los genes huérfanos de Drosophila". eLife . 3 : e01311. arXiv : 1401.4956 . Bibcode :2014arXiv1401.4956P. doi : 10.7554/eLife.01311 . PMC 3927632 . PMID  24554240. 
  74. ^ ab Prabh N, Roeseler W, Witte H, Eberhardt G, Sommer RJ, Rödelsperger C (noviembre de 2018). "Nematodos de Pristionchus". Genome Research . 28 (11): 1664–1674. doi :10.1101/gr.234971.118. PMC 6211646 . PMID  30232197. 
  75. ^ ab Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). "Mecanismos y dinámica de la aparición de genes huérfanos en genomas de insectos". Genome Biology and Evolution . 5 (2): 439–55. doi :10.1093/gbe/evt009. PMC 3590893 . PMID  23348040. 
  76. ^ abcd Schmitz JF, Chain FJ, Bornberg-Bauer E (agosto de 2020). "Evolución de genes novedosos en poblaciones de espinosos de tres espinas". Heredity . 125 (1–2): 50–59. doi :10.1038/s41437-020-0319-7. PMC 7413265 . PMID  32499660. 
  77. ^ Neme R, Tautz D (febrero de 2016). "La rápida renovación de la transcripción del genoma a lo largo del tiempo evolutivo expone todo el ADN no codificante a la aparición de genes de novo". eLife . 5 : e09977. doi : 10.7554/eLife.09977 . PMC 4829534 . PMID  26836309. 
  78. ^ Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC (2012). "Recambio rápido de ARN largos no codificantes y evolución de la expresión génica". PLOS Genetics . 8 (7): e1002841. doi : 10.1371/journal.pgen.1002841 . PMC 3406015 . PMID  22844254. 
  79. ^ abcde Reinhardt JA, Wanjiru BM, Brant AT, Saelao P, Begun DJ, Jones CD (2013). "Los ORFs de novo en Drosophila son importantes para la aptitud del organismo y evolucionaron rápidamente a partir de secuencias que no eran codificantes anteriormente". PLOS Genetics . 9 (10): e1003860. doi : 10.1371/journal.pgen.1003860 . PMC 3798262 . PMID  24146629. 
  80. ^ abc Gubala AM, Schmitz JF, Kearns MJ, Vinh TT, Bornberg-Bauer E, Wolfner MF, Findlay GD (mayo de 2017). "Los genes Goddard y Saturn son esenciales para la fertilidad masculina de Drosophila y pueden haber surgido de novo". Biología molecular y evolución . 34 (5): 1066–1082. doi :10.1093/molbev/msx057. PMC 5400382 . PMID  28104747. 
  81. ^ abc Lange A, Patel PH, Heames B, Damry AM, Saenger T, Jackson CJ, et al. (marzo de 2021). "Caracterización estructural y funcional de un gen putativo de novo en Drosophila". Nature Communications . 12 (1): 1667. Bibcode :2021NatCo..12.1667L. doi :10.1038/s41467-021-21667-6. PMC 7954818 . PMID  33712569. 
  82. ^ Zile K, Dessimoz C, Wurm Y, Masel J (agosto de 2020). "Solo una única familia de genes taxonómicamente restringida en el subgrupo Drosophila melanogaster puede identificarse con alta confianza". Genome Biology and Evolution . 12 (8): 1355–1366. doi :10.1093/gbe/evaa127. PMC 8059200 . PMID  32589737. 
  83. ^ abc Zhuang X, Yang C, Murphy KR, Cheng CC (marzo de 2019). "Mecanismo molecular e historia de la evolución sin sentido a sentido del gen de la glicoproteína anticongelante en los gádidos del norte". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 116 (10): 4400–4405. Bibcode :2019PNAS..116.4400Z. doi : 10.1073/pnas.1817138116 . PMC 6410882 . PMID  30765531. 
  84. ^ ab Baalsrud HT, Tørresen OK, Solbakken MH, Salzburger W, Hanel R, Jakobsen KS, Jentoft S (marzo de 2018). "Evolución genética de novo de glicoproteínas anticongelantes en bacalaos revelada por datos de secuencia completa del genoma". Biología Molecular y Evolución . 35 (3): 593–606. doi :10.1093/molbev/msx311. PMC 5850335 . PMID  29216381. 
  85. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (agosto de 2019). "Un gen desarrollado de novo en el ratón doméstico regula los ciclos de embarazo de las hembras". eLife . 8 . doi : 10.7554/eLife.44392 . PMC 6760900 . PMID  31436535. 
  86. ^ Li D, Dong Y, Jiang Y, Jiang H, Cai J, Wang W (abril de 2010). "Un gen de origen nuevo deprime la vía de apareamiento de la levadura en ciernes y es reprimido por la proteína codificada por su cadena antisentido". Cell Research . 20 (4): 408–20. doi : 10.1038/cr.2010.31 . PMID  20195295.
  87. ^ Li D, Yan Z, Lu L, Jiang H, Wang W (diciembre de 2014). "Pleiotropía del gen MDF1 originado de novo". Scientific Reports . 4 : 7280. Bibcode :2014NatSR...4E7280L. doi :10.1038/srep07280. PMC 4250933 . PMID  25452167. 
  88. ^ ab Moutinho AF, Eyre-Walker A, Dutheil JY (septiembre de 2022). "Evidencia sólida del modelo de caminata adaptativa de la evolución genética en Drosophila y Arabidopsis". PLOS Biology . 20 (9): e3001775. doi : 10.1371/journal.pbio.3001775 . PMC 9470001 . PMID  36099311. 
  89. ^ abc Ekman D, Elofsson A (febrero de 2010). "Identificación y cuantificación de secuencias de proteínas huérfanas en hongos". Journal of Molecular Biology . 396 (2): 396–405. doi :10.1016/j.jmb.2009.11.053. PMID  19944701.
  90. ^ Domazet-Loso T, Tautz D (octubre de 2003). "An evolutionary analysis of orphan genes in Drosophila" (Un análisis evolutivo de genes huérfanos en Drosophila). Genome Research . 13 (10): 2213–2219. doi :10.1101/gr.1311003. PMC 403679 . PMID  14525923. 
  91. ^ Guo WJ, Li P, Ling J, Ye SP (2007). "Características comparativas significativas entre genes huérfanos y no huérfanos en el genoma del arroz (Oryza sativa L.)". Comparative and Functional Genomics . 2007 : 21676. doi : 10.1155/2007/21676 . PMC 2216055 . PMID  18273382. 
  92. ^ Wolf YI, Novichkov PS, Karev GP, Koonin EV, Lipman DJ (mayo de 2009). "La distribución universal de las tasas evolutivas de los genes y las características distintivas de los genes eucariotas de diferentes edades aparentes". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (18): 7273–7280. doi : 10.1073/pnas.0901808106 . PMC 2666616 . PMID  19351897. 
  93. ^ ab Sun W, Zhao XW, Zhang Z (septiembre de 2015). "Identificación y evolución de los genes huérfanos en el gusano de seda doméstico, Bombyx mori". FEBS Letters . 589 (19 Pt B): 2731–2738. Bibcode :2015FEBSL.589.2731S. doi : 10.1016/j.febslet.2015.08.008 . PMID  26296317.
  94. ^ abc Donoghue MT, Keshavaiah C, Swamidtta SH, Spillane C (febrero de 2011). "Orígenes evolutivos de genes específicos de Brassicaceae en Arabidopsis thaliana". BMC Evolutionary Biology . 11 (1): 47. Bibcode :2011BMCEE..11...47D. doi : 10.1186/1471-2148-11-47 . PMC 3049755 . PMID  21332978. 
  95. ^ abcd Werner MS, Sieriebriennikov B, Prabh N, Loschko T, Lanz C, Sommer RJ (noviembre de 2018). "Los genes jóvenes tienen una estructura genética, perfiles epigenéticos y regulación transcripcional distintos". Genome Research . 28 (11): 1675–1687. doi :10.1101/gr.234872.118. PMC 6211652 . PMID  30232198. 
  96. ^ abcde Vakirlis N, Hebert AS, Opulente DA, Achaz G, Hittinger CT, Fischer G, et al. (Marzo de 2018). "Un retrato molecular de genes de novo en levaduras". Biología Molecular y Evolución . 35 (3): 631–645. doi :10.1093/molbev/msx315. PMC 5850487 . PMID  29220506. 
  97. ^ Foy SG, Wilson BA, Bertram J, Cordes MH, Masel J (abril de 2019). "Un cambio en la estrategia de evitación de la agregación marca una dirección a largo plazo para la evolución de las proteínas". Genética . 211 (4): 1345–1355. doi :10.1534/genetics.118.301719. PMC 6456324 . PMID  30692195. 
  98. ^ ab James JE, Willis SM, Nelson PG, Weibel C, Kosinski LJ, Masel J (enero de 2021). "Tendencias universales y específicas de taxón en secuencias de proteínas en función de la edad". eLife . 10 : e57347. doi : 10.7554/eLife.57347 . PMC 7819706 . PMID  33416492. 
  99. ^ ab Zhang JY, Zhou Q (enero de 2019). "Sobre la evolución reguladora de nuevos genes a lo largo de su historia de vida". Biología molecular y evolución . 36 (1): 15–27. doi : 10.1093/molbev/msy206 . PMID  30395322. S2CID  53216993.
  100. ^ Wu B, Knudson A (julio de 2018). "Origen de novo de genes codificadores de proteínas en levaduras". mBio . 9 (4). doi :10.1128/mBio.01024-18. PMC 6069113 . PMID  30065088. 
  101. ^ ab Bekpen C, Xie C, Tautz D (agosto de 2018). "Cómo lidiar con el sistema inmunitario adaptativo durante la evolución de novo de genes a partir de secuencias intergénicas". BMC Evolutionary Biology . 18 (1): 121. Bibcode :2018BMCEE..18..121B. doi : 10.1186/s12862-018-1232-z . PMC 6091031 . PMID  30075701. 
  102. ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A, et al. (2018). "Miles de experimentos de secuenciación de ARN a gran escala producen una nueva lista completa de genes humanos y revelan un amplio ruido transcripcional". bioRxiv . bioRxiv 10.1101/332825 . doi : 10.1101/332825 . 
  103. ^ ab Peng, Junhui; Zhao, Li (2023-06-27), "El origen y la evolución estructural de los genes de novo en Drosophila", BioRxiv: The Preprint Server for Biology , doi :10.1101/2023.03.13.532420, PMC 10326970 , PMID  37425675 , consultado el 25 de diciembre de 2023 
  104. ^ Nielly-Thibault L, Landry CR (agosto de 2019). "Las diferencias entre la materia prima y los productos del nacimiento de genes de novo pueden ser resultado de sesgos mutacionales". Genética . 212 (4): 1353–1366. doi :10.1534/genetics.119.302187. PMC 6707459 . PMID  31227545. 
  105. ^ abc Vakirlis N, Acar O, Hsu B, Castilho Coelho N, Van Oss SB, Wacholder A, et al. (febrero de 2020). "Aparición de novo de proteínas de membrana adaptativas a partir de secuencias genómicas ricas en timina". Nature Communications . 11 (1): 781. Bibcode :2020NatCo..11..781V. doi :10.1038/s41467-020-14500-z. PMC 7005711 . PMID  32034123. 
  106. ^ Kosinski L, Aviles N, Gomez K, Masel J (junio de 2022). "Los péptidos aleatorios ricos en aminoácidos pequeños y promotores de desorden tienen menos probabilidades de ser dañinos". Genome Biology and Evolution . 14 (6): evac085. doi :10.1093/gbe/evac085. PMC 9210321 . PMID  35668555. 
  107. ^ abc Basile W, Sachenkova O, Light S, Elofsson A (marzo de 2017). "El alto contenido de GC hace que las proteínas huérfanas sean intrínsecamente desordenadas". PLOS Computational Biology . 13 (3): e1005375. Bibcode :2017PLSCB..13E5375B. doi : 10.1371/journal.pcbi.1005375 . PMC 5389847 . PMID  28355220. 
  108. ^ Bitard-Feildel T, Heberlein M, Bornberg-Bauer E, Callebaut I (diciembre de 2015). "Detección de dominios huérfanos en Drosophila mediante "análisis de grupos hidrofóbicos"". Biochimie . 119 : 244–53. doi : 10.1016/j.biochi.2015.02.019. PMID  25736992.
  109. ^ Mukherjee S, Panda A, Ghosh TC (junio de 2015). "Elucidación de las características evolutivas y las implicaciones funcionales de los genes huérfanos en Leishmania major ". Infección, genética y evolución . 32 : 330–7. Bibcode :2015InfGE..32..330M. doi :10.1016/j.meegid.2015.03.031. PMID  25843649.
  110. ^ abcdefghij Wilson BA, Foy SG, Neme R, Masel J (junio de 2017). "Los genes jóvenes están altamente desordenados como predice la hipótesis de preadaptación del nacimiento de genes de novo". Nature Ecology & Evolution . 1 (6): 0146–146. Bibcode :2017NatEE...1..146W. doi :10.1038/s41559-017-0146. PMC 5476217 . PMID  28642936. 
  111. ^ Jeon J, Choi J, Lee GW, Park SY, Huh A, Dean RA, et al. (febrero de 2015). "El perfil de metilación del ADN en todo el genoma proporciona información sobre la regulación epigenética del desarrollo fúngico en un hongo fitopatógeno, Magnaporthe oryzae". Scientific Reports . 5 : 8567. Bibcode :2015NatSR...5E8567J. doi :10.1038/srep08567. PMC 4338423 . PMID  25708804. 
  112. ^ Bornberg-Bauer E, Hlouchova K, Lange A (junio de 2021). "Estructura y función de proteínas de novo naturalmente evolucionadas". Current Opinion in Structural Biology . 68 : 175–183. doi : 10.1016/j.sbi.2020.11.010 . PMID  33567396.
  113. ^ Eicholt, Lars A.; Aubel, Margaux; Berk, Katrin; Bornberg-Bauer, Erich; Lange, Andreas (13 de julio de 2022). "Expresión heteróloga de proteínas putativas de novo naturalmente evolucionadas con chaperonas". Protein Science . 31 (8). Wiley: e4371. doi :10.1002/pro.4371. ISSN  0961-8368. PMC 9278007 . PMID  35900020. 
  114. ^ Pan X, Ye P, Yuan DS, Wang X, Bader JS, Boeke JD (marzo de 2006). "Una red de integridad del ADN en la levadura Saccharomyces cerevisiae". Cell . 124 (5): 1069–1081. doi : 10.1016/j.cell.2005.12.036 . PMID  16487579. S2CID  84338859.
  115. ^ David L, Huber W, Granovskaia M, Toedling J, Palm CJ, Bofkin L, et al. (abril de 2006). "Un mapa de alta resolución de la transcripción en el genoma de la levadura". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (14): 5320–5325. Bibcode :2006PNAS..103.5320D. doi : 10.1073/pnas.0601091103 . PMC 1414796 . PMID  16569694. 
  116. ^ Tisseur M, Kwapisz M, Morillon A (noviembre de 2011). "Transcripción generalizada: lecciones de la levadura". Bioquimia . 93 (11): 1889–1896. doi :10.1016/j.biochi.2011.07.001. PMID  21771634.
  117. ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (junio de 2008). "El panorama transcripcional del genoma de la levadura definido por la secuenciación del ARN". Science . 320 (5881): 1344–1349. Bibcode :2008Sci...320.1344N. doi :10.1126/science.1158441. PMC 2951732 . PMID  18451266. 
  118. ^ Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL, et al. (julio de 2011). "La realidad de la transcripción generalizada". PLOS Biology . 9 (7): e1000625, discusión e1001102. doi : 10.1371/journal.pbio.1000625 . PMC 3134446 . PMID  21765801. 
  119. ^ ab Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE, et al. (septiembre de 2014). "El perfil de ribosomas revela una traducción generalizada fuera de los genes codificadores de proteínas anotados". Cell Reports . 8 (5): 1365–1379. doi :10.1016/j.celrep.2014.07.045. PMC 4216110 . PMID  25159147. 
  120. ^ Ruiz-Orera J, Verdaguer-Grau P, Villanueva-Cañas JL, Messeguer X, Albà MM (mayo de 2018). "La traducción de péptidos de evolución neutra proporciona una base para la evolución genética de novo". Ecología y evolución de la naturaleza . 2 (5): 890–896. Código Bib : 2018NatEE...2..890R. doi :10.1038/s41559-018-0506-6. hdl : 10230/36048 . PMID  29556078. S2CID  4959952.
  121. ^ Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM (septiembre de 2014). "ARN largos no codificantes como fuente de nuevos péptidos". eLife . 3 : e03523. arXiv : 1405.4174 . Bibcode :2014arXiv1405.4174R. doi : 10.7554/eLife.03523 . PMC 4359382 . PMID  25233276. 
  122. ^ abc Wilson BA, Masel J (2011). "Las transcripciones supuestamente no codificantes muestran una amplia asociación con los ribosomas". Genome Biology and Evolution . 3 : 1245–1252. doi :10.1093/gbe/evr099. PMC 3209793 . PMID  21948395. 
  123. ^ Chen J, Brunner AD, Cogan JZ, Nuñez JK, Fields AP, Adamson B, et al. (marzo de 2020). "Traducción funcional generalizada de marcos de lectura abiertos humanos no canónicos". Science . 367 (6482): 1140–1146. Bibcode :2020Sci...367.1140C. doi :10.1126/science.aay0262. PMC 7289059 . PMID  32139545. 
  124. ^ ab Silveira AB, Trontin C, Cortijo S, Barau J, Del Bem LE, Loudet O, et al. (Abril de 2013). "Amplia variación epigenética natural en un gen originado de novo". PLOS Genética . 9 (4): e1003437. doi : 10.1371/journal.pgen.1003437 . PMC 3623765 . PMID  23593031. 
  125. ^ Kimmins S, Sassone-Corsi P (marzo de 2005). "Remodelación de la cromatina y características epigenéticas de las células germinales". Nature . 434 (7033): 583–9. Bibcode :2005Natur.434..583K. doi :10.1038/nature03368. PMID  15800613. S2CID  4373304.
  126. ^ ab Papadopoulos C, Callebaut I, Gelly JC, Hatin I, Namy O, Renard M, et al. (noviembre de 2021). "ORFs intergénicos como módulos estructurales elementales del nacimiento de genes de novo y la evolución de proteínas". Genome Research . 31 (12): 2303–2315. doi :10.1101/gr.275638.121. PMC 8647833 . PMID  34810219. 
  127. ^ ab Vakirlis, Nikolaos; Vance, Zoe; Duggan, Kate M.; McLysaght, Aoife (20 de diciembre de 2022). "Nacimiento de novo de microproteínas funcionales en el linaje humano". Cell Reports . 41 (12): 111808. doi : 10.1016/j.celrep.2022.111808 . ISSN  2211-1247. PMC 10073203 . PMID  36543139. S2CID  254966620. 
  128. ^ Dinger ME, Pang KC, Mercer TR, Mattick JS (noviembre de 2008). "Diferenciación entre ARN codificante y no codificante de proteínas: desafíos y ambigüedades". PLOS Computational Biology . 4 (11): e1000176. Bibcode :2008PLSCB...4E0176D. doi : 10.1371/journal.pcbi.1000176 . PMC 2518207 . PMID  19043537. 
  129. ^ Stewart NB, Rogers RL (septiembre de 2019). "Reordenamientos cromosómicos como fuente de formación de nuevos genes en Drosophila yakuba". PLOS Genetics . 15 (9): e1008314. doi : 10.1371/journal.pgen.1008314 . PMC 6776367 . PMID  31545792. 
  130. ^ Swanson WJ, Vacquier VD (febrero de 2002). "La rápida evolución de las proteínas reproductivas". Nature Reviews Genetics . 3 (2): 137–44. doi :10.1038/nrg733. PMID  11836507. S2CID  25696990.
  131. ^ Bustamante CD, Fledel-Alon A, Williamson S, Nielsen R, Hubisz MT, Glanowski S, Tanenbaum DM, White TJ, Sninsky JJ, Hernandez RD, Civello D, Adams MD, Cargill M, Clark AG (octubre de 2005). "Selección natural de genes codificadores de proteínas en el genoma humano". Naturaleza . 437 (7062): 1153–7. Código Bib : 2005Natur.437.1153B. doi : 10.1038/naturaleza04240. PMID  16237444. S2CID  4423768.
  132. ^ Clark NL, Aagaard JE, Swanson WJ (enero de 2006). "Evolución de las proteínas reproductivas de animales y plantas". Reproducción . 131 (1): 11–22. doi : 10.1530/rep.1.00357 . PMID  16388004.
  133. ^ Rivard EL, Ludwig AG, Patel PH, Grandchamp A, Arnold SE, Berger A, et al. (septiembre de 2021). "Un gen putativo evolucionado de novo necesario para la condensación de la cromatina de las espermátidas en Drosophila melanogaster". PLOS Genetics . 17 (9): e1009787. doi : 10.1371/journal.pgen.1009787 . PMC 8445463 . PMID  34478447. 
  134. ^ Cridland JM, Majane AC, Zhao L, Begun DJ (enero de 2022). "Biología poblacional de genes de novo expresados ​​en glándulas accesorias en Drosophila melanogaster". Genética . 220 (1). doi : 10.1093/genetics/iyab207. PMC 8733444 . PMID  34791207. 
  135. ^ Witt, Evan; Benjamin, Sigi; Svetec, Nicolas; Zhao, Li (16 de agosto de 2019). Landry, Christian R; Wittkopp, Patricia J; White-Cooper, Helen (eds.). "La secuenciación de ARN de células individuales de los testículos revela la dinámica de la transcripción genética de novo y el sesgo mutacional de la línea germinal en Drosophila". eLife . 8 : e47138. doi : 10.7554/eLife.47138 . ISSN  2050-084X. PMC 6697446 . PMID  31418408. S2CID  198249413. 
  136. ^ abc Luis Villanueva-Cañas J, Ruiz-Orera J, Agea MI, Gallo M, Andreu D, Albà MM (julio de 2017). "Nuevos genes e innovación funcional en mamíferos". Biología y evolución del genoma . 9 (7): 1886-1900. doi :10.1093/gbe/evx136. PMC 5554394 . PMID  28854603. 
  137. ^ Schmidt EE (julio de 1996). "Promiscuidad transcripcional en los testículos". Current Biology . 6 (7): 768–9. Bibcode :1996CBio....6..768S. doi : 10.1016/S0960-9822(02)00589-4 . PMID  8805310. S2CID  14318566.
  138. ^ White-Cooper H, Davidson I (julio de 2011). "Aspectos singulares de la regulación de la transcripción en células germinales masculinas". Cold Spring Harbor Perspectives in Biology . 3 (7): a002626. doi :10.1101/cshperspect.a002626. PMC 3119912 . PMID  21555408. 
  139. ^ Kleene KC (agosto de 2001). "Una posible función meiótica de los patrones peculiares de expresión génica en células espermatogénicas de mamíferos". Mecanismos del desarrollo . 106 (1–2): 3–23. doi : 10.1016/S0925-4773(01)00413-0 . PMID  11472831. S2CID  949694.
  140. ^ abcd Rajon E, Masel J (enero de 2011). "Evolución de las tasas de error molecular y las consecuencias para la capacidad evolutiva". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (3): 1082–7. Bibcode :2011PNAS..108.1082R. doi : 10.1073/pnas.1012918108 . PMC 3024668 . PMID  21199946. 
  141. ^ Masel J (marzo de 2006). "La variación genética críptica se enriquece para posibles adaptaciones". Genética . 172 (3): 1985–1991. doi :10.1534/genetics.105.051649. PMC 1456269 . PMID  16387877. 
  142. ^ Casola C (2018). "De novo a "de nono": la mayoría de los genes codificadores de proteínas nuevos identificados con filoestratigrafía representan genes antiguos o duplicados recientes". bioRxiv . bioRxiv 10.1101/287193 . doi : 10.1101/287193 . 
  143. ^ Willis S, Masel J (septiembre de 2018). "El nacimiento de genes contribuye al desorden estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi :10.1534/genetics.118.301249. PMC 6116962 . PMID  30026186. 
  144. ^ Abrusán G (diciembre de 2013). "Integración de nuevos genes en redes celulares y su maduración estructural". Genética . 195 (4): 1407–1417. doi :10.1534/genetics.113.152256. PMC 3832282 . PMID  24056411. 
  145. ^ Giacomelli MG, Hancock AS, Masel J (febrero de 2007). "La conversión de 3' UTR en regiones codificantes". Biología molecular y evolución . 24 (2): 457–464. doi :10.1093/molbev/msl172. PMC 1808353 . PMID  17099057. 
  146. ^ abc Bornberg-Bauer E, Schmitz J, Heberlein M (octubre de 2015). "Aparición de proteínas de novo a partir de 'materia genómica oscura' mediante 'crecimiento lento y muda'"". Transacciones de la Sociedad Bioquímica . 43 (5): 867–873. doi :10.1042/BST20150089. PMID  26517896.
  147. ^ Wilder JA, Hewett EK, Gansner ME (diciembre de 2009). "Evolución molecular de GYPC: evidencia de innovación estructural reciente y selección positiva en humanos". Biología molecular y evolución . 26 (12): 2679–2687. doi :10.1093/molbev/msp183. PMC 2775107 . PMID  19679754. 
  148. ^ Vakhrusheva AA, Kazanov MD, Mironov AA, Bazykin GA (febrero de 2011). "Evolución de genes procariotas por desplazamiento de codones de terminación". Journal of Molecular Evolution . 72 (2): 138–146. Bibcode :2011JMolE..72..138V. doi :10.1007/s00239-010-9408-1. PMID  21082168. S2CID  812377.
  149. ^ Andreatta ME, Levine JA, Foy SG, Guzman LD, Kosinski LJ, Cordes MH, Masel J (mayo de 2015). "El origen reciente de novo de los extremos C de las proteínas". Genome Biology and Evolution . 7 (6): 1686–1701. doi :10.1093/gbe/evv098. PMC 4494051 . PMID  26002864. 
  150. ^ Kleppe AS, Bornberg-Bauer E (noviembre de 2018). "Robustez mediante extremos C intrínsecamente desordenados y lectura translacional". Nucleic Acids Research . 46 (19): 10184–10194. doi :10.1093/nar/gky778. PMC 6365619 . PMID  30247639. 
  151. ^ Klasberg S, Bitard-Feildel T, Callebaut I, Bornberg-Bauer E (julio de 2018). "Orígenes y propiedades estructurales de dominios proteicos nuevos y de novo durante la evolución de los insectos". The FEBS Journal . 285 (14): 2605–2625. doi : 10.1111/febs.14504 . PMID  29802682.
  152. ^ Deng C, Cheng CH, Ye H, He X, Chen L (diciembre de 2010). "Evolución de una proteína anticongelante por neofuncionalización bajo escape del conflicto adaptativo". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (50): 21593–21598. Bibcode :2010PNAS..10721593D. doi : 10.1073/pnas.1007883107 . PMC 3003108 . PMID  21115821. 
  153. ^ Long M, VanKuren NW, Chen S, Vibranovski MD (2013). "Nueva evolución genética: poco sabíamos". Revisión anual de genética . 47 : 307–333. doi :10.1146/annurev-genet-111212-133301. PMC 4281893. PMID  24050177 . 
  154. ^ Chen S, Krinsky BH, Long M (septiembre de 2013). "Nuevos genes como impulsores de la evolución fenotípica". Nature Reviews Genetics . 14 (9): 645–60. doi :10.1038/nrg3521. PMC 4236023 . PMID  23949544. 
  155. ^ Suenaga Y, Islam SM, Alagu J, Kaneko Y, Kato M, Tanaka Y, et al. (enero de 2014). "NCYM, un gen antisentido cis de MYCN, codifica una proteína evolucionada de novo que inhibe GSK3β, lo que resulta en la estabilización de MYCN en neuroblastomas humanos". PLOS Genetics . 10 (1): e1003996. doi : 10.1371/journal.pgen.1003996 . PMC 3879166 . PMID  24391509. 
  156. ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B, et al. (febrero de 2000). "PART-1: un nuevo gen humano específico de la próstata, regulado por andrógenos, que se asigna al cromosoma 5q12". Cancer Research . 60 (4): 858–63. PMID  10706094.
  157. ^ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (julio de 2018). "La transferencia mediada por exosomas de lncRNA PART1 induce resistencia a gefitinib en carcinoma de células escamosas de esófago al funcionar como un ARN endógeno competitivo". Journal of Experimental & Clinical Cancer Research . 37 (1): 171. doi : 10.1186/s13046-018-0845-9 . PMC 6063009 . PMID  30049286. (Retractado, ver doi :10.1186/s13046-023-02648-7, PMID  37024914. Si se trata de una cita intencional de un artículo retractado, reemplácelo con . ){{retracted|...}}{{retracted|...|intentional=yes}}
  158. ^ Samusik N, Krukovskaya L, Meln I, Shilov E, Kozlov AP (2013). "PBOV1 es un gen humano de novo con expresión específica de tumores que está asociado con un resultado clínico positivo del cáncer". PLOS ONE . ​​8 (2): e56162. Bibcode :2013PLoSO...856162S. doi : 10.1371/journal.pone.0056162 . PMC 3572036 . PMID  23418531. 
  159. ^ Guerzoni D, McLysaght A (abril de 2016). "Los genes de novo surgen a un ritmo lento pero constante a lo largo del linaje de los primates y han estado sujetos a una clasificación de linaje incompleta". Genome Biology and Evolution . 8 (4): 1222–32. doi :10.1093/gbe/evw074. PMC 4860702 . PMID  27056411. 
  160. ^ Pekarsky Y, Rynditch A, Wieser R, Fonatsch C, Gardiner K (septiembre de 1997). "Activación de un gen nuevo en 3q21 e identificación de transcripciones de fusión intergénica con el sitio de inserción viral ecotrópico I en leucemia". Cancer Research . 57 (18): 3914–9. PMID  9307271.
  161. ^ Papamichos SI, Margaritis D, Kotsianidis I (2015). "La evolución adaptativa acoplada con la exaptación de retrotransposones permitió la generación de un gen codificante específico de proteína humana que promueve la proliferación de células cancerosas y la metástasis tanto en neoplasias hematológicas como en tumores sólidos: el caso extraordinario del gen MYEOV". Scientifica . 2015 : 984706. doi : 10.1155/2015/984706 . PMC 4629056 . PMID  26568894. 
  162. ^ ab Kozlov AP (2016). "Expresión de genes evolutivamente novedosos en tumores". Agentes infecciosos y cáncer . 11 : 34. doi : 10.1186/s13027-016-0077-6 . PMC 4949931. PMID  27437030 . 
  163. ^ Li CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW, et al. (marzo de 2010). "Un gen codificador de proteínas de novo específico de humanos asociado con funciones cerebrales humanas". PLOS Computational Biology . 6 (3): e1000734. Bibcode :2010PLSCB...6E0734L. doi : 10.1371/journal.pcbi.1000734 . PMC 2845654 . PMID  20376170. 
  164. ^ ab Zhang YE, Landback P, Vibranovski MD, Long M (octubre de 2011). "Reclutamiento acelerado de nuevos genes de desarrollo cerebral en el genoma humano". PLOS Biology . 9 (10): e1001179. doi : 10.1371/journal.pbio.1001179 . PMC 3196496 . PMID  22028629. 
  165. ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A, et al. (diciembre de 2014). "La transcripción endógena específica de primates impulsada por retrovirus define células madre similares a las ingenuas" (PDF) . Nature . 516 (7531): 405–9. Bibcode :2014Natur.516..405W. doi :10.1038/nature13804. PMID  25317556. S2CID  205240839.
  166. ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E, et al. (enero de 1999). "Un antígeno de histocompatibilidad menor humano específico para la leucemia linfoblástica aguda de células B". The Journal of Experimental Medicine . 189 (2): 301–8. doi :10.1084/jem.189.2.301. PMC 2192993 . PMID  9892612. 
  167. ^ Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, et al. (enero de 2009). "InterPro: la base de datos de firmas de proteínas integradora". Nucleic Acids Research . 37 (número de la base de datos): D211-5. doi :10.1093/nar/gkn785. PMC 2686546 . PMID  18940856. 
  168. ^ Murphy DN, McLysaght A (2012). "Origen de novo de genes codificadores de proteínas en roedores murinos". PLOS ONE . ​​7 (11): e48650. Bibcode :2012PLoSO...748650M. doi : 10.1371/journal.pone.0048650 . PMC 3504067 . PMID  23185269. 
  169. ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR, et al. (abril de 2019). "Evolución rápida de la diversidad de proteínas mediante el origen de novo en Oryza". Nature Ecology & Evolution . 3 (4): 679–690. Bibcode :2019NatEE...3..679Z. doi :10.1038/s41559-019-0822-5. PMID  30858588. S2CID  73728579.
  170. ^ Prabh N, Rödelsperger C (julio de 2019). "De novo, divergencia y origen mixto contribuyen a la aparición de genes huérfanos en los nematodos Pristionchus". G3 . 9 (7): 2277–2286. doi :10.1534/g3.119.400326. PMC 6643871 . PMID  31088903.