stringtranslate.com

Nacimiento de genes de novo

Pueden surgir nuevos genes de regiones ancestralmente no genéticas a través de mecanismos poco comprendidos. (A) Una región no genética primero obtiene la transcripción y un marco de lectura abierto (ORF), en cualquier orden, lo que facilita el nacimiento de un gen de novo . El ORF tiene solo fines ilustrativos, ya que los genes de novo también pueden ser multiexónicos o carecer de un ORF, como ocurre con los genes de ARN . (B) Sobreimpresión. Se crea un ORF novedoso que se superpone con un ORF existente, pero en un marco diferente. (C) Exonización. Una región anteriormente intrónica se empalma alternativamente como un exón, como cuando se adquieren secuencias repetitivas mediante retroposición y se crean nuevos sitios de empalme mediante procesos mutacionales . La sobreimpresión y la exonización pueden considerarse casos especiales de nacimiento de genes de novo.
Se pueden formar nuevos genes a partir de genes ancestrales mediante diversos mecanismos. [1] (A) Duplicación y divergencia. Después de la duplicación, una copia experimenta una selección relajada y gradualmente adquiere funciones novedosas. (B) Fusión genética. Un gen híbrido formado a partir de algunos o todos dos genes previamente separados. Las fusiones de genes pueden ocurrir por diferentes mecanismos; Aquí se muestra una eliminación intersticial. (C) Fisión genética. Un solo gen se separa para formar dos genes distintos, como por duplicación y degeneración diferencial de las dos copias. [2] (D) Transferencia genética horizontal . Los genes adquiridos de otras especies mediante transferencia horizontal sufren divergencia y neofuncionalización. (E) Retroposición. Las transcripciones pueden transcribirse de forma inversa e integrarse como un gen sin intrones en otra parte del genoma. Este nuevo gen puede entonces sufrir divergencia.

El nacimiento de genes de novo es el proceso mediante el cual nuevos genes evolucionan a partir de ADN no codificante . [1] [3] Los genes de novo representan un subconjunto de genes nuevos y pueden codificar proteínas o actuar como genes de ARN. [4] Los procesos que gobiernan el nacimiento de genes de novo no se comprenden bien, aunque existen varios modelos que describen posibles mecanismos mediante los cuales puede ocurrir el nacimiento de genes de novo .

Aunque el nacimiento de genes de novo puede haber ocurrido en cualquier punto de la historia evolutiva de un organismo, los eventos de nacimientos de genes de novo antiguos son difíciles de detectar. La mayoría de los estudios de genes de novo hasta la fecha se han centrado en genes jóvenes, típicamente genes taxonómicamente restringidos (TRG) que están presentes en una sola especie o linaje, incluidos los llamados genes huérfanos , definidos como genes que carecen de cualquier homólogo identificable. Es importante señalar, sin embargo, que no todos los genes huérfanos surgen de novo , sino que pueden surgir a través de mecanismos bastante bien caracterizados, como la duplicación de genes (incluida la retroposición) o la transferencia horizontal de genes seguida de divergencia de secuencias o fisión/fusión de genes . [5] [6]

Aunque alguna vez se consideró que el nacimiento de genes de novo era algo muy improbable, [7] ahora se han descrito varios ejemplos inequívocos, [8] y algunos investigadores especulan que el nacimiento de genes de novo podría desempeñar un papel importante en la innovación evolutiva, la especificación morfológica y la adaptación, [9] [10] probablemente promovida por su bajo nivel de pleiotropía .

Historia

Ya en la década de 1930, JBS Haldane y otros sugirieron que las copias de genes existentes pueden dar lugar a nuevos genes con funciones novedosas. [6] En 1970, Susumu Ohno publicó el texto fundamental Evolution by Gene Duplication . [11] Durante algún tiempo posteriormente, la opinión consensuada fue que prácticamente todos los genes se derivaban de genes ancestrales, [12] y François Jacob comentó en un ensayo de 1977 que "la probabilidad de que una proteína funcional apareciera de novo por asociación aleatoria de aminoácidos es prácticamente cero." [7]

Sin embargo, ese mismo año, Pierre-Paul Grassé acuñó el término " sobreimpresión " para describir la aparición de genes mediante la expresión de marcos de lectura abiertos (ORF) alternativos que se superponen a genes preexistentes. [13] Estos nuevos ORF pueden estar fuera de marco o ser antisentido con el gen preexistente. También pueden estar en el marco del ORF existente, creando una versión truncada del gen original, o representar extensiones 3' de un ORF existente en un ORF cercano. Los dos primeros tipos de sobreimpresión pueden considerarse como un subtipo particular de nacimiento de genes de novo ; aunque se superpone con una región previamente codificante del genoma, la secuencia de aminoácidos primaria de la nueva proteína es completamente nueva y deriva de un marco que previamente no contenía un gen. Los primeros ejemplos de este fenómeno en bacteriófagos se informaron en una serie de estudios realizados entre 1976 y 1978, [14] [15] [16] y desde entonces se han identificado muchos otros ejemplos en virus, bacterias y varias especies eucariotas. [17] [18] [19] [20] [21] [22]

El fenómeno de la exonización también representa un caso especial de nacimiento de genes de novo , en el que, por ejemplo, secuencias intrónicas a menudo repetitivas adquieren sitios de empalme mediante mutación, lo que conduce a exones de novo . Esto se describió por primera vez en 1994 en el contexto de secuencias de Alu encontradas en las regiones codificantes de los ARNm de primates. [23] Curiosamente, estos exones de novo se encuentran con frecuencia en variantes de empalme menores, lo que puede permitir la "prueba" evolutiva de secuencias nuevas conservando al mismo tiempo la funcionalidad de las variantes de empalme principales. [24]

Aún así, algunos pensaban que la mayoría o todas las proteínas eucariotas se construyeban a partir de un conjunto limitado de exones de "tipo inicial". [25] Utilizando los datos de secuencia disponibles en ese momento, una revisión de 1991 estimó que el número de exones eucariotas ancestrales únicos era <60.000, [25] mientras que en 1992 se publicó un artículo que estimaba que la gran mayoría de las proteínas no pertenecían a más de 1.000 familias. [26] Sin embargo, casi al mismo tiempo, se publicó la secuencia del cromosoma III de la levadura en ciernes Saccharomyces cerevisiae , [27] lo que representa la primera vez que se secuencia un cromosoma completo de cualquier organismo eucariota. A principios de 1996 se completó la secuenciación de todo el genoma nuclear de la levadura mediante un esfuerzo internacional masivo de colaboración. [28] En su revisión del proyecto del genoma de la levadura, Bernard Dujon señaló que la inesperada abundancia de genes que carecían de homólogos conocidos fue quizás el hallazgo más sorprendente de todo el proyecto. [28]

En 2006 y 2007, una serie de estudios proporcionaron posiblemente los primeros ejemplos documentados de nacimiento de genes de novo que no implicaban sobreimpresión. [29] [30] [31] Estos estudios se realizaron utilizando los transcriptomas de las glándulas accesorias de Drosophila yakuba y Drosophila erecta e identificaron 20 genes putativos de linaje restringido que parecía poco probable que hubieran resultado de la duplicación de genes. [31] Levine y sus colegas identificaron y confirmaron cinco genes candidatos de novo específicos de Drosophila melanogaster y/o Drosophila simulans, estrechamente relacionados , mediante un enfoque riguroso que combinaba técnicas bioinformáticas y experimentales. [30]

Desde estos estudios iniciales, muchos grupos han identificado casos específicos de eventos de nacimiento de genes de novo en diversos organismos. [32] El primer gen de novo identificado en levadura, el gen BSC4 , se identificó en S. cerevisiae en 2008. Este gen muestra evidencia de selección purificadora, se expresa tanto a nivel de ARNm como de proteína, y cuando se elimina es sintéticamente letal con otros dos. genes de levadura, todos los cuales indican un papel funcional para el producto del gen BSC4 . [33] Históricamente, un argumento en contra de la noción de un nacimiento generalizado de genes de novo es la complejidad evolucionada del plegamiento de proteínas. Curiosamente, más tarde se demostró que Bsc4 adopta un estado parcialmente plegado que combina propiedades del plegamiento de proteínas nativas y no nativas. [34] En las plantas, el primer gen de novo que se caracterizó funcionalmente fue QQS , un gen de Arabidopsis thaliana identificado en 2009 que regula el metabolismo del carbono y el nitrógeno. [35] El primer gen de novo funcionalmente caracterizado identificado en ratones, un gen de ARN no codificante, también se describió en 2009. [36] En primates, un análisis informático de 2008 estimó que 15/270 genes huérfanos de primates se habían formado de novo . [37] Un informe de 2009 identificó los primeros tres genes humanos de novo , uno de los cuales es un objetivo terapéutico en la leucemia linfocítica crónica. [38] Desde entonces, una gran cantidad de estudios a nivel genómico han identificado una gran cantidad de genes huérfanos en muchos organismos, aunque siguen siendo objeto de debate el grado en que surgieron de novo y el grado en que pueden considerarse funcionales.

Identificación

Identificación de secuencias emergentes de novo.

Hay dos enfoques principales para la identificación sistemática de genes nuevos: filoestratigrafía genómica [39] y métodos basados ​​en sintenia . [40] Ambos enfoques se utilizan ampliamente, de forma individual o complementaria.

Filoestratigrafía genómica

La filoestratigrafía genómica implica examinar cada gen en una especie focal o de referencia e inferir la presencia o ausencia de homólogos ancestrales mediante el uso de algoritmos de alineación de secuencias BLAST [41] o herramientas relacionadas. A cada gen de la especie focal se le puede asignar una edad (también conocida como “nivel de conservación” o “filoestrato genómico”) que se basa en una filogenia predeterminada, correspondiendo la edad a las especies relacionadas más lejanamente en las que se detecta un homólogo. [39] Cuando un gen carece de cualquier homólogo detectable fuera de su propio genoma, o de parientes cercanos, se dice que es un gen nuevo, taxonómicamente restringido o huérfano.

La filoestratigrafía está limitada por el conjunto de genomas estrechamente relacionados que están disponibles y los resultados dependen de los criterios de búsqueda BLAST. [42] Además, a menudo es difícil determinar, basándose en la falta de similitud de secuencia observada, si un nuevo gen ha surgido de novo o ha divergido de un gen ancestral más allá del reconocimiento, por ejemplo, después de un evento de duplicación. Así lo señaló un estudio que simuló la evolución de genes de la misma edad y encontró que los ortólogos distantes pueden ser indetectables para genes que evolucionan rápidamente. [43] Por otro lado, al tener en cuenta los cambios en la tasa de evolución en regiones jóvenes de genes, un enfoque filoestratigráfico fue más preciso al asignar edades de genes en datos simulados. [44] Estudios posteriores que utilizaron evolución simulada encontraron que la filoestratigrafía no logró detectar un ortólogo en las especies más lejanamente relacionadas para el 13,9% de los genes de D. melanogaster y el 11,4% de los genes de S. cerevisiae . [45] [46] Sin embargo, un nuevo análisis de estudios que utilizaron filoestratigrafía en levaduras, moscas de la fruta y humanos encontró que incluso cuando se tenían en cuenta tales tasas de error y se excluyeban genes difíciles de estratificar de los análisis, las conclusiones cualitativas no se vieron afectadas. [47] El impacto del sesgo filoestratigráfico en los estudios que examinan diversas características de los genes de novo sigue siendo debatido.

Enfoques basados ​​en Synteny

Los enfoques basados ​​en Synteny utilizan el orden y el posicionamiento relativo de los genes (u otras características) para identificar los ancestros potenciales de los genes candidatos de novo . [10] [42] Las alineaciones sinténicas están ancladas por "marcadores" conservados. Los genes son el marcador más común para definir bloques sinténicos, aunque también se utilizan k-meros y exones. [48] ​​[40] La confirmación de que la región sinténica carece de potencial de codificación en especies externas permite afirmar un origen de novo con mayor confianza. [42] La evidencia más fuerte posible para la aparición de novo es la inferencia de las mutaciones "habilitadoras" específicas que crearon el potencial de codificación, típicamente a través del análisis de regiones de secuencia más pequeñas, denominadas regiones microsinténicas, de especies estrechamente relacionadas.

Un desafío al aplicar métodos basados ​​en sintenia es que la sintenia puede ser difícil de detectar en escalas de tiempo más largas. Para abordar esto, se han creado varias técnicas de optimización, como el uso de exones agrupados independientemente de su orden específico para definir bloques sinténicos [40] o algoritmos que utilizan regiones genómicas bien conservadas para expandir bloques microsintéticos. [49] También existen dificultades asociadas con la aplicación de enfoques basados ​​en sintenia a conjuntos de genomas que están fragmentados [50] o en linajes con altas tasas de reordenamientos cromosómicos, como es común en los insectos. [51] Los enfoques basados ​​en Synteny se pueden aplicar a estudios de genes de novo en todo el genoma [37] [38] [52] [53] [54] [55] [56] [57] y representan un área prometedora de investigación algorítmica. Desarrollo para la datación genética por nacimiento. Algunos han utilizado enfoques basados ​​en sintenia en combinación con búsquedas de similitud en un intento de desarrollar procesos estrictos y estandarizados [58] que puedan aplicarse a cualquier grupo de genomas en un intento de abordar las discrepancias en las diversas listas de genes de novo que se han identificado. generado.

Determinación del estatus

Incluso cuando se ha establecido el origen evolutivo de una secuencia codificante particular, todavía falta consenso sobre lo que constituye un evento genuino de nacimiento de un gen de novo . Una de las razones de esto es la falta de acuerdo sobre si la totalidad de la secuencia debe ser de origen no genético. Para los genes de novo que codifican proteínas , se ha propuesto que los genes de novo se dividan en subtipos según la proporción del ORF en cuestión que se derivó de una secuencia previamente no codificante. [42] Además, para que se produzca el nacimiento de un gen de novo , la secuencia en cuestión debe ser un gen que haya llevado a cuestionar qué constituye un gen, estableciendo algunos modelos una dicotomía estricta entre secuencias genéticas y no genéticas, y otros proponiendo un continuo más fluido. [59]

Todas las definiciones de genes están vinculadas a la noción de función, ya que generalmente se acepta que un gen genuino debería codificar un producto funcional, ya sea ARN o proteína. Sin embargo, existen diferentes puntos de vista sobre lo que constituye una función, dependiendo de si una secuencia determinada se evalúa mediante enfoques genéticos, bioquímicos o evolutivos. [42] [60] [61] [62] La ambigüedad del concepto de "función" es especialmente problemática para el campo del nacimiento de genes de novo , donde los objetos de estudio a menudo están evolucionando rápidamente. [62] Para abordar estos desafíos, el modelo de función de Pittsburgh deconstruye "función" en cinco significados para describir las diferentes propiedades que adquiere un locus que experimenta el nacimiento de un gen de novo : expresión, capacidades, interacciones, implicaciones fisiológicas e implicaciones evolutivas. [62]

Generalmente se acepta que un gen genuino de novo se expresa al menos en algún contexto, [5] permitiendo que opere la selección, y muchos estudios utilizan evidencia de expresión como criterio de inclusión para definir genes de novo . La expresión de secuencias a nivel de ARNm se puede confirmar de forma individual mediante técnicas como la PCR cuantitativa , o de forma global mediante secuenciación de ARN (RNA-seq) . De manera similar, la expresión a nivel de proteína se puede determinar con alta confianza para proteínas individuales utilizando técnicas como la espectrometría de masas o la transferencia Western , mientras que el perfilado de ribosomas (Ribo-seq) proporciona un estudio global de la traducción en una muestra determinada. Idealmente, para confirmar que un gen surgió de novo , también se demostraría una falta de expresión de la región sinténica de especies exógenas. [63]

Los enfoques genéticos para detectar un fenotipo específico o un cambio en la aptitud tras la interrupción de una secuencia particular son útiles para inferir la función. [61] También se pueden emplear otros enfoques experimentales, incluidas las pruebas de detección de interacciones proteína-proteína y/o genéticas, para confirmar un efecto biológico de un ORF de novo particular .

Se pueden emplear enfoques evolutivos para inferir la existencia de una función molecular a partir de firmas de selección derivadas computacionalmente. En el caso de los TRG, una firma común de selección es la proporción de sustituciones no sinónimas y sinónimas ( relación dN/dS ), calculada a partir de diferentes especies del mismo taxón. De manera similar, en el caso de genes específicos de especies, se pueden usar datos de polimorfismo para calcular una relación pN/pS de diferentes cepas o poblaciones de la especie focal. Dado que los genes de novo jóvenes y específicos de especies carecen de una conservación profunda por definición, detectar desviaciones estadísticamente significativas de 1 puede ser difícil sin un número irrealmente grande de cepas/poblaciones secuenciadas. Un ejemplo de esto puede verse en Mus musculus , donde tres genes de novo muy jóvenes carecen de firmas de selección a pesar de sus funciones fisiológicas bien demostradas. [64] Por esta razón, los enfoques pN/pS a menudo se aplican a grupos de genes candidatos, lo que permite a los investigadores inferir que al menos algunos de ellos están conservados evolutivamente, sin poder especificar cuáles. En su lugar, se han empleado otras firmas de selección, como el grado de divergencia de nucleótidos dentro de las regiones sinténicas, la conservación de los límites ORF o, para genes codificadores de proteínas, una puntuación de codificación basada en las frecuencias de hexámeros de nucleótidos. [65] [66]

Predominio

Estimaciones de números

Las estimaciones de frecuencia y número de genes de novo en varios linajes varían ampliamente y dependen en gran medida de la metodología. Los estudios pueden identificar genes de novo únicamente mediante filoestratigrafía/métodos basados ​​en BLAST, o pueden emplear una combinación de técnicas computacionales, y pueden evaluar o no evidencia experimental de expresión y/o papel biológico. [10] Además, los análisis a escala del genoma pueden considerar todos o la mayoría de los ORF en el genoma, [59] o, en cambio, pueden limitar su análisis a genes previamente anotados.

El linaje de D. melanogaster es ilustrativo de estos diferentes enfoques. Una encuesta inicial que utilizó una combinación de búsquedas BLAST realizadas en secuencias de ADNc junto con búsquedas manuales e información sintética identificó 72 nuevos genes específicos de D. melanogaster y 59 nuevos genes específicos de tres de las cuatro especies del complejo de especies de D. melanogaster . Este informe encontró que sólo 2/72 (~2,8%) de los nuevos genes específicos de D. melanogaster y 7/59 (~11,9%) de los nuevos genes específicos del complejo de especies se derivaron de novo , [56] y el resto surgió mediante duplicación/retroposición. De manera similar, un análisis de 195 genes jóvenes (<35 millones de años) de D. melanogaster identificados a partir de alineamientos sinténicos encontró que solo 16 habían surgido de novo . [54] Por el contrario, un análisis centrado en datos transcriptómicos de los testículos de seis cepas de D. melanogaster identificó 106 genes fijos y 142 genes segregantes de novo . [55] Para muchos de estos, se identificaron ORF ancestrales pero no se expresaron. Un estudio más reciente encontró que hasta el 39 % de los genes huérfanos en el clado de Drosophila pueden haber surgido de novo , ya que se superponen con regiones no codificantes del genoma. [67] Destacando las diferencias entre las comparaciones entre especies e intraespecies, un estudio en poblaciones naturales de Saccharomyces paradoxus encontró que el número de polipéptidos de novo identificados se duplicó con creces al considerar la diversidad intraespecies. [68] En primates, uno de los primeros estudios identificó 270 genes huérfanos (exclusivos de humanos, chimpancés y macacos), de los cuales se pensaba que 15 se habían originado de novo . [37] Informes posteriores identificaron muchos más genes de novo solo en humanos que están respaldados por evidencia transcripcional y proteómica. [57] [69] Los estudios en otros linajes/organismos también han llegado a conclusiones diferentes con respecto al número de genes de novo presentes en cada organismo, así como a los conjuntos específicos de genes identificados. En la siguiente tabla se describe una muestra de estos estudios a gran escala.

En términos generales, sigue debatiéndose si la duplicación y la divergencia o el nacimiento de genes de novo representan el mecanismo dominante para la aparición de nuevos genes, [54] [56] [59] [70] [71] [72] en parte porque los genes de novo Es probable que surjan y se pierdan con más frecuencia que otros genes jóvenes. En un estudio sobre el origen de genes huérfanos en tres linajes eucariotas diferentes, los autores descubrieron que, en promedio, sólo alrededor del 30% de los genes huérfanos pueden explicarse mediante divergencia de secuencias. [72]

Dinámica

Es importante distinguir entre la frecuencia del nacimiento de genes de novo y el número de genes de novo en un linaje determinado. Si el nacimiento de genes de novo es frecuente, se podría esperar que los genomas tiendan a crecer en su contenido genético con el tiempo; sin embargo, el contenido genético de los genomas suele ser relativamente estable. [10] Esto implica que un proceso frecuente de muerte genética debe equilibrar el nacimiento de genes de novo y, de hecho, los genes de novo se distinguen por su rápido recambio en relación con los genes establecidos. En apoyo de esta idea, es mucho más probable que se pierdan genes de Drosophila surgidos recientemente, principalmente a través de pseudogenización , siendo los huérfanos más jóvenes los que se pierden en mayor proporción; [73] esto a pesar del hecho de que se ha demostrado que algunos genes huérfanos de Drosophila se vuelven esenciales rápidamente. [54] Se observó una tendencia similar de pérdida frecuente entre familias de genes jóvenes en el género de nematodos Pristionchus . [74] De manera similar, un análisis de cinco transcriptomas de mamíferos encontró que la mayoría de los ORF en ratones eran muy antiguos o específicos de cada especie, lo que implicaba un nacimiento y muerte frecuentes de transcripciones de novo . [71] Se podría mostrar una tendencia comparable mediante análisis adicionales de seis transcriptomas de primates. [69] En poblaciones silvestres de S. paradoxus , ORF de novo emergen y se pierden a tasas similares. [68] Sin embargo, sigue existiendo una correlación positiva entre el número de genes específicos de una especie en un genoma y la distancia evolutiva desde su ancestro más reciente. [75] [67] También se encontró una rápida ganancia y pérdida de genes de novo a nivel poblacional al analizar nueve poblaciones naturales de espinosos de tres espinas. [76] Además del nacimiento y muerte de genes de novo a nivel del ORF, los procesos mutacionales y de otro tipo también someten a los genomas a un constante "cambio transcripcional". Un estudio en murinos encontró que, si bien todas las regiones del genoma ancestral se transcribieron en algún momento en al menos un descendiente, la porción del genoma bajo transcripción activa en una cepa o subespecie determinada está sujeta a cambios rápidos. [77] El recambio transcripcional de los genes de ARN no codificantes es particularmente rápido en comparación con los genes codificantes. [78]

Ejemplos de genes de novo

Características

Características generales

Los genes de novo surgidos recientemente difieren de los genes establecidos en varios aspectos. En una amplia gama de especies, se ha informado que los genes jóvenes y/o taxonómicamente restringidos tienen una longitud más corta que los genes establecidos, tienen una carga más positiva, evolucionan más rápidamente [88] y se expresan menos. [37] [59] [73] [74] [89] [90] [91] [92] [93] [94] [ 95] [ 96] [71] [69] [67 ] [76] [ excesivo citas ] Aunque estas tendencias podrían ser el resultado de un sesgo de detección de homología, un nuevo análisis de varios estudios que tuvieron en cuenta este sesgo encontró que las conclusiones cualitativas alcanzadas no se vieron afectadas. [47] Otra característica incluye la tendencia de los genes jóvenes a tener sus aminoácidos hidrofóbicos más agrupados uno cerca del otro a lo largo de la secuencia primaria. [97] [98]

También se ha descubierto que la expresión de genes jóvenes es más específica de tejido o condición que la de genes establecidos. [29] [31] [37] [55] [57] [59] [94] [99] [100] [101] [67] [76] En particular, se observó una expresión relativamente alta de genes de novo en hombres tejidos reproductivos en Drosophila , espinosos, ratones y humanos, y en el cerebro humano. [57] [102] [67] [76] En animales con sistemas inmunes adaptativos, una mayor expresión en el cerebro y los testículos puede ser una función de la naturaleza inmune privilegiada de estos tejidos. Un análisis en ratones encontró expresión específica de transcripciones intergénicas en el timo y el bazo (además del cerebro y los testículos). Se ha propuesto que en los vertebrados las transcripciones de novo deben expresarse primero en tejidos que carecen de células inmunitarias antes de que puedan expresarse en tejidos que tienen vigilancia inmunitaria. [101]

Tasa evolutiva

Para la evolución de secuencias, los estudios de análisis dN/dS a menudo indican que los genes de novo evolucionan a un ritmo mayor en comparación con otros genes. [103] [88] Para la evolución de la expresión y la evolución estructural, los estudios cuantitativos en diferentes edades evolutivas o ramas filoestratigráficas son muy pocos.

Características que promueven el nacimiento de genes de novo

También es interesante comparar características de genes de novo surgidos recientemente con el conjunto de ORF no genéticos de los que emergen. Los modelos teóricos han demostrado que tales diferencias son producto tanto de la selección de características que aumentan la probabilidad de funcionalización como de fuerzas evolutivas neutrales que influyen en el recambio alélico. [104] Los experimentos en S. cerevisiae mostraron que los dominios transmembrana predichos estaban fuertemente asociados con efectos beneficiosos de aptitud física cuando se sobreexpresaban ORF jóvenes, pero no cuando se sobreexpresaban ORF establecidos (más antiguos). [105] Los experimentos en E. coli mostraron que los péptidos aleatorios tendían a tener efectos más benignos cuando estaban enriquecidos con aminoácidos que eran pequeños y que promovían el desorden estructural intrínseco. [106]

Características dependientes del linaje

Las características de los genes de novo pueden depender de la especie o linaje que se examine. Esto parece ser en parte el resultado de la variación del contenido de GC en los genomas y de que los genes jóvenes tienen más similitudes con secuencias no genéticas del genoma en el que surgieron que los genes establecidos. [107] Las características de la proteína resultante, como el porcentaje de residuos transmembrana y la frecuencia relativa de varias características estructurales secundarias predichas , muestran una fuerte dependencia de GC en genes huérfanos, mientras que en genes más antiguos estas características solo están débilmente influenciadas por el contenido de GC. [107]

La relación entre la edad del gen y la cantidad de trastorno estructural intrínseco (ISD) prevista en las proteínas codificadas ha sido objeto de un debate considerable. Se ha afirmado que la ISD también es una característica dependiente del linaje, ejemplificada por el hecho de que en organismos con un contenido de GC relativamente alto, desde D. melanogaster hasta el parásito Leishmania major , los genes jóvenes tienen una ISD alta, [108] [109] mientras que en un genoma de GC bajo, como el de la levadura en ciernes, varios estudios han demostrado que los genes jóvenes tienen una ISD baja. [59] [89] [96] [107] Sin embargo, un estudio que excluyó genes jóvenes con evidencia dudosa de funcionalidad, definidos en términos binarios como bajo selección para la retención de genes, encontró que los genes de levadura jóvenes restantes tienen una alta ISD, lo que sugiere que el resultado de la levadura puede deberse a la contaminación del conjunto de genes jóvenes con ORF que no cumplen con esta definición y, por lo tanto, es más probable que tengan propiedades que reflejen el contenido de GC y otras características no genéticas del genoma. [110] Más allá de los huérfanos más jóvenes, este estudio encontró que la ISD tiende a disminuir a medida que aumenta la edad del gen, y que esto se debe principalmente a la composición de aminoácidos más que al contenido de GC. [110] En escalas de tiempo más cortas, el uso de genes de novo que tienen la mayor validación sugiere que los genes más jóvenes están más desordenados en Lachancea , pero menos desordenados en Saccharomyces . [96] El desorden estructural intrínseco y la propensión a la agregación no mostraron diferencias significativas con la edad en algunos estudios de mamíferos [71] y primates, [69] pero sí en otros estudios de mamíferos. [110] Un gran estudio de toda la base de datos de dominios de proteínas de Pfam mostró un enriquecimiento del dominio de proteínas más joven para los aminoácidos que promueven trastornos en los animales, pero un enriquecimiento sobre la base de la disponibilidad de aminoácidos en las plantas. [98]

Papel de las modificaciones epigenéticas.

Un examen de genes de novo en A. thaliana encontró que están hipermetilados y, en general, carecen de modificaciones de histonas . [53] De acuerdo con el modelo de protogen o la contaminación con no genes, los niveles de metilación de los genes de novo fueron intermedios entre los genes establecidos y las regiones intergénicas. Los patrones de metilación de estos genes de novo se heredan de manera estable, y los niveles de metilación fueron más altos, y más similares a los genes establecidos, en genes de novo con capacidad verificada de codificación de proteínas. [53] En el hongo patógeno Magnaporthe oryzae , los genes menos conservados tienden a tener patrones de metilación asociados con niveles bajos de transcripción. [111] Un estudio en levaduras también encontró que los genes de novo están enriquecidos en puntos críticos de recombinación , que tienden a ser regiones libres de nucleosomas. [96]

En Pristionchus pacificus , los genes huérfanos con expresión confirmada muestran estados de cromatina que difieren de los de genes establecidos expresados ​​de manera similar. [95] Los sitios de inicio de genes huérfanos tienen firmas epigenéticas que son características de los potenciadores, en contraste con los genes conservados que exhiben promotores clásicos. [95] Muchos genes huérfanos no expresados ​​están decorados con modificaciones represivas de histonas, mientras que la falta de tales modificaciones facilita la transcripción de un subconjunto expresado de huérfanos, lo que respalda la idea de que la cromatina abierta promueve la formación de nuevos genes. [95]

Evolución estructural

Las proteínas de novo suelen exhibir estructuras secundarias y tridimensionales menos definidas, a menudo carecen de plegamiento rígido pero tienen extensas regiones desordenadas. [103] [110] Aún faltan análisis cuantitativos sobre la evolución de los elementos estructurales secundarios y terciarios a lo largo del tiempo. Como la estructura suele estar más conservada que la secuencia, la comparación de estructuras entre ortólogos podría proporcionar información más profunda sobre la aparición y evolución de genes de novo y ayudar a confirmar que estos genes son verdaderos genes de novo . [112] Sin embargo, hasta ahora sólo se han caracterizado estructural y funcionalmente muy pocas proteínas de novo , especialmente debido a problemas con la purificación de proteínas y su posterior estabilidad. Se han logrado avances utilizando diferentes etiquetas de purificación, tipos de células y acompañantes. [113]

La 'glucoproteína anticongelante' (AFGP) del bacalao ártico evita que su sangre se congele en aguas árticas. [84] [83] Se ha demostrado que Bsc4, una proteína corta no esencial de novo en la levadura, [33] está formada principalmente por láminas β y tiene un núcleo hidrofóbico. [34] Está asociado a la reparación del ADN en condiciones de deficiencia de nutrientes. [114] La proteína Goddard de Drosophila de novo se caracterizó por primera vez en 2017. Las moscas macho Knockdown de Drosophila melanogaster no pudieron producir esperma. [80] Recientemente, se pudo demostrar que esta falta se debía a una falla en la individualización de las espermátidas alargadas. Mediante el uso de predicciones computacionales filogenómicas y estructurales, análisis estructurales experimentales y ensayos biológicos celulares, se propuso que la mitad de la estructura de Goddard está desordenada y la otra mitad está compuesta por aminoácidos alfa-helicoidales. Estos análisis también indicaron que los ortólogos de Goddard muestran resultados similares. Por tanto, la estructura de Goddard parece haberse conservado principalmente desde su aparición. [81]

Mecanismos

expresión generalizada

Con el desarrollo de tecnologías como RNA-seq y Ribo-seq, ahora se sabe que los genomas eucariotas se transcriben y traducen de manera generalizada [115] [116] [117] [118] . [119] Muchos ORF que no están anotados o que están anotados como ARN largos no codificantes (lncRNA) se traducen en algún nivel, ya sea en una condición o de manera específica de tejido. [59] [119] [120] [121] [122] [123] Aunque son poco frecuentes, estos eventos de traducción exponen la secuencia no genética a la selección. Esta expresión generalizada forma la base de varios modelos que describen el nacimiento de genes de novo .

Se ha especulado que el panorama epigenético de los genes de novo en las primeras etapas de formación puede ser particularmente variable entre poblaciones, lo que da como resultado una expresión genética variable, permitiendo así que los genes jóvenes exploren el "paisaje de expresión". [124] El gen QQS en A. thaliana es un ejemplo de este fenómeno; su expresión está regulada negativamente por la metilación del ADN que, si bien es hereditaria durante varias generaciones, varía ampliamente en sus niveles tanto entre muestras naturales como dentro de poblaciones silvestres. [124] La epigenética también es en gran medida responsable del entorno transcripcional permisivo en los testículos, particularmente a través de la incorporación en los nucleosomas de variantes de histonas no canónicas que son reemplazadas por protaminas similares a histonas durante la espermatogénesis. [125]

ORF intergénicos como módulos estructurales elementales.

El análisis de la diversidad potencial de pliegue muestra que se predice que la mayoría de las secuencias de aminoácidos codificadas por los ORF intergénicos de S. cerevisiae serán plegables. [126] Más importante aún, estas secuencias de aminoácidos con potencial de plegamiento pueden servir como bloques de construcción elementales para genes de novo o integrarse en genes preexistentes. [126]

Orden de eventos

Para que se produzca el nacimiento de un gen codificador de proteínas de novo , una secuencia no genética debe transcribirse y adquirir un ORF antes de traducirse. Estos eventos podrían ocurrir en cualquier orden, y hay evidencia que respalda tanto un modelo de "ORF primero" como de "transcripción primero". [5] [127] Un análisis de genes de novo que se segregan en D. melanogaster encontró que las secuencias que se transcriben tenían un potencial de codificación similar al de las secuencias ortólogas de líneas que carecen de evidencia de transcripción. [55] Este hallazgo respalda la idea de que muchos ORF pueden existir antes de ser transcritos. El gen de la glicoproteína anticongelante AFGP , que surgió de novo en los bacalaos del Ártico, proporciona un ejemplo más definitivo en el que se demostró que la aparición de novo del ORF precede a la región promotora. [83] Además, los ORF supuestamente no genéticos lo suficientemente largos como para codificar péptidos funcionales son numerosos en los genomas eucariotas y se espera que ocurran con alta frecuencia por casualidad. [55] [59] A través del seguimiento de la historia de la evolución de las secuencias ORF y la activación de la transcripción de genes humanos de novo , un estudio demostró que algunos ORF estaban listos para conferir importancia biológica a su nacimiento. [127] Al mismo tiempo, la transcripción de genomas eucariotas es mucho más extensa de lo que se pensaba anteriormente, y hay ejemplos documentados de regiones genómicas que se transcribieron antes de la aparición de un ORF que se convirtió en un gen de novo . [79] Se desconoce la proporción de genes de novo que codifican proteínas, pero la aparición de “primero la transcripción” ha llevado a algunos a postular que los genes de novo codificantes de proteínas pueden existir primero como intermediarios de genes de ARN. El caso de los ARN bifuncionales, que se traducen y funcionan como genes de ARN, muestra que tal mecanismo es plausible. [128]

Los dos eventos pueden ocurrir simultáneamente cuando el reordenamiento cromosómico es el evento que precipita el nacimiento del gen. [129]

Modelos

Se han descrito varios modelos teóricos y posibles mecanismos del nacimiento de genes de novo . Los modelos generalmente no son mutuamente excluyentes y es posible que múltiples mecanismos puedan dar lugar a genes de novo . [42] Un ejemplo es el gen de la proteína anticongelante tipo III, que se origina a partir de un antiguo gen de la ácido siálico sintasa ( SAS ), en un pez zoárcido antártico.

Hipótesis “fuera del testículo”

Un estudio de caso inicial sobre el nacimiento de genes de novo , que identificó cinco genes de novo en D. melanogaster , observó la expresión preferencial de estos genes en los testículos, [30] y se identificaron varios genes de novo adicionales utilizando datos transcriptómicos derivados de los testículos y Glándulas accesorias masculinas de D. yakuba y D. erecta . [29] [31] Esto concuerda con otros estudios que demostraron que existe una rápida evolución de genes relacionados con la reproducción en una variedad de linajes, [130] [131] [132] lo que sugiere que la selección sexual puede desempeñar un papel clave en la adaptación Evolución y nacimiento de genes de novo . Un análisis posterior a gran escala de seis cepas de D. melanogaster identificó 248 genes de novo expresados ​​en testículos , de los cuales ~57% no estaban fijados. [55] Un estudio reciente sobre doce especies de Drosophila identificó además una mayor proporción de genes de novo con expresión sesgada por los testículos en comparación con el proteoma anotado. [67] Se ha sugerido que la gran cantidad de genes de novo con expresión específica masculina identificada en Drosophila probablemente se deba al hecho de que dichos genes se retienen preferentemente en relación con otros genes de novo , por razones que no están del todo claras. [73] Curiosamente, se demostró que dos supuestos genes de novo en Drosophila ( Goddard y Saturn ) eran necesarios para la fertilidad masculina normal. [80] [81] Una evaluación genética de más de 40 supuestos genes de novo con expresión enriquecida en testículos en Drosophila melanogaster reveló que uno de los genes de novo, atlas , era necesario para la condensación adecuada de la cromatina durante las etapas finales de la espermatogénesis en el hombre. atlas evolucionó a partir de la fusión de un gen codificante de proteínas que surgió en la base del género Drosophila y un ARN no codificante conservado. [133] El análisis comparativo de los transcriptomas de los testículos y las glándulas accesorias, un tejido somático de los machos que es importante para la fertilidad, de D. melanogaster sugiere que los genes de novo contribuyen más a la complejidad transcriptómica de los testículos en comparación con las glándulas accesorias. [134] Secuencia de ARN unicelular de D. melanogastertestis reveló que el patrón de expresión de los genes de novo estaba sesgado hacia la espermatogénesis temprana. [135]

En humanos, un estudio que identificó 60 genes de novo específicos de humanos encontró que su expresión promedio, medida por RNA-seq, era más alta en los testículos. [57] Otro estudio que analizó genes específicos de mamíferos de manera más general también encontró una expresión enriquecida en los testículos. [136] Se cree que la transcripción en los testículos de los mamíferos es particularmente promiscua, debido en parte a la expresión elevada de la maquinaria de transcripción [137] [138] y un entorno de cromatina abierto. [139] Junto con la naturaleza inmune privilegiada de los testículos, se cree que esta transcripción promiscua crea las condiciones ideales para la expresión de secuencias no genéticas necesarias para el nacimiento de genes de novo . La expresión específica de los testículos parece ser una característica general de todos los genes nuevos, ya que un análisis de Drosophila y especies de vertebrados encontró que los genes jóvenes mostraban una expresión sesgada por los testículos independientemente de su mecanismo de origen. [99]

Modelo de preadaptación

El modelo de preadaptación del nacimiento de genes de novo utiliza modelos matemáticos para mostrar que cuando secuencias que normalmente están ocultas se exponen a una selección débil o protegida, el conjunto resultante de secuencias “crípticas” (es decir, protogenes) puede eliminarse de elementos “evidentemente”. variantes nocivas”, como aquellas propensas a conducir a la agregación de proteínas, y por lo tanto enriquecidas en adaptaciones potenciales en relación con un conjunto de secuencias completamente no expresadas y no purgadas. [140] Esta revelación y purga de secuencias crípticas no genéticas perjudiciales es un subproducto de la transcripción y traducción generalizada de secuencias intergénicas, y se espera que facilite el nacimiento de genes codificadores de proteínas funcionales de novo . [122] Esto se debe a que al eliminar las variantes más nocivas, lo que queda, mediante un proceso de eliminación, tiene más probabilidades de ser adaptativo de lo esperado de secuencias aleatorias. Utilizando la definición evolutiva de función (es decir, que un gen está por definición bajo selección purificadora contra pérdida), el modelo de preadaptación supone que “el nacimiento de un gen es una transición repentina a la funcionalidad” [110] que ocurre tan pronto como un ORF adquiere un beneficio neto. efecto. Para evitar ser perjudiciales, se espera que los genes de los recién nacidos muestren versiones exageradas de características genéticas asociadas con la evitación de daños. Esto contrasta con el modelo de protogenes, que espera que los genes recién nacidos tengan características intermedias entre los genes antiguos y los no genes. [110]

Las matemáticas del modelo de preadaptación suponen que la distribución de los efectos de aptitud es bimodal, con nuevas secuencias de mutaciones que tienden a romper algo o a modificar algo, pero rara vez en el medio. [140] [141] Siguiendo esta lógica, las poblaciones pueden desarrollar soluciones locales, en las que la selección opera en cada locus individual y se mantiene una tasa de error relativamente alta, o una solución global con una tasa de error baja que permite la acumulación de datos crípticos nocivos. secuencias. [140] Se cree que el nacimiento de genes de novo se ve favorecido en poblaciones que desarrollan soluciones locales, ya que la tasa de error relativamente alta dará como resultado un conjunto de variación críptica que está "preadaptada" mediante la purga de secuencias nocivas. Las soluciones locales son más probables en poblaciones con un tamaño poblacional efectivo alto .

En apoyo del modelo de preadaptación, un análisis de ISD en ratones y levaduras encontró que los genes jóvenes tienen una ISD más alta que los genes viejos, mientras que las secuencias aleatorias no genéticas tienden a mostrar los niveles más bajos de ISD. [110] Aunque la tendencia observada puede haber resultado en parte de un subconjunto de genes jóvenes derivados de la sobreimpresión, [142] también se observa una ISD más alta en genes jóvenes entre pares de genes virales superpuestos. [143] Con respecto a otras características estructurales predichas, como el contenido de la cadena β y la propensión a la agregación, los péptidos codificados por protogenes son similares a secuencias no genéticas y categóricamente distintos de los genes canónicos. [144]

Modelo de protogen

Este modelo de protogen concuerda con el modelo de preadaptación sobre la importancia de la expresión generalizada y se refiere al conjunto de secuencias expresadas de forma generalizada que no cumplen con todas las definiciones de un gen como "protogenes". [59] En contraste con el modelo de preadaptación, el modelo de protogenes sugiere que los genes recién nacidos tienen características intermedias entre los genes antiguos y los no genes. [110] Específicamente, este modelo prevé un proceso más gradual bajo selección del estado no genético al estado genético, rechazando la clasificación binaria de gen y no gen.

En una extensión del modelo de protogenes, se ha propuesto que a medida que los protogenes se vuelven más parecidos a genes, su potencial de cambio adaptativo da paso a efectos seleccionados; por tanto, el impacto previsto de las mutaciones en la aptitud física depende del estado evolutivo del ORF. [105] Esta noción está respaldada por el hecho de que la sobreexpresión de ORF establecidos en S. cerevisiae tiende a ser menos beneficiosa (y más dañina) que la sobreexpresión de ORF emergentes. [105]

Varias características de los ORF se correlacionan con la edad de los ORF según lo determinado mediante análisis filoestratigráfico, y los ORF jóvenes tienen propiedades intermedias entre los ORF antiguos y los no genes; esto se ha tomado como evidencia a favor del modelo de protogen, en el que el estado del protogen es un continuo. [59] Esta evidencia ha sido criticada, porque también se esperan las mismas tendencias aparentes bajo un modelo en el que la identidad como gen es binaria. Según este modelo, cuando cada grupo de edad contiene una proporción diferente de genes versus no genes, la paradoja de Simpson puede generar correlaciones en la dirección equivocada. [110]

Modelo de crecimiento lento y muda.

El modelo de “crecer lentamente y mudar” describe un mecanismo potencial de nacimiento de genes de novo , en particular en el caso de los genes que codifican proteínas. En este escenario, los ORF que codifican proteínas existentes se expanden en sus extremos, especialmente en sus extremos 3', lo que lleva a la creación de nuevos dominios N y C-terminales. [145] [146] [147] [148] [149] Los nuevos dominios C-terminales pueden evolucionar primero bajo selección débil a través de expresión ocasional a través de traducción de lectura, como en el modelo de preadaptación, y solo más tarde se expresan constitutivamente a través de una mutación que altera el codón de parada. [140] [146] Los genes que experimentan una alta lectura traduccional tienden a tener extremos C intrínsecamente desordenados. [150] Además, los genes existentes suelen estar cerca de secuencias repetitivas que codifican dominios desordenados. Estos nuevos dominios desordenados pueden inicialmente conferir cierta capacidad de unión no específica que se refina gradualmente mediante selección. Las secuencias que codifican estos nuevos dominios pueden ocasionalmente separarse de su ORF original, lo que lleva o contribuye a la creación de un gen de novo . [146] Curiosamente, un análisis de 32 genomas de insectos encontró que los dominios nuevos (es decir, aquellos exclusivos de los insectos) tienden a evolucionar de manera bastante neutral, con solo unos pocos sitios bajo selección positiva, mientras que sus proteínas huésped permanecen bajo selección purificadora, lo que sugiere que se pueden desarrollar nuevos dominios funcionales. Los dominios emergen de forma gradual y un tanto estocástica. [151]

Escape del conflicto adaptativo

El modelo evolutivo de escape del conflicto adaptativo (EAC) propone una posible forma de arreglar la duplicación de nuevos genes: el conflicto debido a una función contrastante dentro de un solo gen impulsa la fijación de una nueva duplicación. [152] [153]

Modelo de barrera pleiotropía

El modelo de la 'barrera pleiotropía' sugiere que los genes recientemente evolucionados, incluidos los genes de novo y los genes relacionados con la duplicación, podrían facilitar la innovación evolutiva o la evolución de funciones específicas debido a su bajo (o nulo) efecto pleiotrópico , cuando se enfrenta a una nueva fuerza selectiva, basada en sobre observaciones de datos de enfermedades genéticas humanas.

Salud humana

Además de su importancia para el campo de la biología evolutiva, el nacimiento de genes de novo tiene implicaciones para la salud humana. Se ha especulado que los genes nuevos, incluidos los genes de novo , pueden desempeñar un papel enorme en los rasgos específicos de las especies; [6] [10] [32] [154] Sin embargo, muchos genes específicos de especies carecen de anotación funcional. [136] Sin embargo, hay evidencia que sugiere que genes de novo específicos de humanos están involucrados en enfermedades como el cáncer. NYCM , un gen de novo exclusivo de humanos y chimpancés, regula la patogénesis de los neuroblastomas en modelos de ratón, [155] y la PART1 específica de primates , un gen lncRNA, ha sido identificado como un supresor de tumores y un oncogén en diferentes contextos. [37] [156] [157] Varios otros genes de novo específicos de humanos o primates , incluidos PBOV1 , [158] GR6 , [159] [160] MYEOV , [161] ELFN1-AS1 , [162] y CLLU1 , [38] también están relacionados con el cáncer. Algunos incluso han sugerido considerar genes novedosos evolutivos expresados ​​específicamente en tumores como su propia clase de elementos genéticos, señalando que muchos de esos genes están bajo selección positiva y pueden neofuncionalizarse en el contexto de los tumores. [162]

La expresión específica de muchos genes de novo en el cerebro humano [57] también plantea la intrigante posibilidad de que los genes de novo influyan en los rasgos cognitivos humanos. Un ejemplo de ello es FLJ33706 , un gen de novo que se identificó en GWAS y análisis de ligamiento para la adicción a la nicotina y muestra una expresión elevada en los cerebros de pacientes con Alzheimer. [163] En términos generales, la expresión de genes jóvenes específicos de primates se enriquece en el cerebro humano fetal en relación con la expresión de genes igualmente jóvenes en el cerebro de ratón. [164] La mayoría de estos genes jóvenes, varios de los cuales se originaron de novo , se expresan en la neocorteza, que se cree que es responsable de muchos aspectos de la cognición específica del ser humano. Muchos de estos genes jóvenes muestran firmas de selección positiva y las anotaciones funcionales indican que están involucrados en diversos procesos moleculares, pero están enriquecidos con factores de transcripción. [164]

Además de su papel en los procesos cancerosos, los genes humanos originados de novo han sido implicados en el mantenimiento de la pluripotencia [165] y en la función inmune. [37] [136] [166] La expresión preferencial de genes de novo en los testículos también sugiere un papel en la reproducción. Dado que la función de muchos genes humanos de novo sigue sin caracterizarse, parece probable que siga aumentando la apreciación de su contribución a la salud y el desarrollo humanos.

Estudios a escala genómica de genes huérfanos y de novo en varios linajes.

Nota: Para los fines de esta tabla, los genes se definen como genes huérfanos (cuando son específicos de una especie) o TRG (cuando se limitan a un grupo de especies estrechamente relacionado) cuando no se ha investigado el mecanismo de origen, y como genes de novo cuando no se ha investigado . Se ha inferido el origen novo , independientemente del método de inferencia. La designación de genes de novo como “candidatos” o “protogenes” refleja el lenguaje utilizado por los autores de los respectivos estudios.

Ver también

Referencias

Este artículo fue adaptado de la siguiente fuente bajo una licencia CC BY 4.0 (2019) (informes de los revisores): Stephen Branden Van Oss; Anne-Ruxandra Carvunis (23 de mayo de 2019). "Nacimiento de genes de novo". PLOS Genética . 15 (5): e1008160. doi :10.1371/JOURNAL.PGEN.1008160. ISSN  1553-7390. PMC  6542195 . PMID  31120894. Wikidata  Q86320144.{{cite journal}}: Mantenimiento CS1: DOI gratuito sin marcar ( enlace )

  1. ^ ab Long M, Betrán E, Thornton K, Wang W (noviembre de 2003). "El origen de nuevos genes: destellos de jóvenes y mayores". Naturaleza Reseñas Genética . 4 (11): 865–75. doi :10.1038/nrg1204. PMID  14634634. S2CID  33999892.
  2. ^ Wang W, Yu H, Long M (mayo de 2004). "Duplicación-degeneración como mecanismo de fisión genética y origen de nuevos genes en especies de Drosophila". Genética de la Naturaleza . 36 (5): 523–7. doi : 10.1038/ng1338 . PMID  15064762.
  3. ^ Levy A (octubre de 2019). "Cómo la evolución construye genes desde cero". Naturaleza . 574 (7778): 314–316. Código Bib :2019Natur.574..314L. doi : 10.1038/d41586-019-03061-x . PMID  31619796.
  4. ^ Schmitz JF, Bornberg-Bauer E (2017). "Realidad o ficción: actualizaciones sobre cómo los genes codificadores de proteínas podrían surgir de novo a partir de un ADN que antes no codificaba". F1000Investigación . 6 : 57. doi : 10.12688/f1000research.10079.1 . PMC 5247788 . PMID  28163910. 
  5. ^ abc Schlötterer C (abril de 2015). "Genes desde cero: el destino evolutivo de los genes de novo". Tendencias en Genética . 31 (4): 215–9. doi :10.1016/j.tig.2015.02.007. PMC 4383367 . PMID  25773713. 
  6. ^ abc Kaessmann H (octubre de 2010). "Orígenes, evolución e impacto fenotípico de nuevos genes". Investigación del genoma . 20 (10): 1313–26. doi :10.1101/gr.101386.109. PMC 2945180 . PMID  20651121. 
  7. ^ ab Jacob F (junio de 1977). "Evolución y retoques". Ciencia . 196 (4295): 1161–1166. Código bibliográfico : 1977 Ciencia... 196.1161J. doi : 10.1126/ciencia.860134. PMID  860134. S2CID  29756896.
  8. ^ Van Oss SB, Carvunis AR (mayo de 2019). "Nacimiento de genes de novo". PLOS Genética . 15 (5): e1008160. doi : 10.1371/journal.pgen.1008160 . PMC 6542195 . PMID  31120894. 
  9. ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (septiembre de 2009). "Más que huérfanos: ¿son importantes en la evolución los genes taxonómicamente restringidos?". Tendencias en Genética . 25 (9): 404–413. doi :10.1016/j.tig.2009.07.006. PMID  19716618.
  10. ^ abcde Tautz D, Domazet-Lošo T (agosto de 2011). "El origen evolutivo de los genes huérfanos". Reseñas de la naturaleza. Genética . 12 (10): 692–702. doi :10.1038/nrg3053. PMID  21878963. S2CID  31738556.
  11. ^ Ohno S (1970) Evolución por duplicación de genes Allen & Unwin ; Springer-Verlag
  12. ^ TautzD (2014). "El descubrimiento de la evolución genética de novo". Perspectivas en Biología y Medicina . 57 (1): 149–61. doi :10.1353/pbm.2014.0006. hdl : 11858/00-001M-0000-0024-3416-1 . PMID  25345708. S2CID  29552265.
  13. ^ Grassé PP (1977) Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación Academic Press
  14. ^ Barrell BG, Air GM, Hutchison CA (noviembre de 1976). "Genes superpuestos en el bacteriófago phiX174". Naturaleza . 264 (5581): 34–41. Código bibliográfico : 1976Natur.264...34B. doi :10.1038/264034a0. PMID  1004533. S2CID  4264796.
  15. ^ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (abril de 1978). "Gen K, un nuevo gen superpuesto en el bacteriófago G4". Naturaleza . 272 (5653): 510–5. Código Bib :1978Natur.272..510S. doi :10.1038/272510a0. PMID  692656. S2CID  4218777.
  16. ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Naturaleza . 265 (5596): 687–95. Código Bib :1977Natur.265..687S. doi :10.1038/265687a0. PMID  870828. S2CID  4206886.
  17. ^ Keese PK, Gibbs A (octubre de 1992). "Orígenes de los genes: ¿" big bang "o creación continua?". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Código bibliográfico : 1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . PMC 50157 . PMID  1329098. 
  18. ^ Ohno S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia codificante internamente repetitiva preexistente". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Código bibliográfico : 1984PNAS...81.2421O. doi : 10.1073/pnas.81.8.2421 . PMC 345072 . PMID  6585807. 
  19. ^ Sabath N, Wagner A, Karlin D (diciembre de 2012). "La evolución de las proteínas virales se originó de novo por sobreimpresión". Biología Molecular y Evolución . 29 (12): 3767–80. doi :10.1093/molbev/mss179. PMC 3494269 . PMID  22821011. 
  20. ^ Makałowska I, Lin CF, Hernandez K (octubre de 2007). "Nacimiento y muerte de superposiciones de genes en vertebrados". Biología Evolutiva del BMC . 7 (1): 193. Código bibliográfico : 2007BMCEE...7..193M. doi : 10.1186/1471-2148-7-193 . PMC 2151771 . PMID  17939861. 
  21. ^ Samandi S, Roy AV, Delcourt V, Lucier JF, Gagnon J, Beaudoin MC y col. (octubre de 2017). "La anotación profunda del transcriptoma permite el descubrimiento y la caracterización funcional de pequeñas proteínas crípticas". eVida . 6 . doi : 10.7554/eLife.27860 . PMC 5703645 . PMID  29083303. 
  22. ^ ab Khan YA, Jungreis I, Wright JC, Mudge JM, Choudhary JS, Firth AE, Kellis M (marzo de 2020). "Evidencia de una nueva secuencia codificante superpuesta en POLG iniciada en un codón de inicio CUG". Genética BMC . 21 (1): 25. doi : 10.1186/s12863-020-0828-7 . PMC 7059407 . PMID  32138667. 
  23. ^ Makałowski W, Mitchell GA, Labuda D (junio de 1994). "Secuencias de Alu en las regiones codificantes del ARNm: una fuente de variabilidad de proteínas". Tendencias en Genética . 10 (6): 188–93. doi :10.1016/0168-9525(94)90254-2. PMID  8073532.
  24. ^ Sorek R (octubre de 2007). "El nacimiento de nuevos exones: mecanismos y consecuencias evolutivas". ARN . 13 (10): 1603–8. doi :10.1261/rna.682507. PMC 1986822 . PMID  17709368. 
  25. ^ ab Dorit RL, Gilbert W (diciembre de 1991). "El universo limitado de los exones". Opinión actual en genética y desarrollo . 1 (4): 464–9. doi :10.1016/S0959-437X(05)80193-5. PMID  1822278.
  26. ^ Chothia C (junio de 1992). "Proteínas. Mil familias para el biólogo molecular". Naturaleza . 357 (6379): 543–4. Código Bib :1992Natur.357..543C. doi : 10.1038/357543a0 . PMID  1608464. S2CID  4355476.
  27. ^ Oliver SG, van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (mayo de 1992). "La secuencia completa de ADN del cromosoma III de la levadura". Naturaleza . 357 (6373): 38–46. Código Bib :1992Natur.357...38O. doi :10.1038/357038a0. PMID  1574125. S2CID  4271784.
  28. ^ ab Dujon B (julio de 1996). "El proyecto del genoma de la levadura: ¿qué aprendimos?". Tendencias en Genética . 12 (7): 263–70. doi :10.1016/0168-9525(96)10027-5. PMID  8763498.
  29. ^ abc Begun DJ, Lindfors HA, Kern AD, Jones CD (junio de 2007). "Evidencia de la evolución de novo de genes expresados ​​en testículos en el clado de Drosophila yakuba / Drosophila erecta". Genética . 176 (2): 1131–7. doi :10.1534/genética.106.069245. PMC 1894579 . PMID  17435230. 
  30. ^ abc Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (junio de 2006). "Los nuevos genes derivados del ADN no codificante en Drosophila melanogaster están frecuentemente ligados al cromosoma X y exhiben una expresión sesgada por los testículos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (26): 9935–9. Código Bib : 2006PNAS..103.9935L. doi : 10.1073/pnas.0509809103 . PMC 1502557 . PMID  16777968. 
  31. ^ abcd Begun DJ, Lindfors HA, Thompson ME, Holloway AK (marzo de 2006). "Genes recientemente evolucionados identificados a partir de etiquetas de secuencia expresadas en glándulas accesorias de Drosophila yakuba y D. erecta". Genética . 172 (3): 1675–81. doi :10.1534/genética.105.050336. PMC 1456303 . PMID  16361246. 
  32. ^ ab McLysaght A, Guerzoni D (septiembre de 2015). "Nuevos genes de secuencia no codificante: el papel de los genes codificadores de proteínas de novo en la innovación evolutiva de eucariotas". Transacciones filosóficas de la Royal Society de Londres. Serie B, Ciencias Biológicas . 370 (1678): 20140332. doi :10.1098/rstb.2014.0332. PMC 4571571 . PMID  26323763. 
  33. ^ abc Cai J, Zhao R, Jiang H, Wang W (mayo de 2008). "Origen de novo de un nuevo gen codificador de proteínas en Saccharomyces cerevisiae". Genética . 179 (1): 487–96. doi :10.1534/genética.107.084491. PMC 2390625 . PMID  18493065. 
  34. ^ abc Bungard D, Copple JS, Yan J, Chhun JJ, Kumirov VK, Foy SG y otros. (noviembre de 2017). "Plegabilidad de una proteína natural evolucionada de novo". Estructura . 25 (11): 1687–1696.e4. doi :10.1016/j.str.2017.09.006. PMC 5677532 . PMID  29033289. 
  35. ^ ab Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM, et al. (mayo de 2009). "Identificación de la nueva proteína QQS como componente de la red metabólica del almidón en las hojas de Arabidopsis". El diario de las plantas . 58 (3): 485–98. doi : 10.1111/j.1365-313X.2009.03793.x . PMID  19154206.
  36. ^ ab Heinen TJ, Staubach F, Häming D, Tautz D (septiembre de 2009). "Aparición de un nuevo gen de una región intergénica". Biología actual . 19 (18): 1527–31. Código Bib : 2009CBio...19.1527H. doi : 10.1016/j.cub.2009.07.049 . PMID  19733073. S2CID  12446879.
  37. ^ abcdefgh Toll-Riera M, Bosch N, Bellora N, Castelo R, Armengol L, Estivill X, et al. (Marzo de 2009). "Origen de los genes huérfanos de primates: un enfoque de genómica comparada". Biología Molecular y Evolución . 26 (3): 603–12. doi : 10.1093/molbev/msn281 . PMID  19064677.
  38. ^ abcd Knowles DG, McLysaght A (octubre de 2009). "Origen reciente de novo de genes codificadores de proteínas humanas". Investigación del genoma . 19 (10): 1752–9. doi :10.1101/gr.095026.109. PMC 2765279 . PMID  19726446. 
  39. ^ ab Domazet-Loso T, Brajković J, Tautz D (noviembre de 2007). "Un enfoque de filoestratigrafía para descubrir la historia genómica de las principales adaptaciones en linajes de metazoos". Tendencias en Genética . 23 (11): 533–9. doi :10.1016/j.tig.2007.08.014. PMID  18029048.
  40. ^ abc Gehrmann T, Reinders MJ (noviembre de 2015). "Proteny: descubrir y visualizar grupos sinténicos estadísticamente significativos a nivel de proteoma". Bioinformática . 31 (21): 3437–44. doi : 10.1093/bioinformática/btv389. PMC 4612220 . PMID  26116928. 
  41. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de biología molecular . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.
  42. ^ abcdef McLysaght A, Hurst LD (septiembre de 2016). "Preguntas abiertas en el estudio de genes de novo: qué, cómo y por qué". Naturaleza Reseñas Genética . 17 (9): 567–78. doi :10.1038/nrg.2016.78. PMID  27452112. S2CID  6033249.[ enlace muerto permanente ]
  43. ^ Elhaik E, Sabath N, Graur D (enero de 2006). "La" relación inversa entre la tasa de evolución y la edad de los genes de los mamíferos "es un artefacto de una mayor distancia genética con la tasa de evolución y el tiempo de divergencia". Biología Molecular y Evolución . 23 (1): 1–3. doi : 10.1093/molbev/msj006 . PMID  16151190.
  44. ^ Albà MM, Castresana J (abril de 2007). "Sobre las búsquedas de homología por proteína Blast y la caracterización de la edad de los genes". Biología Evolutiva del BMC . 7 (1): 53. Código bibliográfico : 2007BMCEE...7...53A. doi : 10.1186/1471-2148-7-53 . PMC 1855329 . PMID  17408474. 
  45. ^ Moyers BA, Zhang J (mayo de 2016). "Evaluación de la evidencia filoestratigráfica del nacimiento generalizado de genes de novo en la evolución del genoma". Biología Molecular y Evolución . 33 (5): 1245–56. doi :10.1093/molbev/msw008. PMC 5010002 . PMID  26758516. 
  46. ^ Moyers BA, Zhang J (enero de 2015). "El sesgo filoestratigráfico crea patrones falsos de evolución del genoma". Biología Molecular y Evolución . 32 (1): 258–67. doi :10.1093/molbev/msu286. PMC 4271527 . PMID  25312911. 
  47. ^ ab Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R, et al. (Abril de 2017). "No hay evidencia de que el sesgo filoestratigráfico afecte las inferencias sobre los patrones de aparición y evolución genética". Biología Molecular y Evolución . 34 (4): 843–856. doi :10.1093/molbev/msw284. PMC 5400388 . PMID  28087778. 
  48. ^ Ghiurcuta CG, Moret BM (junio de 2014). "Evaluación de Synteny para mejorar estudios comparativos". Bioinformática . 30 (12): i9-18. doi : 10.1093/bioinformática/btu259. PMC 4058928 . PMID  24932010. 
  49. ^ Jean G, Nikolski M (2011). "SyDiG: descubriendo Synteny en genomas distantes" (PDF) . Revista internacional de investigación y aplicaciones de bioinformática . 7 (1): 43–62. doi :10.1504/IJBRA.2011.039169. PMID  21441096. S2CID  2644451.
  50. ^ Liu D, Hunt M, Tsai IJ (enero de 2018). "Inferir sintenia entre ensamblajes de genomas: una evaluación sistemática". Bioinformática BMC . 19 (1): 26. doi : 10.1186/s12859-018-2026-4 . PMC 5791376 . PMID  29382321. 
  51. ^ Ranz JM, Casals F, Ruiz A (febrero de 2001). "¿Qué tan maleable es el genoma eucariota? Tasa extrema de reordenamiento cromosómico en el género Drosophila". Investigación del genoma . 11 (2): 230–9. doi :10.1101/gr.162901. PMC 311025 . PMID  11157786. 
  52. ^ ab Lu TC, Leu JY, Lin WC (noviembre de 2017). "Un análisis completo de genes de novo compatibles con transcripción en levaduras Saccharomyces sensu estricto". Biología Molecular y Evolución . 34 (11): 2823–2838. doi :10.1093/molbev/msx210. PMC 5850716 . PMID  28981695. 
  53. ^ abcd Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (agosto de 2016). "Sobre el origen de los genes De Novo en poblaciones de Arabidopsis thaliana". Biología y evolución del genoma . 8 (7): 2190–202. doi : 10.1093/gbe/evw164. PMC 4987118 . PMID  27401176. 
  54. ^ abcdefgh Chen S, Zhang YE, Long M (diciembre de 2010). "Los nuevos genes de Drosophila rápidamente se vuelven esenciales". Ciencia . 330 (6011): 1682–5. Código Bib : 2010 Ciencia... 330.1682C. doi : 10.1126/ciencia.1196380. PMC 7211344 . PMID  21164016. S2CID  7899890. 
  55. ^ abcdefg Zhao L, Saelao P, Jones CD, Begun DJ (febrero de 2014). "Origen y difusión de genes de novo en poblaciones de Drosophila melanogaster". Ciencia . 343 (6172): 769–72. Código Bib : 2014 Ciencia... 343..769Z. doi : 10.1126/ciencia.1248286. PMC 4391638 . PMID  24457212. 
  56. ^ abcd Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. (Septiembre de 2008). "Sobre el origen de nuevos genes en Drosophila". Investigación del genoma . 18 (9): 1446–55. doi :10.1101/gr.076588.108. PMC 2527705 . PMID  18550802. 
  57. ^ abcdefg Wu DD, Irwin DM, Zhang YP (noviembre de 2011). "Origen de novo de genes codificadores de proteínas humanas". PLOS Genética . 7 (11): e1002379. doi : 10.1371/journal.pgen.1002379 . PMC 3213175 . PMID  22102831. 
  58. ^ Vakirlis N, McLysaght A (2019). "Predicción computacional de genes codificadores de proteínas surgidos de Novo". Métodos computacionales en la evolución de proteínas . Métodos en biología molecular. vol. 1851. Saltador. págs. 63–81. doi :10.1007/978-1-4939-8736-8_4. ISBN 978-1-4939-8735-1. PMID  30298392. S2CID  52942639.
  59. ^ abcdefghijkl Carvunis AR, Rolland T, Wapinski I, Calderwood MA, Yildirim MA, Simonis N, et al. (Julio de 2012). "Protogenes y nacimiento de genes de novo". Naturaleza . 487 (7407): 370–374. Código Bib :2012Natur.487..370C. doi : 10.1038/naturaleza11184. PMC 3401362 . PMID  22722833. 
  60. ^ Doolittle WF, Brunet TD, Linquist S, Gregory TR (mayo de 2014). "Distinguir entre" función "y" efecto "en biología del genoma". Biología y evolución del genoma . 6 (5): 1234-1237. doi : 10.1093/gbe/evu098. PMC 4041003 . PMID  24814287. 
  61. ^ ab Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (Abril de 2014). "Definición de elementos funcionales del ADN en el genoma humano". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (17): 6131–6138. Código Bib : 2014PNAS..111.6131K. doi : 10.1073/pnas.1318948111 . PMC 4035993 . PMID  24753594. 
  62. ^ abc Keeling DM, Garza P, Nartey CM, Carvunis AR (noviembre de 2019). "Los significados de 'función' en biología y el caso problemático de la aparición de genes de novo". eVida . 8 . doi : 10.7554/eLife.47014 . PMC 6824840 . PMID  31674305. 
  63. ^ Andersson DI, Jerlström-Hultqvist J, Näsvall J (junio de 2015). "Evolución de nuevas funciones de novo y a partir de genes preexistentes". Perspectivas de Cold Spring Harbor en biología . 7 (6): a017996. doi : 10.1101/cshperspect.a017996. PMC 4448608 . PMID  26032716. 
  64. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (Enero de 2019). "El estudio de los inicios de la aparición de genes de novo en ratones revela una rápida integración de nuevos genes en redes funcionales". bioRxiv . bioRxiv 10.1101/510214 . doi : 10.1101/510214 . 
  65. ^ Ruiz-Orera J, Hernández-Rodríguez J, Chiva C, Sabidó E, Kondova I, Bontrop R, et al. (Diciembre de 2015). "Orígenes de los genes de novo en humanos y chimpancés". PLOS Genética . 11 (12): e1005721. arXiv : 1507.07744 . Código Bib : 2015arXiv150707744R. doi : 10.1371/journal.pgen.1005721 . PMC 4697840 . PMID  26720152. 
  66. ^ MIYATA, TAKASHI; YASUNAGA, TERUO; NISHIDA, TOSHIRO (1980). "Divergencia de secuencia de nucleótidos y restricción funcional en la evolución del ARNm". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 77 (12): 7328–7332. Código bibliográfico : 1980PNAS...77.7328M. doi : 10.1073/pnas.77.12.7328 . PMC 350496 . PMID  6938980. 
  67. ^ abcdefg Heames B, Schmitz J, Bornberg-Bauer E (mayo de 2020). "Una continuidad de genes de novo en evolución impulsa la novedad en la codificación de proteínas en Drosophila". Revista de evolución molecular . 88 (4): 382–398. Código Bib : 2020JMolE..88..382H. doi :10.1007/s00239-020-09939-z. PMC 7162840 . PMID  32253450. 
  68. ^ abc Durand É, Gagnon-Arsenault I, Hallin J, Hatin I, Dubé AK, Nielly-Thibault L, et al. (junio de 2019). "La rotación de transcripciones asociadas a ribosomas de ORF de novo produce características similares a genes disponibles para la aparición de genes de novo en poblaciones de levadura salvaje". Investigación del genoma . 29 (6): 932–943. doi : 10.1101/gr.239822.118 . PMC 6581059 . PMID  31152050. 
  69. ^ abcde Dowling D, Schmitz JF, Bornberg-Bauer E (noviembre de 2020). "Ganancia estocástica y pérdida de marcos de lectura abiertos transcritos novedosos en el linaje humano". Biología y evolución del genoma . 12 (11): 2183–2195. doi : 10.1093/gbe/evaa194. PMC 7674706 . PMID  33210146. 
  70. ^ ab Neme R, Tautz D (febrero de 2013). "Los patrones filogenéticos de aparición de nuevos genes respaldan un modelo de evolución frecuente de novo". Genómica BMC . 14 : 117. doi : 10.1186/1471-2164-14-117 . PMC 3616865 . PMID  23433480. 
  71. ^ abcde Schmitz JF, Ullrich KK, Bornberg-Bauer E (octubre de 2018). "Los genes incipientes de novo pueden evolucionar a partir de accidentes congelados que escaparon a la rápida rotación de transcripciones". Ecología y evolución de la naturaleza . 2 (10): 1626-1632. Código Bib : 2018NatEE...2.1626S. doi :10.1038/s41559-018-0639-7. PMID  30201962. S2CID  52181376.
  72. ^ ab Vakirlis N, Carvunis AR, McLysaght A (febrero de 2020). "Los análisis basados ​​en Synteny indican que la divergencia de secuencias no es la principal fuente de genes huérfanos". eVida . 9 . doi : 10.7554/eLife.53500 . PMC 7028367 . PMID  32066524. 
  73. ^ abc Palmieri N, Kosiol C, Schlötterer C (febrero de 2014). "El ciclo de vida de los genes huérfanos de Drosophila". eVida . 3 : e01311. arXiv : 1401.4956 . Código Bib : 2014arXiv1401.4956P. doi : 10.7554/eLife.01311 . PMC 3927632 . PMID  24554240. 
  74. ^ ab Prabh N, Roeseler W, Witte H, Eberhardt G, Sommer RJ, Rödelsperger C (noviembre de 2018). "Nematodos Pristionchus". Investigación del genoma . 28 (11): 1664-1674. doi :10.1101/gr.234971.118. PMC 6211646 . PMID  30232197. 
  75. ^ ab Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). "Mecanismos y dinámica de la aparición de genes huérfanos en genomas de insectos". Biología y evolución del genoma . 5 (2): 439–55. doi : 10.1093/gbe/evt009. PMC 3590893 . PMID  23348040. 
  76. ^ abcd Schmitz JF, Chain FJ, Bornberg-Bauer E (agosto de 2020). "Evolución de genes nuevos en poblaciones de espinosos de tres espinas". Herencia . 125 (1–2): 50–59. doi :10.1038/s41437-020-0319-7. PMC 7413265 . PMID  32499660. 
  77. ^ Neme R, Tautz D (febrero de 2016). "La rápida rotación de la transcripción del genoma a lo largo del tiempo evolutivo expone todo el ADN no codificante a la aparición de genes de novo". eVida . 5 : e09977. doi : 10.7554/eLife.09977 . PMC 4829534 . PMID  26836309. 
  78. ^ Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC (2012). "Rápido recambio de ARN largos no codificantes y evolución de la expresión genética". PLOS Genética . 8 (7): e1002841. doi : 10.1371/journal.pgen.1002841 . PMC 3406015 . PMID  22844254. 
  79. ^ abcde Reinhardt JA, Wanjiru BM, Brant AT, Saelao P, Begun DJ, Jones CD (2013). "Los ORF de novo en Drosophila son importantes para la aptitud del organismo y evolucionaron rápidamente a partir de secuencias que antes no codificaban". PLOS Genética . 9 (10): e1003860. doi : 10.1371/journal.pgen.1003860 . PMC 3798262 . PMID  24146629. 
  80. ^ abc Gubala AM, Schmitz JF, Kearns MJ, Vinh TT, Bornberg-Bauer E, Wolfner MF, Findlay GD (mayo de 2017). "Los genes Goddard y Saturn son esenciales para la fertilidad masculina de Drosophila y pueden haber surgido de novo". Biología Molecular y Evolución . 34 (5): 1066–1082. doi :10.1093/molbev/msx057. PMC 5400382 . PMID  28104747. 
  81. ^ abc Lange A, Patel PH, Heames B, Damry AM, Saenger T, Jackson CJ y col. (Marzo de 2021). "Caracterización estructural y funcional de un supuesto gen de novo en Drosophila". Comunicaciones de la naturaleza . 12 (1): 1667. Bibcode : 2021NatCo..12.1667L. doi :10.1038/s41467-021-21667-6. PMC 7954818 . PMID  33712569. 
  82. ^ Zile K, Dessimoz C, Wurm Y, Masel J (agosto de 2020). "Sólo se puede identificar con alta confianza una única familia de genes taxonómicamente restringida en el subgrupo de Drosophila melanogaster". Biología y evolución del genoma . 12 (8): 1355-1366. doi : 10.1093/gbe/evaa127. PMC 8059200 . PMID  32589737. 
  83. ^ abc Zhuang X, Yang C, Murphy KR, Cheng CC (marzo de 2019). "Mecanismo molecular e historia de la evolución sin sentido del gen de la glicoproteína anticongelante en gadids del norte". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 116 (10): 4400–4405. Código Bib : 2019PNAS..116.4400Z. doi : 10.1073/pnas.1817138116 . PMC 6410882 . PMID  30765531. 
  84. ^ ab Baalsrud HT, Tørresen OK, Solbakken MH, Salzburger W, Hanel R, Jakobsen KS, Jentoft S (marzo de 2018). "Evolución genética de novo de glicoproteínas anticongelantes en bacalaos revelada por datos de secuencia completa del genoma". Biología Molecular y Evolución . 35 (3): 593–606. doi :10.1093/molbev/msx311. PMC 5850335 . PMID  29216381. 
  85. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (agosto de 2019). "Un gen evolucionado de novo en el ratón doméstico regula los ciclos de embarazo femenino". eVida . 8 . doi : 10.7554/eLife.44392 . PMC 6760900 . PMID  31436535. 
  86. ^ Li D, Dong Y, Jiang Y, Jiang H, Cai J, Wang W (abril de 2010). "Un gen originado de novo deprime la vía de apareamiento de la levadura en ciernes y es reprimido por la proteína codificada por su cadena antisentido". Investigación celular . 20 (4): 408–20. doi : 10.1038/cr.2010.31 . PMID  20195295.
  87. ^ Li D, Yan Z, Lu L, Jiang H, Wang W (diciembre de 2014). "Pleiotropía del gen MDF1 originado de novo". Informes científicos . 4 : 7280. Código Bib : 2014NatSR...4E7280L. doi :10.1038/srep07280. PMC 4250933 . PMID  25452167. 
  88. ^ ab Moutinho AF, Eyre-Walker A, Dutheil JY (septiembre de 2022). "Fuerte evidencia del modelo de caminata adaptativa de la evolución genética en Drosophila y Arabidopsis". Más biología . 20 (9): e3001775. doi : 10.1371/journal.pbio.3001775 . PMC 9470001 . PMID  36099311. 
  89. ^ abc Ekman D, Elofsson A (febrero de 2010). "Identificación y cuantificación de secuencias de proteínas huérfanas en hongos". Revista de biología molecular . 396 (2): 396–405. doi :10.1016/j.jmb.2009.11.053. PMID  19944701.
  90. ^ Domazet-Loso T, Tautz D (octubre de 2003). "Un análisis evolutivo de genes huérfanos en Drosophila". Investigación del genoma . 13 (10): 2213–2219. doi :10.1101/gr.1311003. PMC 403679 . PMID  14525923. 
  91. ^ Guo WJ, Li P, Ling J, Ye SP (2007). "Características comparativas significativas entre genes huérfanos y no huérfanos en el genoma del arroz (Oryza sativa L.)". Genómica comparada y funcional . 2007 : 21676. doi : 10.1155/2007/21676 . PMC 2216055 . PMID  18273382. 
  92. ^ Wolf YI, Novichkov PS, Karev GP, Koonin EV, Lipman DJ (mayo de 2009). "La distribución universal de las tasas evolutivas de los genes y las distintas características de los genes eucariotas de diferentes edades aparentes". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (18): 7273–7280. doi : 10.1073/pnas.0901808106 . PMC 2666616 . PMID  19351897. 
  93. ^ ab Sun W, Zhao XW, Zhang Z (septiembre de 2015). "Identificación y evolución de los genes huérfanos en el gusano de seda doméstico Bombyx mori". Cartas FEBS . 589 (19 parte B): 2731–2738. doi : 10.1016/j.febslet.2015.08.008 . PMID  26296317.
  94. ^ abc Donoghue MT, Keshavaiah C, Swamidtta SH, Spillane C (febrero de 2011). "Orígenes evolutivos de genes específicos de Brassicaceae en Arabidopsis thaliana". Biología Evolutiva del BMC . 11 (1): 47. Código bibliográfico : 2011BMCEE..11...47D. doi : 10.1186/1471-2148-11-47 . PMC 3049755 . PMID  21332978. 
  95. ^ abcd Werner MS, Sieriebriennikov B, Prabh N, Loschko T, Lanz C, Sommer RJ (noviembre de 2018). "Los genes jóvenes tienen una estructura genética, perfiles epigenéticos y regulación transcripcional distintos". Investigación del genoma . 28 (11): 1675–1687. doi :10.1101/gr.234872.118. PMC 6211652 . PMID  30232198. 
  96. ^ abcde Vakirlis N, Hebert AS, Opulente DA, Achaz G, Hittinger CT, Fischer G, et al. (Marzo de 2018). "Un retrato molecular de genes de novo en levaduras". Biología Molecular y Evolución . 35 (3): 631–645. doi :10.1093/molbev/msx315. PMC 5850487 . PMID  29220506. 
  97. ^ Foy SG, Wilson BA, Bertram J, Cordes MH, Masel J (abril de 2019). "Un cambio en la estrategia para evitar la agregación marca una dirección a largo plazo hacia la evolución de las proteínas". Genética . 211 (4): 1345-1355. doi :10.1534/genética.118.301719. PMC 6456324 . PMID  30692195. 
  98. ^ ab James JE, Willis SM, Nelson PG, Weibel C, Kosinski LJ, Masel J (enero de 2021). "Tendencias universales y específicas de taxones en secuencias de proteínas en función de la edad". eVida . 10 : e57347. doi : 10.7554/eLife.57347 . PMC 7819706 . PMID  33416492. 
  99. ^ ab Zhang JY, Zhou Q (enero de 2019). "Sobre la evolución regulatoria de nuevos genes a lo largo de su historia de vida". Biología Molecular y Evolución . 36 (1): 15-27. doi : 10.1093/molbev/msy206 . PMID  30395322. S2CID  53216993.
  100. ^ Wu B, Knudson A (julio de 2018). "Origen de novo de genes codificadores de proteínas en levadura". mBio . 9 (4). doi :10.1128/mBio.01024-18. PMC 6069113 . PMID  30065088. 
  101. ^ ab Bekpen C, Xie C, Tautz D (agosto de 2018). "Abordar el sistema inmunológico adaptativo durante la evolución de novo de genes a partir de secuencias intergénicas". Biología Evolutiva del BMC . 18 (1): 121. Código bibliográfico : 2018BMCEE..18..121B. doi : 10.1186/s12862-018-1232-z . PMC 6091031 . PMID  30075701. 
  102. ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A, et al. (2018). "Miles de experimentos de secuenciación de ARN a gran escala producen una nueva lista completa de genes humanos y revelan un amplio ruido transcripcional". bioRxiv . bioRxiv 10.1101/332825 . doi : 10.1101/332825 . 
  103. ^ ab Peng, Junhui; Zhao, Li (27 de junio de 2023), "El origen y la evolución estructural de los genes de novo en Drosophila", BioRxiv: The Preprint Server for Biology , doi :10.1101/2023.03.13.532420, PMC 10326970 , PMID  37425675 , recuperado en 2023- 12-25 
  104. ^ Nielly-Thibault L, Landry CR (agosto de 2019). "Las diferencias entre la materia prima y los productos del nacimiento del gen de Novo pueden deberse a sesgos mutacionales". Genética . 212 (4): 1353-1366. doi :10.1534/genética.119.302187. PMC 6707459 . PMID  31227545. 
  105. ^ abc Vakirlis N, Acar O, Hsu B, Castilho Coelho N, Van Oss SB, Wacholder A, et al. (febrero de 2020). "Surgimiento de novo de proteínas de membrana adaptativas a partir de secuencias genómicas ricas en timina". Comunicaciones de la naturaleza . 11 (1): 781. Código bibliográfico : 2020NatCo..11..781V. doi :10.1038/s41467-020-14500-z. PMC 7005711 . PMID  32034123. 
  106. ^ Kosinski L, Avilés N, Gomez K, Masel J (junio de 2022). "Los péptidos aleatorios ricos en aminoácidos pequeños que promueven trastornos tienen menos probabilidades de ser dañinos". Biología y evolución del genoma . 14 (6): evac085. doi : 10.1093/gbe/evac085. PMC 9210321 . PMID  35668555. 
  107. ^ abc Basile W, Sachenkova O, Light S, Elofsson A (marzo de 2017). "El alto contenido de GC hace que las proteínas huérfanas estén intrínsecamente desordenadas". PLOS Biología Computacional . 13 (3): e1005375. Código Bib : 2017PLSCB..13E5375B. doi : 10.1371/journal.pcbi.1005375 . PMC 5389847 . PMID  28355220. 
  108. ^ Bitard-Feildel T, Heberlein M, Bornberg-Bauer E, Callebaut I (diciembre de 2015). "Detección de dominios huérfanos en Drosophila mediante "análisis de clusters hidrofóbicos"". Biochimie . 119 : 244–53. doi : 10.1016/j.biochi.2015.02.019. PMID  25736992.
  109. ^ Mukherjee S, Panda A, Ghosh TC (junio de 2015). "Aclarar las características evolutivas y las implicaciones funcionales de los genes huérfanos en Leishmania major ". Infección, genética y evolución . 32 : 330–7. doi :10.1016/j.meegid.2015.03.031. PMID  25843649.
  110. ^ abcdefghij Wilson BA, Foy SG, Neme R, Masel J (junio de 2017). "Los genes jóvenes están muy desordenados como lo predice la hipótesis de preadaptación del nacimiento de genes de novo". Ecología y evolución de la naturaleza . 1 (6): 0146–146. Código Bib : 2017NatEE...1..146W. doi :10.1038/s41559-017-0146. PMC 5476217 . PMID  28642936. 
  111. ^ Jeon J, Choi J, Lee GW, Park SY, Huh A, Dean RA y col. (febrero de 2015). "El perfil de la metilación del ADN en todo el genoma proporciona información sobre la regulación epigenética del desarrollo de hongos en un hongo fitopatógeno, Magnaporthe oryzae". Informes científicos . 5 : 8567. Código Bib : 2015NatSR...5E8567J. doi : 10.1038/srep08567. PMC 4338423 . PMID  25708804. 
  112. ^ Bornberg-Bauer E, Hlouchova K, Lange A (junio de 2021). "Estructura y función de proteínas de novo evolucionadas naturalmente". Opinión actual en biología estructural . 68 : 175–183. doi : 10.1016/j.sbi.2020.11.010 . PMID  33567396.
  113. ^ Eicholt, Lars A.; Aubel, Margaux; Berk, Katrin; Bornberg-Bauer, Erich; Lange, Andreas (13 de julio de 2022). "Expresión heteróloga de supuestas proteínas de novo evolucionadas naturalmente con acompañantes". Ciencia de las proteínas . Wiley. 31 (8): e4371. doi :10.1002/pro.4371. ISSN  0961-8368. PMC 9278007 . PMID  35900020. 
  114. ^ Pan X, Ye P, Yuan DS, Wang X, Bader JS, Boeke JD (marzo de 2006). "Una red de integridad del ADN en la levadura Saccharomyces cerevisiae". Celúla . 124 (5): 1069–1081. doi : 10.1016/j.cell.2005.12.036 . PMID  16487579. S2CID  84338859.
  115. ^ David L, Huber W, Granovskaia M, Toedling J, Palm CJ, Bofkin L, et al. (Abril de 2006). "Un mapa de transcripción de alta resolución en el genoma de la levadura". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (14): 5320–5325. Código Bib : 2006PNAS..103.5320D. doi : 10.1073/pnas.0601091103 . PMC 1414796 . PMID  16569694. 
  116. ^ Tisseur M, Kwapisz M, Morillon A (noviembre de 2011). "Transcripción generalizada: lecciones de la levadura". Bioquimia . 93 (11): 1889–1896. doi :10.1016/j.biochi.2011.07.001. PMID  21771634.
  117. ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (junio de 2008). "El panorama transcripcional del genoma de la levadura definido por secuenciación de ARN". Ciencia . 320 (5881): 1344-1349. Código bibliográfico : 2008 Ciencia... 320.1344N. doi : 10.1126/ciencia.1158441. PMC 2951732 . PMID  18451266. 
  118. ^ Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL, et al. (Julio de 2011). "La realidad de la transcripción generalizada". Más biología . 9 (7): e1000625, discusión e1001102. doi : 10.1371/journal.pbio.1000625 . PMC 3134446 . PMID  21765801. 
  119. ^ ab Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE, et al. (septiembre de 2014). "El perfil de ribosomas revela una traducción generalizada fuera de los genes codificadores de proteínas anotados". Informes celulares . 8 (5): 1365-1379. doi :10.1016/j.celrep.2014.07.045. PMC 4216110 . PMID  25159147. 
  120. ^ Ruiz-Orera J, Verdaguer-Grau P, Villanueva-Cañas JL, Messeguer X, Albà MM (mayo de 2018). "La traducción de péptidos de evolución neutra proporciona una base para la evolución genética de novo". Ecología y evolución de la naturaleza . 2 (5): 890–896. Código Bib : 2018NatEE...2..890R. doi :10.1038/s41559-018-0506-6. hdl : 10230/36048 . PMID  29556078. S2CID  4959952.
  121. ^ Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM (septiembre de 2014). "ARN largos no codificantes como fuente de nuevos péptidos". eVida . 3 : e03523. arXiv : 1405.4174 . Código Bib : 2014arXiv1405.4174R. doi : 10.7554/eLife.03523 . PMC 4359382 . PMID  25233276. 
  122. ^ abc Wilson BA, Masel J (2011). "Las transcripciones supuestamente no codificantes muestran una amplia asociación con los ribosomas". Biología y evolución del genoma . 3 : 1245-1252. doi : 10.1093/gbe/evr099. PMC 3209793 . PMID  21948395. 
  123. ^ Chen J, Brunner AD, Cogan JZ, Nuñez JK, Fields AP, Adamson B, et al. (Marzo de 2020). "Traducción funcional generalizada de marcos de lectura abiertos humanos no canónicos". Ciencia . 367 (6482): 1140-1146. Código Bib : 2020 Ciencia... 367.1140C. doi : 10.1126/ciencia.aay0262. PMC 7289059 . PMID  32139545. 
  124. ^ ab Silveira AB, Trontin C, Cortijo S, Barau J, Del Bem LE, Loudet O, et al. (Abril 2013). "Amplia variación epigenética natural en un gen originado de novo". PLOS Genética . 9 (4): e1003437. doi : 10.1371/journal.pgen.1003437 . PMC 3623765 . PMID  23593031. 
  125. ^ Kimmins S, Sassone-Corsi P (marzo de 2005). "Remodelación de cromatina y características epigenéticas de células germinales". Naturaleza . 434 (7033): 583–9. Código Bib :2005Natur.434..583K. doi : 10.1038/naturaleza03368. PMID  15800613. S2CID  4373304.
  126. ^ ab Papadopoulos C, Callebaut I, Gelly JC, Hatin I, Namy O, Renard M, et al. (noviembre de 2021). "ORF intergénicos como módulos estructurales elementales del nacimiento de genes de novo y la evolución de proteínas". Investigación del genoma . 31 (12): 2303–2315. doi :10.1101/gr.275638.121. PMC 8647833 . PMID  34810219. 
  127. ^ ab Vakirlis, Nikolaos; Vance, Zoé; Duggan, Kate M.; McLysaght, Aoife (20 de diciembre de 2022). "Nacimiento de novo de microproteínas funcionales en el linaje humano". Informes celulares . 41 (12): 111808. doi : 10.1016/j.celrep.2022.111808 . ISSN  2211-1247. PMC 10073203 . PMID  36543139. S2CID  254966620. 
  128. ^ Dinger ME, Pang KC, Mercer TR, Mattick JS (noviembre de 2008). "Diferenciar el ARN codificante y no codificante de proteínas: desafíos y ambigüedades". PLOS Biología Computacional . 4 (11): e1000176. Código Bib : 2008PLSCB...4E0176D. doi : 10.1371/journal.pcbi.1000176 . PMC 2518207 . PMID  19043537. 
  129. ^ Stewart NB, Rogers RL (septiembre de 2019). "Los reordenamientos cromosómicos como fuente de formación de nuevos genes en Drosophila yakuba". PLOS Genética . 15 (9): e1008314. doi : 10.1371/journal.pgen.1008314 . PMC 6776367 . PMID  31545792. 
  130. ^ Swanson WJ, Vacquier VD (febrero de 2002). "La rápida evolución de las proteínas reproductivas". Naturaleza Reseñas Genética . 3 (2): 137–44. doi :10.1038/nrg733. PMID  11836507. S2CID  25696990.
  131. ^ Bustamante CD, Fledel-Alon A, Williamson S, Nielsen R, Hubisz MT, Glanowski S, Tanenbaum DM, White TJ, Sninsky JJ, Hernandez RD, Civello D, Adams MD, Cargill M, Clark AG (octubre de 2005). "Selección natural de genes codificadores de proteínas en el genoma humano". Naturaleza . 437 (7062): 1153–7. Código Bib : 2005Natur.437.1153B. doi : 10.1038/naturaleza04240. PMID  16237444. S2CID  4423768.
  132. ^ Clark NL, Aagaard JE, Swanson WJ (enero de 2006). "Evolución de proteínas reproductivas de animales y plantas". Reproducción . 131 (1): 11-22. doi : 10.1530/rep.1.00357 . PMID  16388004.
  133. ^ Rivard EL, Ludwig AG, Patel PH, Grandchamp A, Arnold SE, Berger A, et al. (septiembre de 2021). "Un supuesto gen evolucionado de novo necesario para la condensación de cromatina de espermátida en Drosophila melanogaster". PLOS Genética . 17 (9): e1009787. doi : 10.1371/journal.pgen.1009787 . PMC 8445463 . PMID  34478447. 
  134. ^ Cridland JM, Majane AC, Zhao L, Begun DJ (enero de 2022). "Biología poblacional de genes de novo expresados ​​en glándulas accesorias en Drosophila melanogaster". Genética . 220 (1). doi : 10.1093/genetics/iyab207. PMC 8733444 . PMID  34791207. 
  135. ^ Witt, Evan; Benjamín, Sigi; Svetec, Nicolás; Zhao, Li (16 de agosto de 2019). Landry, Christian R; Wittkopp, Patricia J; White-Cooper, Helen (eds.). "La secuencia de ARN unicelular de testículo revela la dinámica de la transcripción de genes de novo y el sesgo mutacional de la línea germinal en Drosophila". eVida . 8 : e47138. doi : 10.7554/eLife.47138 . ISSN  2050-084X. PMC 6697446 . PMID  31418408. S2CID  198249413. 
  136. ^ abc Luis Villanueva-Cañas J, Ruiz-Orera J, Agea MI, Gallo M, Andreu D, Albà MM (julio de 2017). "Nuevos genes e innovación funcional en mamíferos". Biología y evolución del genoma . 9 (7): 1886-1900. doi :10.1093/gbe/evx136. PMC 5554394 . PMID  28854603. 
  137. ^ Schmidt EE (julio de 1996). "Promiscuidad transcripcional en los testículos". Biología actual . 6 (7): 768–9. Código Bib : 1996CBio....6..768S. doi : 10.1016/S0960-9822(02)00589-4 . PMID  8805310. S2CID  14318566.
  138. ^ White-Cooper H, Davidson I (julio de 2011). "Aspectos únicos de la regulación de la transcripción en células germinales masculinas". Perspectivas de Cold Spring Harbor en biología . 3 (7): a002626. doi : 10.1101/cshperspect.a002626. PMC 3119912 . PMID  21555408. 
  139. ^ Kleene KC (agosto de 2001). "Una posible función meiótica de los peculiares patrones de expresión genética en células espermatogénicas de mamíferos". Mecanismos de Desarrollo . 106 (1–2): 3–23. doi : 10.1016/S0925-4773(01)00413-0 . PMID  11472831. S2CID  949694.
  140. ^ abcd Rajon E, Masel J (enero de 2011). "Evolución de las tasas de error molecular y las consecuencias para la evolucionabilidad". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (3): 1082–7. Código Bib : 2011PNAS..108.1082R. doi : 10.1073/pnas.1012918108 . PMC 3024668 . PMID  21199946. 
  141. ^ Masel J (marzo de 2006). "La variación genética críptica se enriquece para posibles adaptaciones". Genética . 172 (3): 1985-1991. doi :10.1534/genética.105.051649. PMC 1456269 . PMID  16387877. 
  142. ^ Casola C (2018). "De novo a" de nono ": la mayoría de los genes codificadores de proteínas nuevos identificados con filoestratigrafía representan genes antiguos o duplicados recientes". bioRxiv . bioRxiv 10.1101/287193 . doi : 10.1101/287193 . 
  143. ^ Willis S, Masel J (septiembre de 2018). "El nacimiento de genes contribuye al trastorno estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi : 10.1534/genética.118.301249. PMC 6116962 . PMID  30026186. 
  144. Abrusán G (diciembre de 2013). "Integración de nuevos genes en redes celulares y su maduración estructural". Genética . 195 (4): 1407-1417. doi :10.1534/genética.113.152256. PMC 3832282 . PMID  24056411. 
  145. ^ Giacomelli MG, Hancock AS, Masel J (febrero de 2007). "La conversión de 3 'UTR en regiones codificantes". Biología Molecular y Evolución . 24 (2): 457–464. doi :10.1093/molbev/msl172. PMC 1808353 . PMID  17099057. 
  146. ^ abc Bornberg-Bauer E, Schmitz J, Heberlein M (octubre de 2015). "Aparición de proteínas de novo a partir de 'materia genómica oscura' mediante 'crecimiento lento y muda'". Transacciones de la sociedad bioquímica . 43 (5): 867–873. doi :10.1042/BST20150089. PMID  26517896.
  147. ^ Wilder JA, Hewett EK, Gansner ME (diciembre de 2009). "Evolución molecular de GYPC: evidencia de innovación estructural reciente y selección positiva en humanos". Biología Molecular y Evolución . 26 (12): 2679–2687. doi :10.1093/molbev/msp183. PMC 2775107 . PMID  19679754. 
  148. ^ Vakhrusheva AA, Kazanov MD, Mironov AA, Bazykin GA (febrero de 2011). "Evolución de genes procarióticos mediante cambio de codones de parada". Revista de evolución molecular . 72 (2): 138-146. Código Bib : 2011JMolE..72..138V. doi :10.1007/s00239-010-9408-1. PMID  21082168. S2CID  812377.
  149. ^ Andreatta ME, Levine JA, Foy SG, Guzman LD, Kosinski LJ, Cordes MH, Masel J (mayo de 2015). "El reciente origen de novo de la proteína C-Termini". Biología y evolución del genoma . 7 (6): 1686-1701. doi : 10.1093/gbe/evv098. PMC 4494051 . PMID  26002864. 
  150. ^ Kleppe AS, Bornberg-Bauer E (noviembre de 2018). "Robustez por extremos C intrínsecamente desordenados y lectura traslacional". Investigación de ácidos nucleicos . 46 (19): 10184–10194. doi : 10.1093/nar/gky778. PMC 6365619 . PMID  30247639. 
  151. ^ Klasberg S, Bitard-Feildel T, Callebaut I, Bornberg-Bauer E (julio de 2018). "Orígenes y propiedades estructurales de dominios proteicos nuevos y de novo durante la evolución de los insectos". El Diario FEBS . 285 (14): 2605–2625. doi : 10.1111/febrero.14504 . PMID  29802682.
  152. ^ Deng C, Cheng CH, Ye H, He X, Chen L (diciembre de 2010). "Evolución de una proteína anticongelante por neofuncionalización para escapar del conflicto adaptativo". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 107 (50): 21593–21598. Código Bib : 2010PNAS..10721593D. doi : 10.1073/pnas.1007883107 . PMC 3003108 . PMID  21115821. 
  153. ^ Long M, VanKuren NW, Chen S, Vibranovski MD (2013). "Nueva evolución genética: poco sabíamos". Revista Anual de Genética . 47 : 307–333. doi :10.1146/annurev-genet-111212-133301. PMC 4281893 . PMID  24050177. 
  154. ^ Chen S, Krinsky BH, Long M (septiembre de 2013). "Nuevos genes como impulsores de la evolución fenotípica". Naturaleza Reseñas Genética . 14 (9): 645–60. doi :10.1038/nrg3521. PMC 4236023 . PMID  23949544. 
  155. ^ Suenaga Y, Islam SM, Alagu J, Kaneko Y, Kato M, Tanaka Y, et al. (Enero 2014). "NCYM, un gen cis antisentido de MYCN, codifica una proteína evolucionada de novo que inhibe GSK3β, lo que da como resultado la estabilización de MYCN en neuroblastomas humanos". PLOS Genética . 10 (1): e1003996. doi : 10.1371/journal.pgen.1003996 . PMC 3879166 . PMID  24391509. 
  156. ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B, et al. (Febrero de 2000). "PARTE-1: un nuevo gen regulado por andrógenos, específico de la próstata humana, que se asigna al cromosoma 5q12". Investigación sobre el cáncer . 60 (4): 858–63. PMID  10706094.
  157. ^ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (julio de 2018). "La transferencia mediada por exosomas de lncRNA PART1 induce resistencia a gefitinib en el carcinoma de células escamosas de esófago al funcionar como un ARN endógeno competitivo". Revista de investigación clínica y experimental del cáncer . 37 (1): 171. doi : 10.1186/s13046-018-0845-9 . PMC 6063009 . PMID  30049286. 
  158. ^ Samusik N, Krukovskaya L, Meln I, Shilov E, Kozlov AP (2013). "PBOV1 es un gen humano de novo con expresión específica de tumor que se asocia con un resultado clínico positivo del cáncer". MÁS UNO . 8 (2): e56162. Código Bib : 2013PLoSO...856162S. doi : 10.1371/journal.pone.0056162 . PMC 3572036 . PMID  23418531. 
  159. ^ Guerzoni D, McLysaght A (abril de 2016). "Los genes de novo surgen a un ritmo lento pero constante a lo largo del linaje de primates y han estado sujetos a una clasificación de linaje incompleta". Biología y evolución del genoma . 8 (4): 1222–32. doi :10.1093/gbe/evw074. PMC 4860702 . PMID  27056411. 
  160. ^ Pekarsky Y, Rynditch A, Wieser R, Fonatsch C, Gardiner K (septiembre de 1997). "Activación de un nuevo gen en 3q21 e identificación de transcripciones de fusión intergénica con el sitio de inserción viral ecotrópico I en leucemia". Investigación sobre el cáncer . 57 (18): 3914–9. PMID  9307271.
  161. ^ Papamichos SI, Margaritis D, Kotsianidis I (2015). "La evolución adaptativa junto con la exaptación de retrotransposones permitió la generación de un gen codificante específico de proteína humana que promueve la proliferación y metástasis de células cancerosas tanto en neoplasias malignas hematológicas como en tumores sólidos: el caso extraordinario del gen MYEOV". Científica . 2015 : 984706. doi : 10.1155/2015/984706 . PMC 4629056 . PMID  26568894. 
  162. ^ ab Kozlov AP (2016). "Expresión de genes evolutivamente nuevos en tumores". Agentes Infecciosos y Cáncer . 11 : 34. doi : 10.1186/s13027-016-0077-6 . PMC 4949931 . PMID  27437030. 
  163. ^ Li CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW y otros. (Marzo de 2010). "Un gen codificador de proteínas de novo específico de humanos asociado con funciones del cerebro humano". PLOS Biología Computacional . 6 (3): e1000734. Código Bib : 2010PLSCB...6E0734L. doi : 10.1371/journal.pcbi.1000734 . PMC 2845654 . PMID  20376170. 
  164. ^ ab Zhang YE, Landback P, Vibranovski MD, Long M (octubre de 2011). "Reclutamiento acelerado de nuevos genes de desarrollo cerebral en el genoma humano". Más biología . 9 (10): e1001179. doi : 10.1371/journal.pbio.1001179 . PMC 3196496 . PMID  22028629. 
  165. ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A, et al. (Diciembre de 2014). "La transcripción impulsada por retrovirus endógenos específicos de primates define células madre similares a las ingenuas" (PDF) . Naturaleza . 516 (7531): 405–9. Código Bib :2014Natur.516..405W. doi : 10.1038/naturaleza13804. PMID  25317556. S2CID  205240839.
  166. ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E, et al. (Enero de 1999). "Un antígeno de histocompatibilidad menor humano específico para la leucemia linfoblástica aguda de células B". La Revista de Medicina Experimental . 189 (2): 301–8. doi :10.1084/jem.189.2.301. PMC 2192993 . PMID  9892612. 
  167. ^ Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, et al. (Enero de 2009). "InterPro: la base de datos integradora de firmas de proteínas". Investigación de ácidos nucleicos . 37 (Problema de base de datos): D211-5. doi : 10.1093/nar/gkn785. PMC 2686546 . PMID  18940856. 
  168. ^ Murphy DN, McLysaght A (2012). "Origen de novo de genes codificadores de proteínas en roedores murinos". MÁS UNO . 7 (11): e48650. Código Bib : 2012PLoSO...748650M. doi : 10.1371/journal.pone.0048650 . PMC 3504067 . PMID  23185269. 
  169. ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR, et al. (Abril de 2019). "Rápida evolución de la diversidad de proteínas por origen de novo en Oryza". Ecología y evolución de la naturaleza . 3 (4): 679–690. Código Bib : 2019NatEE...3..679Z. doi :10.1038/s41559-019-0822-5. PMID  30858588. S2CID  73728579.
  170. ^ Prabh N, Rödelsperger C (julio de 2019). "De Novo, la divergencia y el origen mixto contribuyen a la aparición de genes huérfanos en los nematodos Pristionchus". G3 . 9 (7): 2277–2286. doi :10.1534/g3.119.400326. PMC 6643871 . PMID  31088903.