La sobreimpresión se refiere a un tipo de superposición en el que toda o parte de la secuencia de un gen se lee en un marco de lectura alternativo de otro gen en el mismo locus . [4] Se cree que los marcos de lectura abiertos (ORF) alternativos se crean mediante sustituciones críticas de nucleótidos dentro de un gen preexistente expresable, que puede inducirse a expresar una nueva proteína sin dejar de preservar la función del gen original. [5] Se ha planteado la hipótesis de que la sobreimpresión es un mecanismo para la aparición de novo de nuevos genes a partir de secuencias existentes, ya sean genes más antiguos o regiones del genoma que antes no codificaban . [6] Se cree que la mayoría de los genes superpuestos, o genes cuyas secuencias de nucleótidos expresables se superponen parcialmente entre sí, evolucionaron en parte debido a este mecanismo, lo que sugiere que cada superposición está compuesta por un gen ancestral y un gen nuevo. [7] Posteriormente, también se cree que la sobreimpresión es una fuente de nuevas proteínas, ya que las proteínas de novo codificadas por estos nuevos genes generalmente carecen de homólogos remotos en las bases de datos. [8] Los genes sobreimpresos son características particularmente comunes de la organización genómica de los virus y probablemente aumenten en gran medida el número de genes expresables potenciales a partir de un pequeño conjunto de información genética viral. [9] Es probable que la sobreimpresión sea responsable de la generación de numerosas proteínas nuevas por parte de los virus a lo largo de su historia evolutiva .
Clasificación
Superposición desfasada en tándem de los genes mitocondriales humanos ATP8 (cuadro +1, en rojo) y ATP6 (cuadro +3, en azul) [10]
Los genes pueden superponerse de diversas formas y pueden clasificarse según sus posiciones entre sí. [3] [11] [12] [13] [14]
Superposición unidireccional o en tándem : el extremo 3' de un gen se superpone con el extremo 5' de otro gen en la misma cadena. Esta disposición se puede simbolizar con la notación → → donde las flechas indican el marco de lectura de principio a fin.
Superposición convergente o de extremo : los extremos 3' de los dos genes se superponen en hebras opuestas. Esto se puede escribir como → ←.
Superposición divergente o de cola : los extremos 5' de los dos genes se superponen en hebras opuestas. Esto se puede escribir como ← →.
Los genes superpuestos también se pueden clasificar por fases , que describen sus marcos de lectura relativos : [3] [11] [12] [13] [14]
La superposición en fase ocurre cuando las secuencias compartidas usan el mismo marco de lectura. Esto también se conoce como "fase 0". Los genes unidireccionales con superposición de fase 0 no se consideran genes distintos, sino sitios de inicio alternativos del mismo gen.
Las superposiciones desfasadas se producen cuando las secuencias compartidas utilizan diferentes marcos de lectura. Esto puede ocurrir en la "fase 1" o en la "fase 2", dependiendo de si los marcos de lectura están compensados en 1 o 2 nucleótidos. Debido a que un codón tiene tres nucleótidos de largo, un desplazamiento de tres nucleótidos es un marco de fase 0 en fase.
Los estudios sobre genes superpuestos sugieren que su evolución se puede resumir en dos modelos posibles. [4] En un modelo, las dos proteínas codificadas por sus respectivos genes superpuestos evolucionan bajo presiones de selección similares . Las proteínas y la región de superposición están altamente conservadas cuando se favorece una fuerte selección contra el cambio de aminoácidos . Se cree que los genes superpuestos evolucionan bajo restricciones estrictas, ya que una única sustitución de nucleótidos puede alterar la estructura y función de las dos proteínas simultáneamente. Un estudio sobre el virus de la hepatitis B (VHB), cuyo genoma de ADN contiene numerosos genes superpuestos, mostró que el número medio de sustituciones de nucleótidos sinónimos por sitio en regiones codificantes superpuestas era significativamente menor que el de las regiones no superpuestas. [15] El mismo estudio demostró que era posible que algunas de estas regiones superpuestas y sus proteínas divergieran significativamente del original cuando hay una selección débil contra el cambio de aminoácidos. El dominio espaciador de la polimerasa y la región pre-S1 de una proteína de superficie del VHB, por ejemplo, tenían un porcentaje de aminoácidos conservados del 30% y 40%, respectivamente. [15] Sin embargo, se sabe que estas regiones superpuestas son menos importantes para la replicación en comparación con las regiones superpuestas que estaban altamente conservadas entre diferentes cepas de VHB, que son absolutamente esenciales para el proceso.
El segundo modelo sugiere que las dos proteínas y sus respectivos genes superpuestos evolucionan bajo presiones de selección opuestas: un marco experimenta selección positiva mientras que el otro está bajo selección purificadora . En los tombusvirus , las proteínas p19 y p22 están codificadas por genes superpuestos que forman una región codificante de 549 nt, y se muestra que p19 está bajo selección positiva mientras que p22 está bajo selección purificadora. [16] Se mencionan ejemplos adicionales en estudios que involucran genes superpuestos del virus Sendai , [17] del virus del enrollamiento de la hoja de la papa , [18] y del parvovirus humano B19 . [19] Se sugiere que este fenómeno de genes superpuestos que experimentan diferentes presiones de selección es una consecuencia de una alta tasa de sustitución de nucleótidos con diferentes efectos en los dos marcos; las sustituciones pueden ser en su mayoría no sinónimas para un marco, mientras que en su mayoría son sinónimas para el otro marco. [4]
Evolución
Los genes superpuestos son particularmente comunes en genomas que evolucionan rápidamente, como los de virus , bacterias y mitocondrias . Pueden originarse de tres maneras: [20]
Por extensión de un ORF existente aguas arriba en un gen contiguo debido a la pérdida de un codón de iniciación ;
Por generación de un ORF novedoso dentro de uno existente debido a una mutación puntual .
El uso de la misma secuencia de nucleótidos para codificar múltiples genes puede proporcionar una ventaja evolutiva debido a la reducción del tamaño del genoma y a la oportunidad de coregulación transcripcional y traduccional de los genes superpuestos. [12] [21] [22] [23] Las superposiciones de genes introducen nuevas restricciones evolutivas en las secuencias de las regiones superpuestas. [14] [24]
Orígenes de nuevos genes
Un cladograma que indica la probable trayectoria evolutiva de la región pX densa en genes en el virus linfotrópico T humano 1 (HTLV1), un deltaretrovirus asociado con cánceres de sangre. Esta región contiene numerosos genes superpuestos, varios de los cuales probablemente se originaron de novo mediante sobreimpresión. [9]
En 1977, Pierre-Paul Grassé propuso que uno de los genes del par podría haberse originado de novo mediante mutaciones para introducir nuevos ORF en marcos de lectura alternativos; describió el mecanismo como sobreimpresión . [25] : 231 Posteriormente fue corroborado por Susumu Ohno , quien identificó un gen candidato que puede haber surgido por este mecanismo. [26] Algunos genes de novo que se originan de esta manera pueden no permanecer superpuestos, sino subfuncionalizarse después de la duplicación genética , [6] contribuyendo a la prevalencia de genes huérfanos . Qué miembro de un par de genes superpuestos es más joven puede identificarse bioinformáticamente mediante una distribución filogenética más restringida o mediante un uso de codones menos optimizado . [9] [27] [28] Los miembros más jóvenes de la pareja tienden a tener un mayor desorden estructural intrínseco que los miembros más viejos, pero los miembros más viejos también están más desordenados que otras proteínas, presumiblemente como una forma de aliviar las mayores limitaciones evolutivas planteadas por la superposición. . [27] Es más probable que las superposiciones se originen en proteínas que ya tienen un alto desorden. [27]
Distribución taxonómica
Genes superpuestos en el genoma del bacteriófago ΦX174. Hay 11 genes en este genoma (A, A*, BH, J, K). Los genes B, K, E se superponen con los genes A, C, D. [29]
Los genes superpuestos ocurren en todos los ámbitos de la vida , aunque con frecuencias variables. Son especialmente comunes en genomas virales .
La existencia de genes superpuestos se identificó por primera vez en el virus ΦX174 , cuyo genoma fue el primer genoma de ADN secuenciado por Frederick Sanger en 1977. [29] Análisis previos de ΦX174, un pequeño bacteriófago de ADN monocatenario que infectó a la bacteria Escherichia coli . sugirió que las proteínas producidas durante la infección requerían secuencias codificantes más largas que la longitud medida de su genoma. [31] El análisis del genoma de 5386 nucleótidos completamente secuenciado mostró que el virus poseía una amplia superposición entre las regiones codificantes, revelando que algunos genes (como los genes D y E) se tradujeron a partir de las mismas secuencias de ADN pero en diferentes marcos de lectura. [29] [31] Se demostró que un sitio de inicio alternativo dentro del gen de replicación del genoma A de ΦX174 expresa una proteína truncada con una secuencia codificante idéntica al extremo C de la proteína A original pero que posee una función diferente [32] [33 ] Se concluyó que otros sitios de síntesis de polipéptidos no descubiertos podrían estar ocultos a través del genoma debido a la superposición de genes. Se demostró que un gen de novo identificado de otro locus genético superpuesto expresa una nueva proteína que induce la lisis de E. coli al inhibir la biosíntesis de su pared celular [56], lo que sugiere que la creación de proteínas de novo a través del proceso de sobreimpresión puede ser un importante factor en la evolución de la patogenicidad de los virus. [4] Otro ejemplo es el gen ORF3d del virus SARS-CoV 2 . [1] [34] Los genes superpuestos son particularmente comunes en los genomas virales . [9] Algunos estudios atribuyen esta observación a la presión selectiva hacia tamaños de genoma pequeños mediada por las limitaciones físicas de empaquetar el genoma en una cápside viral , particularmente una de geometría icosaédrica . [35] Sin embargo, otros estudios cuestionan esta conclusión y argumentan que es más probable que la distribución de superposiciones en los genomas virales refleje la sobreimpresión como el origen evolutivo de genes virales superpuestos. [36] La sobreimpresión es una fuente común de genes de novo en los virus. [28]
La proporción de virus con secuencias codificantes superpuestas dentro de sus genomas varía. [2] Los virus de ARN bicatenario tienen menos de una cuarta parte que los contiene, mientras que casi las tres cuartas partes de los retroviridae y los virus con genomas de ADN monocatenario contienen secuencias codificantes superpuestas. [37] Los virus segmentados en particular, o los virus con su genoma dividido en partes separadas y empaquetados en la misma cápside o en cápsides separadas, tienen más probabilidades de contener una secuencia superpuesta que los virus no segmentados. [37] Los virus de ARN tienen menos genes superpuestos que los virus de ADN, que poseen tasas de mutación más bajas y tamaños de genoma menos restrictivos. [37] [38] La menor tasa de mutación de los virus de ADN facilita una mayor novedad genómica y exploración evolutiva dentro de un genoma estructuralmente restringido y puede ser el principal impulsor de la evolución de genes superpuestos. [39] [40]
Los estudios de genes virales sobreimpresos sugieren que sus productos proteicos tienden a ser proteínas accesorias que no son esenciales para la proliferación viral, pero que contribuyen a la patogenicidad . Las proteínas sobreimpresas suelen tener distribuciones inusuales de aminoácidos y altos niveles de desorden intrínseco . [41] En algunos casos, las proteínas sobreimpresas tienen estructuras tridimensionales bien definidas, pero novedosas; [42] un ejemplo es el supresor de silenciamiento de ARN p19 que se encuentra en los Tombusvirus , que tiene un pliegue proteico novedoso y un modo de unión novedoso para reconocer los ARNip . [28] [30] [43]
Procariotas
Las estimaciones de la superposición de genes en los genomas bacterianos suelen encontrar que alrededor de un tercio de los genes bacterianos están superpuestos, aunque normalmente sólo por unos pocos pares de bases. [12] [44] [45] La mayoría de los estudios de superposición en genomas bacterianos encuentran evidencia de que la superposición cumple una función en la regulación genética , permitiendo que los genes superpuestos se corregulan transcripcional y traduccionalmente . [12] [23] En los genomas procarióticos, las superposiciones unidireccionales son más comunes, posiblemente debido a la tendencia de los genes procarióticos adyacentes a compartir la orientación. [12] [14] [11] Entre las superposiciones unidireccionales, las superposiciones largas se leen más comúnmente con un desplazamiento de un nucleótido en el marco de lectura (es decir, fase 1) y las superposiciones cortas se leen más comúnmente en la fase 2. [45] [46 ] Las superposiciones largas de más de 60 pares de bases son más comunes en los genes convergentes; sin embargo, las supuestas superposiciones largas tienen tasas muy altas de anotaciones erróneas . [47] Los ejemplos sólidamente validados de superposiciones prolongadas en genomas bacterianos son raros; En el organismo modelo bien estudiado Escherichia coli , sólo cuatro pares de genes están bien validados por tener superposiciones largas y sobreimpresas. [48]
Eucariotas
En comparación con los genomas procarióticos, los genomas eucariotas suelen estar mal anotados y, por lo tanto, identificar superposiciones genuinas es relativamente desafiante. [28] Sin embargo, se han documentado ejemplos de superposiciones de genes validados en una variedad de organismos eucariotas, incluidos mamíferos como ratones y humanos. [49] [50] [51] [52] Los eucariotas se diferencian de los procariotas en la distribución de los tipos de superposición: mientras que las superposiciones unidireccionales (es decir, de la misma cadena) son más comunes en los procariotas, las superposiciones de cadenas opuestas o antiparalelas son más comunes en los eucariotas. Entre las superposiciones de hebras opuestas, la orientación convergente es la más común. [50] La mayoría de los estudios sobre la superposición de genes eucarióticos han encontrado que los genes superpuestos están ampliamente sujetos a la reorganización genómica incluso en especies estrechamente relacionadas y, por lo tanto, la presencia de una superposición no siempre está bien conservada. [51] [53] La superposición con genes más antiguos o menos restringidos taxonómicamente también es una característica común de genes que probablemente se hayan originado de novo en un linaje eucariota determinado. [51] [54] [55]
Función
Las funciones precisas de los genes superpuestos parecen variar según los ámbitos de la vida, pero varios experimentos han demostrado que son importantes para los ciclos de vida de los virus a través de la expresión y estequiometría adecuadas de las proteínas [56] , además de desempeñar un papel en el plegamiento adecuado de las proteínas. [57] También se creó una versión del bacteriófago ΦX174 donde se eliminaron todas las superposiciones de genes [58], lo que demuestra que no eran necesarios para la replicación.
La retención y evolución de genes superpuestos dentro de los virus también puede deberse a limitaciones del tamaño de la cápside . [59] Se observó una pérdida dramática de viabilidad en virus con genomas diseñados para ser más largos que el genoma de tipo salvaje. [60] El aumento de la longitud del genoma del ADN monocatenario de ΦX174 en >1% da como resultado una pérdida casi completa de infectividad , lo que se cree que es el resultado de las estrictas restricciones físicas impuestas por el volumen finito de la cápside. [61] Los estudios sobre virus adenoasociados como vectores de entrega de genes mostraron que el empaquetamiento viral está limitado por límites de tamaño de carga genética, lo que requiere el uso de múltiples vectores para entregar genes humanos grandes como CFTR81. [62] [63] Por lo tanto, se sugiere que los genes superpuestos evolucionaron como un medio para superar estas limitaciones físicas, aumentando la diversidad genética al utilizar solo la secuencia existente en lugar de aumentar la longitud del genoma.
Métodos para identificar genes y ORF superpuestos.
Los métodos estandarizados, como la anotación del genoma , pueden ser inapropiados para la detección de genes superpuestos, ya que dependen de genes ya seleccionados, mientras que los genes superpuestos generalmente se pasan por alto y contienen una composición de secuencia atípica. [2] [64] [65] [66] Los estándares de anotación del genoma también suelen estar sesgados contra la superposición de características, como genes contenidos enteramente dentro de otro gen. [67] Además, algunos canales de bioinformática, como el canal RAST, penalizan marcadamente las superposiciones entre los ORF previstos. [68] Sin embargo, el rápido avance de las herramientas de medición de proteínas y ARN a escala genómica junto con algoritmos de predicción cada vez más avanzados han revelado una avalancha de genes y ORF superpuestos dentro de numerosos genomas. [2] Los métodos proteogenómicos han sido esenciales para descubrir numerosos genes superpuestos e incluyen una combinación de técnicas como la proteómica ascendente , la elaboración de perfiles de ribosomas , la secuenciación de ADN y la perturbación . La secuenciación de ARN también se utiliza para identificar regiones genómicas que contienen transcripciones superpuestas. Se ha utilizado para identificar 180.000 ORF alternativos dentro de regiones codificantes previamente anotadas que se encuentran en humanos. [69] Los ORF recientemente descubiertos como estos se verifican utilizando una variedad de técnicas de genética inversa , como CRISPR-Cas9 y la disrupción de Cas9 catalíticamente muerta (dCas9) . [70] [71] [72] También se realizan intentos de prueba por síntesis para mostrar más allá de toda duda la ausencia de genes superpuestos no descubiertos. [73]
^ ab Nelson, Chase W; et al. (1 de octubre de 2020). "Un nuevo gen superpuesto en evolución dinámica como factor en la pandemia del SARS-CoV-2". eVida . 9 . doi : 10.7554/eLife.59633 . PMC 7655111 . PMID 33001029.
^ abcdef Wright, Bradley W.; Molloy, Mark P.; Jaschke, Paul R. (5 de octubre de 2021). "Genes superpuestos en genomas naturales y diseñados". Naturaleza Reseñas Genética . 23 (3): 154-168. doi :10.1038/s41576-021-00417-w. ISSN 1471-0064. PMC 8490965 . PMID 34611352.
^ abc Y. Fukuda, M. Tomita y T. Washio (1999). "Estudio comparativo de genes superpuestos en los genomas de Mycoplasma genitalium y Mycoplasma pneumoniae". Ácidos nucleicos Res . 27 (8): 1847–1853. doi :10.1093/nar/27.8.1847. PMC 148392 . PMID 10101192.
^ abcd Pavesi, Angelo (26 de mayo de 2021). "Origen, evolución y estabilidad de genes superpuestos en virus: una revisión sistemática". Genes . 12 (6): 809. doi : 10.3390/genes12060809 . ISSN 2073-4425. PMC 8227390 . PMID 34073395.
^ Normark, Staffan; Bergstrom, Sven; Edlund, Thomas; Grundstrom, Thomas; Jaurín, Bengtake; Lindberg, Frederik P.; Olsson, Olof (diciembre de 1983). "Genes superpuestos". Revista Anual de Genética . 17 (1): 499–525. doi : 10.1146/annurev.ge.17.120183.002435. ISSN 0066-4197. PMID 6198955.
^ ab Keese, PK; Gibbs, A (15 de octubre de 1992). "Orígenes de los genes: ¿" big bang "o creación continua?". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Código bibliográfico : 1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . PMC 50157 . PMID 1329098.
^ Keese, PK; Gibbs, A. (15 de octubre de 1992). "Orígenes de los genes: ¿" big bang "o creación continua?". Procedimientos de la Academia Nacional de Ciencias . 89 (20): 9489–9493. Código bibliográfico : 1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . ISSN 0027-8424. PMC 50157 . PMID 1329098.
^ Gibbs, Adrián; Keese, Paul K. (19 de octubre de 1995), "En busca de los orígenes de los genes virales", Molecular Basis of Virus Evolution , Cambridge University Press, págs. 76–90, doi :10.1017/cbo9780511661686.008, ISBN9780521455336, consultado el 3 de diciembre de 2021
^ abcd Pavesi, Angelo; Magiorkinis, Gkikas; Karlín, David G.; Wilke, Claus O. (15 de agosto de 2013). "Las proteínas virales originadas de novo mediante sobreimpresión pueden identificarse mediante el uso de codones: aplicación al" vivero de genes "de deltaretrovirus". PLOS Biología Computacional . 9 (8): e1003162. Código Bib : 2013PLSCB...9E3162P. doi : 10.1371/journal.pcbi.1003162 . PMC 3744397 . PMID 23966842.
^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (abril de 1981). "Secuencia y organización del genoma mitocondrial humano". Naturaleza . 290 (5806): 457–465. Código Bib :1981Natur.290..457A. doi :10.1038/290457a0. PMID 7219534. S2CID 4355527.
^ abc Fukuda, Yoko; Nakayama, Yoichi; Tomita, Masaru (diciembre de 2003). "Sobre la dinámica de genes superpuestos en genomas bacterianos". Gen. 323 : 181–187. doi :10.1016/j.gene.2003.09.021. PMID 14659892.
^ abcdef Johnson Z, Chisholm S (2004). "Las propiedades de genes superpuestos se conservan en todos los genomas microbianos". Res del genoma . 14 (11): 2268–72. doi :10.1101/gr.2433104. PMC 525685 . PMID 15520290.
^ ab Normark S.; Bergstrom S.; Edlund T.; Grundstrom T.; Jaurín B.; Lindberg FP; Olsson O. (1983). "Genes superpuestos". Revista Anual de Genética . 17 : 499–525. doi : 10.1146/annurev.ge.17.120183.002435. PMID 6198955.
^ abcd Rogozin, Igor B.; Spiridonov, Alexey N.; Sorokin, Alejandro V.; Lobo, Yuri I.; Jordania, I.Rey; Tatusov, Roman L.; Koonin, Eugene V. (mayo de 2002). "Selección purificadora y direccional en genes procarióticos superpuestos". Tendencias en Genética . 18 (5): 228–232. doi :10.1016/S0168-9525(02)02649-5. PMID 12047938.
^ ab Mizokami, Masashi; Orito, Etsuro; Ohba, Ken-ichi; Ikeo, Kazuho; Lau, Johnson YN; Gojobori, Takashi (enero de 1997). "Evolución limitada con respecto a la superposición genética del virus de la hepatitis B". Revista de evolución molecular . 44 (T1): S83-S90. Código Bib : 1997JMolE..44S..83M. doi :10.1007/pl00000061. ISSN 0022-2844. PMID 9071016. S2CID 22644652.
^ Allison, Jane R.; Lechner, Marcos; Hoeppner, Marc P.; Poole, Anthony M. (12 de febrero de 2016). "¿Selección positiva o libertad de variación? Evaluación de la importancia funcional del cambio de secuencia mediante dinámica molecular". MÁS UNO . 11 (2): e0147619. Código Bib : 2016PLoSO..1147619A. doi : 10.1371/journal.pone.0147619 . ISSN 1932-6203. PMC 4752228 . PMID 26871901.
^ Fujii, Yutaka; Kiyotani, Katsuhiro; Yoshida, Tetsuya; Sakaguchi, Takemasa (2001). "regiones conservadas y no conservadas en el genoma del virus Sendai: evolución de un gen que posee marcos de lectura superpuestos". Genes de virus . 22 (1): 47–52. doi :10.1023/a:1008130318633. ISSN 0920-8569. PMID 11210938. S2CID 12869504.
^ Guyader, Sébastien; Ducray, Danièle Giblot (1 de julio de 2002). "El análisis de secuencia de aislados del virus del enrollamiento de la hoja de la papa revela estabilidad genética, eventos evolutivos importantes y presión de selección diferencial entre productos de marcos de lectura superpuestos". Revista de Virología General . 83 (7): 1799–1807. doi : 10.1099/0022-1317-83-7-1799 . ISSN 0022-1317. PMID 12075102.
^ Stamenković, Gorana G.; Ćirković, Valentina S.; Šiljić, Marina M.; Blagojević, Jelena V.; Knežević, Aleksandra M.; Joksić, Ivana D.; Stanojević, Maja P. (24 de octubre de 2016). "Tasa de sustitución y selección natural en parvovirus B19". Informes científicos . 6 (1): 35759. Código bibliográfico : 2016NatSR...635759S. doi :10.1038/srep35759. ISSN 2045-2322. PMC 5075947 . PMID 27775080.
^ Krakauer, David C. (junio de 2000). "Estabilidad y evolución de genes superpuestos". Evolución . 54 (3): 731–739. doi : 10.1111/j.0014-3820.2000.tb00075.x . PMID 10937248. S2CID 8818055.
^ Delayé, Luis; DeLuna, Alejandro; Lazcano, Antonio; Becerra, Arturo (2008). "El origen de un gen novedoso mediante sobreimpresión en Escherichia coli". Biología Evolutiva del BMC . 8 (1): 31. doi : 10.1186/1471-2148-8-31 . PMC 2268670 . PMID 18226237.
^ Saha, Deeya; Podder, Soumita; Panda, Arup; Ghosh, Tapash Chandra (mayo de 2016). "Genes superpuestos: un correlato genómico significativo de las tasas de crecimiento procariótico". Gen. 582 (2): 143-147. doi :10.1016/j.gene.2016.02.002. PMID 26853049.
^ ab Luo, Yingqin; Battistuzzi, Fabia; Lin, Kui; Gibas, Cynthia (29 de noviembre de 2013). "Dinámica evolutiva de genes superpuestos en Salmonella". MÁS UNO . 8 (11): e81016. Código Bib : 2013PLoSO...881016L. doi : 10.1371/journal.pone.0081016 . PMC 3843671 . PMID 24312259.
^ Wei, X.; Zhang, J. (31 de diciembre de 2014). "Un método simple para estimar la fuerza de la selección natural en genes superpuestos". Biología y evolución del genoma . 7 (1): 381–390. doi : 10.1093/gbe/evu294. PMC 4316641 . PMID 25552532.
^ Grassé, Pierre-Paul (1977). Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación . Prensa académica. ISBN9781483274096.
^ Ohno, S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia codificante internamente repetitiva preexistente". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Código bibliográfico : 1984PNAS...81.2421O. doi : 10.1073/pnas.81.8.2421 . PMC 345072 . PMID 6585807.
^ abc Willis, Sara; Masel, Joanna (19 de julio de 2018). "El nacimiento de genes contribuye al trastorno estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi : 10.1534/genética.118.301249. PMC 6116962 . PMID 30026186.
^ abcd Sabath, N .; Wagner, A.; Karlin, D. (19 de julio de 2012). "Evolución de proteínas virales originadas de novo por sobreimpresión". Biología Molecular y Evolución . 29 (12): 3767–3780. doi :10.1093/molbev/mss179. PMC 3494269 . PMID 22821011.
^ abc Sanger, F .; Aire, GM; Barril, BG; marrón, NL; Coulson, AR; Fiddes, JC; Hutchison, California; Slocombe, PM; Smith, M. (1977). "Secuencia de nucleótidos del ADN del bacteriófago ΦX174". Naturaleza . 265 (5596): 687–95. Código Bib :1977Natur.265..687S. doi :10.1038/265687a0. PMID 870828. S2CID 4206886.
^ ab Ye, Keqiong; Malinina, Lucy; Patel, Dinshaw J. (3 de diciembre de 2003). "Reconocimiento de pequeños ARN de interferencia por un supresor viral del silenciamiento del ARN". Naturaleza . 426 (6968): 874–878. Código Bib :2003Natur.426..874Y. doi : 10.1038/naturaleza02213. PMC 4694583 . PMID 14661029.
^ ab Barrell, BG; Aire, GM; Hutchison, CA (noviembre de 1976). "Genes superpuestos en el bacteriófago φX174". Naturaleza . 264 (5581): 34–41. Código bibliográfico : 1976Natur.264...34B. doi :10.1038/264034a0. ISSN 1476-4687. PMID 1004533. S2CID 4264796.
^ LINNEY, ELWOOD; HAYASHI, MASAKI (mayo de 1974). "Regulación intragénica de la síntesis de proteínas del gen A ΦX174". Naturaleza . 249 (5455): 345–348. Código Bib :1974Natur.249..345L. doi :10.1038/249345a0. ISSN 0028-0836. PMID 4601823. S2CID 4175651.
^ Roznowski, Aaron P.; Doore, Sarah M.; Kemp, Sundance Z.; Fane, Bentley A. (6 de enero de 2020). "Finalmente, un papel digno de una estrella: las proteínas del microvirus A * no esenciales y fuertemente conservadas garantizan la fidelidad del producto en las reacciones del empaque". Revista de Virología . 94 (2). doi :10.1128/jvi.01593-19. ISSN 0022-538X. PMC 6955274 . PMID 31666371.
^ Dockrill, Peter (11 de noviembre de 2020). "Los científicos acaban de encontrar un 'gen dentro de un gen' misteriosamente oculto en el SARS-CoV-2". Alerta científica . Consultado el 11 de noviembre de 2020 .
^ Chirico, N.; Vianelli, A.; Belshaw, R. (7 de julio de 2010). "Por qué los genes se superponen en los virus". Actas de la Royal Society B: Ciencias Biológicas . 277 (1701): 3809–3817. doi :10.1098/rspb.2010.1052. PMC 2992710 . PMID 20610432.
^ Brandes, Nadav; Linial, Michal (21 de mayo de 2016). "Superposición de genes y limitaciones de tamaño en el mundo viral". Biología Directa . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . PMC 4875738 . PMID 27209091.
^ abc Schlub, Timothy E; Holmes, Edward C (1 de enero de 2020). "Propiedades y abundancia de genes superpuestos en virus". Evolución de los virus . 6 (1): veaa009. doi :10.1093/ve/veaa009. ISSN 2057-1577. PMC 7017920 . PMID 32071766.
^ Chirico, Nicola; Vianelli, Alberto; Belshaw, Robert (7 de julio de 2010). "Por qué los genes se superponen en los virus". Actas de la Royal Society B: Ciencias Biológicas . 277 (1701): 3809–3817. doi :10.1098/rspb.2010.1052. ISSN 0962-8452. PMC 2992710 . PMID 20610432.
^ Brandes, Nadav; Linial, Michal (21 de mayo de 2016). "Superposición de genes y limitaciones de tamaño en el mundo viral". Biología Directa . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . ISSN 1745-6150. PMC 4875738 . PMID 27209091.
^ Pavesi, Angelo (julio de 2020). "Nuevos conocimientos sobre las características evolutivas de los genes virales superpuestos mediante análisis discriminante". Virología . 546 : 51–66. doi :10.1016/j.virol.2020.03.007. ISSN 0042-6822. PMC 7157939 . PMID 32452417.
^ Rancurel, C.; Khosravi, M.; Dunker, Alaska; Romero, PR; Karlin, D. (29 de julio de 2009). "Los genes superpuestos producen proteínas con propiedades de secuencia inusuales y ofrecen información sobre la creación de proteínas de novo". Revista de Virología . 83 (20): 10719–10736. doi :10.1128/JVI.00595-09. PMC 2753099 . PMID 19640978.
^ Abroi, Aare (1 de diciembre de 2015). "Una visión basada en dominios proteicos de la relación virosfera-huésped". Bioquimia . 119 : 231–243. doi :10.1016/j.biochi.2015.08.008. PMID 26296474.
^ Vargason, Jeffrey M; Szittya, György; Burgyán, József; Hall, Traci M. Tanaka (diciembre de 2003). "Reconocimiento selectivo de tamaño de ARNip mediante un supresor de silenciamiento de ARN". Celúla . 115 (7): 799–811. doi : 10.1016/S0092-8674(03)00984-X . PMID 14697199. S2CID 12993441.
^ Huvet, Maxime; Stumpf, Michael PH (1 de enero de 2014). "Genes superpuestos: una ventana a la capacidad de evolución de los genes". Genómica BMC . 15 (1): 721. doi : 10.1186/1471-2164-15-721 . ISSN 1471-2164. PMC 4161906 . PMID 25159814.
^ ab Cock, Peter JA; Whitworth, David E. (19 de marzo de 2007). "Evolución de las superposiciones de genes: sesgo relativo del marco de lectura en genes del sistema procariótico de dos componentes". Revista de evolución molecular . 64 (4): 457–462. Código Bib : 2007JMolE..64..457C. doi :10.1007/s00239-006-0180-1. PMID 17479344. S2CID 21612308.
^ Fonseca, MM; Harris, DJ; Posada, D. (5 de noviembre de 2013). "Origen y distribución de longitud de genes superpuestos procarióticos unidireccionales". G3: Genes, Genomas, Genética . 4 (1): 19–27. doi :10.1534/g3.113.005652. PMC 3887535 . PMID 24192837.
^ Pallejá, Albert; Harrington, Eoghan D; Bork, par (2008). "Grandes superposiciones de genes en genomas procarióticos: ¿resultado de limitaciones funcionales o predicciones erróneas?". Genómica BMC . 9 (1): 335. doi : 10.1186/1471-2164-9-335 . PMC 2478687 . PMID 18627618.
^ Fellner, Lea; Simón, Svenja; Scherling, cristiano; Ingenio, Michael; Schober, Steffen; Poltè, Christine; Schmitt-Kopplin, Philippe; Keim, Daniel A.; Scherer, Sigfrido; Neuhaus, Klaus (18 de diciembre de 2015). "Evidencia del origen reciente de un gen huérfano superpuesto que codifica una proteína bacteriana mediante sobreimpresión evolutiva". Biología Evolutiva del BMC . 15 (1): 283. doi : 10.1186/s12862-015-0558-z . PMC 4683798 . PMID 26677845.
^ McLysaght, Aoife; Guerzoni, Daniele (31 de agosto de 2015). "Nuevos genes de secuencia no codificante: el papel de los genes codificadores de proteínas de novo en la innovación evolutiva de eucariotas". Transacciones Filosóficas de la Royal Society B: Ciencias Biológicas . 370 (1678): 20140332. doi :10.1098/rstb.2014.0332. PMC 4571571 . PMID 26323763.
^ ab C. Sanna, W. Li y L. Zhang (2008). "Genes superpuestos en los genomas humano y de ratón". Genómica BMC . 9 (169): 169. doi : 10.1186/1471-2164-9-169 . PMC 2335118 . PMID 18410680.
^ abc Makałowska, Izabela; Lin, Chiao-Feng; Hernández, Krisitina (2007). "Nacimiento y muerte de superposiciones de genes en vertebrados". Biología Evolutiva del BMC . 7 (1): 193. doi : 10.1186/1471-2148-7-193 . PMC 2151771 . PMID 17939861.
^ Veeramachaneni, V. (1 de febrero de 2004). "Genes superpuestos de mamíferos: la perspectiva comparada". Investigación del genoma . 14 (2): 280–286. doi :10.1101/gr.1590904. PMC 327103 . PMID 14762064.
^ Behura, Susanta K; Severson, David W (2013). "Genes superpuestos de Aedes aegypti: implicaciones evolutivas de la comparación con ortólogos de Anopheles gambiae y otros insectos". Biología Evolutiva del BMC . 13 (1): 124. doi : 10.1186/1471-2148-13-124 . PMC 3689595 . PMID 23777277.
^ Murphy, Daniel N.; McLysaght, Aoife; Carmel, Liran (21 de noviembre de 2012). "Origen de novo de genes codificadores de proteínas en roedores murinos". MÁS UNO . 7 (11): e48650. Código Bib : 2012PLoSO...748650M. doi : 10.1371/journal.pone.0048650 . PMC 3504067 . PMID 23185269.
^ Knowles, director general; McLysaght, A. (2 de septiembre de 2009). "Origen reciente de novo de genes codificadores de proteínas humanas". Investigación del genoma . 19 (10): 1752-1759. doi :10.1101/gr.095026.109. PMC 2765279 . PMID 19726446.
^ Wright, Bradley W.; Ruan, Juanfang; Molloy, Mark P.; Jaschke, Paul R. (20 de noviembre de 2020). "La modularización del genoma revela que la topología genética superpuesta es necesaria para una reproducción viral eficiente". Biología sintética ACS . 9 (11): 3079–3090. doi :10.1021/acssynbio.0c00323. ISSN 2161-5063. PMID 33044064. S2CID 222300240.
^ Pradhan, Prajakta; Li, Wen; Kaur, Parjit (enero de 2009). "El acoplamiento traslacional controla la expresión y función de la bomba de salida de fármaco DrrAB". Revista de biología molecular . 385 (3): 831–842. doi :10.1016/j.jmb.2008.11.027. PMID 19063901.
^ Jaschke, Paul R.; Lieberman, Erica K.; Rodríguez, Jon; Sierra, Adrián; Endy, Drew (diciembre de 2012). "Un genoma de bacteriófago sintético øX174 completamente descomprimido ensamblado y archivado en levadura". Virología . 434 (2): 278–284. doi : 10.1016/j.virol.2012.09.020 . ISSN 0042-6822. PMID 23079106.
^ Krakauer, CC; Plotkin, JB (29 de enero de 2002). "Redundancia, antiredundancia y robustez de los genomas". Procedimientos de la Academia Nacional de Ciencias . 99 (3): 1405-1409. Código Bib : 2002PNAS...99.1405K. doi : 10.1073/pnas.032668599 . ISSN 0027-8424. PMC 122203 . PMID 11818563.
^ Feiss, Michael; Pescador, RA; Crayton, MA; Egner, Carol (marzo de 1977). "Embalaje del cromosoma λ del bacteriófago: efecto de la longitud del cromosoma". Virología . 77 (1): 281–293. doi :10.1016/0042-6822(77)90425-1. ISSN 0042-6822. PMID 841861.
^ Aoyama, A; Hayashi, M (septiembre de 1985). "Efectos del tamaño del genoma en el empaquetado del ADN del bacteriófago phi X174 in vitro". Revista de Química Biológica . 260 (20): 11033–11038. doi : 10.1016/s0021-9258(17)39144-5 . ISSN 0021-9258. PMID 3161888. S2CID 32443408.
^ Wu, Zhijian; Yang, Hongyan; Colosi, Peter (enero de 2010). "Efecto del tamaño del genoma en el empaquetado de vectores AAV". Terapia Molecular . 18 (1): 80–86. doi :10.1038/mt.2009.255. ISSN 1525-0016. PMC 2839202 . PMID 19904234.
^ Vaidyanathan, Sriram; Baik, Ron; Chen, Lu; Bravo, Amanecer T.; Suárez, Carlos J.; Abazari, Shayda M.; Salahudeen, Ameen A.; Dudek, Amanda M.; Terán, Christopher A.; Davis, Timothy H.; Lee, Ciaran M. (marzo de 2021). "Reemplazo dirigido de CFTR de longitud completa en células madre de las vías respiratorias humanas por CRISPR-Cas9 para la corrección de mutaciones en el locus endógeno". Terapia Molecular . 30 (1): 223–237. doi :10.1016/j.ymthe.2021.03.023. PMC 8753290 . PMID 33794364. S2CID 232761334.
^ Willis, Sara; Masel, Joanna (19 de julio de 2018). "El nacimiento de genes contribuye al trastorno estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi : 10.1534/genética.118.301249. ISSN 1943-2631. PMC 6116962 . PMID 30026186.
^ Pavesi, Ángel; Vianelli, Alberto; Chirico, Nicola; Bao, Yiming; Blinkova, Olga; Belshaw, Robert; Cuarto, Andrés; Karlin, David (19 de octubre de 2018). "Los genes superpuestos y las proteínas que codifican difieren significativamente en la composición de su secuencia de los genes que no se superponen". MÁS UNO . 13 (10): e0202513. Código Bib : 2018PLoSO..1302513P. doi : 10.1371/journal.pone.0202513 . ISSN 1932-6203. PMC 6195259 . PMID 30339683.
^ Pavesi, Ángel; Magiorkinis, Gkikas; Karlin, David G. (15 de agosto de 2013). "Las proteínas virales originadas de novo mediante sobreimpresión pueden identificarse mediante el uso de codones: aplicación al" vivero de genes "de deltaretrovirus". PLOS Biología Computacional . 9 (8): e1003162. Código Bib : 2013PLSCB...9E3162P. doi : 10.1371/journal.pcbi.1003162 . ISSN 1553-7358. PMC 3744397 . PMID 23966842.
^ "Información complementaria 2: información de acceso a la base de datos del genoma del NCBI (archivo PDF)". doi : 10.7717/peerj.6447/supp-2 .{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Ahmed, Niyaz (27 de marzo de 2009). "Recomendación de opiniones de profesores de The RAST Server: anotaciones rápidas utilizando tecnología de subsistemas". doi : 10.3410/f.1157743.618965 .{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Ben-Tal, Nir, ed. (23 de junio de 2017). "Carta de decisión: la anotación profunda del transcriptoma permite el descubrimiento y la caracterización funcional de pequeñas proteínas crípticas". doi : 10.7554/elife.27860.082 .{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Bazzini, Ariel; Wu, Qiushuang (6 de marzo de 2020). "Recomendación de las opiniones de los profesores sobre la traducción funcional generalizada de marcos de lectura abiertos humanos no canónicos". doi : 10.3410/f.737484924.793572056 . S2CID 215850701.{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Prensner, John R.; Enache, Oana M.; Luria, Víctor; Krug, Karsten; Clauser, Karl R.; Dempster, Josué M.; Karger, Amir; Wang, Li; Stumbraite, Karolina; Wang, Vickie M.; Botta, Ginevra (28 de enero de 2021). "Los marcos de lectura abiertos no canónicos codifican proteínas funcionales esenciales para la supervivencia de las células cancerosas". Biotecnología de la Naturaleza . 39 (6): 697–704. doi :10.1038/s41587-020-00806-2. ISSN 1087-0156. PMC 8195866 . PMID 33510483.
^ Cao, Xiongwen; Khitun, Alexandra; Luo, Yang; Na, Zhenkun; Phoodokmai, Thitima; Sappakhaw, Khomkrit; Olatunji, Elizabeth; Uttamapinant, Chayasith; Slavoff, Sarah A. (5 de marzo de 2020). "Alt-RPL36 regula negativamente la vía de señalización PI3K-AKT-mTOR al interactuar con TMEM24". Comunicaciones de la naturaleza . 12 (1): 508. bioRxiv 10.1101/2020.03.04.977314 . doi :10.1038/s41467-020-20841-6. PMC 7820019 . PMID 33479206.
^ Jaschke, Paul R.; Dotson, Gabrielle A.; Hung, Kay S.; Liu, Diana; Endy, Drew (12 de noviembre de 2019). "Demostración definitiva mediante síntesis de la integridad de la anotación del genoma". Procedimientos de la Academia Nacional de Ciencias . 116 (48): 24206–24213. Código Bib : 2019PNAS..11624206J. doi : 10.1073/pnas.1905990116 . ISSN 0027-8424. PMC 6883844 . PMID 31719208.