Un gen cuya secuencia se superpone parcialmente al marco de lectura de otro gen.
Un gen superpuesto (u OLG ) [1] [2] es un gen cuya secuencia de nucleótidos expresable se superpone parcialmente con la secuencia de nucleótidos expresable de otro gen. [3] De esta manera, una secuencia de nucleótidos puede contribuir a la función de uno o más productos génicos . Los genes superpuestos están presentes y son una característica fundamental tanto de los genomas celulares como virales . [2] La definición actual de un gen superpuesto varía significativamente entre eucariotas, procariotas y virus. [2] En procariotas y virus, la superposición debe ser entre secuencias codificantes pero no entre transcripciones de ARNm , y se define cuando estas secuencias codificantes comparten un nucleótido en la misma cadena o en cadenas opuestas. En eucariotas , la superposición de genes casi siempre se define como superposición de transcripciones de ARNm. Específicamente, una superposición de genes en eucariotas se define cuando al menos un nucleótido se comparte entre los límites de las transcripciones de ARNm primarias de dos o más genes, de modo que una mutación de la base de ADN en cualquier punto de la región superpuesta afectaría las transcripciones de todos los genes involucrados. Esta definición incluye regiones no traducidas (UTR) 5′ y 3′ junto con intrones .
La sobreimpresión se refiere a un tipo de superposición en la que toda o parte de la secuencia de un gen se lee en un marco de lectura alternativo de otro gen en el mismo locus . [4] Se cree que los marcos de lectura abiertos alternativos (ORF) se crean por sustituciones críticas de nucleótidos dentro de un gen preexistente expresable, que puede inducirse para expresar una proteína nueva mientras aún preserva la función del gen original. [5] Se ha planteado la hipótesis de que la sobreimpresión es un mecanismo para la aparición de novo de nuevos genes a partir de secuencias existentes, ya sean genes más antiguos o regiones previamente no codificantes del genoma. [6] Se cree que la mayoría de los genes superpuestos, o genes cuyas secuencias de nucleótidos expresables se superponen parcialmente entre sí, evolucionaron en parte debido a este mecanismo, lo que sugiere que cada superposición se compone de un gen ancestral y un gen nuevo. [7] Posteriormente, también se cree que la sobreimpresión es una fuente de proteínas nuevas, ya que las proteínas de novo codificadas por estos genes nuevos generalmente carecen de homólogos remotos en las bases de datos. [8] Los genes sobreimpresos son características particularmente comunes de la organización genómica de los virus, que probablemente aumenten en gran medida el número de genes expresables potenciales a partir de un pequeño conjunto de información genética viral. [9] Es probable que la sobreimpresión sea responsable de la generación de numerosas proteínas nuevas por parte de los virus a lo largo de su historia evolutiva .
Clasificación
Los genes pueden superponerse de diversas maneras y pueden clasificarse por sus posiciones relativas entre sí. [3] [11] [12] [13] [14]
Superposición unidireccional o en tándem : el extremo 3' de un gen se superpone con el extremo 5' de otro gen de la misma cadena. Esta disposición se puede simbolizar con la notación → → donde las flechas indican el marco de lectura de principio a fin.
Superposición convergente o de extremos : los extremos 3' de los dos genes se superponen en cadenas opuestas. Esto se puede escribir como → ←.
Superposición divergente o de cola : los extremos 5' de los dos genes se superponen en cadenas opuestas. Esto se puede escribir como ← →.
Los genes superpuestos también se pueden clasificar por fases , que describen sus marcos de lectura relativos : [3] [11] [12] [13] [14]
La superposición en fase se produce cuando las secuencias compartidas utilizan el mismo marco de lectura. Esto también se conoce como "fase 0". Los genes unidireccionales con superposición en fase 0 no se consideran genes distintos, sino sitios de inicio alternativos del mismo gen.
Las superposiciones fuera de fase se producen cuando las secuencias compartidas utilizan diferentes marcos de lectura. Esto puede ocurrir en la "fase 1" o la "fase 2", dependiendo de si los marcos de lectura están desfasados por 1 o 2 nucleótidos. Debido a que un codón tiene tres nucleótidos de longitud, un desfase de tres nucleótidos es un marco en fase, fase 0.
Los estudios sobre genes superpuestos sugieren que su evolución se puede resumir en dos modelos posibles. [4] En un modelo, las dos proteínas codificadas por sus respectivos genes superpuestos evolucionan bajo presiones de selección similares . Las proteínas y la región superpuesta están altamente conservadas cuando se favorece una fuerte selección contra el cambio de aminoácidos . Se razona que los genes superpuestos evolucionan bajo restricciones estrictas ya que una sola sustitución de nucleótidos puede alterar la estructura y función de las dos proteínas simultáneamente. Un estudio sobre el virus de la hepatitis B (VHB), cuyo genoma de ADN contiene numerosos genes superpuestos, mostró que el número medio de sustituciones de nucleótidos sinónimas por sitio en regiones codificantes superpuestas era significativamente menor que el de las regiones no superpuestas. [15] El mismo estudio mostró que era posible que algunas de estas regiones superpuestas y sus proteínas divergieran significativamente del original cuando hay una selección débil contra el cambio de aminoácidos. El dominio espaciador de la polimerasa y la región pre-S1 de una proteína de superficie del VHB, por ejemplo, tenían un porcentaje de aminoácidos conservados del 30% y 40%, respectivamente. [15] Sin embargo, se sabe que estas regiones superpuestas son menos importantes para la replicación en comparación con las regiones superpuestas que estaban altamente conservadas entre diferentes cepas de VHB, que son absolutamente esenciales para el proceso.
El segundo modelo sugiere que las dos proteínas y sus respectivos genes superpuestos evolucionan bajo presiones de selección opuestas: un marco experimenta una selección positiva mientras que el otro está bajo selección purificadora . En los tombusvirus , las proteínas p19 y p22 están codificadas por genes superpuestos que forman una región codificante de 549 nt, y se muestra que p19 está bajo selección positiva mientras que p22 está bajo selección purificadora. [16] Se mencionan ejemplos adicionales en estudios que involucran genes superpuestos del virus Sendai , [17] el virus del enrollamiento de la hoja de la papa , [18] y el parvovirus humano B19 . [19] Se sugiere que este fenómeno de genes superpuestos que experimentan diferentes presiones de selección es una consecuencia de una alta tasa de sustitución de nucleótidos con diferentes efectos en los dos marcos; las sustituciones pueden ser mayoritariamente no sinónimas para un marco mientras que en su mayoría son sinónimas para el otro marco. [4]
Evolución
Los genes superpuestos son particularmente comunes en genomas de rápida evolución, como los de los virus , las bacterias y las mitocondrias . Pueden originarse de tres maneras: [20]
Por extensión de un ORF existente aguas arriba en un gen contiguo debido a la pérdida de un codón de iniciación ;
Mediante la generación de un nuevo ORF dentro de uno existente debido a una mutación puntual .
El uso de la misma secuencia de nucleótidos para codificar múltiples genes puede proporcionar una ventaja evolutiva debido a la reducción del tamaño del genoma y a la oportunidad de corregulación transcripcional y traduccional de los genes superpuestos. [12] [21] [22] [23] Las superposiciones de genes introducen nuevas restricciones evolutivas en las secuencias de las regiones superpuestas. [14] [24]
Orígenes de nuevos genes
En 1977, Pierre-Paul Grassé propuso que uno de los genes del par podría haberse originado de novo por mutaciones para introducir nuevos ORFs en marcos de lectura alternativos; describió el mecanismo como sobreimpresión . [25] : 231 Posteriormente fue corroborado por Susumu Ohno , quien identificó un gen candidato que puede haber surgido por este mecanismo. [26] Algunos genes de novo que se originan de esta manera pueden no permanecer superpuestos, sino subfuncionalizarse después de la duplicación genética , [6] contribuyendo a la prevalencia de genes huérfanos . Qué miembro de un par de genes superpuestos es más joven se puede identificar bioinformáticamente ya sea por una distribución filogenética más restringida o por un uso de codones menos optimizado . [9] [27] [28] Los miembros más jóvenes del par tienden a tener un desorden estructural intrínseco mayor que los miembros más viejos, pero los miembros más viejos también están más desordenados que otras proteínas, presumiblemente como una forma de aliviar las mayores restricciones evolutivas planteadas por la superposición. [27] Es más probable que las superposiciones se originen en proteínas que ya tienen un alto nivel de desorden. [27]
Distribución taxonómica
Los genes superpuestos se dan en todos los ámbitos de la vida , aunque con frecuencias variables. Son especialmente comunes en los genomas virales .
Virus
La existencia de genes superpuestos se identificó por primera vez en el virus ΦX174 , cuyo genoma fue el primer genoma de ADN secuenciado por Frederick Sanger en 1977. [29] Análisis previos de ΦX174, un pequeño bacteriófago de ADN monocatenario que infectó a la bacteria Escherichia coli , sugirieron que las proteínas producidas durante la infección requerían secuencias codificantes más largas que la longitud medida de su genoma. [31] El análisis del genoma de 5386 nucleótidos completamente secuenciado mostró que el virus poseía una superposición extensa entre regiones codificantes, revelando que algunos genes (como los genes D y E) se tradujeron de las mismas secuencias de ADN pero en diferentes marcos de lectura. [29] [31] Se demostró que un sitio de inicio alternativo dentro del gen A de replicación del genoma de ΦX174 expresa una proteína truncada con una secuencia codificante idéntica al extremo C de la proteína A original pero que posee una función diferente [32] [33] Se concluyó que otros sitios no descubiertos de síntesis de polipéptidos podrían estar ocultos a través del genoma debido a genes superpuestos. Se demostró que un gen de novo identificado de otro locus de genes superpuestos expresa una proteína nueva que induce la lisis de E. coli al inhibir la biosíntesis de su pared celular [56], lo que sugiere que la creación de proteínas de novo a través del proceso de sobreimpresión puede ser un factor significativo en la evolución de la patogenicidad de los virus. [4] Otro ejemplo es el gen ORF3d en el virus SARS-CoV 2. [1] [34] Los genes superpuestos son particularmente comunes en los genomas virales . [9] Algunos estudios atribuyen esta observación a la presión selectiva hacia tamaños pequeños de genoma mediada por las restricciones físicas del empaquetamiento del genoma en una cápside viral , particularmente una de geometría icosaédrica . [35] Sin embargo, otros estudios cuestionan esta conclusión y argumentan que la distribución de superposiciones en genomas virales es más probable que refleje la sobreimpresión como el origen evolutivo de los genes virales superpuestos. [36] La sobreimpresión es una fuente común de genes de novo en los virus. [28]
La proporción de virus con secuencias codificantes superpuestas dentro de sus genomas varía. [2] Los virus de ARN bicatenario tienen menos de una cuarta parte que los contiene, mientras que casi tres cuartas partes de los retrovirus y los virus con genomas de ADN monocatenario contienen secuencias codificantes superpuestas. [37] Los virus segmentados en particular, o los virus con su genoma dividido en piezas separadas y empaquetados ya sea todos en la misma cápside o en cápsides separadas, tienen más probabilidades de contener una secuencia superpuesta que los virus no segmentados. [37] Los virus de ARN tienen menos genes superpuestos que los virus de ADN que poseen tasas de mutación más bajas y tamaños de genoma menos restrictivos. [37] [38] La menor tasa de mutación de los virus de ADN facilita una mayor novedad genómica y exploración evolutiva dentro de un genoma estructuralmente restringido y puede ser el principal impulsor de la evolución de genes superpuestos. [39] [40]
Los estudios de genes virales sobreimpresos sugieren que sus productos proteicos tienden a ser proteínas accesorias que no son esenciales para la proliferación viral, pero contribuyen a la patogenicidad . Las proteínas sobreimpresas a menudo tienen distribuciones de aminoácidos inusuales y altos niveles de desorden intrínseco . [41] En algunos casos, las proteínas sobreimpresas tienen estructuras tridimensionales bien definidas, pero novedosas; [42] un ejemplo es el supresor de silenciamiento de ARN p19 encontrado en Tombusvirus , que tiene un nuevo pliegue proteico y un nuevo modo de unión para reconocer siRNA . [28] [30] [43]
Procariotas
Las estimaciones de superposición de genes en genomas bacterianos generalmente encuentran que alrededor de un tercio de los genes bacterianos están superpuestos, aunque generalmente solo por unos pocos pares de bases. [12] [44] [45] La mayoría de los estudios de superposición en genomas bacterianos encuentran evidencia de que la superposición cumple una función en la regulación genética , permitiendo que los genes superpuestos sean co-regulados transcripcional y traduccionalmente . [12] [23] En genomas procariotas, las superposiciones unidireccionales son las más comunes, posiblemente debido a la tendencia de los genes procariotas adyacentes a compartir la orientación. [12] [14] [11] Entre las superposiciones unidireccionales, las superposiciones largas se leen más comúnmente con un desplazamiento de un nucleótido en el marco de lectura (es decir, fase 1) y las superposiciones cortas se leen más comúnmente en la fase 2. [45] [46] Las superposiciones largas de más de 60 pares de bases son más comunes para genes convergentes; sin embargo, las supuestas superposiciones largas tienen tasas muy altas de anotación errónea . [47] Son raros los ejemplos validados de superposiciones prolongadas en genomas bacterianos; en el organismo modelo bien estudiado Escherichia coli , solo cuatro pares de genes están bien validados por tener superposiciones largas y sobreimpresas. [48]
Eucariotas
En comparación con los genomas procariotas, los genomas eucariotas suelen estar mal anotados y, por lo tanto, identificar superposiciones genuinas es relativamente difícil. [28] Sin embargo, se han documentado ejemplos de superposiciones de genes validadas en una variedad de organismos eucariotas, incluidos mamíferos como ratones y humanos. [49] [50] [51] [52] Los eucariotas difieren de los procariotas en la distribución de los tipos de superposición: mientras que las superposiciones unidireccionales (es decir, de la misma cadena) son más comunes en los procariotas, las superposiciones de cadenas opuestas o antiparalelas son más comunes en los eucariotas. Entre las superposiciones de cadenas opuestas, la orientación convergente es la más común. [50] La mayoría de los estudios de superposición de genes eucariotas han encontrado que los genes superpuestos están ampliamente sujetos a la reorganización genómica incluso en especies estrechamente relacionadas y, por lo tanto, la presencia de una superposición no siempre está bien conservada. [51] [53] La superposición con genes más antiguos o menos restringidos taxonómicamente también es una característica común de los genes que probablemente se hayan originado de novo en un linaje eucariota determinado. [51] [54] [55]
Función
Las funciones precisas de los genes superpuestos parecen variar en los distintos dominios de la vida, pero varios experimentos han demostrado que son importantes para los ciclos de vida de los virus a través de la expresión y estequiometría adecuadas de las proteínas [56], además de desempeñar un papel en el plegamiento adecuado de las proteínas. [57] También se ha creado una versión del bacteriófago ΦX174 en la que se eliminaron todas las superposiciones de genes [58], lo que demuestra que no eran necesarias para la replicación.
La retención y evolución de genes superpuestos dentro de los virus también puede deberse a limitaciones en el tamaño de la cápside . [59] Se observó una pérdida dramática de viabilidad en virus con genomas diseñados para ser más largos que el genoma de tipo salvaje. [60] Aumentar la longitud del genoma de ADN monocatenario de ΦX174 en >1% da como resultado una pérdida casi completa de infectividad , que se cree que es el resultado de las estrictas restricciones físicas impuestas por el volumen finito de la cápside. [61] Los estudios sobre virus adenoasociados como vectores de administración de genes mostraron que el empaquetamiento viral está restringido por límites de tamaño de carga genética, lo que requiere el uso de múltiples vectores para administrar genes humanos grandes como CFTR81. [62] [63] Por lo tanto, se sugiere que los genes superpuestos evolucionaron como un medio para superar estas restricciones físicas, aumentando la diversidad genética utilizando solo la secuencia existente en lugar de aumentar la longitud del genoma.
Métodos para identificar genes superpuestos y ORFs
Los métodos estandarizados como la anotación del genoma pueden ser inadecuados para la detección de genes superpuestos, ya que dependen de genes ya seleccionados, mientras que los genes superpuestos generalmente se pasan por alto porque contienen una composición de secuencia atípica. [2] [64] [65] [66] Los estándares de anotación del genoma también suelen estar sesgados contra las superposiciones de características, como los genes completamente contenidos dentro de otro gen. [67] Además, algunas tuberías de bioinformática, como la tubería RAST, penalizan notablemente las superposiciones entre los ORF previstos. [68] Sin embargo, el rápido avance de las herramientas de medición de proteínas y ARN a escala del genoma junto con algoritmos de predicción cada vez más avanzados han revelado una avalancha de genes superpuestos y ORF dentro de numerosos genomas. [2] Los métodos proteogenómicos han sido esenciales para descubrir numerosos genes superpuestos e incluyen una combinación de técnicas como la proteómica de abajo hacia arriba , el perfil de ribosomas , la secuenciación de ADN y la perturbación . La secuenciación de ARN también se utiliza para identificar regiones genómicas que contienen transcripciones superpuestas. Se ha utilizado para identificar 180.000 ORF alternativos dentro de regiones codificantes anotadas previamente que se encuentran en humanos. [69] Los ORF recién descubiertos como estos se verifican utilizando una variedad de técnicas de genética inversa , como CRISPR-Cas9 y la disrupción de Cas9 catalíticamente muerta (dCas9) . [70] [71] [72] También se realizan intentos de prueba por síntesis para demostrar más allá de toda duda la ausencia de genes superpuestos no descubiertos. [73]
^ ab Nelson, Chase W, et al. (1 de octubre de 2020). "Nuevo gen superpuesto que evoluciona dinámicamente como factor en la pandemia del SARS-CoV-2". eLife . 9 . doi : 10.7554/eLife.59633 . PMC 7655111 . PMID 33001029.
^ abcdef Wright BW, Molloy MP, Jaschke PR (5 de octubre de 2021). "Superposición de genes en genomas naturales y de ingeniería". Nature Reviews Genetics . 23 (3): 154–168. doi :10.1038/s41576-021-00417-w. ISSN 1471-0064. PMC 8490965 . PMID 34611352.
^ abc Y. Fukuda, M. Tomita y T. Washio (1999). "Estudio comparativo de genes superpuestos en los genomas de Mycoplasma genitalium y Mycoplasma pneumoniae". Nucleic Acids Res . 27 (8): 1847–1853. doi :10.1093/nar/27.8.1847. PMC 148392 . PMID 10101192.
^ abcd Pavesi A (26 de mayo de 2021). "Origen, evolución y estabilidad de genes superpuestos en virus: una revisión sistemática". Genes . 12 (6): 809. doi : 10.3390/genes12060809 . ISSN 2073-4425. PMC 8227390 . PMID 34073395.
^ Normark S, Bergström S, Edlund T, Grundström T, Jaurin B, Lindberg FP, Olsson O (diciembre de 1983). "Genes superpuestos". Revista Anual de Genética . 17 (1): 499–525. doi : 10.1146/annurev.ge.17.120183.002435. ISSN 0066-4197. PMID 6198955.
^ ab Keese PK, Gibbs A (15 de octubre de 1992). "Orígenes de los genes: ¿"big bang" o creación continua?". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Bibcode :1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . PMC 50157 . PMID 1329098.
^ Keese PK, Gibbs A (15 de octubre de 1992). "Orígenes de los genes: ¿"big bang" o creación continua?". Actas de la Academia Nacional de Ciencias . 89 (20): 9489–9493. Bibcode :1992PNAS...89.9489K. doi : 10.1073/pnas.89.20.9489 . ISSN 0027-8424. PMC 50157 . PMID 1329098.
^ Gibbs A, Keese PK (19 de octubre de 1995), "En busca de los orígenes de los genes virales", Molecular Basis of Virus Evolution , Cambridge University Press, págs. 76-90, doi :10.1017/cbo9780511661686.008, ISBN978-0-521-45533-6, consultado el 3 de diciembre de 2021
^ abcd Pavesi A, Magiorkinis G, Karlin DG, Wilke CO (15 de agosto de 2013). "Las proteínas virales originadas de novo por sobreimpresión se pueden identificar por el uso de codones: aplicación al "guardería genética" de deltaretrovirus". PLOS Computational Biology . 9 (8): e1003162. Bibcode :2013PLSCB...9E3162P. doi : 10.1371/journal.pcbi.1003162 . PMC 3744397 . PMID 23966842.
^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (abril de 1981). "Secuencia y organización del genoma mitocondrial humano". Nature . 290 (5806): 457–465. Bibcode :1981Natur.290..457A. doi :10.1038/290457a0. PMID 7219534. S2CID 4355527.
^ abc Fukuda Y, Nakayama Y, Tomita M (diciembre de 2003). "Sobre la dinámica de los genes superpuestos en genomas bacterianos". Gene . 323 : 181–187. doi :10.1016/j.gene.2003.09.021. PMID 14659892.
^ abcdef Johnson Z, Chisholm S (2004). "Las propiedades de los genes superpuestos se conservan en los genomas microbianos". Genome Res . 14 (11): 2268–72. doi :10.1101/gr.2433104. PMC 525685 . PMID 15520290.
^ ab Normark S., Bergstrom S., Edlund T., Grundstrom T., Jaurin B., Lindberg FP, Olsson O. (1983). "Superposición de genes". Revisión anual de genética . 17 : 499–525. doi :10.1146/annurev.ge.17.120183.002435. PMID 6198955.
^ abcd Rogozin IB, Spiridonov AN, Sorokin AV, Wolf YI, Jordan I, Tatusov RL, Koonin EV (mayo de 2002). "Purificación y selección direccional en genes procariotas superpuestos". Tendencias en genética . 18 (5): 228–232. doi :10.1016/S0168-9525(02)02649-5. PMID 12047938.
^ ab Mizokami M, Orito E, Ohba Ki, Ikeo K, Lau JY, Gojobori T (enero de 1997). "Evolución restringida con respecto a la superposición de genes del virus de la hepatitis B". Journal of Molecular Evolution . 44 (S1): S83–S90. Bibcode :1997JMolE..44S..83M. doi :10.1007/pl00000061. ISSN 0022-2844. PMID 9071016. S2CID 22644652.
^ Allison JR, Lechner M, Hoeppner MP, Poole AM (12 de febrero de 2016). "¿Selección positiva o libertad de variación? Evaluación de la significación funcional del cambio de secuencia mediante dinámica molecular". PLOS ONE . 11 (2): e0147619. Bibcode :2016PLoSO..1147619A. doi : 10.1371/journal.pone.0147619 . ISSN 1932-6203. PMC 4752228 . PMID 26871901.
^ Fujii Y, Kiyotani K, Yoshida T, Sakaguchi T (2001). "Regiones conservadas y no conservadas en el genoma del virus Sendai: evolución de un gen que posee marcos de lectura superpuestos". Virus Genes . 22 (1): 47–52. doi :10.1023/a:1008130318633. ISSN 0920-8569. PMID 11210938. S2CID 12869504.
^ Guyader S, Ducray DG (1 de julio de 2002). "El análisis de secuencias de aislados del virus del enrollamiento de la hoja de la papa revela estabilidad genética, eventos evolutivos importantes y presión de selección diferencial entre productos con marcos de lectura superpuestos". Journal of General Virology . 83 (7): 1799–1807. doi : 10.1099/0022-1317-83-7-1799 . ISSN 0022-1317. PMID 12075102.
^ Stamenković GG, Ćirković VS, Šiljić MM, Blagojević JV, Knežević AM, Joksić ID, Stanojević MP (24 de octubre de 2016). "Tasa de sustitución y selección natural en parvovirus B19". Informes científicos . 6 (1): 35759. Código bibliográfico : 2016NatSR...635759S. doi :10.1038/srep35759. ISSN 2045-2322. PMC 5075947 . PMID 27775080.
^ Krakauer DC (junio de 2000). "Estabilidad y evolución de genes superpuestos". Evolution . 54 (3): 731–739. doi : 10.1111/j.0014-3820.2000.tb00075.x . PMID 10937248. S2CID 8818055.
^ Delaye L, DeLuna A, Lazcano A, Becerra A (2008). "El origen de un nuevo gen a través de la sobreimpresión en Escherichia coli". BMC Evolutionary Biology . 8 (1): 31. Bibcode :2008BMCEE...8...31D. doi : 10.1186/1471-2148-8-31 . PMC 2268670 . PMID 18226237.
^ Saha D, Podder S, Panda A, Ghosh TC (mayo de 2016). "Superposición de genes: un correlato genómico significativo de las tasas de crecimiento procariota". Gene . 582 (2): 143–147. doi :10.1016/j.gene.2016.02.002. PMID 26853049.
^ ab Luo Y, Battistuzzi F, Lin K, Gibas C (29 de noviembre de 2013). "Dinámica evolutiva de genes superpuestos en Salmonella". PLOS ONE . 8 (11): e81016. Bibcode :2013PLoSO...881016L. doi : 10.1371/journal.pone.0081016 . PMC 3843671 . PMID 24312259.
^ Wei X, Zhang J (31 de diciembre de 2014). "Un método simple para estimar la fuerza de la selección natural en genes superpuestos". Genome Biology and Evolution . 7 (1): 381–390. doi :10.1093/gbe/evu294. PMC 4316641 . PMID 25552532.
^ Grassé PP (1977). Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación . Academic Press. ISBN978-1-4832-7409-6.
^ Ohno S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia codificante internamente repetitiva preexistente". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Bibcode :1984PNAS...81.2421O. doi : 10.1073/pnas.81.8.2421 . PMC 345072 . PMID 6585807.
^ abc Willis S, Masel J (19 de julio de 2018). "El nacimiento de genes contribuye al desorden estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi :10.1534/genetics.118.301249. PMC 6116962 . PMID 30026186.
^ abcd Sabath N, Wagner A, Karlin D (19 de julio de 2012). "Evolución de proteínas virales originadas de novo por sobreimpresión". Biología molecular y evolución . 29 (12): 3767–3780. doi :10.1093/molbev/mss179. PMC 3494269 . PMID 22821011.
^ abc Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes JC, Hutchison CA, Slocombe PM, Smith M (1977). "Secuencia de nucleótidos del ADN del bacteriófago ΦX174". Nature . 265 (5596): 687–95. Código Bibliográfico :1977Natur.265..687S. doi :10.1038/265687a0. PMID 870828. S2CID 4206886.
^ ab Ye K, Malinina L, Patel DJ (3 de diciembre de 2003). "Reconocimiento de ARN interferente pequeño por un supresor viral del silenciamiento del ARN". Nature . 426 (6968): 874–878. Bibcode :2003Natur.426..874Y. doi :10.1038/nature02213. PMC 4694583 . PMID 14661029.
^ ab Barrell BG, Air GM, Hutchison CA (noviembre de 1976). "Superposición de genes en el bacteriófago φX174". Nature . 264 (5581): 34–41. Bibcode :1976Natur.264...34B. doi :10.1038/264034a0. ISSN 1476-4687. PMID 1004533. S2CID 4264796.
^ LINNEY E, HAYASHI M (mayo de 1974). "Regulación intragénica de la síntesis de proteínas del gen A ΦX174". Nature . 249 (5455): 345–348. Bibcode :1974Natur.249..345L. doi :10.1038/249345a0. ISSN 0028-0836. PMID 4601823. S2CID 4175651.
^ Roznowski AP, Doore SM, Kemp SZ, Fane BA (6 de enero de 2020). "Finalmente, un papel digno de una estrella: las proteínas del microvirus A* no esenciales y fuertemente conservadas garantizan la fidelidad del producto de las reacciones de empaquetamiento". Journal of Virology . 94 (2). doi :10.1128/jvi.01593-19. ISSN 0022-538X. PMC 6955274 . PMID 31666371.
^ Dockrill P (11 de noviembre de 2020). "Los científicos acaban de encontrar un 'gen dentro de un gen' misteriosamente oculto en el SARS-CoV-2". ScienceAlert . Consultado el 11 de noviembre de 2020 .
^ Chirico N, Vianelli A, Belshaw R (7 de julio de 2010). "Por qué los genes se superponen en los virus". Actas de la Royal Society B: Biological Sciences . 277 (1701): 3809–3817. doi :10.1098/rspb.2010.1052. PMC 2992710 . PMID 20610432.
^ Brandes N, Linial M (21 de mayo de 2016). "Superposición de genes y restricciones de tamaño en el mundo viral". Biology Direct . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . PMC 4875738 . PMID 27209091.
^ abc Schlub TE, Holmes EC (1 de enero de 2020). "Propiedades y abundancia de genes superpuestos en virus". Virus Evolution . 6 (1): veaa009. doi :10.1093/ve/veaa009. ISSN 2057-1577. PMC 7017920 . PMID 32071766.
^ Chirico N, Vianelli A, Belshaw R (7 de julio de 2010). "Por qué los genes se superponen en los virus". Actas de la Royal Society B: Biological Sciences . 277 (1701): 3809–3817. doi :10.1098/rspb.2010.1052. ISSN 0962-8452. PMC 2992710 . PMID 20610432.
^ Brandes N, Linial M (21 de mayo de 2016). "Superposición de genes y restricciones de tamaño en el mundo viral". Biology Direct . 11 (1): 26. doi : 10.1186/s13062-016-0128-3 . ISSN 1745-6150. PMC 4875738 . PMID 27209091.
^ Pavesi A (julio de 2020). "Nuevos conocimientos sobre las características evolutivas de los genes superpuestos virales mediante análisis discriminante". Virology . 546 : 51–66. doi :10.1016/j.virol.2020.03.007. ISSN 0042-6822. PMC 7157939 . PMID 32452417.
^ Rancurel C, Khosravi M, Dunker AK, Romero PR, Karlin D (29 de julio de 2009). "Los genes superpuestos producen proteínas con propiedades de secuencia inusuales y ofrecen información sobre la creación de proteínas de novo". Journal of Virology . 83 (20): 10719–10736. doi :10.1128/JVI.00595-09. PMC 2753099 . PMID 19640978.
^ Abroi A (1 de diciembre de 2015). "Una visión basada en el dominio proteico de la relación entre la virosfera y el huésped". Biochimie . 119 : 231–243. doi :10.1016/j.biochi.2015.08.008. PMID 26296474.
^ Vargason JM, Szittya G, Burgyán J, Hall TM (diciembre de 2003). "Reconocimiento selectivo por tamaño de siRNA por un supresor de silenciamiento de ARN". Cell . 115 (7): 799–811. doi : 10.1016/S0092-8674(03)00984-X . PMID 14697199. S2CID 12993441.
^ Huvet M, Stumpf MP (1 de enero de 2014). "Superposición de genes: una ventana a la capacidad de evolución de los genes". BMC Genomics . 15 (1): 721. doi : 10.1186/1471-2164-15-721 . ISSN 1471-2164. PMC 4161906 . PMID 25159814.
^ ab Cock PJ, Whitworth DE (19 de marzo de 2007). "Evolución de superposiciones de genes: sesgo relativo del marco de lectura en genes de sistemas procariotas de dos componentes". Journal of Molecular Evolution . 64 (4): 457–462. Bibcode :2007JMolE..64..457C. doi :10.1007/s00239-006-0180-1. PMID 17479344. S2CID 21612308.
^ Fonseca MM, Harris DJ, Posada D (5 de noviembre de 2013). "Origen y distribución de longitud de genes superpuestos procariotas unidireccionales". G3: Genes, Genomas, Genética . 4 (1): 19–27. doi :10.1534/g3.113.005652. PMC 3887535 . PMID 24192837.
^ Pallejà A, Harrington ED, Bork P (2008). "Grandes solapamientos de genes en genomas procariotas: ¿resultado de limitaciones funcionales o predicciones erróneas?". BMC Genomics . 9 (1): 335. doi : 10.1186/1471-2164-9-335 . PMC 2478687 . PMID 18627618.
^ Fellner L, Simon S, Scherling C, Witting M, Schober S, Polte C, Schmitt-Kopplin P, Keim DA, Scherer S, Neuhaus K (18 de diciembre de 2015). "Evidencia del origen reciente de un gen huérfano superpuesto que codifica proteínas bacterianas mediante sobreimpresión evolutiva". BMC Evolutionary Biology . 15 (1): 283. Bibcode :2015BMCEE..15..283F. doi : 10.1186/s12862-015-0558-z . PMC 4683798 . PMID 26677845.
^ McLysaght A, Guerzoni D (31 de agosto de 2015). "Nuevos genes a partir de secuencias no codificantes: el papel de los genes codificantes de proteínas de novo en la innovación evolutiva eucariota". Philosophical Transactions of the Royal Society B: Biological Sciences . 370 (1678): 20140332. doi :10.1098/rstb.2014.0332. PMC 4571571 . PMID 26323763.
^ ab C. Sanna, W. Li y L. Zhang (2008). "Superposición de genes en los genomas humanos y de ratón". BMC Genomics . 9 (169): 169. doi : 10.1186/1471-2164-9-169 . PMC 2335118 . PMID 18410680.
^ abc Makałowska I, Lin CF, Hernandez K (2007). "Nacimiento y muerte de superposiciones de genes en vertebrados". BMC Evolutionary Biology . 7 (1): 193. Bibcode :2007BMCEE...7..193M. doi : 10.1186/1471-2148-7-193 . PMC 2151771 . PMID 17939861.
^ Veeramachaneni V (1 de febrero de 2004). "Genes superpuestos en mamíferos: la perspectiva comparativa". Genome Research . 14 (2): 280–286. doi :10.1101/gr.1590904. PMC 327103 . PMID 14762064.
^ Behura SK, Severson DW (2013). "Superposición de genes de Aedes aegypti: implicaciones evolutivas a partir de la comparación con ortólogos de Anopheles gambiae y otros insectos". BMC Evolutionary Biology . 13 (1): 124. Bibcode :2013BMCEE..13..124B. doi : 10.1186/1471-2148-13-124 . PMC 3689595 . PMID 23777277.
^ Murphy DN, McLysaght A, Carmel L (21 de noviembre de 2012). "Origen de novo de genes codificadores de proteínas en roedores murinos". PLOS ONE . 7 (11): e48650. Bibcode :2012PLoSO...748650M. doi : 10.1371/journal.pone.0048650 . PMC 3504067 . PMID 23185269.
^ Knowles DG, McLysaght A (2 de septiembre de 2009). "Origen reciente de novo de genes codificadores de proteínas humanas". Genome Research . 19 (10): 1752–1759. doi :10.1101/gr.095026.109. PMC 2765279 . PMID 19726446.
^ Wright BW, Ruan J, Molloy MP, Jaschke PR (20 de noviembre de 2020). "La modularización del genoma revela que la topología de genes superpuestos es necesaria para una reproducción viral eficiente". ACS Synthetic Biology . 9 (11): 3079–3090. doi :10.1021/acssynbio.0c00323. ISSN 2161-5063. PMID 33044064. S2CID 222300240.
^ Pradhan P, Li W, Kaur P (enero de 2009). "El acoplamiento traduccional controla la expresión y la función de la bomba de eflujo de fármacos DrrAB". Journal of Molecular Biology . 385 (3): 831–842. doi :10.1016/j.jmb.2008.11.027. PMID 19063901.
^ Jaschke PR, Lieberman EK, Rodriguez J, Sierra A, Endy D (diciembre de 2012). "Un genoma del bacteriófago sintético øX174 completamente descomprimido ensamblado y archivado en levadura". Virology . 434 (2): 278–284. doi : 10.1016/j.virol.2012.09.020 . ISSN 0042-6822. PMID 23079106.
^ Krakauer DC, Plotkin JB (29 de enero de 2002). "Redundancia, antiredundancia y robustez de los genomas". Actas de la Academia Nacional de Ciencias . 99 (3): 1405–1409. Bibcode :2002PNAS...99.1405K. doi : 10.1073/pnas.032668599 . ISSN 0027-8424. PMC 122203 . PMID 11818563.
^ Feiss M, Fisher R, Crayton M, Egner C (marzo de 1977). "Empaquetamiento del cromosoma λ del bacteriófago: efecto de la longitud del cromosoma". Virología . 77 (1): 281–293. doi :10.1016/0042-6822(77)90425-1. ISSN 0042-6822. PMID 841861.
^ Aoyama A, Hayashi M (septiembre de 1985). "Efectos del tamaño del genoma en el empaquetamiento del ADN del bacteriófago phi X174 in vitro". Journal of Biological Chemistry . 260 (20): 11033–11038. doi : 10.1016/s0021-9258(17)39144-5 . ISSN 0021-9258. PMID 3161888. S2CID 32443408.
^ Wu Z, Yang H, Colosi P (enero de 2010). "Efecto del tamaño del genoma en el empaquetamiento del vector AAV". Terapia molecular . 18 (1): 80–86. doi :10.1038/mt.2009.255. ISSN 1525-0016. PMC 2839202 . PMID 19904234.
^ Vaidyanathan S, Baik R, Chen L, Bravo DT, Suarez CJ, Abazari SM, Salahudeen AA, Dudek AM, Teran CA, Davis TH, Lee CM (marzo de 2021). "Reemplazo dirigido de CFTR de longitud completa en células madre de las vías respiratorias humanas por CRISPR-Cas9 para la corrección de mutaciones en el locus endógeno". Terapia Molecular . 30 (1): 223–237. doi :10.1016/j.ymthe.2021.03.023. PMC 8753290 . PMID 33794364. S2CID 232761334.
^ Willis S, Masel J (19 de julio de 2018). "El nacimiento de genes contribuye al desorden estructural codificado por genes superpuestos". Genética . 210 (1): 303–313. doi :10.1534/genetics.118.301249. ISSN 1943-2631. PMC 6116962 . PMID 30026186.
^ Pavesi A, Vianelli A, Chirico N, Bao Y, Blinkova O, Belshaw R, Firth A, Karlin D (19 de octubre de 2018). "Los genes superpuestos y las proteínas que codifican difieren significativamente en su composición de secuencia de los genes no superpuestos". PLOS ONE . 13 (10): e0202513. Bibcode :2018PLoSO..1302513P. doi : 10.1371/journal.pone.0202513 . ISSN 1932-6203. PMC 6195259 . PMID 30339683.
^ Pavesi A, Magiorkinis G, Karlin DG (15 de agosto de 2013). "Las proteínas virales originadas de novo por sobreimpresión se pueden identificar por el uso de codones: aplicación al "guardería genética" de deltaretrovirus". PLOS Computational Biology . 9 (8): e1003162. Bibcode :2013PLSCB...9E3162P. doi : 10.1371/journal.pcbi.1003162 . ISSN 1553-7358. PMC 3744397 . PMID 23966842.
^ "Información suplementaria 2: Información de acceso a la base de datos del genoma del NCBI (archivo PDF)". doi : 10.7717/peerj.6447/supp-2 .{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Ahmed N (27 de marzo de 2009). "Recomendación de la opinión de la facultad sobre el servidor RAST: anotaciones rápidas utilizando tecnología de subsistemas". doi : 10.3410/f.1157743.618965 .{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Ben-Tal N, ed. (23 de junio de 2017). "Carta de decisión: la anotación profunda del transcriptoma permite el descubrimiento y la caracterización funcional de pequeñas proteínas crípticas". doi : 10.7554/elife.27860.082 .{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Bazzini A, Wu Q (6 de marzo de 2020). "Recomendación de opiniones de la facultad sobre la traducción funcional generalizada de marcos de lectura abiertos humanos no canónicos". doi : 10.3410/f.737484924.793572056 . S2CID 215850701.{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Prensner JR, Enache OM, Luria V, Krug K, Clauser KR, Dempster JM, Karger A, Wang L, Stumbraite K, Wang VM, Botta G (28 de enero de 2021). "Los marcos de lectura abiertos no canónicos codifican proteínas funcionales esenciales para la supervivencia de las células cancerosas". Nature Biotechnology . 39 (6): 697–704. doi :10.1038/s41587-020-00806-2. ISSN 1087-0156. PMC 8195866 . PMID 33510483.
^ Cao X, Khitun A, Luo Y, Na Z, Phoodokmai T, Sappakhaw K, Olatunji E, Uttamapinant C, Slavoff SA (5 de marzo de 2020). "Alt-RPL36 regula negativamente la vía de señalización PI3K-AKT-mTOR al interactuar con TMEM24". Nature Communications . 12 (1): 508. bioRxiv 10.1101/2020.03.04.977314 . doi :10.1038/s41467-020-20841-6. PMC 7820019 . PMID 33479206.
^ Jaschke PR, Dotson GA, Hung KS, Liu D, Endy D (12 de noviembre de 2019). "Demostración definitiva mediante síntesis de la integridad de la anotación del genoma". Actas de la Academia Nacional de Ciencias . 116 (48): 24206–24213. Bibcode :2019PNAS..11624206J. doi : 10.1073/pnas.1905990116 . ISSN 0027-8424. PMC 6883844 . PMID 31719208.