ORF1ab (también ORF1a/b ) se refiere colectivamente a dos marcos de lectura abiertos (ORF), ORF1a y ORF1b , que se conservan en los genomas de los nidovirus , un grupo de virus que incluye a los coronavirus . Los genes expresan grandes poliproteínas que sufren proteólisis para formar varias proteínas no estructurales con diversas funciones en el ciclo de vida viral , incluidas las proteasas y los componentes del complejo replicasa-transcriptasa (RTC). [1] [2] [3] Juntos, los dos ORF a veces se denominan el gen de la replicasa . [4] Están relacionados por un cambio de marco ribosómico programado que permite que el ribosoma continúe traduciendo más allá del codón de parada al final de ORF1a, en un marco de lectura -1 . Las poliproteínas resultantes se conocen como pp1a y pp1ab . [1] [2] [3] [4]
ORF1a es el primer marco de lectura abierto en el extremo 5' del genoma. En conjunto, ORF1ab ocupa aproximadamente dos tercios del genoma, y el tercio restante en el extremo 3' codifica las proteínas estructurales y las proteínas accesorias . [1] [2] [3] Se traduce a partir de un ARN con capuchón 5' mediante traducción dependiente del capuchón . [1] Los nidovirus tienen un sistema complejo de producción de ARN subgenómico discontinuo para permitir la expresión de genes en sus genomas de ARN relativamente grandes (normalmente de 27 a 32 kb para los coronavirus [1] ), pero ORF1ab se traduce directamente a partir del ARN genómico. [5] Se han observado secuencias de ORF1ab en ARN subgenómicos no canónicos, aunque su importancia funcional no está clara. [5]
Un cambio de marco ribosómico programado permite la lectura a través del codón de terminación que termina ORF1a para continuar en un marco de lectura -1 , produciendo la poliproteína más larga pp1ab. El cambio de marco ocurre en una secuencia resbaladiza seguida por una estructura secundaria de ARN pseudonudo . [1] Esto se ha medido con una eficiencia de entre el 20 y el 50 % para el coronavirus murino [6] , o del 45 al 70 % en el SARS-CoV-2 [7], lo que produce una estequiometría de aproximadamente 1,5 a 2 veces más proteína pp1a que pp1ab expresada. [2]
Las poliproteínas pp1a y pp1ab contienen entre 13 y 17 proteínas no estructurales . [3] Sufren autoproteólisis para liberar las proteínas no estructurales debido a las acciones de los dominios internos de cisteína proteasa . [1] [2] [3]
En los coronavirus, hay un total de 16 proteínas no estructurales; la proteína pp1a contiene las proteínas no estructurales nsp1-11 y la proteína pp1ab contiene nsp1-10 y nsp12-16. El procesamiento proteolítico lo realizan dos proteasas: el dominio proteico de la proteasa similar a la papaína ubicado en la proteína multidominio nsp3 escinde hasta nsp4, y la proteasa 3CL (también conocida como la proteasa principal, nsp5) realiza las escisiones restantes de nsp5 a través del extremo C de la poliproteína . [1] [2] Las proteínas nsp12-16, los componentes C-terminales de la poliproteína pp1ab, contienen las actividades enzimáticas centrales necesarias para la replicación viral . [1] Después del procesamiento proteolítico, varias de las proteínas no estructurales se ensamblan en un gran complejo proteico conocido como complejo replicasa-transcriptasa (RTC) que realiza la replicación y transcripción del genoma . [1] [2]
Un conjunto de cinco dominios conservados de proteína "replicasa central" están presentes en todos los linajes de nidovirus ( arterivirus , mesonivirus , ronivirus y coronavirus ): de ORF1a, la proteasa principal flanqueada en cada extremo por dominios transmembrana ; y de ORF1b, un dominio de nucleotidiltransferasa conocido como NiRAN, ARN polimerasa dependiente de ARN (RdRp), un dominio de unión a zinc y una helicasa . [3] [9] (A veces se considera que son siete dominios, contando las regiones transmembrana por separado. [4] ) Además, se encuentra un dominio de endorribonucleasa en todos los nidovirus que infectan a los huéspedes vertebrados . Los arterivirus, que tienen genomas más pequeños que los otros linajes de nidovirus, también carecen de metiltransferasas , así como de una exorribonucleasa de corrección , un dominio que se conserva en los nidovirus con genomas más grandes. [3] Se cree que esta función de corrección es necesaria para lograr la fidelidad suficiente para replicar genomas de ARN grandes, pero también puede desempeñar funciones adicionales en algunos virus. [9]
En los coronavirus, pp1a y pp1ab contienen juntas dieciséis proteínas no estructurales, que tienen las siguientes funciones: [1] [2] [10] [11]
La estructura y organización del genoma, incluyendo ORF1a, ORF1b y el cambio de marco que los separa, se conserva entre los nidovirus. Se han descrito algunas estructuras de nidovirus "no canónicas", que involucran principalmente fusiones de genes . [4] El nidovirus más grande conocido, el nidovirus de células secretoras de planarias (PSCNV), con un genoma de 41 kb, tiene una estructura genómica no canónica en la que ORF1a, ORF1b y los ORF posteriores que contienen proteínas estructurales se fusionan y se expresan como un solo ORF grande que codifica una poliproteína de más de 13.000 aminoácidos . [4] [12] En estos genomas no canónicos, se pueden usar otras ubicaciones de cambio de marco o la lectura continua del codón de terminación para regular la estequiometría de las proteínas virales. [4]
Los nidovirus varían ampliamente en tamaño de genoma, desde los arterivirus con genomas típicamente de 12-15 kb hasta los coronavirus con 27-32 kb. Su historia evolutiva ha sido de interés para la investigación en la comprensión de la replicación de genomas de ARN muy grandes a pesar del mecanismo de replicación de relativamente baja fidelidad de la ARN polimerasa dependiente del ARN viral (RdRp). [4] Los genomas más grandes de nidovirus (por encima de alrededor de 20 kb [3] ) codifican una exorribonucleasa de corrección de errores (nsp14 en coronavirus) que se cree que es necesaria para la fidelidad de la replicación. [9] [1]
Entre los coronavirus , ORF1ab está más conservado que los ORF 3' que codifican proteínas estructurales . [11] A lo largo de la pandemia de COVID-19 , el genoma de los virus SARS-CoV-2 se ha secuenciado muchas veces, lo que resultó en la identificación de miles de variantes distintas . En un análisis de la Organización Mundial de la Salud de julio de 2020, ORF1ab fue el gen mutado con mayor frecuencia , seguido del gen S que codifica la proteína de la espiga . La proteína más comúnmente mutada dentro de ORF1ab fue la proteasa similar a la papaína (nsp3), y la mutación sin sentido observada más comúnmente fue en la ARN polimerasa dependiente de ARN . [13] Algunas pruebas de PCR que detectan COVID-19 analizan la muestra para el gen ORF1ab, entre otros. [14]