El bacteriófago phi X 174 (o ΦX174 ) es un virus de ADN monocatenario ( ssDNA ) que infecta Escherichia coli . Este virus fue aislado en 1935 por Nicolas Bulgakov [1] en el laboratorio de Félix d'Hérelle en el Instituto Pasteur , a partir de muestras recogidas en las alcantarillas de París. Su caracterización y el estudio de su mecanismo de replicación se realizaron a partir de la década de 1950. Fue el primer genoma basado en ADN que se secuenció. Este trabajo fue completado por Fred Sanger y su equipo en 1977. [2] En 1962, Walter Fiers y Robert Sinsheimer ya habían demostrado la circularidad física, covalentemente cerrada, del ADN ΦX174. [3] El ganador del premio Nobel Arthur Kornberg utilizó ΦX174 como modelo para demostrar por primera vez que el ADN sintetizado en un tubo de ensayo mediante enzimas purificadas podía producir todas las características de un virus natural, marcando el comienzo de la era de la biología sintética . [4] [5] En 1972-1974, Jerard Hurwitz , Sue Wickner y Reed Wickner , con sus colaboradores, identificaron los genes necesarios para producir las enzimas que catalizarían la conversión de la forma monocatenaria del virus a la forma replicativa bicatenaria. [6] En 2003, el grupo de Craig Venter informó que el genoma de ΦX174 fue el primero en ensamblarse completamente in vitro a partir de oligonucleótidos sintetizados. [7] La partícula del virus ΦX174 también se ha ensamblado con éxito in vitro . [8] En 2012, se demostró cómo su genoma altamente superpuesto puede descomprimirse por completo y seguir siendo funcional. [9]
Este bacteriófago tiene un genoma de ADN monocatenario circular de sentido [+] de 5.386 nucleótidos . [10] El contenido de GC del genoma es del 44% y el 95% de los nucleótidos pertenecen a genes codificantes. Debido al patrón de equilibrio de bases del genoma, se utiliza como ADN de control para los secuenciadores de Illumina. [ cita necesaria ]
ΦX174 codifica 11 genes, nombrados como letras consecutivas del alfabeto en el orden en que fueron descubiertos, con la excepción de A*, que es un codón de inicio alternativo dentro de los genes A grandes. Se cree que sólo los genes A* y K no son esenciales, aunque existen algunas dudas sobre A* porque su codón de inicio podría cambiarse a ATT pero no a cualquier otra secuencia. [11] Ahora se sabe que es probable que el ATT todavía sea capaz de producir proteínas [12] dentro de E. coli y, por lo tanto, este gen puede ser esencial.
La primera mitad del genoma ΦX174 presenta altos niveles de superposición de genes [13] con ocho de 11 genes superpuestos en al menos un nucleótido. [2] Se ha demostrado que estas superposiciones no son esenciales [9] aunque el fago refactorizado al que se le eliminaron todas las superposiciones genéticas tenía una aptitud disminuida respecto al tipo salvaje. [14]
El fago ΦX174 se ha utilizado para intentar establecer la ausencia de información genética no descubierta mediante un enfoque de "prueba por síntesis". [15]
En 2020 se generó el transcriptoma de ΦX174. [16] Las características notables del transcriptoma ΦX174 son una serie de hasta cuatro promotores relativamente débiles en serie con hasta cuatro terminadores independientes de Rho (intrínsecos) y un terminador dependiente de Rho. [ cita necesaria ]
ΦX174 codifica 11 proteínas .
Recientemente se ha informado de la identificación de todas las proteínas ΦX174 mediante espectrometría de masas. [14]
La infección comienza cuando la proteína G se une a los lipopolisacáridos de la superficie de la célula bacteriana huésped. La proteína H (o proteína piloto de ADN) dirige el genoma viral a través de la membrana bacteriana de la bacteria E. coli [18] muy probablemente a través de una hélice de dominio transmembrana N-terminal prevista . [19] Sin embargo, se ha hecho evidente que la proteína H es una proteína multifuncional. [20] Esta es la única proteína de la cápside viral de ΦX174 que carece de estructura cristalina por un par de razones. Tiene un bajo contenido aromático y un alto contenido de glicina , lo que hace que la estructura de la proteína sea muy flexible y, además, los átomos de hidrógeno individuales (el grupo R de las glicinas) son difíciles de detectar en la cristalografía de proteínas. Además, la proteína H induce la lisis del huésped bacteriano en altas concentraciones, ya que la hélice transmembrana N-terminal prevista perfora fácilmente la pared bacteriana. Según la bioinformática , esta proteína contiene cuatro dominios en espiral predichos que tienen una homología significativa con factores de transcripción conocidos. Además, se determinó que se requería proteína H de novo para la síntesis óptima de otras proteínas virales. [21] Las mutaciones en la proteína H que impiden la incorporación viral se pueden superar cuando se suministran cantidades excesivas de proteína B, la proteína de andamiaje interno. [ cita necesaria ]
El ADN se expulsa a través de un canal hidrófilo en el vértice quíntuple. [22] Se entiende que la proteína H reside en esta área, pero la evidencia experimental no ha verificado su ubicación exacta. Una vez dentro de la bacteria huésped, la replicación del genoma [+] ssDNA continúa a través de un intermediario de ADN de sentido negativo. Esto se hace a medida que el genoma del fago se superenrolla y la estructura secundaria formada por dicho superenrollamiento atrae un complejo de proteína primosómica . Esto se transloca una vez alrededor del genoma y sintetiza un [-]ssDNA del genoma original positivo. [+]Los genomas de ADNss para empaquetar en virus se crean a partir de esto mediante un mecanismo de círculo rodante. Este es el mecanismo por el cual el genoma superenrollado de doble cadena es cortado en la cadena positiva por una proteína A codificada por un virus, atrayendo también una ADN polimerasa bacteriana (DNAP) al sitio de escisión. DNAP utiliza la cadena negativa como plantilla para generar ADN con sentido positivo. A medida que se traslada alrededor del genoma, desplaza la cadena externa de ADN ya sintetizado, que queda inmediatamente recubierta por proteínas SSBP . La proteína A escinde el genoma completo cada vez que reconoce la secuencia de origen. [ cita necesaria ]
Como la proteína D es la transcripción genética más abundante, es la mayor cantidad de proteína en la procápside viral. De manera similar, las transcripciones de genes de F, J y G son más abundantes que las de H, ya que la estequiometría de estas proteínas estructurales es 5:5:5:1. Los primosomas son complejos proteicos que unen o unen la enzima helicasa en la plantilla. Los primosomas proporcionan cebadores de ARN para la síntesis de ADN en las hebras. [ cita necesaria ]
ΦX174 está estrechamente relacionado con otros microviridae , especialmente el fago NC (por ejemplo, NC1, NC7, NC11, NC16, NC37, NC5, NC41, NC56, NC51, etc.) y más lejanamente relacionado con los fagos tipo G4 e incluso más lejanamente relacionado. al fago tipo α3. Rokyta et al. 2006 presentó un árbol filogenético de sus relaciones. [23]
ΦX174 se ha utilizado como organismo modelo en muchos experimentos de evolución. [24]
ΦX174 se utiliza regularmente como control positivo en la secuenciación de ADN debido a su tamaño de genoma relativamente pequeño en comparación con otros organismos, su contenido de nucleótidos relativamente equilibrado: aproximadamente 23 % G, 22 % C, 24 % A y 31 % T, es decir, 45% G+C y 55% A+T, consulte la entrada NC_001422.1 [10] para conocer su secuencia de 5.386 nucleótidos de longitud. Los instrumentos de secuenciación de Illumina utilizan ΦX174 como control positivo, [25] y una sola secuenciación de Illumina puede cubrir el genoma de ΦX174 varios millones de veces, lo que lo convierte muy probablemente en el genoma más secuenciado de la historia. [ cita necesaria ]
ΦX174 también se utiliza para probar la resistencia del equipo de protección personal a los virus transmitidos por la sangre. [26]
ΦX174 también se ha modificado para permitir la presentación de péptidos (presentación en fagos) de la proteína G de la cápside viral. [27]
El genoma ΦX174 fue el primer fago clonado en levadura, [9] lo que proporciona un dique seco conveniente para las modificaciones del genoma. [28] ΦX174 también fue el primer genoma que se descomprimió completamente y se eliminaron todas las superposiciones de genes. [13] El efecto de estos cambios resultó en una reducción significativa de la adhesión al huésped, la desregulación de la expresión de proteínas y la sensibilidad al calor. [14]