El bacteriófago phi X 174 (o ΦX174 ) es un virus de ADN monocatenario ( ssDNA ) que infecta a Escherichia coli . Este virus fue aislado en 1935 por Nicolas Bulgakov [1] en el laboratorio de Félix d'Hérelle en el Instituto Pasteur , a partir de muestras recogidas en las alcantarillas de París. Su caracterización y el estudio de su mecanismo de replicación se llevaron a cabo a partir de la década de 1950. Fue el primer genoma basado en ADN en ser secuenciado. Este trabajo fue completado por Fred Sanger y su equipo en 1977. [2] En 1962, Walter Fiers y Robert Sinsheimer ya habían demostrado la circularidad física, covalentemente cerrada, del ADN ΦX174. [3] El premio Nobel Arthur Kornberg utilizó ΦX174 como modelo para demostrar por primera vez que el ADN sintetizado en un tubo de ensayo mediante enzimas purificadas podía producir todas las características de un virus natural, marcando el comienzo de la era de la biología sintética . [4] [5] En 1972-1974, Jerard Hurwitz , Sue Wickner y Reed Wickner con colaboradores identificaron los genes necesarios para producir las enzimas para catalizar la conversión de la forma monocatenaria del virus a la forma replicativa bicatenaria. [6] En 2003, el grupo de Craig Venter informó que el genoma de ΦX174 fue el primero en ensamblarse completamente in vitro a partir de oligonucleótidos sintetizados. [7] La partícula del virus ΦX174 también se ha ensamblado con éxito in vitro . [8] En 2012, se demostró cómo su genoma altamente superpuesto puede descomprimirse por completo y seguir siendo funcional. [9]
Este bacteriófago tiene un genoma de ADN monocatenario circular con sentido [+] de 5386 nucleótidos . [10] El contenido de GC del genoma es del 44% y el 95% de los nucleótidos pertenecen a genes codificantes. Debido al patrón de bases equilibrado del genoma, se utiliza como ADN de control para los secuenciadores Illumina. [ cita requerida ]
ΦX174 codifica 11 genes, nombrados como letras consecutivas del alfabeto en el orden en que fueron descubiertos, con la excepción de A* que es un codón de inicio alternativo dentro de los genes A grandes. Se cree que solo los genes A* y K no son esenciales, aunque existen algunas dudas sobre A* porque su codón de inicio podría cambiarse a ATT pero no a ninguna otra secuencia. [11] Ahora se sabe que es probable que el ATT aún sea capaz de producir proteínas [12] dentro de E. coli y, por lo tanto, este gen puede, de hecho, ser esencial.
La primera mitad del genoma ΦX174 presenta altos niveles de superposición de genes [13] con ocho de los 11 genes superpuestos en al menos un nucleótido. [2] Se ha demostrado que estas superposiciones no son esenciales [9] aunque el fago refactorizado con todas las superposiciones de genes eliminadas tenía una aptitud reducida en comparación con el tipo salvaje. [14]
El fago ΦX174 se ha utilizado para intentar establecer la ausencia de información genética no descubierta a través de un enfoque de "prueba por síntesis". [15]
En 2020, se generó el transcriptoma de ΦX174. [16] Las características notables del transcriptoma de ΦX174 son una serie de hasta cuatro promotores relativamente débiles en serie con hasta cuatro terminadores independientes de Rho (intrínsecos) y un terminador dependiente de Rho. [ cita requerida ]
ΦX174 codifica 11 proteínas .
Recientemente se ha informado de la identificación de todas las proteínas ΦX174 mediante espectrometría de masas. [14]
La infección comienza cuando la proteína G se une a los lipopolisacáridos en la superficie de la célula huésped bacteriana. La proteína H (o proteína piloto de ADN) dirige el genoma viral a través de la membrana bacteriana de la bacteria E. coli [18], probablemente a través de una hélice de dominio transmembrana N-terminal predicha . [19] Sin embargo, se ha vuelto evidente que la proteína H es una proteína multifuncional. [20] Esta es la única proteína de la cápside viral de ΦX174 que carece de una estructura cristalina por un par de razones. Tiene un bajo contenido aromático y un alto contenido de glicina , lo que hace que la estructura de la proteína sea muy flexible y, además, los átomos de hidrógeno individuales (el grupo R para las glicinas) son difíciles de detectar en la cristalografía de proteínas. Además, la proteína H induce la lisis del huésped bacteriano a altas concentraciones, ya que la hélice transmembrana N-terminal predicha perfora fácilmente la pared bacteriana. Por bioinformática , esta proteína contiene cuatro dominios de bobina enrollada predichos que tienen una homología significativa con factores de transcripción conocidos. Además, se determinó que la proteína H de novo era necesaria para la síntesis óptima de otras proteínas virales. [21] Las mutaciones en la proteína H que impiden la incorporación viral se pueden superar cuando se suministran cantidades excesivas de proteína B, la proteína de andamiaje interno. [ cita requerida ]
El ADN se expulsa a través de un canal hidrófilo en el vértice quíntuple. [22] Se entiende que la proteína H reside en esta área, pero la evidencia experimental no ha verificado su ubicación exacta. Una vez dentro de la bacteria huésped, la replicación del genoma [+] ssDNA procede a través de un intermediario de ADN de sentido negativo. Esto se hace a medida que el genoma del fago se superenrolla y la estructura secundaria formada por tal superenrollamiento atrae un complejo de proteína primosómica . Este se transloca una vez alrededor del genoma y sintetiza un [−]ssDNA a partir del genoma original positivo. Los genomas [+]ssDNA para empaquetar en virus se crean a partir de esto mediante un mecanismo de círculo rodante. Este es el mecanismo por el cual el genoma superenrollado de doble cadena es cortado en la cadena positiva por una proteína A codificada por el virus, que también atrae a una ADN polimerasa bacteriana (DNAP) al sitio de escisión. La DNAP utiliza la cadena negativa como plantilla para hacer ADN de sentido positivo. A medida que se desplaza por el genoma, desplaza la hebra externa de ADN ya sintetizado, que queda inmediatamente recubierta por las proteínas SSBP . La proteína A corta el genoma completo cada vez que reconoce la secuencia de origen. [ cita requerida ]
Como la proteína D es el gen transcrito más abundante, es la proteína más abundante en la procápside viral. De manera similar, las transcripciones génicas de F, J y G son más abundantes que las de H, ya que la estequiometría para estas proteínas estructurales es 5:5:5:1. Los primosomas son complejos proteicos que unen la enzima helicasa a la plantilla. Los primosomas proporcionan cebadores de ARN para la síntesis de ADN a las hebras. [ cita requerida ]
Se estima que la tasa de mutación de phiX174 es de 1,0 x 10 -6 sustituciones por base por ronda de copia, un valor que es consistente con la regla de Drake (0,003 mutaciones por genoma por ronda de copia en microorganismos basados en ADN). [23]
PhiX174 es capaz de experimentar recombinación genética . Basándose en las frecuencias de recombinación obtenidas en los cruces genéticos, se construyó un mapa genético. [24] La recombinación en phi X174 está asociada con una alta interferencia negativa, es decir, una correlación positiva (interferencia negativa) de eventos de recombinación (véase wikipedia crossover interference ). [24]
ΦX174 está estrechamente relacionado con otros microvirus , especialmente el fago NC (por ejemplo, NC1, NC7, NC11, NC16, NC37, NC5, NC41, NC56, NC51, etc.) y más distantemente relacionado con los fagos similares a G4 e incluso más distantemente relacionado con el fago similar a α3. Rokyta et al. 2006 presentó un árbol filogenético de sus relaciones. [25]
ΦX174 se ha utilizado como organismo modelo en muchos experimentos de evolución. [26]
El ΦX174 se utiliza regularmente como control positivo en la secuenciación de ADN debido a su tamaño de genoma relativamente pequeño en comparación con otros organismos, su contenido de nucleótidos relativamente equilibrado (alrededor de 23 % G, 22 % C, 24 % A y 31 % T, es decir, 45 % G+C y 55 % A+T), consulte la referencia NC_001422.1 [10] para su secuencia de 5386 nucleótidos de longitud. Los instrumentos de secuenciación de Illumina utilizan el ΦX174 como control positivo, [27] y una sola ejecución de secuenciación de Illumina puede cubrir el genoma del ΦX174 varios millones de veces, lo que hace que este sea probablemente el genoma más secuenciado de la historia. [ cita requerida ]
El ΦX174 también se utiliza para probar la resistencia del equipo de protección personal a los virus transmitidos por la sangre. [28]
ΦX174 también se ha modificado para permitir la visualización de péptidos (visualización de fagos) de la proteína G de la cápside viral. [29]
El genoma ΦX174 fue el primer fago que se clonó en levadura, [9] lo que proporciona un dique seco conveniente para modificaciones del genoma. [30] ΦX174 también fue el primer genoma que se descomprimió por completo, al eliminarse todas las superposiciones de genes. [13] El efecto de estos cambios resultó en una reducción significativa de la adhesión al huésped, desregulación de la expresión de proteínas y sensibilidad al calor. [14]