La filodinámica viral es el estudio de cómo los procesos epidemiológicos , inmunológicos y evolutivos actúan y potencialmente interactúan para dar forma a las filogenias virales . [1] Desde que se acuñó el término en 2004, la investigación sobre la filodinámica viral se ha centrado en la dinámica de transmisión en un esfuerzo por arrojar luz sobre cómo esta dinámica impacta la variación genética viral. La dinámica de transmisión se puede considerar a nivel de células dentro de un huésped infectado, huéspedes individuales dentro de una población o poblaciones enteras de huéspedes.
Muchos virus, especialmente los virus de ARN , acumulan rápidamente variación genética debido a los cortos tiempos de generación y las altas tasas de mutación . Por lo tanto, los patrones de variación genética viral están muy influenciados por la rapidez con la que se produce la transmisión y por qué entidades se transmiten entre sí. Los patrones de variación genética viral también se verán afectados por la selección que actúa sobre los fenotipos virales. Aunque los virus pueden diferir con respecto a muchos fenotipos, hasta la fecha los estudios filodinámicos han tendido a centrarse en un número limitado de fenotipos virales. Estos incluyen fenotipos de virulencia, fenotipos asociados con la transmisibilidad viral, fenotipos de tropismo celular o tisular y fenotipos antigénicos que pueden facilitar el escape de la inmunidad del huésped . Debido al impacto que la dinámica de transmisión y la selección pueden tener en la variación genética viral, las filogenias virales se pueden utilizar para investigar importantes procesos epidemiológicos, inmunológicos y evolutivos, como la propagación epidémica , [2] la dinámica espacio-temporal, incluida la dinámica de la metapoblación , [3] la transmisión zoonótica , el tropismo tisular , [4] y la deriva antigénica . [5] La investigación cuantitativa de estos procesos a través de la consideración de las filogenias virales es el objetivo central de la filodinámica viral.
Al acuñar el término filodinámica , Grenfell y sus coautores [1] postularon que las filogenias virales "... están determinadas por una combinación de selección inmunitaria, cambios en el tamaño de la población viral y dinámica espacial". Su estudio mostró tres características de las filogenias virales, que pueden servir como reglas generales para identificar procesos epidemiológicos, inmunológicos y evolutivos importantes que influyen en los patrones de variación genética viral.
Aunque estas tres características filogenéticas son reglas generales útiles para identificar procesos epidemiológicos, inmunológicos y evolutivos que podrían estar afectando la variación genética viral, existe un creciente reconocimiento de que la correlación entre el proceso y el patrón filogenético puede ser de muchos a uno. Por ejemplo, aunque los árboles en escalera podrían reflejar la presencia de selección direccional, los árboles en escalera también podrían reflejar cuellos de botella genéticos secuenciales que podrían ocurrir con una rápida propagación espacial, como en el caso del virus de la rabia. [7] Debido a esta correlación de muchos a uno entre el proceso y el patrón filogenético, la investigación en el campo de la filodinámica viral ha buscado desarrollar y aplicar métodos cuantitativos para inferir eficazmente el proceso a partir de filogenias virales reconstruidas (ver Métodos). La consideración de otras fuentes de datos (por ejemplo, patrones de incidencia) puede ayudar a distinguir entre hipótesis filodinámicas en competencia. La combinación de fuentes dispares de datos para el análisis filodinámico sigue siendo un desafío importante en el campo y es un área activa de investigación.
Los modelos filodinámicos pueden ayudar a datar los orígenes de epidemias y pandemias. La rápida tasa de evolución de los virus permite estimar modelos de reloj molecular a partir de secuencias genéticas, lo que proporciona una tasa anual de evolución del virus. Con la tasa de evolución medida en unidades reales de tiempo, es posible inferir la fecha del ancestro común más reciente (MRCA) para un conjunto de secuencias virales. La edad del MRCA de estos aislamientos es un límite inferior; el ancestro común de toda la población de virus debe haber existido antes que el MRCA de la muestra de virus. En abril de 2009, el análisis genético de 11 secuencias de influenza H1N1 de origen porcino sugirió que el ancestro común existía el 12 de enero de 2009 o antes . [8] Este hallazgo ayudó a hacer una estimación temprana del número básico de reproducción de la pandemia. De manera similar, el análisis genético de secuencias aisladas de un individuo puede usarse para determinar el tiempo de infección del individuo. [9]
Los modelos filodinámicos pueden proporcionar información sobre parámetros epidemiológicos que son difíciles de evaluar a través de los medios de vigilancia tradicionales. Por ejemplo, la evaluación de a partir de datos de vigilancia requiere un control cuidadoso de la variación de la tasa de notificación y la intensidad de la vigilancia. Inferir la historia demográfica de la población del virus a partir de datos genéticos puede ayudar a evitar estas dificultades y puede proporcionar una vía separada para la inferencia de . [2] Estos enfoques se han utilizado para estimar en el virus de la hepatitis C [10] y el VIH. [2] Además, la transmisión diferencial entre grupos, ya sea geográfica, relacionada con la edad o el riesgo, es muy difícil de evaluar solo a partir de los datos de vigilancia. Los modelos filogeográficos tienen la posibilidad de revelar más directamente estos patrones de transmisión que de otro modo estarían ocultos. [11] Los enfoques filodinámicos han mapeado el movimiento geográfico del virus de la influenza humana [3] y cuantificado la propagación epidémica del virus de la rabia en mapaches norteamericanos. [12] [13] Sin embargo, el muestreo no representativo puede sesgar las inferencias tanto de [14] como de los patrones de migración. [3] También se han utilizado métodos filodinámicos para comprender mejor la dinámica de transmisión y propagación del virus en huéspedes infectados. Por ejemplo, se han utilizado estudios filodinámicos para inferir la tasa de crecimiento del virus en huéspedes infectados y para argumentar la existencia de compartimentación viral en la infección por hepatitis C. [4]
Los métodos filodinámicos también pueden ser útiles para determinar la eficacia de las medidas de control viral, en particular en el caso de enfermedades con bajas tasas de notificación. Por ejemplo, la diversidad genética del virus de la hepatitis B basado en ADN disminuyó en los Países Bajos a fines de los años 1990, tras el inicio de un programa de vacunación. [15] Esta correlación se utilizó para argumentar que la vacunación era eficaz para reducir la prevalencia de la infección, aunque son posibles explicaciones alternativas. [16]
Los esfuerzos de control viral también pueden afectar la velocidad a la que evolucionan las poblaciones virales, influyendo así en los patrones filogenéticos. Por lo tanto, los enfoques filodinámicos que cuantifican cómo cambian las tasas evolutivas con el tiempo pueden proporcionar información sobre la eficacia de las estrategias de control. Por ejemplo, una aplicación a secuencias de VIH dentro de huéspedes infectados mostró que las tasas de sustitución viral cayeron a prácticamente cero después del inicio de la terapia con medicamentos antirretrovirales. [17] Esta disminución en las tasas de sustitución se interpretó como un cese efectivo de la replicación viral después del comienzo del tratamiento, y se esperaría que condujera a cargas virales más bajas. Este hallazgo es especialmente alentador porque las tasas de sustitución más bajas se asocian con una progresión más lenta al SIDA en pacientes sin tratamiento previo. [18]
El tratamiento antiviral también crea una presión selectiva para la evolución de la resistencia a los fármacos en las poblaciones de virus y, por lo tanto, puede afectar los patrones de diversidad genética. Por lo general, existe un equilibrio entre la replicación más rápida de las cepas susceptibles en ausencia de tratamiento antiviral y la replicación más rápida de las cepas resistentes en presencia de antivirales. [19] Por lo tanto, determinar el nivel de presión antiviral necesario para cambiar los resultados evolutivos es de importancia para la salud pública. Se han utilizado enfoques filodinámicos para examinar la propagación de la resistencia al oseltamivir en la gripe A/H1N1. [20]
En la mayoría de los casos, el objetivo de los análisis filodinámicos es extraer conclusiones de los procesos epidemiológicos a partir de las filogenias virales. Por ello, la mayoría de los análisis filodinámicos comienzan con la reconstrucción de un árbol filogenético. Las secuencias genéticas suelen muestrearse en múltiples puntos temporales, lo que permite estimar las tasas de sustitución y el tiempo del MRCA utilizando un modelo de reloj molecular. [21] En el caso de los virus, los métodos filogenéticos bayesianos son populares debido a su capacidad para adaptarse a escenarios demográficos complejos y, al mismo tiempo, integrar la incertidumbre filogenética. [22] [23]
Los enfoques evolutivos tradicionales utilizan directamente métodos de la filogenética computacional y la genética de poblaciones para evaluar hipótesis de selección y estructura de la población sin tener en cuenta directamente los modelos epidemiológicos. Por ejemplo,
Sin embargo, dichos análisis no fueron diseñados con inferencia epidemiológica en mente y puede ser difícil extrapolar las estadísticas estándar a las cantidades epidemiológicas deseadas.
En un esfuerzo por salvar la brecha entre los enfoques evolutivos tradicionales y los modelos epidemiológicos, se han desarrollado varios métodos analíticos para abordar específicamente los problemas relacionados con la filodinámica. Estos métodos se basan en la teoría de coalescencia , los modelos de nacimiento-muerte [24] y la simulación , y se utilizan para relacionar más directamente los parámetros epidemiológicos con las secuencias virales observadas.
El coalescente es un modelo matemático que describe la ascendencia de una muestra de copias de genes no recombinantes . Al modelar el proceso de coalescencia, generalmente se considera que el tiempo fluye hacia atrás desde el presente. En una población selectivamente neutral de tamaño constante y generaciones no superpuestas (el modelo de Wright Fisher ), el tiempo esperado para que una muestra de dos copias de genes se fusione (es decir, encuentre un ancestro común) es de generaciones. De manera más general, el tiempo de espera para que dos miembros de una muestra de copias de genes compartan un ancestro común se distribuye exponencialmente , con una tasa
Este intervalo de tiempo se denomina , y al final quedan linajes existentes. Estos linajes restantes se fusionarán a la tasa después de intervalos . Este proceso se puede simular dibujando variables aleatorias exponenciales con tasas hasta que solo quede un único linaje (el MRCA de la muestra). En ausencia de selección y estructura de la población, la topología del árbol se puede simular eligiendo dos linajes de manera uniforme al azar después de cada intervalo de coalescencia .
El tiempo de espera esperado para encontrar el MRCA de la muestra es la suma de los valores esperados de los intervalos entre los entrenudos,
Dos corolarios son:
En consecuencia, la TMRCA estimada a partir de una muestra relativamente pequeña de secuencias genéticas virales es una estimación asintóticamente imparcial del tiempo en que la población viral se fundó en la población huésped.
Por ejemplo, Robbins et al. [25] estimaron que el TMRCA para 74 secuencias genéticas del subtipo B del VIH-1 recolectadas en América del Norte era 1968. Suponiendo un tamaño de población constante, esperamos que el tiempo hasta 1968 represente el TMRCA de la población del virus de América del Norte.
Si el tamaño de la población cambia con el tiempo, la tasa de coalescencia también será una función del tiempo. Donnelley y Tavaré [26] derivaron esta tasa para un tamaño de población variable en el tiempo bajo el supuesto de tasas de natalidad constantes:
Debido a que todas las topologías son igualmente probables bajo el coalescente neutro, este modelo tendrá las mismas propiedades que el coalescente de tamaño constante bajo un reescalamiento de la variable de tiempo: .
Muy al principio de una epidemia, la población del virus puede estar creciendo exponencialmente a un ritmo , de modo que en unidades de tiempo en el pasado, la población tendrá un tamaño . En este caso, la tasa de coalescencia se convierte en
Esta tasa es pequeña cerca del momento en que se recolectó la muestra ( ), de modo que las ramas externas (aquellas sin descendientes) de una genealogía genética tenderán a ser largas en relación con aquellas cercanas a la raíz del árbol. Esta es la razón por la que las poblaciones que crecen rápidamente producen árboles con ramas largas en las puntas.
Si se calcula la tasa de crecimiento exponencial a partir de una genealogía genética, se puede combinar con el conocimiento de la duración de la infección o el intervalo serial de un patógeno en particular para estimar el número básico de reproducción, . Los dos pueden vincularse mediante la siguiente ecuación: [27]
Por ejemplo, una de las primeras estimaciones fue para la influenza pandémica H1N1 en 2009, utilizando un análisis basado en coalescencia de 11 secuencias de hemaglutinina en combinación con datos previos sobre el período infeccioso de la influenza. [8]
Las epidemias de enfermedades infecciosas suelen caracterizarse por cambios rápidos y altamente no lineales en el número de individuos infectados y el tamaño efectivo de la población del virus. En tales casos, las tasas de natalidad son muy variables, lo que puede disminuir la correspondencia entre el tamaño efectivo de la población y la prevalencia de la infección. [28] Se han desarrollado muchos modelos matemáticos en el campo de la epidemiología matemática para describir las series temporales no lineales de prevalencia de la infección y el número de huéspedes susceptibles. Un ejemplo bien estudiado es el sistema de ecuaciones diferenciales Susceptible-Infectado-Recuperado (SIR) , que describe las fracciones de la población susceptible, infectada y recuperada en función del tiempo:
Aquí, es la tasa per cápita de transmisión a huéspedes susceptibles, y es la tasa a la que los individuos infectados se recuperan, con lo cual ya no son infecciosos. En este caso, la incidencia de nuevas infecciones por unidad de tiempo es , que es análoga a la tasa de natalidad en los modelos clásicos de genética de poblaciones. La fórmula general para la tasa de coalescencia es: [2]
La razón puede entenderse como el resultado de la probabilidad de que dos linajes seleccionados de manera uniforme al azar sean ambos ancestros de la muestra. Esta probabilidad es la razón entre la cantidad de formas de elegir dos linajes sin reemplazo del conjunto de linajes y del conjunto de todas las infecciones: . Los eventos coalescentes ocurrirán con esta probabilidad a la tasa dada por la función de incidencia .
Para el modelo SIR simple, esto produce
Esta expresión es similar a la tasa de coalescencia de Kingman , pero está amortiguada por la fracción susceptible .
Al principio de una epidemia , por lo que para el modelo SIR
Esta tiene la misma forma matemática que la tasa en la coalescencia de Kingman, sustituyendo . En consecuencia, las estimaciones del tamaño efectivo de la población basadas en la coalescencia de Kingman serán proporcionales a la prevalencia de la infección durante el período inicial de crecimiento exponencial de la epidemia. [28]
Cuando una enfermedad ya no crece exponencialmente sino que se ha vuelto endémica, también se puede derivar la tasa de coalescencia de linaje para el modelo epidemiológico que rige la dinámica de transmisión de la enfermedad. Esto se puede hacer extendiendo el modelo de Wright Fisher para permitir distribuciones desiguales de la descendencia. Con una generación de Wright Fisher que toma unidades de tiempo, la tasa de coalescencia viene dada por:
donde el tamaño efectivo de la población es el tamaño de la población dividido por la varianza de la distribución de la descendencia . [29] El tiempo de generación para un modelo epidemiológico en equilibrio está dado por la duración de la infección y el tamaño de la población está estrechamente relacionado con el número de equilibrio de individuos infectados. Para derivar la varianza en la distribución de la descendencia para un modelo epidemiológico dado, uno puede imaginar que los individuos infectados pueden diferir entre sí en sus infectividades, sus tasas de contacto, sus duraciones de infección o en otras características relacionadas con su capacidad para transmitir el virus con el que están infectados. Estas diferencias pueden reconocerse asumiendo que el número básico de reproducción es una variable aleatoria que varía entre los individuos de la población y que sigue una distribución de probabilidad continua. [30] La media y la varianza de estos números básicos de reproducción individuales, y , respectivamente, pueden usarse entonces para calcular . La expresión que relaciona estas cantidades está dada por: [31]
Por ejemplo, para el modelo SIR anterior, modificado para incluir nacimientos en la población y muertes fuera de la población, el tamaño de la población está dado por el número de equilibrio de individuos infectados, . El número básico de reproducción medio, promediado entre todos los individuos infectados, está dado por , bajo el supuesto de que la tasa de mortalidad de fondo es insignificante en comparación con la tasa de recuperación . La varianza en las tasas básicas de reproducción de los individuos está dada por , porque la duración del tiempo que los individuos permanecen infectados en el modelo SIR se distribuye exponencialmente. La varianza en la distribución de la descendencia es, por lo tanto, 2. por lo tanto, se convierte en y la tasa de coalescencia se convierte en:
Esta tasa, derivada para el modelo SIR en equilibrio, es equivalente a la tasa de coalescencia dada por la fórmula más general. [2] Las tasas de coalescencia se pueden derivar de manera similar para modelos epidemiológicos con superpropagadores u otras heterogeneidades de transmisión, para modelos con individuos que están expuestos pero aún no son infecciosos y para modelos con períodos infecciosos variables, entre otros. [31] Dada cierta información epidemiológica (como la duración de la infección) y una especificación de un modelo matemático, las filogenias virales se pueden utilizar para estimar parámetros epidemiológicos que de otra manera podrían ser difíciles de cuantificar.
En el nivel más básico, la presencia de una estructura geográfica de la población se puede revelar comparando la relación genética de los aislamientos virales con la relación geográfica. Una pregunta básica es si las etiquetas de caracteres geográficos están más agrupadas en una filogenia de lo esperado bajo un modelo simple no estructurado. Esta pregunta se puede responder contando el número de transiciones geográficas en la filogenia mediante parsimonia , máxima verosimilitud o mediante inferencia bayesiana . Si existe una estructura de la población, entonces habrá menos transiciones geográficas en la filogenia de lo esperado en un modelo panmíctico . [32] Esta hipótesis se puede probar mezclando aleatoriamente las etiquetas de caracteres en las puntas de la filogenia y contando el número de transiciones geográficas presentes en los datos mezclados. Al mezclar repetidamente los datos y calcular los recuentos de transición, se puede construir una distribución nula y calcular un valor p comparando los recuentos de transición observados con esta distribución nula. [32]
Más allá de la presencia o ausencia de estructura poblacional, los métodos filodinámicos pueden utilizarse para inferir las tasas de movimiento de linajes virales entre ubicaciones geográficas y reconstruir las ubicaciones geográficas de linajes ancestrales. Aquí, la ubicación geográfica se trata como un estado de carácter filogenético, similar en espíritu a 'A', 'T', 'G', 'C', de modo que la ubicación geográfica se codifica como un modelo de sustitución . La misma maquinaria filogenética que se utiliza para inferir modelos de evolución del ADN puede así utilizarse para inferir matrices de transición geográfica. [33] El resultado final es una tasa, medida en términos de años o en términos de sustituciones de nucleótidos por sitio, a la que un linaje en una región se mueve a otra región a lo largo del curso del árbol filogenético. En una red de transmisión geográfica, algunas regiones pueden mezclarse más fácilmente y otras regiones pueden estar más aisladas. Además, algunas conexiones de transmisión pueden ser asimétricas, de modo que la tasa a la que los linajes en la región 'A' se mueven a la región 'B' puede diferir de la tasa a la que los linajes en 'B' se mueven a 'A'. Con la ubicación geográfica así codificada, la reconstrucción del estado ancestral se puede utilizar para inferir las ubicaciones geográficas ancestrales de nodos particulares en la filogenia. [33] Este tipo de enfoques se pueden ampliar sustituyendo otros atributos por las ubicaciones geográficas. Por ejemplo, en una aplicación al virus de la rabia, Streicker y sus colegas estimaron las tasas de transmisión entre especies considerando la especie huésped como el atributo. [7]
Como se ha comentado anteriormente, es posible inferir directamente parámetros de modelos epidemiológicos compartimentados simples , como los modelos SIR, a partir de datos de secuencias observando patrones genealógicos. Además, se pueden inferir patrones generales de movimiento geográfico a partir de datos de secuencias, pero estas inferencias no implican un modelo explícito de dinámica de transmisión entre individuos infectados. En el caso de modelos epidemiológicos más complicados, como los que implican inmunidad cruzada , estructura de edad de las tasas de contacto con el huésped, estacionalidad o múltiples poblaciones de huéspedes con diferentes rasgos de historia de vida, suele ser imposible predecir analíticamente patrones genealógicos a partir de parámetros epidemiológicos. Por ello, la maquinaria de inferencia estadística tradicional no funcionará con estos modelos más complicados y, en este caso, es habitual utilizar en su lugar un enfoque basado en simulación hacia delante.
Los modelos basados en simulación requieren la especificación de un modelo de transmisión para el proceso de infección entre huéspedes infectados y huéspedes susceptibles y para el proceso de recuperación de huéspedes infectados. Los modelos basados en simulación pueden ser compartimentados , rastreando el número de huéspedes infectados y recuperados a diferentes cepas virales, [34] o pueden estar basados en individuos , rastreando el estado de infección y el historial inmunológico de cada huésped en la población. [5] [35] Generalmente, los modelos compartimentados ofrecen ventajas significativas en términos de velocidad y uso de memoria, pero pueden ser difíciles de implementar para escenarios evolutivos o epidemiológicos complejos. Un modelo de simulación hacia adelante puede dar cuenta de la estructura geográfica de la población o la estructura de edad modulando las tasas de transmisión entre individuos huéspedes de diferentes clases geográficas o de edad. Además, la estacionalidad puede incorporarse permitiendo que la época del año influya en la tasa de transmisión de manera escalonada o sinusoidal .
Para conectar el modelo epidemiológico con las genealogías virales es necesario que en la simulación existan múltiples cepas virales con diferentes secuencias de nucleótidos o aminoácidos, que a menudo se indican como diferentes clases infectadas. En este caso, la mutación actúa para convertir un huésped de una clase infectada en otra clase infectada. En el transcurso de la simulación, los virus mutan y se producen secuencias a partir de las cuales se pueden construir y analizar filogenias.
En el caso de virus antigénicamente variables , resulta crucial modelar el riesgo de transmisión de un individuo infectado con la cepa "A" del virus a un individuo que haya sido previamente infectado con las cepas "B", "C", etc. del virus. El nivel de protección contra una cepa de virus por una segunda cepa se conoce como inmunidad cruzada . Además del riesgo de infección, la inmunidad cruzada puede modular la probabilidad de que un huésped se vuelva infeccioso y la duración en que un huésped sigue siendo infeccioso. [36] A menudo, se supone que el grado de inmunidad cruzada entre cepas de virus está relacionado con su distancia de secuencia .
En general, al necesitar ejecutar simulaciones en lugar de calcular probabilidades, puede ser difícil hacer inferencias a escala fina sobre parámetros epidemiológicos y, en cambio, este trabajo generalmente se centra en preguntas más amplias, probando si los patrones genealógicos generales son consistentes con un modelo epidemiológico u otro. Además, los métodos basados en simulación se utilizan a menudo para validar los resultados de la inferencia, proporcionando datos de prueba donde la respuesta correcta se conoce de antemano. Debido a que el cálculo de probabilidades para datos genealógicos bajo modelos de simulación complejos ha demostrado ser difícil, un enfoque estadístico alternativo llamado Cálculo Bayesiano Aproximado (ABC) se está volviendo popular para ajustar estos modelos de simulación a patrones de variación genética, luego de la aplicación exitosa de este enfoque a enfermedades bacterianas. [37] [38] [39] Esto se debe a que ABC hace uso de estadísticas de resumen fácilmente computables para aproximar probabilidades, en lugar de las probabilidades en sí.
La influenza humana es una infección respiratoria aguda causada principalmente por los virus de la influenza A y la influenza B. Los virus de la influenza A se pueden clasificar en subtipos, como A/H1N1 y A/H3N2 . Aquí, los subtipos se denotan de acuerdo con sus genes de hemaglutinina (H o HA) y neuraminidasa (N o NA), que como proteínas de superficie, actúan como los objetivos primarios para la respuesta inmune humoral . Los virus de la influenza también circulan en otras especies, más notablemente como la influenza porcina y la influenza aviar . A través del reordenamiento , las secuencias genéticas de la influenza porcina y aviar ocasionalmente ingresan a la población humana. Si una hemaglutinina o neuraminidasa particular ha estado circulando fuera de la población humana, entonces los humanos carecerán de inmunidad a esta proteína y una pandemia de influenza puede seguir a un evento de cambio de hospedador , como se vio en 1918, 1957, 1968 y 2009. Después de la introducción en la población humana, un linaje de influenza generalmente persiste a través de la deriva antigénica , en la que HA y NA acumulan continuamente mutaciones que permiten que los virus infecten a los hospedadores inmunes a formas anteriores del virus. Estos linajes de influenza muestran epidemias estacionales recurrentes en regiones templadas y transmisión menos periódica en los trópicos. Generalmente, en cada evento pandémico, la nueva forma del virus supera a los linajes existentes. [35] El estudio de la filodinámica viral en la influenza se enfoca principalmente en la circulación y evolución continuas de la influenza epidémica, en lugar de en la aparición de una pandemia. De interés central para el estudio de la filodinámica viral es el árbol filogenético distintivo de la influenza epidémica A/H3N2, que muestra un único linaje principal predominante que persiste a través del tiempo y ramas secundarias que persisten solo durante 1 a 5 años antes de extinguirse. [40]
Las técnicas filodinámicas han proporcionado información sobre los efectos selectivos relativos de las mutaciones en diferentes sitios y genes en todo el genoma del virus de la gripe. La ubicación expuesta de la hemaglutinina (HA) sugiere que debería existir una fuerte presión selectiva para la evolución a los sitios específicos de la HA que son reconocidos por los anticuerpos en el sistema inmunológico humano. Estos sitios se denominan sitios de epítopos . El análisis filogenético de la gripe H3N2 ha demostrado que los supuestos sitios de epítopos de la proteína HA evolucionan aproximadamente 3,5 veces más rápido en el tronco de la filogenia que en las ramas laterales. [41] [42] Esto sugiere que los virus que poseen mutaciones en estos sitios expuestos se benefician de la selección positiva y tienen más probabilidades de apoderarse de la población de gripe que los virus que carecen de dichas mutaciones. Por el contrario, los supuestos sitios no epitópicos de la proteína HA evolucionan aproximadamente dos veces más rápido en las ramas laterales que en el tronco de la filogenia H3, [41] [42] lo que indica que las mutaciones en estos sitios se seleccionan en contra y los virus que poseen dichas mutaciones tienen menos probabilidades de apoderarse de la población de gripe. Por lo tanto, el análisis de los patrones filogenéticos proporciona información sobre las fuerzas selectivas subyacentes. Un análisis similar que combina sitios en distintos genes muestra que, si bien tanto HA como NA experimentan una selección positiva sustancial, los genes internos muestran tasas bajas de fijación de aminoácidos en relación con los niveles de polimorfismo , lo que sugiere una ausencia de selección positiva. [43]
Análisis posteriores de HA han demostrado que tiene un tamaño de población efectiva muy pequeño en relación con el tamaño del censo de la población del virus, como se espera para un gen que experimenta una fuerte selección positiva. [44] Sin embargo, en todo el genoma de la influenza, hay sorprendentemente poca variación en el tamaño de la población efectiva; todos los genes son casi igualmente bajos. [45] Este hallazgo sugiere que la redistribución entre segmentos ocurre lo suficientemente lento, en relación con las acciones de la selección positiva, como para que el autostop genético cause mutaciones beneficiosas en HA y NA para reducir la diversidad en la variación neutral vinculada en otros segmentos del genoma.
La influenza A/H1N1 muestra un mayor tamaño de población efectiva y una mayor diversidad genética que la influenza H3N2, [45] lo que sugiere que el H1N1 experimenta una evolución menos adaptativa que el H3N2. Esta hipótesis está respaldada por patrones empíricos de evolución antigénica; la OMS ha recomendado nueve actualizaciones de vacunas para el H1N1 en el período interpandémico entre 1978 y 2009, mientras que ha recomendado 20 actualizaciones de vacunas para el H3N2 durante este mismo período de tiempo. [46] Además, un análisis de los patrones de evolución de secuencias en el tronco y las ramas laterales sugiere que el H1N1 experimenta una selección positiva sustancialmente menor que el H3N2. [42] [43] Sin embargo, la causa evolutiva o epidemiológica subyacente de esta diferencia entre el H3N2 y el H1N1 sigue sin estar clara.
La extremadamente rápida renovación de la población de influenza significa que la tasa de propagación geográfica de los linajes de influenza también debe ser, en cierta medida, rápida. Los datos de vigilancia muestran un patrón claro de fuertes epidemias estacionales en regiones templadas y epidemias menos periódicas en los trópicos. [47] El origen geográfico de las epidemias estacionales en los hemisferios norte y sur había sido una importante pregunta abierta en el campo. Sin embargo, las epidemias templadas generalmente surgen de un reservorio global en lugar de surgir de la diversidad genética de la temporada anterior. [45] [48] Este trabajo y otros posteriores han sugerido que la persistencia global de la población de influenza está impulsada por virus que se transmiten de epidemia en epidemia, sin que ninguna región individual en el mundo muestre una persistencia continua. [3] [49] Sin embargo, existe un debate considerable sobre la configuración particular de la red global de influenza, con una hipótesis que sugiere una metapoblación en el este y sudeste de Asia que continuamente siembra influenza en el resto del mundo, [48] y otra hipótesis que aboga por una metapoblación más global en la que los linajes templados a menudo regresan a los trópicos al final de una epidemia estacional. [3] [49]
Todos estos estudios filogeográficos necesariamente sufren limitaciones en el muestreo mundial de virus de la gripe. Por ejemplo, aún no se ha descubierto la importancia relativa de África tropical y la India. Además, los métodos filogeográficos utilizados en estos estudios (véase la sección sobre métodos filogeográficos) hacen inferencias de las ubicaciones ancestrales y las tasas de migración solo sobre las muestras disponibles, en lugar de sobre la población en la que están incluidas estas muestras. Debido a esto, los procedimientos de muestreo específicos del estudio son una preocupación al extrapolar a inferencias a nivel de población. Sin embargo, las estimaciones de las tasas de migración que se basan conjuntamente en simulaciones epidemiológicas y evolutivas parecen robustas en gran medida al submuestreo o sobremuestreo de una región en particular. [3] Se requieren más avances metodológicos para abordar más plenamente estas cuestiones.
Los modeladores de enfermedades han desarrollado activamente enfoques basados en simulación hacia adelante para abordar cómo la selección inmune puede dar forma a la filogenia de la proteína hemaglutinina de la influenza A/H3N2 desde principios de la década de 2000. Estos enfoques incluyen tanto modelos compartimentales como modelos basados en agentes . Uno de los primeros modelos compartimentales para la influenza fue desarrollado por Gog y Grenfell [34] , quienes simularon la dinámica de muchas cepas con inmunidad cruzada parcial entre sí. Bajo una parametrización de larga vida del huésped y corto período infeccioso, encontraron que las cepas formarían conjuntos autoorganizados que surgirían y se reemplazarían entre sí. Aunque los autores no reconstruyeron una filogenia a partir de sus resultados simulados, la dinámica que encontraron fue consistente con una filogenia viral de tipo escalera que exhibe baja diversidad de cepas y rápida renovación de linaje.
En trabajos posteriores de Ferguson y sus colegas [35] se adoptó un enfoque basado en agentes para identificar mejor los determinantes inmunológicos y ecológicos de la evolución de la gripe. Los autores modelaron la hemaglutinina de la gripe como cuatro epítopos, cada uno de ellos formado por tres aminoácidos. Demostraron que, con inmunidad específica de la cepa únicamente (con inmunidad cruzada parcial entre cepas basada en su similitud de aminoácidos), se esperaba que la filogenia de la HA de la gripe A/H3N2 exhibiera una "diversidad genética explosiva", un patrón que es incoherente con los datos empíricos. Esto llevó a los autores a postular la existencia de una inmunidad temporal que trascendía la cepa: los individuos eran inmunes a la reinfección con cualquier otra cepa de gripe durante aproximadamente seis meses después de una infección. Con esta suposición, el modelo basado en agentes podía reproducir la filogenia en forma de escalera de la proteína HA de la gripe A/H3N2.
El trabajo de Koelle y sus colegas [5] revisó la dinámica de la evolución de la influenza A/H3N2 luego de la publicación de un artículo de Smith y sus colegas [50] que mostraba que la evolución antigénica del virus se producía de manera puntual. El modelo filodinámico diseñado por Koelle y sus coautores sostenía que este patrón reflejaba una correlación genotipo-fenotipo de muchos a uno, con la posibilidad de que cepas de grupos antigénicamente distintos de influenza compartieran un alto grado de similitud genética. Al incorporar esta correlación del genotipo viral al fenotipo viral (o grupo antigénico) en su modelo, los autores pudieron reproducir la filogenia en escalera de la proteína HA de la influenza sin una inmunidad generalizada que trascendiera la cepa. La reproducción de la filogenia en escalera resultó de que la población viral pasara por repetidos barridos selectivos. Estos barridos fueron impulsados por la inmunidad de grupo y actuaron para limitar la diversidad genética viral.
En lugar de modelar los genotipos de las cepas virales, un modelo de simulación compartimental de Gökaydin y colegas [51] consideró la evolución de la influenza a escala de grupos antigénicos (o fenotipos). Este modelo mostró que la aparición y el reemplazo antigénicos podrían producirse en ciertas condiciones epidemiológicas. Esta dinámica antigénica sería coherente con una filogenia de la influenza en forma de escalera que exhibe una baja diversidad genética y un recambio continuo de cepas.
En un trabajo reciente, Bedford y sus colegas [52] utilizaron un modelo basado en agentes para demostrar que la evolución en un espacio antigénico euclidiano puede explicar el patrón filogenético de la HA de la influenza A/H3N2, así como los patrones antigénicos, epidemiológicos y geográficos del virus. El modelo demostró que la reproducción de la filogenia en escalera de la influenza dependía críticamente de la tasa de mutación del virus, así como de la distancia inmunológica producida por cada mutación.
Aunque la mayoría de las investigaciones sobre la filodinámica de la gripe se han centrado en la gripe estacional A/H3N2 en humanos, los virus de la gripe muestran una amplia variedad de patrones filogenéticos. Cualitativamente similar a la filogenia de la proteína hemaglutinina de la gripe A/H3N2, la gripe A/H1N1 muestra una filogenia en escalera con una diversidad genética relativamente baja en cualquier momento y una rápida renovación de linaje. [35] Sin embargo, la filogenia de la proteína hemaglutinina de la gripe B tiene dos linajes circulantes: el linaje Yamagata y el linaje Victoria. [53] No está claro cómo la dinámica poblacional de la gripe B contribuye a este patrón evolutivo, aunque un modelo de simulación ha podido reproducir este patrón filogenético con períodos infecciosos más largos del huésped. [54]
La variación genética y antigénica de la influenza también está presente en un conjunto diverso de especies hospedadoras. El impacto de la estructura de la población hospedadora se puede ver en la evolución de la influenza equina A/H3N8 : en lugar de un solo tronco con ramas laterales cortas, la hemaglutinina de la influenza A/H3N8 se divide en dos linajes geográficamente distintos, que representan los virus americano y europeo. [55] [56] Se cree que la evolución de estos dos linajes ocurrió como consecuencia de las medidas de cuarentena . [55] Además, se plantea la hipótesis de que las respuestas inmunes del hospedador modulan la dinámica evolutiva del virus. Se sabe que la influenza porcina A/H3N2 evoluciona antigénicamente a una tasa seis veces más lenta que la del mismo virus que circula en humanos, aunque las tasas de evolución genética de estos virus son similares. [57] Se plantea la hipótesis de que la influenza en las aves acuáticas exhibe "estasis evolutiva", [58] aunque trabajos filogenéticos recientes indican que la tasa de cambio evolutivo en estos huéspedes es similar a la de otros huéspedes, incluidos los humanos. [59] En estos casos, se cree que la corta esperanza de vida del huésped impide la acumulación de la inmunidad del huésped necesaria para impulsar eficazmente la deriva antigénica.
La diversidad global del grupo M del VIH-1 está determinada por sus orígenes en África central a principios del siglo XX. La epidemia experimentó un crecimiento explosivo a lo largo de los primeros años del siglo XX con múltiples irradiaciones desde África central. Si bien los datos de vigilancia epidemiológica tradicionales son casi inexistentes para el período inicial de expansión de la epidemia, los análisis filodinámicos basados en datos de secuencias modernas se pueden utilizar para estimar cuándo comenzó la epidemia y para estimar la tasa de crecimiento inicial. El rápido crecimiento inicial del VIH-1 en África central se refleja en las filogenias en forma de estrella del virus, con la mayoría de los eventos coalescentes ocurriendo en el pasado distante. Múltiples eventos fundadores han dado lugar a distintos subtipos del grupo M del VIH-1 que predominan en diferentes partes del mundo. El subtipo B es más frecuente en América del Norte y Europa occidental, mientras que los subtipos A y C, que representan más de la mitad de las infecciones en todo el mundo, son comunes en África. [60] Los subtipos del VIH difieren ligeramente en su transmisibilidad, virulencia, eficacia de la terapia antirretroviral y patogénesis. [61]
La tasa de crecimiento exponencial del VIH en África central a principios del siglo XX, antes del establecimiento de los subtipos modernos, se ha estimado utilizando métodos coalescentes. En la tabla 1 se muestran varias estimaciones basadas en modelos de crecimiento exponencial paramétrico para diferentes períodos de tiempo, grupos de riesgo y subtipos. La propagación temprana del VIH-1 también se ha caracterizado utilizando estimaciones no paramétricas ("skyline") de . [62]
El crecimiento inicial del subtipo B en América del Norte fue bastante alto, sin embargo, la duración del crecimiento exponencial fue relativamente corta, y la saturación se produjo a mediados y fines de la década de 1980. [2] En el extremo opuesto, el grupo O del VIH-1, un grupo relativamente raro que está geográficamente confinado a Camerún y que se propaga principalmente por sexo heterosexual, ha crecido a un ritmo menor que el subtipo B o el C.
Las secuencias del VIH-1 muestreadas a lo largo de un lapso de cinco décadas se han utilizado con métodos filogenéticos de reloj molecular relajado para estimar el momento de la propagación viral entre especies a los humanos alrededor de principios del siglo XX. [67] El TMRCA estimado para el VIH-1 coincide con la aparición de las primeras grandes ciudades densamente pobladas en África Central. Se han utilizado métodos similares para estimar el momento en que el VIH se originó en diferentes partes del mundo. Se estima que el origen del subtipo B en América del Norte se produjo en la década de 1960, donde pasó desapercibido hasta la epidemia del SIDA en la década de 1980. [25] Hay evidencia de que los progenitores del subtipo B moderno colonizaron originalmente el Caribe antes de sufrir múltiples radiaciones en América del Norte y del Sur. [68] El subtipo C se originó aproximadamente en la misma época en África. [65]
En escalas temporales más cortas y geográficas más precisas, las filogenias del VIH pueden reflejar dinámicas epidemiológicas relacionadas con el comportamiento de riesgo y las redes sexuales . Un muestreo muy denso de secuencias virales dentro de las ciudades durante períodos cortos de tiempo ha proporcionado una imagen detallada de los patrones de transmisión del VIH en las epidemias modernas. La secuenciación del virus de pacientes recién diagnosticados es ahora una rutina en muchos países para la vigilancia de mutaciones de resistencia a los medicamentos , lo que ha producido grandes bases de datos de secuencias en esas áreas. Hay evidencia de que la transmisión del VIH dentro de redes sexuales heterogéneas deja un rastro en las filogenias del VIH, en particular haciendo que las filogenias sean más desequilibradas y concentrando eventos coalescentes en una minoría de linajes. [69]
Al analizar las filogenias estimadas a partir de secuencias de VIH de hombres que tienen sexo con hombres en Londres, Reino Unido, Lewis et al. encontraron evidencia de que la transmisión está altamente concentrada en el breve período de infección primaria por VIH (PHI), que consiste aproximadamente en los primeros 6 meses del período infeccioso. [70] En un análisis separado, Volz et al. [71] encontraron que la dinámica epidemiológica simple explica la agrupación filogenética de los virus recolectados de pacientes con PHI. Los pacientes que se infectaron recientemente tenían más probabilidades de albergar virus que son filogenéticamente cercanos a las muestras de otros pacientes recientemente infectados. Dicha agrupación es consistente con las observaciones en la dinámica epidemiológica simulada que presenta un período temprano de transmisión intensificada durante la PHI. Por lo tanto, estos resultados proporcionaron más apoyo a los hallazgos de Lewis et al. de que la transmisión del VIH ocurre con frecuencia de individuos en las primeras etapas de su infección.
La selección inmunitaria purificadora domina la evolución del VIH dentro de los hospedadores, pero la evolución entre hospedadores está en gran medida desacoplada de la evolución dentro del hospedador. [72] La selección inmunitaria tiene relativamente poca influencia en las filogenias del VIH a nivel de población por tres razones. En primer lugar, existe un cuello de botella extremo en la diversidad viral en el momento de la transmisión sexual. [73] En segundo lugar, la transmisión tiende a ocurrir temprano en la infección antes de que la selección inmunitaria haya tenido la oportunidad de operar. [74] Finalmente, la aptitud replicativa de una cepa viral (medida en transmisiones por hospedador) es en gran medida extrínseca a los factores virológicos, y depende más fuertemente de los comportamientos en la población hospedadora. Estos incluyen comportamientos heterogéneos sexuales y de consumo de drogas.
Hay algunas pruebas de análisis filogenéticos comparativos y simulaciones epidémicas de que el VIH se adapta a nivel de la población para maximizar el potencial de transmisión entre huéspedes. [75] Esta adaptación es hacia niveles de virulencia intermedios , que equilibran la vida productiva del huésped (tiempo hasta el SIDA) con la probabilidad de transmisión por acto. Un indicador útil para la virulencia es la carga viral de punto de ajuste (SPVL), que se correlaciona con el tiempo hasta el SIDA. [76] La SPVL es el título de cuasi-equilibrio de partículas virales en la sangre durante la infección crónica . Para que la adaptación hacia la virulencia intermedia sea posible, la SPVL debe ser hereditaria y debe existir un equilibrio entre la transmisibilidad viral y la vida útil del huésped. Se ha demostrado que la SPVL está correlacionada entre el donante y los receptores de VIH en pares de transmisión, [77] lo que proporciona evidencia de que la SPVL es al menos parcialmente heredable. La probabilidad de transmisión del VIH por acto sexual está correlacionada positivamente con la carga viral, [78] [79] lo que proporciona evidencia de la relación entre transmisibilidad y virulencia. Por lo tanto, es teóricamente posible que el VIH evolucione para maximizar su potencial de transmisión. La simulación epidemiológica y los estudios filogenéticos comparativos han demostrado que la adaptación del VIH hacia una SPVL óptima podría esperarse en un período de 100 a 150 años. [80] Estos resultados dependen de estimaciones empíricas de la transmisibilidad del VIH y la expectativa de vida de los huéspedes en función de la SPVL.
Hasta este punto, los enfoques filodinámicos se han centrado casi por completo en los virus de ARN, que a menudo tienen tasas de mutación del orden de 10 −3 a 10 −4 sustituciones por sitio por año. [81] Esto permite que una muestra de alrededor de 1000 bases tenga el poder de brindar un grado razonable de confianza en la estimación de la genealogía subyacente que conecta los virus muestreados. Sin embargo, otros patógenos pueden tener tasas de evolución significativamente más lentas. Los virus de ADN , como el virus del herpes simple , evolucionan órdenes de magnitud más lentamente. [82] Estos virus tienen genomas proporcionalmente más grandes. Los patógenos bacterianos como el neumococo y la tuberculosis evolucionan aún más lentamente y tienen genomas aún más grandes. De hecho, existe una correlación negativa muy general entre el tamaño del genoma y la tasa de mutación en los sistemas observados. [83] Debido a esto, es probable que se obtengan cantidades similares de señal filogenética al secuenciar genomas completos de virus de ARN, virus de ADN o bacterias. A medida que las tecnologías de secuenciación continúan mejorando, resulta cada vez más factible realizar análisis filodinámicos sobre toda la diversidad de organismos patógenos.
Además, las mejoras en las tecnologías de secuenciación permitirán una investigación detallada de la evolución dentro del huésped, ya que se puede descubrir toda la diversidad de una cuasiespecie infectante si se realiza un esfuerzo de secuenciación suficiente.
Este artículo fue adaptado de la siguiente fuente bajo licencia CC BY 4.0 (2013) (informes de los revisores): Erik M Volz; Katia Koelle; Trevor Bedford (21 de marzo de 2013). "Filodinámica viral". PLOS Computational Biology . 9 (3): e1002947. doi : 10.1371/JOURNAL.PCBI.1002947 . ISSN 1553-734X. PMC 3605911 . PMID 23555203. Wikidata Q21045423.