stringtranslate.com

Asignación filogenética de linajes de brotes globales con nombre

La asignación filogenética de linajes de brotes globales nombrados ( PANGOLIN ) es una herramienta de software desarrollada por la Dra. Áine O'Toole [2] y miembros del laboratorio Andrew Rambaut , con una aplicación web asociada desarrollada por el Centro de Vigilancia de Patógenos Genómicos en el sur de Cambridgeshire . [3] Su propósito es implementar una nomenclatura dinámica (conocida como la nomenclatura Pango) para clasificar los linajes genéticos del SARS-CoV-2 , el virus que causa la COVID-19 . [4] Un usuario con una secuencia completa del genoma de una muestra del SARS-CoV-2 puede usar la herramienta para enviar esa secuencia, que luego se compara con otras secuencias del genoma y se le asigna el linaje más probable (linaje Pango). [5] Son posibles ejecuciones simples o múltiples, y la herramienta puede devolver más información sobre el historial conocido del linaje asignado. [5] Además, interactúa con Microreact para mostrar una secuencia temporal de la ubicación de los informes de muestras secuenciadas del mismo linaje. [5] Esta última característica se basa en genomas disponibles públicamente obtenidos del Consorcio de Genómica COVID-19 del Reino Unido y de aquellos enviados a GISAID . [5] Su nombre deriva del pangolín .

Contexto

PANGOLIN es un componente clave que sustenta el sistema de nomenclatura Pango. [6]

Como se describe en Andrew Rambaut et al. (2020), [4] un linaje de Pango se describe como un conjunto de secuencias asociadas con un evento epidemiológico, por ejemplo, una introducción del virus en un área geográfica específica con evidencia de propagación posterior. Los linajes están diseñados para capturar el borde emergente de la pandemia y tienen una resolución de grano fino adecuada para la vigilancia epidemiológica genómica y la investigación de brotes. [ cita requerida ]

Tanto la herramienta como el sistema de nomenclatura PANGOLIN se han utilizado ampliamente durante la pandemia de COVID-19 . [4] [7] [8]

Descripción

Designación de linaje

A diferencia de la herramienta PANGOLIN, los linajes de Pango se seleccionan de forma manual y regular en función de la diversidad actual que circula a nivel mundial. Se construye un gran árbol filogenético a partir de una alineación que contiene genomas de SARS-CoV-2 disponibles públicamente, y los subgrupos de secuencias de este árbol se examinan manualmente y se contrastan con información epidemiológica para designar nuevos linajes; estos pueden ser designados por los productores de datos, y las sugerencias de linajes se pueden enviar al equipo de Pango a través de una solicitud de problemas en GitHub . [9] [10] [ se necesita más explicación ]

Entrenamiento de modelos

Estas designaciones de linaje seleccionadas manualmente y las secuencias genómicas asociadas son la entrada al modelo de entrenamiento de aprendizaje automático. Este modelo, tanto el de entrenamiento como el de asignación, se ha denominado "pangoLEARN". La versión actual de pangoLEARN utiliza un árbol de clasificación basado en la implementación de scikit-learn [11] de un clasificador de árbol de decisión.

Asignación de linaje

Originalmente, PANGOLIN utilizaba un algoritmo de asignación basado en la máxima verosimilitud para asignar a la consulta SARS-CoV-2 la secuencia de linaje más probable. Sin embargo, desde el lanzamiento de la versión 2.0 en julio de 2020, ha utilizado el algoritmo de asignación basado en aprendizaje automático 'pangoLEARN' para asignar linajes a nuevos genomas de SARS-CoV-2. [12] Este enfoque es rápido y puede asignar grandes cantidades de genomas de SARS-CoV-2 en un tiempo relativamente corto. [13]

Disponibilidad

PANGOLIN está disponible como una herramienta basada en línea de comandos , descargable desde Conda y desde un repositorio de GitHub [12] , y como una aplicación web [14] con una interfaz gráfica de usuario de arrastrar y soltar. La aplicación web PANGOLIN ha asignado más de 512.000 secuencias únicas de SARS-CoV-2 a enero de 2021. [ cita requerida ]

Creadores y desarrolladores

PANGOLIN fue creado por Áine O'Toole y el laboratorio Rambaut y lanzado el 5 de abril de 2020. Los principales desarrolladores de PANGOLIN son Áine O'Toole y Emily Scher; muchos otros han contribuido a varios aspectos de la herramienta, incluidos Ben Jackson, JT McCrone, Verity Hill y Rachel Colquhoun del laboratorio Rambaut. [5]

La aplicación web PANGOLIN fue desarrollada por el Centro de Vigilancia de Patógenos Genómicos, [14] es decir, Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab y David Aanensen. [5]

Véase también

Referencias

  1. ^ "Versión 4.3.1". 26 de julio de 2023. Consultado el 1 de agosto de 2023 .
  2. ^ O'Toole, Áine; Scher, Emily; Underwood, Anthony; Jackson, Ben; Hill, Verity; McCrone, John T; Colquhoun, Rachel; Ruis, Chris; Abu-Dahab, Khalil; Taylor, Ben; Yeats, Corin; Du Plessis, Louis; Maloney, Daniel; Medd, Nathan; Attwood, Stephen W; Aanensen, David M; Holmes, Edward C; Pybus, Oliver G; Rambaut, Andrew (5 de julio de 2021). "Asignación de linajes epidemiológicos en una pandemia emergente utilizando la herramienta Pangolin". Evolución del virus . 7 (2): veab064. doi :10.1093/ve/veab064. PMC 8344591 . PMID  34527285. 
  3. ^ "Epidemiología en tiempo real de la COVID-19". www.pathogensurveillance.net . Archivado desde el original el 17 de enero de 2021 . Consultado el 22 de enero de 2021 .
  4. ^ abc Rambaut, A.; Holmes, EC; O'Toole, Á.; et al. (2020). "Una propuesta de nomenclatura dinámica para los linajes del SARS-CoV-2 para ayudar a la epidemiología genómica". Nature Microbiology . 5 (11): 1403–1407. doi : 10.1038/s41564-020-0770-5 . PMC 7610519 . PMID  32669681. S2CID  220544096. 
  5. ^ abcdef "Lanzamiento de la aplicación web Pangolin". virological.org . Mayo de 2020. Archivado desde el original el 10 de febrero de 2021 . Consultado el 18 de febrero de 2021 .
  6. ^ Rambaut, Andrew; Holmes, Edward C.; o'Toole, Áine; Hill, Verity; McCrone, John T.; Ruis, Christopher; Du Plessis, Louis; Pybus, Oliver G. (15 de julio de 2020). "Adenda: una propuesta de nomenclatura dinámica para los linajes del SARS-CoV-2 para ayudar a la epidemiología genómica". Nature Microbiology . 6 (3): 415. doi : 10.1038/s41564-021-00872-5 . PMC 7845574 . PMID  33514928. 
  7. ^ Pipes, Lenore; Wang, Hongru; Huelsenbeck, John P; Nielsen, Rasmus (9 de diciembre de 2020). Malik, Harmit (ed.). "Evaluación de la incertidumbre en el enraizamiento de la filogenia del SARS-CoV-2". Biología molecular y evolución . 38 (4). Oxford University Press (OUP): 1537–1543. doi : 10.1093/molbev/msaa316 . ISSN  0737-4038. PMC 7798932 . PMID  33295605. Archivado desde el original el 10 de diciembre de 2020 . Consultado el 22 de enero de 2021 . 
  8. ^ Jacob, Jobin John; Vasudevan, Karthick; Pragasam, Agila Kumari; Gunasekaran, Karthik; Kang, Gagandeep; Veeraraghavan, Balaji; Mutreja, Ankur (22 de diciembre de 2020). "El seguimiento evolutivo de las variantes genéticas del SARS-CoV-2 destaca el intrincado equilibrio de las mutaciones estabilizadoras y desestabilizadoras". bioRxiv 10.1101/2020.12.22.423920 . La herramienta de asignación filogenética de linajes de brotes globales con nombre (PANGOLIN) ha sido la herramienta más utilizada para la asignación de linaje a las variantes emergentes. 
  9. ^ "pangoLEARN Almacén del modelo entrenado al que PANGOLIN puede acceder". GitHub: cov-lineages/pangoLEARN . Archivado desde el original el 3 de enero de 2021 . Consultado el 13 de febrero de 2021 .
  10. ^ "Linajes de PANGO". cov-lineages.org . Archivado desde el original el 28 de febrero de 2021 . Consultado el 4 de marzo de 2021 .
  11. ^ "sklearn.tree.DecisionTreeClassifier". scikit-learn.org . Archivado desde el original el 19 de febrero de 2021 . Consultado el 13 de febrero de 2021 .
  12. ^ ab "cov-lineages/pangolin". GitHub: cov-lineages/pangolin . Archivado desde el original el 15 de febrero de 2021 . Consultado el 13 de febrero de 2021 .
  13. ^ "pangoLEARN PANGOLIN 2.0: descripción de pangoLEARN". cov-lineages.org . Archivado desde el original el 4 de noviembre de 2021 . Consultado el 19 de noviembre de 2021 . El modelo se entrenó utilizando ~60 000 secuencias de SARS-CoV-2 de GISAID... entrenar este modelo lleva aproximadamente 30 minutos en nuestro hardware
  14. ^ ab "Asignador de linaje de COVID-19 de Pangolin". pangolin.cog-uk.io . Archivado desde el original el 10 de febrero de 2021 . Consultado el 13 de febrero de 2021 .

Enlaces externos