stringtranslate.com

Asignación filogenética de linajes de brotes globales nombrados

La asignación filogenética de linajes de brotes globales nombrados ( PANGOLIN ) es una herramienta de software desarrollada por la Dra. Áine O'Toole [2] y miembros del laboratorio Andrew Rambaut , con una aplicación web asociada desarrollada por el Centro de Vigilancia de Patógenos Genómicos en el sur de Cambridgeshire. . [3] Su propósito es implementar una nomenclatura dinámica (conocida como nomenclatura Pango) para clasificar los linajes genéticos del SARS-CoV-2 , el virus que causa el COVID-19 . [4] Un usuario con una secuencia genómica completa de una muestra de SARS-CoV-2 puede usar la herramienta para enviar esa secuencia, que luego se compara con otras secuencias genómicas y se le asigna el linaje más probable (linaje Pango). [5] Son posibles ejecuciones únicas o múltiples, y la herramienta puede devolver más información sobre la historia conocida del linaje asignado. [5] Además, interactúa con Microreact para mostrar una secuencia temporal de la ubicación de informes de muestras secuenciadas del mismo linaje. [5] Esta última característica se basa en genomas disponibles públicamente obtenidos del Consorcio COVID-19 Genomics UK y de los enviados a GISAID . [5] Lleva el nombre del pangolín .

Contexto

PANGOLIN es un componente clave que sustenta el sistema de nomenclatura Pango. [6]

Como se describe en Andrew Rambaut et al. (2020), [4] un linaje de Pango se describe como un conjunto de secuencias asociadas con un evento epidemiológico, por ejemplo, una introducción del virus en un área geográfica distinta con evidencia de propagación posterior. Los linajes están diseñados para capturar el borde emergente de la pandemia y tienen una resolución fina adecuada para la vigilancia epidemiológica genómica y la investigación de brotes. [ cita necesaria ]

Tanto la herramienta como el sistema de nomenclatura PANGOLIN se han utilizado ampliamente durante la pandemia de COVID-19 . [4] [7] [8]

Descripción

Designación de linaje

A diferencia de la herramienta PANGOLIN, los linajes de Pango se seleccionan de forma regular y manual en función de la diversidad actual que circula a nivel mundial. Se construye un gran árbol filogenético a partir de una alineación que contiene genomas de SARS-CoV-2 disponibles públicamente, y los subgrupos de secuencias de este árbol se examinan manualmente y se comparan con información epidemiológica para designar nuevos linajes; estos pueden ser designados por los productores de datos, y las sugerencias de linaje se pueden enviar al equipo de Pango a través de una solicitud de problema de GitHub . [9] [10] [ se necesita más explicación ]

Entrenamiento modelo

Estas designaciones de linaje seleccionadas manualmente y las secuencias del genoma asociadas son la entrada al entrenamiento del modelo de aprendizaje automático. Este modelo, tanto de formación como de asignación, se ha denominado 'pangoLEARN'. La versión actual de pangoLEARN utiliza un árbol de clasificación, basado en la implementación scikit-learn [11] de un clasificador de árbol de decisión.

Asignación de linaje

Originalmente, PANGOLIN utilizó un algoritmo de asignación basado en máxima verosimilitud para asignar a la consulta SARS-CoV-2 la secuencia de linaje más probable. Sin embargo, desde el lanzamiento de la versión 2.0 en julio de 2020, ha utilizado el algoritmo de asignación basado en aprendizaje automático 'pangoLEARN' para asignar linajes a nuevos genomas de SARS-CoV-2. [12] Este enfoque es rápido y puede asignar una gran cantidad de genomas de SARS-CoV-2 en un tiempo relativamente corto. [13]

Disponibilidad

PANGOLIN está disponible como una herramienta basada en línea de comandos , descargable desde Conda y desde un repositorio de GitHub, [12] y como una aplicación web [14] con una interfaz gráfica de usuario de arrastrar y soltar. La aplicación web PANGOLIN ha asignado más de 512.000 secuencias únicas de SARS-CoV-2 hasta enero de 2021. [ cita necesaria ]

Creadores y desarrolladores

PANGOLIN fue creado por Áine O'Toole y el laboratorio Rambaut y lanzado el 5 de abril de 2020. Los principales desarrolladores de PANGOLIN son Áine O'Toole y Emily Scher; muchos otros han contribuido a diversos aspectos de la herramienta, incluidos Ben Jackson, JT McCrone, Verity Hill y Rachel Colquhoun del Rambaut Lab. [5]

La aplicación web PANGOLIN fue desarrollada por el Centro de Vigilancia de Patógenos Genómicos, [14] a saber, Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab y David Aanensen. [5]

Ver también

Referencias

  1. ^ "Versión 4.3.1". 26 de julio de 2023 . Consultado el 1 de agosto de 2023 .
  2. ^ O'Toole, Áine; Scher, Emily; Underwood, Antonio; Jackson, Ben; colina, verdad; McCrone, John T; Colquhoun, Raquel; Ruís, Chris; Abu-Dahab, Khalil; Taylor, Ben; Yeats, Corin; Du Plessis, Luis; Maloney, Daniel; Medd, Nathan; Attwood, Stephen W; Aanensen, David M; Holmes, Edward C; Pybus, Oliver G; Rambaut, Andrew (5 de julio de 2021). "Asignación de linajes epidemiológicos en una pandemia emergente utilizando la herramienta Pangolin". Evolución de los virus . 7 (2): veab064. doi :10.1093/ve/veab064. PMC 8344591 . PMID  34527285. 
  3. ^ "Epidemiología en tiempo real de COVID-19". www.pathogensurveillance.net . Archivado desde el original el 17 de enero de 2021 . Consultado el 22 de enero de 2021 .
  4. ^ abc Rambaut, A.; Holmes, CE; O'Toole, Á.; et al. (2020). "Una propuesta de nomenclatura dinámica para los linajes del SARS-CoV-2 para ayudar a la epidemiología genómica". Microbiología de la naturaleza . 5 (11): 1403-1407. doi : 10.1038/s41564-020-0770-5 . PMC 7610519 . PMID  32669681. S2CID  220544096. 
  5. ^ abcdef "Lanzamiento de la aplicación web Pangolin". virológico.org . Mayo de 2020. Archivado desde el original el 10 de febrero de 2021 . Consultado el 18 de febrero de 2021 .
  6. ^ Rambaut, Andrés; Holmes, Edward C.; o'Toole, Áine; colina, verdad; McCrone, John T.; Ruís, Cristóbal; Du Plessis, Luis; Pybus, Oliver G. (15 de julio de 2020). "Anexo: una propuesta de nomenclatura dinámica para los linajes del SARS-CoV-2 para ayudar a la epidemiología genómica". Microbiología de la naturaleza . 6 (3): 415. doi : 10.1038/s41564-021-00872-5 . PMC 7845574 . PMID  33514928. 
  7. ^ Pipas, Lenore; Wang, Hongru; Huelsenbeck, John P; Nielsen, Rasmus (9 de diciembre de 2020). Malik, Harmit (ed.). "Evaluación de la incertidumbre en el arraigo de la filogenia del SARS-CoV-2". Biología Molecular y Evolución . 38 (4). Prensa de la Universidad de Oxford (OUP): 1537–1543. doi : 10.1093/molbev/msaa316 . ISSN  0737-4038. PMC 7798932 . PMID  33295605. Archivado desde el original el 10 de diciembre de 2020 . Consultado el 22 de enero de 2021 . 
  8. ^ Jacob, Jobin John; Vasudevan, Karthick; Pragasam, Agila Kumari; Gunasekaran, Karthik; Kang, Gagandeep; Veeraraghavan, Balaji; Mutreja, Ankur (22 de diciembre de 2020). "El seguimiento evolutivo de las variantes genéticas del SARS-CoV-2 destaca un intrincado equilibrio entre mutaciones estabilizadoras y desestabilizadoras". bioRxiv 10.1101/2020.12.22.423920 . La herramienta de asignación filogenética de LINeages de brotes globales nombrados (PANGOLIN) ha sido la herramienta más utilizada para la asignación de linajes a variantes recientemente emergentes. 
  9. ^ "Tienda pangoLEARN del modelo entrenado para que acceda PANGOLIN". GitHub: cov-lineages/pangoLEARN . Archivado desde el original el 3 de enero de 2021 . Consultado el 13 de febrero de 2021 .
  10. ^ "Linajes PANGO". cov-lineages.org . Archivado desde el original el 28 de febrero de 2021 . Consultado el 4 de marzo de 2021 .
  11. ^ "sklearn.tree.DecisionTreeClassifier". scikit-learn.org . Archivado desde el original el 19 de febrero de 2021 . Consultado el 13 de febrero de 2021 .
  12. ^ ab "linajes-cov/pangolín". GitHub: cov-lineages/pangolin . Archivado desde el original el 15 de febrero de 2021 . Consultado el 13 de febrero de 2021 .
  13. ^ "pangoLEARN PANGOLIN 2.0: descripción de pangoLEARN". cov-lineages.org . Archivado desde el original el 4 de noviembre de 2021 . Consultado el 19 de noviembre de 2021 . El modelo se entrenó utilizando ~60 000 secuencias de SARS-CoV-2 de GISAID... entrenar este modelo lleva aproximadamente 30 minutos en nuestro hardware
  14. ^ ab "Asignador de linaje Pangolin COVID-19". pangolin.cog-uk.io . Archivado desde el original el 10 de febrero de 2021 . Consultado el 13 de febrero de 2021 .

enlaces externos