stringtranslate.com

Anotación de SNP

La anotación de polimorfismos de un solo nucleótido ( anotación de SNP ) es el proceso de predecir el efecto o la función de un SNP individual utilizando herramientas de anotación de SNP. En la anotación de SNP, la información biológica se extrae, recopila y muestra de forma clara y fácil de consultar. La anotación funcional de SNP se realiza normalmente en función de la información disponible sobre secuencias de ácidos nucleicos y proteínas . [1]

Introducción

Gráfico dirigido de relaciones entre servidores web de predicción de SNP y sus fuentes bioinformáticas. [2]

Los polimorfismos de un solo nucleótido (SNP) desempeñan un papel importante en los estudios de asociación de todo el genoma porque actúan como biomarcadores primarios . Los SNP son actualmente el marcador de elección debido a su gran cantidad en prácticamente todas las poblaciones de individuos. La ubicación de estos biomarcadores puede ser tremendamente importante en términos de predicción de la importancia funcional, el mapeo genético y la genética de poblaciones . [3] Cada SNP representa un cambio de nucleótido entre dos individuos en una ubicación definida. Los SNP son la variante genética más común encontrada en todos los individuos con un SNP cada 100–300 pb en algunas especies . [4] Dado que hay una cantidad masiva de SNP en el genoma , existe una clara necesidad de priorizar los SNP de acuerdo con su efecto potencial para agilizar la genotipificación y el análisis. [5]

La anotación de grandes cantidades de SNP es un proceso difícil y complejo, que necesita métodos computacionales para manejar un conjunto de datos tan grande. Se han desarrollado muchas herramientas disponibles para la anotación de SNP en diferentes organismos: algunas de ellas están optimizadas para su uso con organismos densamente muestreados para SNP (como los humanos ), pero actualmente hay pocas herramientas disponibles que no sean específicas de la especie o que admitan datos de organismos no modelo. La mayoría de las herramientas de anotación de SNP proporcionan efectos deletéreos putativos de SNP predichos computacionalmente. Estas herramientas examinan si un SNP reside en regiones genómicas funcionales como exones, sitios de empalme o sitios reguladores de la transcripción, y predicen los posibles efectos funcionales correspondientes que el SNP puede tener utilizando una variedad de enfoques de aprendizaje automático. Pero las herramientas y los sistemas que priorizan los SNP funcionalmente significativos sufren algunas limitaciones: primero, examinan los supuestos efectos deletéreos de los SNP con respecto a una sola función biológica que proporciona solo información parcial sobre la importancia funcional de los SNP. En segundo lugar, los sistemas actuales clasifican los SNP en grupos deletéreos o neutrales. [6]

Muchos algoritmos de anotación se centran en las variantes de un solo nucleótido (SNV), consideradas más raras que los SNP según su frecuencia de alelo menor (MAF). [7] [8] Como consecuencia, los datos de entrenamiento para los métodos de predicción correspondientes pueden ser diferentes y, por lo tanto, se debe tener cuidado al seleccionar la herramienta adecuada para un propósito específico. Para los fines de este artículo, se utilizará "SNP" para referirse tanto a SNP como a SNV, pero los lectores deben tener en cuenta las diferencias.

Anotación de SNP

Diferentes tipos de anotaciones en genómica

Para la anotación de SNP, se utilizan muchos tipos de información genética y genómica. Según las diferentes características que utiliza cada herramienta de anotación, los métodos de anotación de SNP pueden dividirse aproximadamente en las siguientes categorías:

Anotación basada en genes

La información genómica de los elementos genómicos circundantes es una de las más útiles para interpretar la función biológica de una variante observada. La información de un gen conocido se utiliza como referencia para indicar si la variante observada reside en un gen o cerca de él y si tiene el potencial de alterar la secuencia de la proteína y su función. La anotación basada en genes se basa en el hecho de que las mutaciones no sinónimas pueden alterar la secuencia de la proteína y que la mutación del sitio de empalme puede alterar el patrón de empalme de la transcripción. [9]

Anotación basada en conocimiento

La anotación de la base de conocimiento se realiza en base a la información de los atributos genéticos, la función de la proteína y su metabolismo . En este tipo de anotación se da más énfasis a la variación genética que altera el dominio de la función de la proteína, la interacción proteína-proteína y la vía biológica . La región no codificante del genoma contiene muchos elementos reguladores importantes, incluidos el promotor , el potenciador y el aislante; cualquier tipo de cambio en esta región reguladora puede cambiar la funcionalidad de esa proteína. [10] La mutación en el ADN puede cambiar la secuencia del ARN y luego influir en la estructura secundaria del ARN , el reconocimiento de la proteína de unión del ARN y la actividad de unión del miARN. [11] [12]

Anotación funcional

Este método identifica principalmente la función de las variantes basándose en la información sobre si los loci de las variantes se encuentran en la región funcional conocida que alberga señales genómicas o epigenómicas. La función de las variantes no codificantes es extensa en términos de la región genómica afectada y están involucradas en casi todos los procesos de regulación génica desde el nivel transcripcional hasta el postraduccional [13].

Regulación de genes transcripcionales

El proceso de regulación génica transcripcional depende de muchos factores espaciales y temporales en el núcleo, como los estados globales o locales de la cromatina, la posición de los nucleosomas, la unión de los factores de transcripción y las actividades potenciadoras/promotoras. Las variantes que alteran la función de cualquiera de estos procesos biológicos pueden alterar la regulación génica y causar anomalías fenotípicas. [14] Las variantes genéticas que se localizan en la región reguladora distal pueden afectar el motivo de unión de los factores de transcripción, los reguladores de la cromatina y otros factores transcripcionales distales, lo que altera la interacción entre el potenciador/silenciador y su gen diana. [15]

Empalme alternativo

El splicing alternativo es uno de los componentes más importantes que muestran la complejidad funcional del genoma. El splicing modificado tiene un efecto significativo en el fenotipo que es relevante para la enfermedad o el metabolismo de los fármacos. Un cambio en el splicing puede ser causado por la modificación de cualquiera de los componentes de la maquinaria de splicing, como los sitios de splicing o los potenciadores o silenciadores de splicing. [16] La modificación en el sitio de splicing alternativo puede conducir a una forma de proteína diferente que mostrará una función diferente. Los humanos utilizan aproximadamente 100.000 proteínas diferentes o más, por lo que algunos genes deben ser capaces de codificar mucho más que una sola proteína. El splicing alternativo ocurre con más frecuencia de lo que se creía anteriormente y puede ser difícil de controlar; los genes pueden producir decenas de miles de transcripciones diferentes, lo que requiere un nuevo modelo genético para cada splicing alternativo.

Procesamiento del ARN y regulación postranscripcional

Las mutaciones en la región no traducida (UTR) afectan a muchas regulaciones postranscripcionales . Se requieren características estructurales distintivas para que muchas moléculas de ARN y elementos reguladores que actúan en cis ejecuten funciones efectivas durante la regulación génica. Las SNV pueden alterar la estructura secundaria de las moléculas de ARN y luego interrumpir el plegamiento adecuado de los ARN, como el plegamiento de ARNt/ARNm/ARNlnc y las regiones de reconocimiento de unión de miARN. [17]

Traducción y modificaciones postraduccionales

Las variantes de un solo nucleótido también pueden afectar a los elementos reguladores que actúan en cis en los ARNm para inhibir o promover el inicio de la traducción. El cambio en la región de codones sinónimos debido a una mutación puede afectar la eficiencia de la traducción debido a sesgos en el uso de codones. La elongación de la traducción también puede verse retardada por mutaciones a lo largo de la rampa del movimiento ribosomal. En el nivel postraduccional, las variantes genéticas pueden contribuir a la proteostasis y a las modificaciones de aminoácidos. Sin embargo, los mecanismos del efecto de las variantes en este campo son complicados y solo hay unas pocas herramientas disponibles para predecir el efecto de las variantes en las modificaciones relacionadas con la traducción. [18]

Función de la proteína

No sinónima es la variante en exones que cambia la secuencia de aminoácidos codificada por el gen, incluyendo cambios de base única e indels sin cambio de marco. Se ha investigado extremadamente la función de las variantes no sinónimas en la proteína y se han desarrollado muchos algoritmos para predecir la deletreidad y patogénesis de las variantes de un solo nucleótido (SNV). Las herramientas bioinformáticas clásicas, como SIFT, Polyphen y MutationTaster , predicen con éxito la consecuencia funcional de la sustitución no sinónima. [19] [20] [21] [22] El servidor web PopViz proporciona un enfoque centrado en los genes para visualizar los puntajes de predicción del daño por mutación (CADD, SIFT, PolyPhen-2) o la genética de la población (frecuencia de alelos menores) versus las posiciones de aminoácidos de todas las variantes codificantes de un determinado gen humano. [23] PopViz también está vinculado con la base de datos UniProt, donde se puede encontrar la información del dominio de la proteína y luego identificar las variantes deletéreas predichas que caen en estos dominios de proteína en el gráfico de PopViz. [23]

Conservación evolutiva y selección natural

Se utilizaron métodos de genómica comparativa para predecir las variantes relevantes para la función bajo el supuesto de que el locus genético funcional debería conservarse en diferentes especies a una distancia filogenética extensa. Por otro lado, algunos rasgos adaptativos y las diferencias poblacionales son impulsados ​​por selecciones positivas de variantes ventajosas, y estas mutaciones genéticas son funcionalmente relevantes para fenotipos específicos de la población. La predicción funcional del efecto de las variantes en diferentes procesos biológicos es fundamental para identificar el mecanismo molecular de las enfermedades/rasgos y dirigir la validación experimental. [24]

Lista de herramientas de anotación de SNP disponibles

Para anotar las grandes cantidades de datos NGS disponibles, actualmente hay una gran cantidad de herramientas de anotación de SNP disponibles. Algunas de ellas son específicas para SNP específicos, mientras que otras son más generales. Algunas de las herramientas de anotación de SNP disponibles son las siguientes: SNPeff, Ensembl Variant Effect Predictor (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs&GO, LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster , SNPdat, Snpranker, NGS – SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP y FAST-SNP. Las funciones y los enfoques utilizados en las herramientas de anotación de SNP se enumeran a continuación.

Algoritmos utilizados en herramientas de anotación

Las herramientas de anotación de variantes utilizan algoritmos de aprendizaje automático para predecir las anotaciones de variantes. Las distintas herramientas de anotación utilizan distintos algoritmos. Los algoritmos más comunes incluyen:

Comparación de herramientas de anotación de variantes

Existe una gran cantidad de herramientas de anotación de variantes disponibles para la anotación de variantes. La anotación realizada por diferentes herramientas no siempre coincide entre sí, ya que las reglas definidas para el manejo de datos difieren entre aplicaciones. Es francamente imposible realizar una comparación perfecta de las herramientas disponibles. No todas las herramientas tienen la misma entrada y salida ni la misma funcionalidad. A continuación se muestra una tabla de las principales herramientas de anotación y su área funcional.

[59]

Solicitud

Diferentes anotaciones capturan diversos aspectos de la función de las variantes. [60] El uso simultáneo de múltiples y variadas anotaciones funcionales podría mejorar el poder de análisis de asociación de variantes raras de los estudios de secuenciación de exomas y genomas completos . [61] Se han desarrollado algunas herramientas para permitir el análisis de asociación fenotipo-genotipo informado funcionalmente para variantes comunes y raras mediante la incorporación de anotaciones funcionales en cohortes a escala de biobanco. [62] [63] [64] [65]

Conclusiones

La próxima generación de servidores web de anotación de SNP puede aprovechar la creciente cantidad de datos en los recursos bioinformáticos básicos y utilizar agentes inteligentes para obtener datos de diferentes fuentes según sea necesario. Desde el punto de vista del usuario, es más eficiente enviar un conjunto de SNP y recibir los resultados en un solo paso, lo que hace que los metaservidores sean la opción más atractiva. Sin embargo, si las herramientas de anotación de SNP ofrecen datos heterogéneos que abarcan la secuencia, la estructura, la regulación, las vías, etc., también deben proporcionar marcos para integrar los datos en algoritmos de decisión y medidas de confianza cuantitativas para que los usuarios puedan evaluar qué datos son relevantes y cuáles no.

Referencias

  1. ^ Aubourg S, Rouzé P (2001). "Anotación del genoma". Plant Physiol. Biochem . 29 (3–4): 181–193. doi :10.1016/S0981-9428(01)01242-6.
  2. ^ Karchin R (enero de 2009). "Herramientas de próxima generación para la anotación de SNP humanos". Briefings in Bioinformatics . 10 (1): 35–52. doi :10.1093/bib/bbn047. PMC 2638621 . PMID  19181721. 
  3. ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federados para la anotación funcional de SNP". Métodos informáticos y programas en biomedicina . 95 (2): 181–189. doi :10.1016/j.cmpb.2009.02.010. PMC 2680224. PMID  19327864 . 
  4. ^ NC Oraguzie, EHA Rikkerink, SE Gardiner, HN de Silva (eds.), "Mapeo de asociaciones en plantas", Springer, 2007
  5. ^ Capriotti E, Nehrt NL, Kann MG, Bromberg Y (julio de 2012). "Bioinformática para la interpretación del genoma personal". Briefings in Bioinformatics . 13 (4): 495–512. doi :10.1093/bib/bbr070. PMC 3404395 . PMID  22247263. 
  6. ^ PH Lee, H. Shatkay, “Clasificación de polimorfismos de un solo nucleótido según sus posibles efectos nocivos”, Laboratorio de Biología Computacional y Aprendizaje Automático, Facultad de Informática, Queen's University, Kingston, ON, Canadá
  7. ^ "Polimorfismo de un solo nucleótido", Wikipedia , 2019-08-12 , consultado el 2019-09-03
  8. ^ "Frecuencia de alelos menores", Wikipedia , 2019-08-12 , consultado el 2019-09-03
  9. ^ MJ Li, J. Wang, "Tendencia actual de la anotación de la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
  10. ^ Wang Z, Gerstein M, Snyder M (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Nature Reviews. Genetics . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280 . PMID  19015660. 
  11. ^ Halvorsen M, Martin JS, Broadaway S, Laederach A (agosto de 2010). "Mutaciones asociadas a enfermedades que alteran el conjunto estructural del ARN". PLOS Genetics . 6 (8): e1001074. doi : 10.1371/journal.pgen.1001074 . PMC 2924325 . PMID  20808897. 
  12. ^ Wan Y, Qu K, Zhang QC, Flynn RA, Manor O, Ouyang Z, et al. (enero de 2014). "Paisaje y variación de la estructura secundaria del ARN en el transcriptoma humano". Nature . 505 (7485): 706–709. Bibcode :2014Natur.505..706W. doi :10.1038/nature12946. PMC 3973747 . PMID  24476892. 
  13. ^ Sauna ZE, Kimchi-Sarfaty C (agosto de 2011). "Entender la contribución de las mutaciones sinónimas a las enfermedades humanas". Nature Reviews. Genetics . 12 (10): 683–691. doi :10.1038/nrg3051. PMID  21878961. S2CID  8358824.
  14. ^ Li MJ, Yan B, Sham PC, Wang J (mayo de 2015). "Explorando la función de las variantes genéticas en las regiones genómicas no codificantes: enfoques para identificar variantes reguladoras humanas que afectan la expresión génica". Briefings in Bioinformatics . 16 (3): 393–412. doi : 10.1093/bib/bbu018 . PMID  24916300.
  15. ^ French JD, Ghoussaini M, Edwards SL, Meyer KB, Michailidou K, Ahmed S, et al. (abril de 2013). "Las variantes funcionales en el locus de riesgo 11q13 para el cáncer de mama regulan la expresión de ciclina D1 a través de potenciadores de largo alcance". American Journal of Human Genetics . 92 (4): 489–503. doi :10.1016/j.ajhg.2013.01.002. PMC 3617380 . PMID  23540573. 
  16. ^ Faber K, Glatting KH, Mueller PJ, Risch A, Hotz-Wagenblatt A (2011). "Predicción de SNP modificadores de empalme en todo el genoma en genes humanos mediante un nuevo proceso de análisis denominado AASsites". BMC Bioinformatics . 12 (Supl 4): S2. doi : 10.1186/1471-2105-12-s4-s2 . PMC 3194194 . PMID  21992029. 
  17. ^ Kumar V, Westra HJ, Karjalainen J, Zhernakova DV, Esko T, Hrdlickova B, et al. (2013). "La variación genética asociada a enfermedades humanas afecta la expresión de ARN no codificante intergénico de gran tamaño". PLOS Genetics . 9 (1): e1003201. doi : 10.1371/journal.pgen.1003201 . PMC 3547830 . PMID  23341781. 
  18. ^ MJ Li, J. Wang, "Tendencia actual de la anotación de la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
  19. ^ J. Wu, R. Jiang, "Predicción de polimorfismos de nucleótido único no sinónimos perjudiciales para enfermedades humanas", The Scientific World Journal, 2013, 10 páginas
  20. ^ Sim NL, Kumar P, Hu J, Henikoff S, Schneider G, Ng PC (julio de 2012). "Servidor web SIFT: predicción de los efectos de las sustituciones de aminoácidos en las proteínas". Nucleic Acids Research . 40 (número del servidor web): W452–W457. doi :10.1093/nar/gks539. PMC 3394338 . PMID  22689647. 
  21. ^ Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, et al. (abril de 2010). "Un método y un servidor para predecir mutaciones sin sentido perjudiciales". Nature Methods . 7 (4): 248–249. doi :10.1038/nmeth0410-248. PMC 2855889 . PMID  20354512. 
  22. ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial de alteración de secuencias para causar enfermedades". Nature Methods . 7 (8): 575–576. doi :10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  23. ^ abc Zhang P, Bigio B, Rapaport F, Zhang SY, Casanova JL, Abel L, et al. (diciembre de 2018). "PopViz: un servidor web para visualizar frecuencias de alelos menores y puntuaciones de predicción de daños de variaciones genéticas humanas". Bioinformática . 34 (24): 4307–4309. doi :10.1093/bioinformatics/bty536. PMC 6289133 . PMID  30535305. 
  24. ^ MJ Li, J. Wang, "Tendencia actual de la anotación de la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs. 1-9
  25. ^ Ofoegbu TC, David A, Kelley LA, Mezulis S, Islam SA, Mersmann SF, et al. (junio de 2019). "PhyreRisk: una aplicación web dinámica para unir la genómica, la proteómica y los datos estructurales 3D para guiar la interpretación de las variantes genéticas humanas". Revista de biología molecular . 431 (13): 2460–2466. doi :10.1016/j.jmb.2019.04.043. PMC 6597944 . PMID  31075275. 
  26. ^ Ittisoponpisan S, Islam SA, Khanna T, Alhuzimi E, David A, Sternberg MJ (mayo de 2019). "¿Pueden las estructuras tridimensionales de proteínas predichas proporcionar información fiable sobre si las variantes sin sentido están asociadas a enfermedades?". Journal of Molecular Biology . 431 (11): 2197–2212. doi :10.1016/j.jmb.2019.04.009. PMC 6544567 . PMID  30995449. 
  27. ^ ab Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. (2012). "Un programa para anotar y predecir los efectos de los polimorfismos de un solo nucleótido, SnpEff: SNP en el genoma de la cepa w1118 de Drosophila melanogaster; iso-2; iso-3". Fly . 6 (2): 80–92. doi :10.4161/fly.19695. PMC 3679285 . PMID  22728672. 
  28. ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, et al. (junio de 2016). "El predictor del efecto de la variante Ensembl". Genome Biology . 17 (1): 122. doi : 10.1186/s13059-016-0974-4 . PMC 4893825 . PMID  27268795. 
  29. ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas a partir de datos de secuenciación de alto rendimiento". Nucleic Acids Research . 38 (16): e164. doi :10.1093/nar/gkq603. PMC 2938201 . PMID  20601685. 
  30. ^ Jäger M, Wang K, Bauer S, Smedley D, Krawitz P, Robinson PN (mayo de 2014). "Jannovar: una biblioteca Java para la anotación del exoma". Human Mutation . 35 (5): 548–555. doi : 10.1002/humu.22531 . PMID  24677618. S2CID  10822001.
  31. ^ Capriotti E, Calabrese R, Casadio R (noviembre de 2006). "Predicción de la insurgencia de enfermedades genéticas humanas asociadas a mutaciones de proteínas puntuales con máquinas de vectores de soporte e información evolutiva". Bioinformática . 22 (22): 2729–2734. doi : 10.1093/bioinformatics/btl423 . PMID  16895930.
  32. ^ Adzhubei I, Jordan DM, Sunyaev SR (enero de 2013). "Predicción del efecto funcional de las mutaciones sin sentido humanas utilizando PolyPhen-2". Protocolos actuales en genética humana . Capítulo 7: Unidad 7.20. doi :10.1002/0471142905.hg0720s76. PMC 4480630. PMID  23315928 . 
  33. ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial de alteración de secuencias para causar enfermedades". Nature Methods . 7 (8): 575–576. doi :10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  34. ^ Yates CM, Filippis I, Kelley LA, Sternberg MJ (julio de 2014). "SuSPect: predicción mejorada del fenotipo de variante de un solo aminoácido (SAV) utilizando características de red". Journal of Molecular Biology . 426 (14): 2692–2701. doi :10.1016/j.jmb.2014.04.026. PMC 4087249 . PMID  24810707. 
  35. ^ Lee PH, Shatkay H (enero de 2008). "F-SNP: SNP funcionales predichos computacionalmente para estudios de asociación de enfermedades". Nucleic Acids Research . 36 (número de la base de datos): D820–D824. doi :10.1093/nar/gkm904. PMC 2238878 . PMID  17986460. 
  36. ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas". Bioinformática . 28 (5): 724–725. doi :10.1093/bioinformatics/bts032. PMC 3289923 . PMID  22257670. 
  37. ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federados para la anotación funcional de SNP". Métodos informáticos y programas en biomedicina . 95 (2): 181–189. doi :10.1016/j.cmpb.2009.02.010. PMC 2680224. PMID  19327864 . 
  38. ^ Gamazon ER, Zhang W, Konkashbaev A, Duan S, Kistner EO, ​​Nicolae DL, et al. (enero de 2010). "SCAN: SNP y anotación del número de copias". Bioinformática . 26 (2): 259–262. doi :10.1093/bioinformatics/btp644. PMC 2852202 . PMID  19933162. 
  39. ^ Bromberg Y, Rost B (2007). "SNAP: predecir el efecto de los polimorfismos no sinónimos en la función". Investigación de ácidos nucleicos . 35 (11): 3823–3835. doi :10.1093/nar/gkm238. PMC 1920242 . PMID  17526529. 
  40. ^ Calabrese R, Capriotti E, Fariselli P, Martelli PL, Casadio R (agosto de 2009). "Las anotaciones funcionales mejoran la puntuación predictiva de mutaciones relacionadas con enfermedades humanas en proteínas". Human Mutation . 30 (8): 1237–1244. doi : 10.1002/humu.21047 . PMID  19514061. S2CID  33900765.
  41. ^ Karchin R, Diekhans M, Kelly L, Thomas DJ, Pieper U, Eswar N, et al. (junio de 2005). "LS-SNP: anotación a gran escala de SNP no sinónimos codificantes basados ​​en múltiples fuentes de información". Bioinformática . 21 (12): 2814–2820. doi : 10.1093/bioinformatics/bti442 . PMID  15827081.
  42. ^ Asmann YW, Middha S, Hossain A, Baheti S, Li Y, Chai HS, et al. (enero de 2012). "TREAT: una herramienta bioinformática para anotaciones y visualizaciones de variantes en datos de secuenciación dirigida y del exoma". Bioinformática . 28 (2): 277–278. doi :10.1093/bioinformatics/btr612. PMC 3259432 . PMID  22088845. 
  43. ^ Doran AG, Creevey CJ (febrero de 2013). "Snpdat: anotación fácil y rápida de resultados de proyectos de descubrimiento de SNP de novo para organismos modelo y no modelo". BMC Bioinformatics . 14 : 45. doi : 10.1186/1471-2105-14-45 . PMC 3574845 . PMID  23390980. 
  44. ^ Grant JR, Arantes AS, Liao X, Stothard P (agosto de 2011). "Anotación en profundidad de SNP que surgen de proyectos de resecuenciación utilizando NGS-SNP". Bioinformática . 27 (16): 2300–2301. doi :10.1093/bioinformatics/btr372. PMC 3150039 . PMID  21697123. 
  45. ^ Ge D, Ruzzo EK, Shianna KV, He M, Pelak K, Heinzen EL, et al. (julio de 2011). "SVA: software para anotar y visualizar genomas humanos secuenciados". Bioinformática . 27 (14): 1998–2000. doi :10.1093/bioinformatics/btr317. PMC 3129530 . PMID  21624899. 
  46. ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (julio de 2012). "VARIANT: Línea de comandos, servicio web e interfaz web para la caracterización funcional rápida y precisa de variantes encontradas mediante secuenciación de nueva generación". Nucleic Acids Research . 40 (número del servidor web): W54–W58. doi :10.1093/nar/gks572. PMC 3394276 . PMID  22693211. 
  47. ^ Ng PC, Henikoff S (julio de 2003). "SIFT: Predicción de cambios en aminoácidos que afectan la función de las proteínas". Nucleic Acids Research . 31 (13): 3812–3814. doi :10.1093/nar/gkg509. PMC 168916 . PMID  12824425. 
  48. ^ Malhis N, Jones SJ, Gsponer J (abril de 2019). "Medidas mejoradas para la conservación evolutiva que explotan las distancias taxonómicas". Nature Communications . 10 (1): 1556. Bibcode :2019NatCo..10.1556M. doi :10.1038/s41467-019-09583-2. PMC 6450959 . PMID  30952844. 
  49. ^ Malhis N, Jacobson M, Jones SJ, Gsponer J (julio de 2020). "LIST-S2: clasificación basada en taxonomía de mutaciones sin sentido perjudiciales en distintas especies". Nucleic Acids Research . 48 (W1): W154–W161. doi : 10.1093/nar/gkaa288 . PMC 7319545 . PMID  32352516. 
  50. ^ Yuan HY, Chiou JJ, Tseng WH, Liu CH, Liu CK, Lin YJ, et al. (julio de 2006). "FASTSNP: un servicio siempre actualizado y ampliable para el análisis y la priorización de la función de SNP". Nucleic Acids Research . 34 (edición del servidor web): W635–W641. doi :10.1093/nar/gkl236. PMC 1538865 . PMID  16845089. 
  51. ^ Mi H, Guo N, Kejariwal A, Thomas PD (enero de 2007). "PANTHER versión 6: datos de evolución de la función y secuencia de proteínas con representación expandida de vías biológicas". Nucleic Acids Research . 35 (número de la base de datos): D247–D252. doi :10.1093/nar/gkl869. PMC 1716723 . PMID  17130144. 
  52. ^ Capriotti E, Altman RB, Bromberg Y (2013). "El juicio colectivo predice variantes de un solo nucleótido asociadas a la enfermedad". BMC Genomics . 14 (Supl 3): S2. doi : 10.1186/1471-2164-14-S3-S2 . PMC 3839641 . PMID  23819846. 
  53. ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas a partir de datos de secuenciación de alto rendimiento". Nucleic Acids Research . 38 (16): e164. doi :10.1093/nar/gkq603. PMC 2938201 . PMID  20601685. 
  54. ^ "charite/jannovar". GitHub . Consultado el 25 de septiembre de 2016 .
  55. ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, et al. (junio de 2016). "El predictor del efecto de la variante Ensembl". Genome Biology . 17 (1): 122. doi : 10.1186/s13059-016-0974-4 . PMC 4893825 . PMID  27268795. 
  56. ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas". Bioinformática . 28 (5): 724–725. doi :10.1093/bioinformatics/bts032. PMC 3289923 . PMID  22257670. 
  57. ^ "Archivo de lista de variaciones de entrada para anotación". Anotación SeattleSeq 151 .
  58. ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (julio de 2012). "VARIANT: Línea de comandos, servicio web e interfaz web para la caracterización funcional rápida y precisa de variantes encontradas mediante secuenciación de nueva generación". Nucleic Acids Research . 40 (número del servidor web): W54–W58. doi :10.1093/nar/gks572. PMC 3394276 . PMID  22693211. 
  59. ^ Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, et al. (marzo de 2014). "Un estudio de herramientas para el análisis de variantes de datos de secuenciación genómica de próxima generación". Briefings in Bioinformatics . 15 (2): 256–278. doi :10.1093/bib/bbs086. PMC 3956068 . PMID  23341494. 
  60. ^ Lee PH, Lee C, Li X, Wee B, Dwivedi T, Daly M (enero de 2018). "Principios y métodos de priorización in silico de variantes reguladoras no codificantes". Genética humana . 137 (1): 15–30. doi :10.1007/s00439-017-1861-0. PMC 5892192 . PMID  29288389. 
  61. ^ Li X, Li Z, Zhou H, Gaynor SM, Liu Y, Chen H, et al. (septiembre de 2020). "La incorporación dinámica de múltiples anotaciones funcionales in silico potencia el análisis de asociación de variantes raras en estudios de secuenciación de todo el genoma a gran escala". Nature Genetics . 52 (9): 969–983. doi :10.1038/s41588-020-0676-4. PMC 7483769 . PMID  32839606. 
  62. ^ Watanabe K, Taskesen E, van Bochoven A, Posthuma D (noviembre de 2017). "Mapeo funcional y anotación de asociaciones genéticas con FUMA". Nature Communications . 8 (1): 1826. doi : 10.1038/s41467-017-01261-5 . PMC 5705698 . PMID  29184056. 
  63. ^ Li Z, Li X, Zhou H, Gaynor SM, Selvaraj MS, Arapoglou T, et al. (diciembre de 2022). "Un marco para detectar asociaciones de variantes raras no codificantes en estudios de secuenciación del genoma completo a gran escala". Nature Methods . 19 (12): 1599–1611. doi :10.1038/s41592-022-01640-x. PMC 10008172 . PMID  36303018. S2CID  243873361. 
  64. ^ "STAARpipeline: una herramienta todo en uno para detectar variantes raras y obtener datos de secuenciación del genoma completo a escala de biobanco". Nature Methods . 19 (12): 1532–1533. Diciembre de 2022. doi :10.1038/s41592-022-01641-w. PMID  36316564. S2CID  253246835.
  65. ^ Li, Xihao; Rápido, Corbin; Zhou, Hufeng; Gaynor, Sheila M.; Liu, Yaowu; Chen, Han; Selvaraj, Margaret Sunitha; Sol, Ryan; Dey, Rounak; Arnett, Donna K.; Bielak, Lawrence F.; Bis, Josué C.; Blangero, Juan; Boerwinkle, Eric; Bowden, Donald W.; Brody, Jennifer A.; Cade, Brian E.; Correa, Adolfo; Cupples, L. Adrienne; Curran, Joanne E.; de Vries, Paul S.; Duggirala, Ravindranath; Freedman, Barry I.; Göring, Harald HH; Guo, Xiuqing; Haessler, Jeffrey; Kalyani, Rita R.; Kooperberg, Charles; Kral, Brian G.; Lange, Leslie A.; Manichaikul, Ani; Martín, Lisa W.; McGarvey, Stephen T.; Mitchell, Braxton D.; Montasser, May E.; Morrison, Alanna C.; Naseri, Take; O'Connell, Jeffrey R.; Palmer, Nicholette D.; Peyser, Patricia A.; Psaty, Bruce M.; Raffield, Laura M.; Redline, Susan; Reiner, Alexander P.; Reupena, Muagututi'a Sefuiva; Rice, Kenneth M.; Rich, Stephen S.; Sitlani, Colleen M.; Smith, Jennifer A.; Taylor, Kent D. ; Vasan, Ramachandran S.; Willer, Cristen J.; Wilson, James G.; Yanek, Lisa R.; Zhao, Wei; Consorcio NHLBI Trans-Omics for Precision Medicine (TOPMed); Grupo de trabajo de lípidos TOPMed; Rotter, Jerome I .; Natarajan, Pradeep; Peloso, Gina M.; Li, Zilin; Lin, Xihong (enero de 2023). "Metaanálisis potente, escalable y eficiente en términos de recursos de asociaciones de variantes raras en estudios de secuenciación del genoma completo a gran escala". Nature Genetics . 55 (1): 154–164. doi :10.1038/s41588-022-01225-6. PMC 10084891 . Número de modelo: PMID  36564505. Número de modelo: S2CID  255084231.