stringtranslate.com

Anotación SNP

La anotación de polimorfismo de un solo nucleótido ( anotación SNP ) es el proceso de predecir el efecto o función de un SNP individual utilizando herramientas de anotación de SNP. En la anotación SNP, la información biológica se extrae, recopila y muestra de una forma clara y susceptible de consulta. La anotación funcional de SNP normalmente se realiza en función de la información disponible sobre secuencias de proteínas y ácidos nucleicos . [1]

Introducción

Gráfico dirigido de relaciones entre servidores web de predicción de SNP y sus fuentes bioinformáticas. [2]

Los polimorfismos de un solo nucleótido (SNP) desempeñan un papel importante en los estudios de asociación de todo el genoma porque actúan como biomarcadores primarios . Los SNP son actualmente el marcador de elección debido a su gran número en prácticamente todas las poblaciones de individuos. La ubicación de estos biomarcadores puede ser tremendamente importante en términos de predicción de importancia funcional, mapeo genético y genética de poblaciones . [3] Cada SNP representa un cambio de nucleótido entre dos individuos en una ubicación definida. Los SNP son la variante genética más común que se encuentra en todos los individuos, con un SNP cada 100 a 300 pb en algunas especies . [4] Dado que existe una gran cantidad de SNP en el genoma , existe una clara necesidad de priorizar los SNP de acuerdo con su efecto potencial para acelerar la genotipificación y el análisis. [5]

Anotar una gran cantidad de SNP es un proceso difícil y complejo, que necesita métodos computacionales para manejar un conjunto de datos tan grande. Se han desarrollado muchas herramientas disponibles para la anotación de SNP en diferentes organismos: algunas de ellas están optimizadas para su uso con organismos muestreados densamente para SNP (como los humanos ), pero actualmente hay pocas herramientas disponibles que no sean específicas de especies o que admitan modelos no específicos. datos del organismo. La mayoría de las herramientas de anotación de SNP proporcionan supuestos efectos nocivos de los SNP predichos computacionalmente. Estas herramientas examinan si un SNP reside en regiones genómicas funcionales, como exones, sitios de empalme o sitios reguladores de la transcripción, y predicen los posibles efectos funcionales correspondientes que el SNP puede tener utilizando una variedad de enfoques de aprendizaje automático. Pero las herramientas y sistemas que priorizan los SNP funcionalmente significativos tienen pocas limitaciones: primero, examinan los supuestos efectos nocivos de los SNP con respecto a una única función biológica que proporciona solo información parcial sobre la importancia funcional de los SNP. En segundo lugar, los sistemas actuales clasifican los SNP en grupos nocivos o neutrales. [6]

Muchos algoritmos de anotación se centran en variantes de un solo nucleótido (SNV), consideradas más raras que los SNP según se definen por su frecuencia de alelo menor (MAF). [7] [8] Como consecuencia, los datos de entrenamiento para los métodos de predicción correspondientes pueden ser diferentes y, por lo tanto, se debe tener cuidado al seleccionar la herramienta adecuada para un propósito específico. A los efectos de este artículo, se utilizará "SNP" para referirse tanto a SNP como a SNV, pero los lectores deben tener en cuenta las diferencias.

Anotación SNP

Diferentes tipos de anotaciones en genómica.

Para la anotación de SNP, se utilizan muchos tipos de información genética y genómica. Según las diferentes funciones utilizadas por cada herramienta de anotación, los métodos de anotación SNP se pueden dividir aproximadamente en las siguientes categorías:

Anotación basada en genes

La información genómica de los elementos genómicos circundantes se encuentra entre la información más útil para interpretar la función biológica de una variante observada. La información de un gen conocido se utiliza como referencia para indicar si la variante observada reside en un gen o cerca de él y si tiene el potencial de alterar la secuencia de la proteína y su función. La anotación basada en genes se basa en el hecho de que las mutaciones no sinónimas pueden alterar la secuencia de la proteína y que la mutación del sitio de empalme puede alterar el patrón de empalme de la transcripción. [9]

Anotación basada en el conocimiento

La anotación de la base de conocimientos se realiza en función de la información del atributo genético, la función de la proteína y su metabolismo . En este tipo de anotación se da más énfasis a la variación genética que altera el dominio de función de la proteína, la interacción proteína-proteína y la vía biológica . La región no codificante del genoma contiene muchos elementos reguladores importantes, incluidos el promotor , el potenciador y el aislante; cualquier tipo de cambio en esta región reguladora puede cambiar la funcionalidad de esa proteína. [10] La mutación en el ADN puede cambiar la secuencia del ARN y luego influir en la estructura secundaria del ARN , el reconocimiento de la proteína de unión al ARN y la actividad de unión del miARN. [11] [12]

Anotación funcional

Este método identifica principalmente la función variante basándose en la información de si los loci variantes se encuentran en la región funcional conocida que alberga señales genómicas o epigenómicas. La función de las variantes no codificantes es extensa en términos de la región genómica afectada y participan en casi todos los procesos de regulación genética desde el nivel transcripcional hasta el postraduccional [13].

Regulación genética transcripcional.

El proceso de regulación de genes transcripcionales depende de muchos factores espaciales y temporales en el núcleo, como los estados de cromatina globales o locales, el posicionamiento de los nucleosomas, la unión de TF y las actividades potenciadoras/promotoras. Las variantes que alteran la función de cualquiera de estos procesos biológicos pueden alterar la regulación genética y provocar anomalías fenotípicas. [14] Las variantes genéticas que se ubican en la región reguladora distal pueden afectar el motivo de unión de los TF, los reguladores de la cromatina y otros factores transcripcionales distales, que perturban la interacción entre el potenciador/silenciador y su gen objetivo. [15]

Splicing alternativo

El empalme alternativo es uno de los componentes más importantes que muestran la complejidad funcional del genoma. El empalme modificado tiene un efecto significativo sobre el fenotipo que es relevante para la enfermedad o el metabolismo de los fármacos. Un cambio en el empalme puede ser causado modificando cualquiera de los componentes de la maquinaria de empalme, como sitios de empalme o potenciadores de empalme o silenciadores. [16] La modificación en el sitio de empalme alternativo puede conducir a una forma de proteína diferente que mostrará una función diferente. Se estima que los seres humanos utilizan unas 100.000 proteínas diferentes o más, por lo que algunos genes deben ser capaces de codificar mucho más que una sola proteína. El empalme alternativo ocurre con más frecuencia de lo que se pensaba anteriormente y puede ser difícil de controlar; Los genes pueden producir decenas de miles de transcripciones diferentes, lo que requiere un nuevo modelo genético para cada empalme alternativo.

Procesamiento de ARN y regulación postranscripcional.

Las mutaciones en la región no traducida (UTR) afectan muchas regulaciones postranscripcionales . Se requieren características estructurales distintivas para que muchas moléculas de ARN y elementos reguladores que actúan en cis ejecuten funciones efectivas durante la regulación genética. Los SNV pueden alterar la estructura secundaria de las moléculas de ARN y luego alterar el plegamiento adecuado de los ARN, como el plegamiento de ARNt/ARNm/ARNc y las regiones de reconocimiento de unión de miARN. [17]

Traducción y modificaciones postraduccionales.

La variante de un solo nucleótido también puede afectar los elementos reguladores que actúan en cis en los ARNm para inhibir/promover el inicio de la traducción. El cambio en la región de codones sinónimos debido a una mutación puede afectar la eficiencia de la traducción debido a sesgos en el uso de codones. El alargamiento de la traducción también puede verse retardado por mutaciones a lo largo de la rampa del movimiento ribosomal. En el nivel postraduccional, las variantes genéticas pueden contribuir a la proteostasis y a las modificaciones de aminoácidos. Sin embargo, los mecanismos del efecto de las variantes en este campo son complicados y sólo hay unas pocas herramientas disponibles para predecir el efecto de las variantes sobre las modificaciones relacionadas con la traducción. [18]

Función proteica

No sinónimo es la variante en los exones que cambian la secuencia de aminoácidos codificada por el gen, incluidos cambios de base única e indeles sin desplazamiento de marco. Se ha investigado exhaustivamente la función de variantes no sinónimas en las proteínas y se han desarrollado muchos algoritmos para predecir el efecto nocivo y la patogénesis de las variantes de un solo nucleótido (SNV). Las herramientas bioinformáticas clásicas, como SIFT, Polyphen y MutationTaster , predicen con éxito la consecuencia funcional de la sustitución no sinónima. [19] [20] [21] [22] El servidor web PopViz proporciona un enfoque centrado en genes para visualizar las puntuaciones de predicción de daños por mutación (CADD, SIFT, PolyPhen-2) o la genética de la población (frecuencia de alelos menores) frente a las posiciones de los aminoácidos. de todas las variantes codificantes de un determinado gen humano. [23] PopViz también está entrecruzado con la base de datos UniProt, donde se puede encontrar la información del dominio de proteínas, y para luego identificar las variantes nocivas predichas que caen en estos dominios de proteínas en el gráfico de PopViz. [23]

Conservación evolutiva y selección de la naturaleza.

Se utilizaron enfoques de genómica comparativa para predecir las variantes funcionales relevantes bajo el supuesto de que el locus genético funcional debe conservarse en diferentes especies a una distancia filogenética extensa. Por otro lado, algunos rasgos adaptativos y las diferencias poblacionales están impulsados ​​por selecciones positivas de variantes ventajosas, y estas mutaciones genéticas son funcionalmente relevantes para fenotipos específicos de la población. La predicción funcional del efecto de las variantes en diferentes procesos biológicos es fundamental para identificar el mecanismo molecular de las enfermedades/rasgos y dirigir la validación experimental. [24]

Lista de herramientas de anotación SNP disponibles

Para anotar las grandes cantidades de datos NGS disponibles, actualmente hay disponible una gran cantidad de herramientas de anotación de SNP. Algunos de ellos son específicos de SNP específicos, mientras que otros son más generales. Algunas de las herramientas de anotación de SNP disponibles son las siguientes: SNPeff, Ensembl Variant Effect Predictor (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs&GO, LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster , SNPdat, Snpranker, NGS – SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP y FAST-SNP. Las funciones y enfoques utilizados en las herramientas de anotación de SNP se enumeran a continuación.

Algoritmos utilizados en herramientas de anotación.

Las herramientas de anotación de variantes utilizan algoritmos de aprendizaje automático para predecir anotaciones de variantes. Diferentes herramientas de anotación utilizan diferentes algoritmos. Los algoritmos comunes incluyen:

Comparación de herramientas de anotación de variantes

Hay disponible una gran cantidad de herramientas de anotación de variantes para la anotación de variantes. La anotación realizada por diferentes herramientas no siempre coincide entre sí, ya que las reglas definidas para el manejo de datos difieren entre aplicaciones. Es francamente imposible realizar una comparación perfecta de las herramientas disponibles. No todas las herramientas tienen las mismas entradas y salidas ni la misma funcionalidad. A continuación se muestra una tabla de las principales herramientas de anotación y su área funcional.

[59]

Solicitud

Diferentes anotaciones capturan diversos aspectos de la función variante. [60] El uso simultáneo de anotaciones funcionales múltiples y variadas podría mejorar el poder del análisis de asociación de variantes raras de los estudios de secuenciación del exoma completo y del genoma completo . [61] Se han desarrollado algunas herramientas para permitir el análisis de asociación fenotipo-genotipo funcionalmente informado para variantes comunes y raras mediante la incorporación de anotaciones funcionales en cohortes a escala de biobanco. [62] [63] [64] [65]

Conclusiones

La próxima generación de servidores web de anotaciones SNP puede aprovechar la creciente cantidad de datos en los recursos bioinformáticos centrales y utilizar agentes inteligentes para recuperar datos de diferentes fuentes según sea necesario. Desde el punto de vista del usuario, es más eficiente enviar un conjunto de SNP y recibir resultados en un solo paso, lo que hace que los metaservidores sean la opción más atractiva. Sin embargo, si las herramientas de anotación de SNP ofrecen datos heterogéneos que cubren secuencia, estructura, regulación, vías, etc., también deben proporcionar marcos para integrar datos en algoritmos de decisión y medidas de confianza cuantitativas para que los usuarios puedan evaluar qué datos son relevantes y cuáles no. .

Referencias

  1. ^ Aubourg S, Rouzé P (2001). "Anotación del genoma". Fisiol vegetal. Bioquímica . 29 (3–4): 181–193. doi :10.1016/S0981-9428(01)01242-6.
  2. ^ Karchin R (enero de 2009). "Herramientas de próxima generación para la anotación de SNP humanos". Sesiones informativas en Bioinformática . 10 (1): 35–52. doi : 10.1093/bib/bbn047. PMC 2638621 . PMID  19181721. 
  3. ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federado con el fin de realizar anotaciones funcionales de SNP". Métodos y Programas Informáticos en Biomedicina . 95 (2): 181–189. doi :10.1016/j.cmpb.2009.02.010. PMC 2680224 . PMID  19327864. 
  4. ^ NC Oraguzie, EHA Rikkerink, SE Gardiner, HN de Silva (eds.), "Mapeo de asociaciones en plantas", Springer, 2007
  5. ^ Capriotti E, Nehrt NL, Kann MG, Bromberg Y (julio de 2012). "Bioinformática para la interpretación del genoma personal". Sesiones informativas en Bioinformática . 13 (4): 495–512. doi : 10.1093/bib/bbr070. PMC 3404395 . PMID  22247263. 
  6. ^ PH Lee, H. Shatkay, "Clasificación de polimorfismos de un solo nucleótido según posibles efectos nocivos", Laboratorio de biología computacional y aprendizaje automático, Facultad de Computación, Queen's University, Kingston, ON, Canadá
  7. ^ "Polimorfismo de un solo nucleótido", Wikipedia , 2019-08-12 , consultado el 3 de septiembre de 2019
  8. ^ "Frecuencia de alelos menores", Wikipedia , 2019-08-12 , consultado el 3 de septiembre de 2019
  9. ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs.
  10. ^ Wang Z, Gerstein M, Snyder M (enero de 2009). "RNA-Seq: una herramienta revolucionaria para la transcriptómica". Reseñas de la naturaleza. Genética . 10 (1): 57–63. doi :10.1038/nrg2484. PMC 2949280 . PMID  19015660. 
  11. ^ Halvorsen M, Martin JS, Broadaway S, Laederach A (agosto de 2010). "Mutaciones asociadas a enfermedades que alteran el conjunto estructural del ARN". PLOS Genética . 6 (8): e1001074. doi : 10.1371/journal.pgen.1001074 . PMC 2924325 . PMID  20808897. 
  12. ^ Wan Y, Qu K, Zhang QC, Flynn RA, Manor O, Ouyang Z, et al. (Enero 2014). "Paisaje y variación de la estructura secundaria del ARN en el transcriptoma humano". Naturaleza . 505 (7485): 706–709. Código Bib :2014Natur.505..706W. doi : 10.1038/naturaleza12946. PMC 3973747 . PMID  24476892. 
  13. ^ Sauna ZE, Kimchi-Sarfaty C (agosto de 2011). "Comprender la contribución de mutaciones sinónimas a las enfermedades humanas". Reseñas de la naturaleza. Genética . 12 (10): 683–691. doi :10.1038/nrg3051. PMID  21878961. S2CID  8358824.
  14. ^ Li MJ, Yan B, Sham PC, Wang J (mayo de 2015). "Explorando la función de variantes genéticas en las regiones genómicas no codificantes: enfoques para identificar variantes reguladoras humanas que afectan la expresión génica". Sesiones informativas en Bioinformática . 16 (3): 393–412. doi : 10.1093/bib/bbu018 . PMID  24916300.
  15. ^ JD francés, Ghoussaini M, Edwards SL, Meyer KB, Michailidou K, Ahmed S, et al. (Abril 2013). "Las variantes funcionales en el locus de riesgo 11q13 para el cáncer de mama regulan la expresión de ciclina D1 a través de potenciadores de largo alcance". Revista Estadounidense de Genética Humana . 92 (4): 489–503. doi :10.1016/j.ajhg.2013.01.002. PMC 3617380 . PMID  23540573. 
  16. ^ Faber K, Glatting KH, Mueller PJ, Risch A, Hotz-Wagenblatt A (2011). "Predicción de todo el genoma de SNP modificadores de empalme en genes humanos utilizando una nueva línea de análisis llamada AASsites". Bioinformática BMC . 12 (Suplemento 4): T2. doi : 10.1186/1471-2105-12-s4-s2 . PMC 3194194 . PMID  21992029. 
  17. ^ Kumar V, Westra HJ, Karjalainen J, Zhernakova DV, Esko T, Hrdlickova B, et al. (2013). "La variación genética asociada a enfermedades humanas afecta la gran expresión de ARN intergénico no codificante". PLOS Genética . 9 (1): e1003201. doi : 10.1371/journal.pgen.1003201 . PMC 3547830 . PMID  23341781. 
  18. ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs.
  19. ^ J. Wu, R. Jiang, "Predicción del polimorfismo de un solo nucleótido no sinónimo nocivo para enfermedades humanas", The Scientific World Journal, 2013, 10 páginas
  20. ^ Sim NL, Kumar P, Hu J, Henikoff S, Schneider G, Ng PC (julio de 2012). "Servidor web SIFT: predicción de los efectos de las sustituciones de aminoácidos en las proteínas". Investigación de ácidos nucleicos . 40 (problema del servidor web): W452–W457. doi : 10.1093/nar/gks539. PMC 3394338 . PMID  22689647. 
  21. ^ Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, et al. (Abril de 2010). "Un método y servidor para predecir mutaciones sin sentido dañinas". Métodos de la naturaleza . 7 (4): 248–249. doi :10.1038/nmeth0410-248. PMC 2855889 . PMID  20354512. 
  22. ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial de las alteraciones de secuencia como causantes de enfermedades". Métodos de la naturaleza . 7 (8): 575–576. doi :10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  23. ^ abc Zhang P, Bigio B, Rapaport F, Zhang SY, Casanova JL, Abel L, et al. (Diciembre de 2018). "PopViz: un servidor web para visualizar frecuencias de alelos menores y puntuaciones de predicción de daños de variaciones genéticas humanas". Bioinformática . 34 (24): 4307–4309. doi : 10.1093/bioinformática/bty536. PMC 6289133 . PMID  30535305. 
  24. ^ MJ Li, J. Wang, "Tendencia actual de anotar la variación de un solo nucleótido en humanos: un estudio de caso sobre SNVrap", Elsevier, 2014, págs.
  25. ^ Ofoegbu TC, David A, Kelley LA, Mezulis S, Islam SA, Mersmann SF, et al. (junio de 2019). "PhyreRisk: una aplicación web dinámica para unir la genómica, la proteómica y los datos estructurales 3D para guiar la interpretación de variantes genéticas humanas". Revista de biología molecular . 431 (13): 2460–2466. doi :10.1016/j.jmb.2019.04.043. PMC 6597944 . PMID  31075275. 
  26. ^ Ittisoponpisan S, Islam SA, Khanna T, Alhuzimi E, David A, Sternberg MJ (mayo de 2019). "¿Pueden las estructuras 3D de proteínas previstas proporcionar información confiable sobre si las variantes sin sentido están asociadas a enfermedades?". Revista de biología molecular . 431 (11): 2197–2212. doi :10.1016/j.jmb.2019.04.009. PMC 6544567 . PMID  30995449. 
  27. ^ ab Cingolani P, Platts A, Wang LL, Coon M, Nguyen T, Wang L, et al. (2012). "Un programa para anotar y predecir los efectos de polimorfismos de un solo nucleótido, SnpEff: SNP en el genoma de la cepa w1118 de Drosophila melanogaster; iso-2; iso-3". Volar . 6 (2): 80–92. doi : 10.4161/fly.19695. PMC 3679285 . PMID  22728672. 
  28. ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, et al. (junio de 2016). "El predictor del efecto variante del conjunto". Biología del genoma . 17 (1): 122. doi : 10.1186/s13059-016-0974-4 . PMC 4893825 . PMID  27268795. 
  29. ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas a partir de datos de secuenciación de alto rendimiento". Investigación de ácidos nucleicos . 38 (16): e164. doi :10.1093/nar/gkq603. PMC 2938201 . PMID  20601685. 
  30. ^ Jäger M, Wang K, Bauer S, Smedley D, Krawitz P, Robinson PN (mayo de 2014). "Jannovar: una biblioteca de Java para la anotación del exoma". Mutación humana . 35 (5): 548–555. doi : 10.1002/humu.22531 . PMID  24677618. S2CID  10822001.
  31. ^ Capriotti E, Calabrese R, Casadio R (noviembre de 2006). "Predecir la aparición de enfermedades genéticas humanas asociadas a mutaciones de proteínas de un solo punto con máquinas de vectores de soporte e información evolutiva". Bioinformática . 22 (22): 2729–2734. doi : 10.1093/bioinformática/btl423 . PMID  16895930.
  32. ^ Adzhubei I, Jordan DM, Sunyaev SR (enero de 2013). "Predicción del efecto funcional de mutaciones sin sentido humanas utilizando PolyPhen-2". Protocolos actuales en genética humana . Capítulo 7: Unidad7.20. doi :10.1002/0471142905.hg0720s76. PMC 4480630 . PMID  23315928. 
  33. ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (agosto de 2010). "MutationTaster evalúa el potencial de las alteraciones de secuencia como causantes de enfermedades". Métodos de la naturaleza . 7 (8): 575–576. doi :10.1038/nmeth0810-575. PMID  20676075. S2CID  26892938.
  34. ^ Yates CM, Filippis I, Kelley LA, Sternberg MJ (julio de 2014). "SuSPect: predicción mejorada del fenotipo de variante de un solo aminoácido (SAV) utilizando funciones de red". Revista de biología molecular . 426 (14): 2692–2701. doi :10.1016/j.jmb.2014.04.026. PMC 4087249 . PMID  24810707. 
  35. ^ Lee PH, Shatkay H (enero de 2008). "F-SNP: SNP funcionales predichos computacionalmente para estudios de asociación de enfermedades". Investigación de ácidos nucleicos . 36 (Problema de la base de datos): D820 – D824. doi :10.1093/nar/gkm904. PMC 2238878 . PMID  17986460. 
  36. ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas". Bioinformática . 28 (5): 724–725. doi : 10.1093/bioinformática/bts032. PMC 3289923 . PMID  22257670. 
  37. ^ Shen TH, Carlson CS, Tarczy-Hornoch P (agosto de 2009). "SNPit: un sistema de integración de datos federado con el fin de realizar anotaciones funcionales de SNP". Métodos y Programas Informáticos en Biomedicina . 95 (2): 181–189. doi :10.1016/j.cmpb.2009.02.010. PMC 2680224 . PMID  19327864. 
  38. ^ Gamazon ER, Zhang W, Konkashbaev A, Duan S, Kistner EO, ​​Nicolae DL y col. (Enero de 2010). "ESCANEO: SNP y anotación del número de copia". Bioinformática . 26 (2): 259–262. doi : 10.1093/bioinformática/btp644. PMC 2852202 . PMID  19933162. 
  39. ^ Bromberg Y, Rost B (2007). "SNAP: predecir el efecto de polimorfismos no sinónimos en la función". Investigación de ácidos nucleicos . 35 (11): 3823–3835. doi : 10.1093/nar/gkm238. PMC 1920242 . PMID  17526529. 
  40. ^ Calabrese R, Capriotti E, Fariselli P, Martelli PL, Casadio R (agosto de 2009). "Las anotaciones funcionales mejoran la puntuación predictiva de mutaciones en proteínas relacionadas con enfermedades humanas". Mutación humana . 30 (8): 1237–1244. doi : 10.1002/humu.21047 . PMID  19514061. S2CID  33900765.
  41. ^ Karchin R, Diekhans M, Kelly L, Thomas DJ, Pieper U, Eswar N, et al. (junio de 2005). "LS-SNP: anotación a gran escala de codificación de SNP no sinónimos basada en múltiples fuentes de información". Bioinformática . 21 (12): 2814–2820. doi : 10.1093/bioinformática/bti442 . PMID  15827081.
  42. ^ Asmann YW, Middha S, Hossain A, Baheti S, Li Y, Chai HS, et al. (Enero de 2012). "TREAT: una herramienta bioinformática para anotaciones y visualizaciones de variantes en datos de secuenciación de exomas y específicos". Bioinformática . 28 (2): 277–278. doi : 10.1093/bioinformática/btr612. PMC 3259432 . PMID  22088845. 
  43. ^ Doran AG, Creevey CJ (febrero de 2013). "Snpdat: anotación fácil y rápida de resultados de proyectos de descubrimiento de snp de novo para organismos modelo y no modelo". Bioinformática BMC . 14 : 45. doi : 10.1186/1471-2105-14-45 . PMC 3574845 . PMID  23390980. 
  44. ^ Grant JR, Arantes AS, Liao X, Stothard P (agosto de 2011). "Anotación en profundidad de los SNP que surgen de proyectos de resecuenciación utilizando NGS-SNP". Bioinformática . 27 (16): 2300–2301. doi : 10.1093/bioinformática/btr372. PMC 3150039 . PMID  21697123. 
  45. ^ Ge D, Ruzzo EK, Shianna KV, He M, Pelak K, Heinzen EL, et al. (Julio de 2011). "SVA: software para anotar y visualizar genomas humanos secuenciados". Bioinformática . 27 (14): 1998-2000. doi : 10.1093/bioinformática/btr317. PMC 3129530 . PMID  21624899. 
  46. ^ Medina I, De María A, Bleda M, Salavert F, Alonso R, González CY, Dopazo J (julio de 2012). "VARIANTE: Línea de comandos, servicio web e interfaz web para una caracterización funcional rápida y precisa de las variantes encontradas mediante la secuenciación de próxima generación". Investigación de ácidos nucleicos . 40 (problema del servidor web): W54–W58. doi : 10.1093/nar/gks572. PMC 3394276 . PMID  22693211. 
  47. ^ Ng PC, Henikoff S (julio de 2003). "SIFT: predecir cambios de aminoácidos que afectan la función de las proteínas". Investigación de ácidos nucleicos . 31 (13): 3812–3814. doi :10.1093/nar/gkg509. PMC 168916 . PMID  12824425. 
  48. ^ Malhis N, Jones SJ, Gsponer J (abril de 2019). "Medidas mejoradas para la conservación evolutiva que explotan las distancias taxonómicas". Comunicaciones de la naturaleza . 10 (1): 1556. Código bibliográfico : 2019NatCo..10.1556M. doi :10.1038/s41467-019-09583-2. PMC 6450959 . PMID  30952844. 
  49. ^ Malhis N, Jacobson M, Jones SJ, Gsponer J (julio de 2020). "LISTA-S2: clasificación basada en taxonomía de mutaciones sin sentido nocivas entre especies". Investigación de ácidos nucleicos . 48 (W1): W154-W161. doi : 10.1093/nar/gkaa288 . PMC 7319545 . PMID  32352516. 
  50. ^ Yuan HY, Chiou JJ, Tseng WH, Liu CH, Liu CK, Lin YJ y otros. (Julio de 2006). "FASTSNP: un servicio siempre actualizado y ampliable para el análisis y priorización de funciones SNP". Investigación de ácidos nucleicos . 34 (problema del servidor web): W635–W641. doi : 10.1093/nar/gkl236. PMC 1538865 . PMID  16845089. 
  51. ^ Mi H, Guo N, Kejariwal A, Thomas PD (enero de 2007). "PANTHER versión 6: datos de evolución de función y secuencia de proteínas con representación ampliada de vías biológicas". Investigación de ácidos nucleicos . 35 (Problema de la base de datos): D247–D252. doi : 10.1093/nar/gkl869. PMC 1716723 . PMID  17130144. 
  52. ^ Capriotti E, Altman RB, Bromberg Y (2013). "El juicio colectivo predice variantes de un solo nucleótido asociadas a enfermedades". Genómica BMC . 14 (Suplemento 3): T2. doi : 10.1186/1471-2164-14-S3-S2 . PMC 3839641 . PMID  23819846. 
  53. ^ Wang K, Li M, Hakonarson H (septiembre de 2010). "ANNOVAR: anotación funcional de variantes genéticas a partir de datos de secuenciación de alto rendimiento". Investigación de ácidos nucleicos . 38 (16): e164. doi :10.1093/nar/gkq603. PMC 2938201 . PMID  20601685. 
  54. ^ "carité/jannovar". GitHub . Consultado el 25 de septiembre de 2016 .
  55. ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, et al. (junio de 2016). "El predictor del efecto variante del conjunto". Biología del genoma . 17 (1): 122. doi : 10.1186/s13059-016-0974-4 . PMC 4893825 . PMID  27268795. 
  56. ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (marzo de 2012). "AnnTools: un conjunto de herramientas de anotación completo y versátil para variantes genómicas". Bioinformática . 28 (5): 724–725. doi : 10.1093/bioinformática/bts032. PMC 3289923 . PMID  22257670. 
  57. ^ "Archivo de lista de variaciones de entrada para anotaciones". Anotación SeattleSeq 151 .
  58. ^ Medina I, De María A, Bleda M, Salavert F, Alonso R, González CY, Dopazo J (julio de 2012). "VARIANTE: Línea de comandos, servicio web e interfaz web para una caracterización funcional rápida y precisa de las variantes encontradas mediante la secuenciación de próxima generación". Investigación de ácidos nucleicos . 40 (problema del servidor web): W54–W58. doi : 10.1093/nar/gks572. PMC 3394276 . PMID  22693211. 
  59. ^ Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, et al. (Marzo del 2014). "Un estudio de herramientas para el análisis de variantes de datos de secuenciación del genoma de próxima generación". Sesiones informativas en Bioinformática . 15 (2): 256–278. doi : 10.1093/bib/bbs086. PMC 3956068 . PMID  23341494. 
  60. ^ Lee PH, Lee C, Li X, Wee B, Dwivedi T, Daly M (enero de 2018). "Principios y métodos de priorización in silico de variantes reguladoras no codificantes". Genética Humana . 137 (1): 15–30. doi :10.1007/s00439-017-1861-0. PMC 5892192 . PMID  29288389. 
  61. ^ Li X, Li Z, Zhou H, Gaynor SM, Liu Y, Chen H, et al. (septiembre de 2020). "La incorporación dinámica de múltiples anotaciones funcionales in silico permite el análisis de asociación de variantes raras de grandes estudios de secuenciación del genoma completo a escala". Genética de la Naturaleza . 52 (9): 969–983. doi :10.1038/s41588-020-0676-4. PMC 7483769 . PMID  32839606. 
  62. ^ Watanabe K, Taskesen E, van Bochoven A, Posthuma D (noviembre de 2017). "Mapeo funcional y anotación de asociaciones genéticas con FUMA". Comunicaciones de la naturaleza . 8 (1): 1826. doi : 10.1038/s41467-017-01261-5 . PMC 5705698 . PMID  29184056. 
  63. ^ Li Z, Li X, Zhou H, Gaynor SM, Selvaraj MS, Arapoglou T, et al. (diciembre de 2022). "Un marco para detectar asociaciones de variantes raras no codificantes de estudios de secuenciación del genoma completo a gran escala". Métodos de la naturaleza . 19 (12): 1599-1611. doi :10.1038/s41592-022-01640-x. PMC 10008172 . PMID  36303018. S2CID  243873361. 
  64. ^ "STAARpipeline: una herramienta todo en uno de variantes raras para datos de secuenciación del genoma completo a escala de biobanco". Métodos de la naturaleza . 19 (12): 1532-1533. Diciembre de 2022. doi :10.1038/s41592-022-01641-w. PMID  36316564. S2CID  253246835.
  65. ^ Li, Xihao; Rápido, Corbin; Zhou, Hufeng; Gaynor, Sheila M.; Liu, Yaowu; Chen, Han; Selvaraj, Margaret Sunitha; Sol, Ryan; Dey, Rounak; Arnett, Donna K.; Bielak, Lawrence F.; Bis, Josué C.; Blangero, Juan; Boerwinkle, Eric; Bowden, Donald W.; Brody, Jennifer A.; Cade, Brian E.; Correa, Adolfo; Cupples, L. Adrienne; Curran, Joanne E.; de Vries, Paul S.; Duggirala, Ravindranath; Freedman, Barry I.; Göring, Harald HH; Guo, Xiuqing; Haessler, Jeffrey; Kalyani, Rita R.; Kooperberg, Charles; Kral, Brian G.; Lange, Leslie A.; Manichaikul, Ani; Martín, Lisa W.; McGarvey, Stephen T.; Mitchell, Braxton D.; Montasser, mayo E.; Morrison, Alanna C.; Naseri, toma; O'Connell, Jeffrey R.; Palmer, Nicholette D.; Peyser, Patricia A.; Psaty, Bruce M.; Raffield, Laura M.; Línea roja, Susan; Reiner, Alejandro P.; Reupeña, Muagututi'a Sefuiva; Arroz, Kenneth M.; Rico, Stephen S.; Sitlani, Colleen M.; Smith, Jennifer A.; Taylor, Kent D.; Vasan, Ramachandran S.; Willer, Cristen J.; Wilson, James G.; Yanek, Lisa R.; Zhao, Wei; Consorcio NHLBI Trans-Omics para Medicina de Precisión (TOPMed); Grupo de Trabajo de Lípidos TOPMed; Rotter, Jerónimo I.; Natarajan, Pradeep; Peloso, Gina M.; Li, Zilin; Lin, Xihong (enero de 2023). "Metanálisis potente, escalable y eficiente en recursos de asociaciones de variantes raras en grandes estudios de secuenciación del genoma completo". Genética de la Naturaleza . 55 (1): 154-164. doi :10.1038/s41588-022-01225-6. PMC 10084891 . PMID  36564505. S2CID  255084231.