stringtranslate.com

Descubrimiento bioinformático de ARN no codificantes

Los ARN no codificantes se han descubierto utilizando métodos experimentales y bioinformáticos . Los métodos bioinformáticos se pueden dividir en tres categorías principales. La primera implica la búsqueda de homología, aunque estas técnicas, por definición, no pueden encontrar nuevas clases de ARNnc. La segunda categoría incluye algoritmos diseñados para descubrir tipos específicos de ARNnc que tienen propiedades similares. Por último, algunos métodos de descubrimiento se basan en propiedades muy generales del ARN y, por lo tanto, pueden descubrir tipos completamente nuevos de ARNnc.

Descubrimiento por búsqueda de homología

La búsqueda de homología se refiere al proceso de búsqueda en una base de datos de secuencias de ARN que sean similares a secuencias de ARN ya conocidas. Se puede utilizar cualquier algoritmo diseñado para la búsqueda de homología de secuencias de ácidos nucleicos, por ejemplo, BLAST . [1] Sin embargo, dichos algoritmos normalmente no son tan sensibles o precisos como los algoritmos diseñados específicamente para el ARN.

De particular importancia para el ARN es la conservación de una estructura secundaria , que puede modelarse para lograr una precisión adicional en las búsquedas. Por ejemplo, los modelos de covarianza [2] pueden considerarse como una extensión de un modelo de perfil oculto de Markov que también refleja una estructura secundaria conservada. Los modelos de covarianza se implementan en el paquete de software Infernal. [3]

Descubrimiento de tipos específicos de ncRNA

Algunos tipos de ARN tienen propiedades compartidas que los algoritmos pueden aprovechar. Por ejemplo, tRNAscan-SE [4] está especializado en encontrar ARNt . El núcleo de este programa es una búsqueda de homología de ARNt basada en modelos de covarianza, pero se utilizan otros programas de búsqueda específicos de ARNt para acelerar las búsquedas.

Las propiedades de los snoRNA han permitido el desarrollo de programas para detectar nuevos ejemplos de snoRNA, incluidos aquellos que podrían estar relacionados sólo lejanamente con ejemplos previamente conocidos. Los programas informáticos que implementan estos enfoques incluyen snoscan [5] y snoReport [6] .

De manera similar, se han desarrollado varios algoritmos para detectar microARN . Algunos ejemplos incluyen miRNAFold [7] y miRNAminer [8] .

Descubrimiento por propiedades generales

Algunas propiedades son compartidas por múltiples clases no relacionadas de ARNnc, y estas propiedades pueden ser utilizadas para descubrir nuevas clases. La principal de ellas es la conservación de una estructura secundaria de ARN. Para medir la conservación de la estructura secundaria, es necesario encontrar de alguna manera secuencias homólogas que puedan exhibir una estructura común. Las estrategias para hacer esto han incluido el uso de BLAST entre dos secuencias [9] o múltiples secuencias, [10] la explotación de la sintenia a través de genes ortólogos [11] [12] o el uso de hash sensible a la localidad en combinación con características estructurales y de secuencia. [13]

Las mutaciones que cambian la secuencia de nucleótidos , pero preservan la estructura secundaria se denominan covariación y pueden proporcionar evidencia de conservación. Se pueden utilizar otras estadísticas y modelos probabilísticos para medir dicha conservación. El primer método de descubrimiento de ncRNA que utilizó la conservación estructural fue QRNA, [9] que comparó las probabilidades de una alineación de dos secuencias basándose en un modelo de ARN o un modelo en el que solo se conservaba la secuencia primaria. El trabajo en esta dirección ha permitido más de dos secuencias e incluyó modelos filogenéticos, por ejemplo, con EvoFold. [14] Un enfoque adoptado en RNAz [15] implicó calcular estadísticas sobre una alineación de secuencias múltiples de entrada. Algunas de estas estadísticas se relacionan con la conservación estructural, mientras que otras miden propiedades generales de la alineación que podrían afectar los rangos esperados de las estadísticas estructurales. Estas estadísticas se combinaron utilizando una máquina de vectores de soporte .

Otras propiedades incluyen la aparición de un promotor para transcribir el ARN. Los ncRNA también suelen ir seguidos de un terminador de transcripción independiente de Rho .

Utilizando una combinación de estos enfoques, varios estudios han enumerado ARN candidatos, por ejemplo, [9] [12] Algunos estudios han procedido al análisis manual de las predicciones para encontrar una predicción estructural y funcional detallada. [11] [16] [17]

Véase también

Referencias

  1. ^ Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda en bases de datos de proteínas". Nucleic Acids Res . 25 (17): 3389–3402. doi :10.1093/nar/25.17.3389. PMC  146917 . PMID  9254694.
  2. ^ Eddy SR, Durbin R (junio de 1994). "Análisis de secuencias de ARN utilizando modelos de covarianza". Nucleic Acids Res . 22 (11): 2079–2088. doi :10.1093/nar/22.11.2079. PMC 308124 . PMID  8029015. 
  3. ^ Nawrocki EP, Eddy SR (noviembre de 2013). "Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas". Bioinformática . 29 (22): 2933–2935. doi :10.1093/bioinformatics/btt509. PMC 3810854 . PMID  24008419. 
  4. ^ Lowe TM, Eddy SR (marzo de 1997). "tRNAscan-SE: un programa para la detección mejorada de genes de ARN de transferencia en secuencia genómica". Nucleic Acids Res . 25 (5): 955–964. doi :10.1093/nar/25.5.955. PMC 146525 . PMID  9023104. 
  5. ^ Lowe TM, Eddy SR (febrero de 1999). "Un análisis computacional de los snoRNA guía de metilación en levadura". Science . 283 (5405): 1168–1171. Bibcode :1999Sci...283.1168L. doi :10.1126/science.283.5405.1168. PMID  10024243. S2CID  8084145.
  6. ^ Hertel J, Hofacker IL, Stadler PF (enero de 2008). "SnoReport: identificación computacional de snoRNAs con objetivos desconocidos". Bioinformática . 24 (2): 158–164. doi : 10.1093/bioinformatics/btm464 . PMID  17895272.
  7. ^ Tempel S, Tahi F (2012). "Un método ab-initio rápido para predecir precursores de miRNA en genomas". Nucleic Acids Res . 40 (11): 955–964. doi :10.1093/nar/gks146. PMC 3367186 . PMID  22362754. 
  8. ^ Artzi S, Kiezun A, Shomron N (2008). "miRNAminer: una herramienta para la búsqueda de genes de microARN homólogos". BMC Bioinformatics . 9 (1): 39. doi : 10.1186/1471-2105-9-39 . PMC 2258288 . PMID  18215311. 
  9. ^ abc Rivas E, Eddy SR (2001). "Detección de genes de ARN no codificante mediante análisis de secuencias comparativas". BMC Bioinformatics . 2 : 8. doi : 10.1186/1471-2105-2-8 . PMC 64605 . PMID  11801179. 
  10. ^ Tseng HH, Weinberg Z, Gore J, Breaker RR, Ruzzo WL (abril de 2009). "Encontrar ARN no codificantes mediante agrupamiento a escala del genoma". J Bioinform Comput Biol . 7 (2): 373–388. doi :10.1142/s0219720009004126. PMC 3417115 . PMID  19340921. 
  11. ^ ab Weinberg Z, Barrick JE, Yao Z, Roth A, Kim JN, Gore J, Wang JX, Lee ER, Block KF, Sudarsan N, Neph S, Tompa M, Ruzzo WL, Breaker RR (2007). "Identificación de 22 ARN estructurados candidatos en bacterias utilizando el proceso de genómica comparativa CMfinder". Nucleic Acids Res . 35 (14): 4809–4819. doi :10.1093/nar/gkm487. PMC 1950547. PMID  17621584. 
  12. ^ ab Hammond MC, Wachter A, Breaker RR (mayo de 2009). "Un imitador del ARN ribosomal 5S de plantas regula el empalme alternativo de los pre-ARNm del factor de transcripción IIIA". Nat. Struct. Mol. Biol . 16 (5): 541–549. doi :10.1038/nsmb.1588. PMC 2680232. PMID  19377483 . 
  13. ^ Heyne S, Costa F, Rose D, Backofen R (junio de 2012). "GraphClust: agrupamiento estructural sin alineamiento de estructuras secundarias de ARN local". Bioinformática . 28 (12): i224–32. doi :10.1093/bioinformatics/bts224. PMC 3371856 . PMID  22689765. 
  14. ^ Pedersen JS, Bejerano G, Siepel A, Rosenbloom K, Lindblad-Toh K, Lander ES, Kent J, Miller W, Haussler D (abril de 2006). "Identificación y clasificación de estructuras secundarias de ARN conservadas en el genoma humano". PLOS Comput. Biol . 2 (4): e33. Bibcode :2006PLSCB...2...33P. doi : 10.1371/journal.pcbi.0020033 . PMC 1440920 . PMID  16628248. 
  15. ^ Washietl S, Hofacker IL, Stadler PF (febrero de 2005). "Predicción rápida y confiable de ARN no codificantes". Proc. Natl. Acad. Sci. USA . 102 (7): 2454–2459. doi : 10.1073/pnas.0409169102 . PMC 548974. PMID  15665081 . 
  16. ^ Weinberg Z, Wang JX, Bogue J, Yang J, Corbino K, Moy RH, Breaker RR (2010). "La genómica comparativa revela 104 ARN estructurados candidatos de bacterias, arqueas y sus metagenomas". Genome Biol . 11 (3): R31. doi : 10.1186/gb-2010-11-3-r31 . PMC 2864571. PMID  20230605 . 
  17. ^ Weinberg Z, Lünse CE, Corbino KA, Ames TD, Nelson JW, Roth A, Perkins KR, Sherlock ME, Breaker RR (octubre de 2017). "Detección de 224 ARN estructurados candidatos mediante análisis comparativo de subconjuntos específicos de regiones intergénicas". Nucleic Acids Res . 45 (18): 10811–10823. doi :10.1093/nar/gkx699. PMC 5737381 . PMID  28977401.