Secuenciación de péptidos de novo

En espectrometría de masas , la secuenciación de péptidos de novo es el método en el cual se determina una secuencia de aminoácidos de péptidos a partir de espectrometría de masas en tándem .

Conocer la secuencia de aminoácidos de los péptidos a partir de una digestión de proteínas es esencial para estudiar la función biológica de la proteína. Antiguamente, esto se lograba mediante el procedimiento de degradación de Edman . ^[1] Hoy en día, el análisis mediante un espectrómetro de masas en tándem es un método más común para resolver la secuenciación de péptidos. En general, existen dos enfoques: búsqueda en bases de datos y secuenciación de novo. La búsqueda en bases de datos es una versión simple, ya que se envían los datos del espectro de masas del péptido desconocido y se ejecutan para encontrar una coincidencia con una secuencia de péptidos conocida; se seleccionará el péptido con la puntuación de coincidencia más alta. ^[2] Este enfoque no reconoce péptidos nuevos, ya que solo puede coincidir con secuencias existentes en la base de datos. La secuenciación de novo es una asignación de iones de fragmentos de un espectro de masas. Se utilizan diferentes algoritmos ^[3] para la interpretación y la mayoría de los instrumentos vienen con programas de secuenciación de novo.

Fragmentación de péptidos

Los péptidos se protonan en modo de iones positivos. El protón se ubica inicialmente en el extremo N o en una cadena lateral de residuos básicos, pero debido a la solvatación interna , puede moverse a lo largo de la cadena principal rompiéndose en diferentes sitios, lo que da como resultado diferentes fragmentos. Las reglas de fragmentación están bien explicadas en algunas publicaciones. ^[4]^[5]^[6]^[7]^[8]^[9]

Se pueden romper tres tipos diferentes de enlaces de la cadena principal para formar fragmentos peptídicos: enlace alquilocarbonilo (CHR-CO), enlace amida peptídica (CO-NH) y enlace aminoalquilo (NH-CHR). ^{[ cita requerida ]}

Diferentes tipos de iones fragmento

Cuando los enlaces de la cadena principal se rompen, se forman seis tipos diferentes de iones de secuencia, como se muestra en la figura 1. Los iones de fragmentos cargados en el extremo N se clasifican como a, b o c, mientras que los cargados en el extremo C se clasifican como x, y o z. El subíndice n es el número de residuos de aminoácidos. La nomenclatura fue propuesta por primera vez por Roepstorff y Fohlman, luego Biemann la modificó y esta se convirtió en la versión más aceptada. ^[11]^[12]

Entre estos iones de secuencia, los iones a, b e y son los tipos de iones más comunes, especialmente en los espectrómetros de masas de disociación inducida por colisión (CID) de baja energía, ya que el enlace amida peptídica (CO-NH) es el más vulnerable y la pérdida de CO de los iones b.

Masa de iones b = Σ (masas de residuos) + 1 (H ⁺ )

Masa de iones y = Σ (masas de residuos) + 19 (H ₂ O+H ⁺ )

Masa de iones a = masa de iones b – 28 (CO)

La escisión de la doble cadena produce iones internos, de tipo acilio como H ₂ N-CHR ² -CO-NH-CHR ³ -CO+ o de tipo imonio como H ₂ N-CHR ² -CO-NH ⁺ =CHR ³ . Estos iones suelen ser perturbadores en los espectros.

Iones satélite en la fragmentación de péptidos ^[8]

Se produce una escisión adicional bajo CID de alta energía en la cadena lateral de los residuos C-terminales, formándose iones d _n , v _n , w _{n .}^[8]

Resumen de las reglas de fragmentación

La mayoría de los iones fragmentados son iones b o y. Los iones a también se observan con frecuencia por la pérdida de CO de los iones b. ^[9]

Los iones satélite (iones w _n , v _n , d _n ) se forman mediante CID de alta energía.

Los iones que contienen Ser, Thr, Asp y Glu generan una pérdida molecular neutra de agua (-18).

Los iones que contienen Asn, Gln, Lys y Arg generan una pérdida molecular neutra de amoníaco (-17).

La pérdida neutra de amoníaco de Arg conduce a iones fragmento (y-17) o (b-17) con mayor abundancia que sus iones correspondientes.

Cuando el extremo C tiene un residuo básico, el péptido genera el ion (b _n-1 +18).

En los espectros de iones con cargas múltiples se puede observar un par de iones complementarios. Para este par de iones, la suma de sus subíndices es igual al número total de residuos de aminoácidos en el péptido desconocido.

Si el extremo C es Arg o Lys, se puede encontrar el ion y ₁ en el espectro para demostrarlo.

Métodos para la fragmentación de péptidos

En la disociación inducida por colisión de baja energía (CID), los iones b e y son los principales iones del producto. Además, se observa pérdida de amoníaco (-17 Da) en el fragmento que contiene aminoácidos RKNQ. Se puede observar pérdida de agua (-18 Da) en el fragmento que contiene aminoácidos STED. No se muestran iones satélite en los espectros. ^{[ cita requerida ]}

En la CID de alta energía, se pueden observar todos los diferentes tipos de iones de fragmentos, pero no hay pérdidas de amoníaco o agua. ^{[ cita requerida ]}

En la disociación por transferencia de electrones (ETD) y la disociación por captura de electrones (ECD), los iones predominantes son c, y, z+1, z+2 y, a veces, iones w. ^{[ cita requerida ]}

Para la desintegración posterior a la fuente (PSD) en MALDI , los iones a, b, y son los iones de producto más comunes. ^{[ cita requerida ]}

Los factores que afectan la fragmentación son el estado de carga (cuanto mayor sea el estado de carga, menos energía se necesita para la fragmentación), la masa del péptido (cuanto mayor sea la masa, más energía se requiere), la energía inducida (una mayor energía conduce a una mayor fragmentación), la secuencia primaria de aminoácidos, el modo de disociación y el gas de colisión. ^{[ cita requerida ]}

Pautas para la interpretación

Para la interpretación, ^[14] primero, busque iones de amonio de un solo aminoácido (H ₂ N ⁺ =CHR ² ). Los iones de amonio correspondientes para los aminoácidos se enumeran en la Tabla 1. Ignore algunos picos en el extremo de alta masa del espectro. Son iones que sufren pérdidas de moléculas neutras (H ₂ O, NH ₃ , CO ₂ , HCOOH) de los iones [M+H] ⁺ . Encuentre diferencias de masa a 28 Da ya que los iones b pueden formar iones a por pérdida de CO. Busque iones b ₂ en el extremo de baja masa del espectro, lo que también ayuda a identificar iones y _n-2 . La masa de los iones b ₂ se enumera en la Tabla 2, así como los aminoácidos individuales que tienen la misma masa que los iones b ₂ . ^[15] La masa del ión b ₂ = masa de dos residuos de aminoácidos + 1.

Identificar una serie de iones de secuencia por la misma diferencia de masa, que coincida con una de las masas de los residuos de aminoácidos (ver Tabla 1). Por ejemplo, las diferencias de masa entre a _n y a _n-1 , b _n y b _n-1 , c _n y c _n-1 son las mismas. Identificar el ion y _n-1 en el extremo de alta masa del espectro. Luego continuar identificando los iones y _n-2 , y _n-3 ... haciendo coincidir las diferencias de masa con las masas de los residuos de aminoácidos (ver Tabla 1). Buscar los iones b correspondientes de los iones y identificados. La masa de los iones b+y es la masa del péptido +2 Da. Después de identificar la serie de iones y y la serie de iones b, asignar la secuencia de aminoácidos y verificar la masa. El otro método es identificar primero los iones b y luego encontrar los iones y correspondientes. ^{[ cita requerida ]}

Algoritmos y software

La secuenciación manual de novo es una tarea laboriosa y que requiere mucho tiempo. Por lo general, se aplican algoritmos o programas que vienen con el espectrómetro de masas para la interpretación de los espectros.

Desarrollo de algoritmos de secuenciación de novo.

Un método antiguo consiste en enumerar todos los péptidos posibles para el ion precursor en el espectro de masas y hacer coincidir el espectro de masas de cada candidato con el espectro experimental. El péptido posible que tenga el espectro más similar tendrá la mayor probabilidad de ser la secuencia correcta. Sin embargo, el número de péptidos posibles puede ser grande. Por ejemplo, un péptido precursor con un peso molecular de 774 tiene 21.909.046 péptidos posibles. Aunque se hace en la computadora, lleva mucho tiempo. ^[17]^[18]

Otro método se denomina "subsecuenciación", que en lugar de enumerar la secuencia completa de péptidos posibles, combina secuencias cortas de péptidos que representan solo una parte del péptido completo. Cuando se encuentran secuencias que coinciden en gran medida con los iones del fragmento en el espectro experimental, se extienden por residuos uno por uno para encontrar la mejor coincidencia. ^[19]^[20]^[21]^[22]

En el tercer método, se aplica una representación gráfica de los datos, en la que los iones de fragmentos que tienen las mismas diferencias de masa de un residuo de aminoácido se conectan mediante líneas. De esta manera, es más fácil obtener una imagen clara de las series de iones del mismo tipo. Este método podría ser útil para la secuenciación manual de novo de péptidos, pero no funciona en condiciones de alto rendimiento. ^[23]

El cuarto método, que se considera exitoso, es la teoría de grafos. La aplicación de la teoría de grafos en la secuenciación de péptidos de novo fue mencionada por primera vez por Bartels ^[24] . Los picos del espectro se transforman en vértices en un grafo llamado "grafo espectral". Si dos vértices tienen la misma diferencia de masa de uno o varios aminoácidos, se aplicará un borde dirigido. El algoritmo SeqMS ^{[25] , el algoritmo de Lutefisk}^[26] , el algoritmo de Sherenga ^[27] son algunos ejemplos de este tipo.

Aprendizaje profundo

Más recientemente, se han aplicado técnicas de aprendizaje profundo para resolver el problema de secuenciación de péptidos de novo. El primer avance fue DeepNovo, que adoptó la estructura de red neuronal convolucional, logró importantes mejoras en la precisión de la secuencia y permitió el ensamblaje completo de la secuencia de proteínas sin ayudar a las bases de datos ^[28]. Posteriormente, se han adoptado estructuras de red adicionales, como PointNet (PointNovo ^[29] ), para extraer características de un espectro sin procesar. El problema de secuenciación de péptidos de novo se enmarca entonces como un problema de predicción de secuencia. Dada la secuencia de péptidos parcial previamente predicha, los modelos de secuenciación de péptidos de novo basados en redes neuronales generarán repetidamente el siguiente aminoácido más probable hasta que la masa del péptido predicho coincida con la masa del precursor. En el momento de la inferencia, se pueden adoptar estrategias de búsqueda como la búsqueda de haz para explorar un espacio de búsqueda más grande mientras se mantiene bajo el costo computacional. En comparación con los métodos anteriores, los modelos basados en redes neuronales han demostrado una precisión y sensibilidad significativamente mejores. ^[28]^[29]^[30] Además, con un diseño de modelo cuidadoso, los algoritmos de secuenciación de péptidos de novo basados en aprendizaje profundo también pueden ser lo suficientemente rápidos para lograr una secuenciación de péptidos de novo en tiempo real. ^[29] El software PEAKS incorpora este aprendizaje de redes neuronales en sus algoritmos de secuenciación de novo.

Paquetes de software

Como describieron Andreotti et al. en 2012, ^[31] Antilope es una combinación de relajación lagrangiana y una adaptación de los k caminos más cortos de Yen. Se basa en el método de "gráfico de espectro" y contiene diferentes funciones de puntuación, y puede compararse en tiempo de ejecución y precisión con "los populares programas de última generación " PepNovo y NovoHMM.

Grossmann et al. ^[32] presentaron AUDENS en 2005 como una herramienta automatizada de secuenciación de péptidos de novo que contiene un módulo de preprocesamiento que puede reconocer picos de señal y picos de ruido.

Lutefisk puede resolver la secuenciación de novo a partir de espectros de masas CID. En este algoritmo, primero se encuentran los iones significativos y luego se determina la lista de evidencias N- y C-terminales. Con base en la lista de secuencias, genera secuencias completas en espectros y las puntúa con el espectro experimental. Sin embargo, el resultado puede incluir varias secuencias candidatas que tienen solo una pequeña diferencia, por lo que es difícil encontrar la secuencia de péptidos correcta. Se puede aplicar un segundo programa, CIDentify, que es una versión modificada por Alex Taylor del algoritmo FASTA de Bill Pearson, para distinguir esos candidatos similares inciertos. ^{[ cita requerida ]}

Mo et al. presentaron el algoritmo MSNovo en 2007 y demostraron que funcionaba "mejor que las herramientas de novo existentes en múltiples conjuntos de datos". ^[33] Este algoritmo puede realizar una interpretación de secuenciación de novo de espectrómetros de masas LCQ y LTQ y de iones con carga simple, doble y triple. A diferencia de otros algoritmos, aplica una función de puntuación novedosa y utiliza una matriz de masas en lugar de un gráfico de espectro.

Fisher et al. ^[34] propusieron el método NovoHMM de secuenciación de novo. Se aplica un modelo oculto de Markov (HMM) como una nueva forma de resolver la secuenciación de novo en un marco bayesiano. En lugar de puntuar símbolos individuales de la secuencia, este método considera probabilidades posteriores para aminoácidos. En el artículo, se demuestra que este método tiene un mejor rendimiento que otros métodos populares de secuenciación de péptidos de novo como PepNovo mediante una gran cantidad de espectros de ejemplo.

PEAKS es un paquete de software completo para la interpretación de espectros de masas de péptidos. Contiene secuenciación de novo, búsqueda en bases de datos, identificación de PTM, búsqueda de homología y cuantificación en análisis de datos. Ma et al. describieron un nuevo modelo y algoritmo para la secuenciación de novo en PEAKS, y compararon el rendimiento con Lutefisk de varios péptidos tripsídicos de proteínas estándar, mediante el espectrómetro de masas de tiempo de vuelo cuadrupolo (Q-TOF). ^[35]

PepNovo es una herramienta de secuenciación de péptidos de novo de alto rendimiento que utiliza una red probabilística como método de puntuación. Por lo general, la interpretación de un espectro demora menos de 0,2 segundos. Descrito por Frank et al. , PepNovo funciona mejor que varios algoritmos populares como Sherenga, PEAKS y Lutefisk. ^[36] Ahora está disponible una nueva versión de PepNovo+.

Chi et al. presentaron pNovo+ en 2013 como una nueva herramienta de secuenciación de péptidos de novo mediante el uso de espectros de masas en tándem HCD y ETD complementarios. ^[37] En este método, un algoritmo de componentes, pDAG, acelera en gran medida el tiempo de adquisición de la secuenciación de péptidos a 0,018 s en promedio, que es tres veces más rápido que el otro software de secuenciación de novo popular.

Como lo describen Jeong et al. , en comparación con otras herramientas de secuenciación de péptidos do novo, que funcionan bien solo en ciertos tipos de espectros, UniNovo es una herramienta más universal que tiene un buen desempeño en varios tipos de espectros o pares espectrales como CID, ETD, HCD, CID/ETD, etc. Tiene una mejor precisión que PepNovo+ o PEAKS. Además, genera la tasa de error de las secuencias de péptidos informadas. ^[38]

Ma publicó Novor en 2015 como un motor de secuenciación de péptidos de novo en tiempo real. Se busca que la herramienta mejore la velocidad de novo en un orden de magnitud y mantenga una precisión similar a la de otras herramientas de novo del mercado. En una computadora portátil Macbook Pro, Novor ha logrado más de 300 espectros MS/MS por segundo. ^[39]

Pevtsov et al. compararon el rendimiento de los cinco algoritmos de secuenciación de novo anteriores: AUDENS, Lutefisk, NovoHMM, PepNovo y PEAKS. En el análisis se emplearon datos de espectrómetros de masas QSTAR y LCQ, y se evaluaron mediante el valor de distancia relativa a la secuencia (RSD), que era la similitud entre la secuenciación de péptidos de novo y la secuencia de péptidos verdadera calculada mediante un método de programación dinámica. Los resultados mostraron que todos los algoritmos tuvieron un mejor rendimiento en los datos QSTAR que en los datos LCQ, mientras que PEAKS, como el mejor, tuvo una tasa de éxito del 49,7 % en los datos QSTAR, y NovoHMM, como el mejor, tuvo una tasa de éxito del 18,3 % en los datos LCQ. El orden de rendimiento en los datos QSTAR fue PEAKS > Lutefisk, PepNovo > AUDENS, NovoHMM, y en los datos LCQ fue NovoHMM > PepNovo, PEAKS > Lutefisk > AUDENS. Comparados en un rango de calidad de espectro, PEAKS y NovoHMM también mostraron el mejor desempeño en ambos datos entre los 5 algoritmos. PEAKS y NovoHMM también tuvieron la mejor sensibilidad en los datos de QSTAR y LCQ. Sin embargo, ninguno de los algoritmos evaluados superó el 50% de identificación exacta para ambos conjuntos de datos. ^[40]

Los recientes avances en los espectrómetros de masas han hecho posible generar espectros de masas de resolución ultraalta [1]. La precisión mejorada, junto con la mayor cantidad de datos de espectrometría de masas que se están generando, atrae el interés de aplicar técnicas de aprendizaje profundo a la secuenciación de péptidos de novo. En 2017, Tran et al. propusieron DeepNovo, el primer software de secuenciación de novo basado en aprendizaje profundo. El análisis de referencia en la publicación original demostró que DeepNovo superó a los métodos anteriores, incluidos PEAKS, Novor y PepNovo, por un margen significativo. DeepNovo se implementa en Python con el marco Tensorflow. ^[41] Para representar un espectro de masas como una entrada de dimensión fija a la red neuronal, DeepNovo discretizó cada espectro en un vector de longitud 150.000. Esta representación de espectro innecesariamente grande y el uso de CPU de un solo subproceso en la implementación original evitan que DeepNovo realice la secuenciación de péptidos en tiempo real. Para mejorar aún más la eficiencia de los modelos de secuenciación de péptidos de novo, Qiao et al. PointNovo se propuso en 2020. PointNovo es un software de Python implementado con el marco PyTorch ^[42] y elimina la representación de espectro-vector que consume espacio adoptada por DeepNovo. En comparación con DeepNovo, PointNovo logró lograr una mejor precisión y eficiencia al mismo tiempo al representar directamente un espectro como un conjunto de pares m/z e intensidad. ^{[ cita requerida ]}

Referencias

^ Edman, P.; Begg, G. (marzo de 1967). "Un secuenciador de proteínas". Revista Europea de Bioquímica . 1 (1): 80–91. doi : 10.1111/j.1432-1033.1967.tb00047.x . PMID 6059350.
^ Webb-Robertson, B.-JM; Cannon, WR (20 de junio de 2007). "Tendencias actuales en inferencia computacional a partir de proteómica basada en espectrometría de masas". Briefings in Bioinformatics . 8 (5): 304–317. doi : 10.1093/bib/bbm023 . PMID 17584764.
^ Lu, Bingwen; Chen, Ting (marzo de 2004). "Algoritmos para la secuenciación de péptidos de novo mediante espectrometría de masas en tándem". Drug Discovery Today: BIOSILICO . 2 (2): 85–90. doi :10.1016/S1741-8364(04)02387-X.
^ ab Papayannopoulos, Ioannis A. (enero de 1995). "La interpretación de los espectros de masas en tándem de disociación inducida por colisión de péptidos". Mass Spectrometry Reviews . 14 (1): 49–73. Bibcode :1995MSRv...14...49P. doi :10.1002/mas.1280140104.
^ Dass, Chhabil; Desiderio, Dominic M. (mayo de 1987). "Análisis de péptidos opioides mediante espectrometría de masas por bombardeo atómico rápido". Analytical Biochemistry . 163 (1): 52–66. doi :10.1016/0003-2697(87)90092-3. PMID 2887130.
^ Yalcin, Talat; Csizmadia, Imre G.; Peterson, Michael R.; Harrison, Alex G. (marzo de 1996). "La estructura y fragmentación de iones B n (n≥3) en espectros de péptidos". Revista de la Sociedad Americana de Espectrometría de Masas . 7 (3): 233–242. doi : 10.1016/1044-0305(95)00677-X . PMID 24203294.
^ Tang, Xue-Jun; Boyd, Robert K.; Bertrand, MJ (noviembre de 1992). "Una investigación de los mecanismos de fragmentación de péptidos tripsíticos doblemente protonados". Comunicaciones rápidas en espectrometría de masas . 6 (11): 651–657. Bibcode :1992RCMS....6..651T. doi :10.1002/rcm.1290061105. PMID 1467549.
^ abc Johnson, Richard S.; Martin, Stephen A.; Biemann, Klaus (diciembre de 1988). "Fragmentación inducida por colisión de iones (M + H)+ de péptidos. Iones de secuencia específica de cadena lateral". Revista internacional de espectrometría de masas y procesos iónicos . 86 : 137–154. Código Bibliográfico :1988IJMSI..86..137J. doi :10.1016/0168-1176(88)80060-0.
^ ab Dass, Chhabil (2007). Fundamentos de la espectrometría de masas contemporánea ([Online-Ausg.]. Ed.). Hoboken, Nueva Jersey: Wiley-Interscience. págs. 317–322. doi :10.1002/0470118490. ISBN 9780470118498.
^ Dass, Chhabil (2001). Principios y práctica de la espectrometría de masas biológica . Nueva York, NY [ua]: Wiley. ISBN 978-0-471-33053-0.
^ Roepstorff, P; Fohlman, J (noviembre de 1984). "Propuesta de una nomenclatura común para iones de secuencia en espectros de masas de péptidos". Espectrometría de masas biomédica . 11 (11): 601. doi :10.1002/bms.1200111109. PMID 6525415.
^ McCloskey, James A., ed. (1990). Espectrometría de masas . San Diego: Academic Press. págs. 886–887. ISBN. 978-0121820947.
^ Falick, AM; Hines, WM; Medzihradszky, KF; Baldwin, MA; Gibson, BW (noviembre de 1993). "Iones de baja masa producidos a partir de péptidos mediante disociación inducida por colisión de alta energía en espectrometría de masas en tándem". Journal of the American Society for Mass Spectrometry . 4 (11): 882–893. doi : 10.1016/1044-0305(93)87006-X . PMID 24227532.
^ Dass, Chhabil (2007). Fundamentos de la espectrometría de masas contemporánea ([Online-Ausg.]. Ed.). Hoboken, Nueva Jersey: Wiley-Interscience. págs. 327–330. ISBN 9780470118498.
^ Harrison, Alex G.; Csizmadia, Imre G.; Tang, Ting-Hua (mayo de 2000). "Estructura y fragmentación de iones b ₂ en espectros de masas de péptidos". Revista de la Sociedad Americana de Espectrometría de Masas . 11 (5): 427–436. doi :10.1016/S1044-0305(00)00104-5. PMID 10790847. S2CID 24794690.
^ Dass, Chhabil (2007). Fundamentos de la espectrometría de masas contemporánea ([Online-Ausg.]. Ed.). Hoboken, Nueva Jersey: Wiley-Interscience. pag. 329.ISBN 9780470118498.
^ Sakurai, T.; Matsuo, T.; Matsuda, H.; Katakuse, I. (agosto de 1984). "PAAS 3: Un programa informático para determinar la secuencia probable de péptidos a partir de datos espectrométricos de masas". Espectrometría de masas biológica . 11 (8): 396–399. doi :10.1002/bms.1200110806.
^ Hamm, CW; Wilson, WE; Harvan, DJ (1986). "Programa de secuenciación de péptidos". Bioinformática . 2 (2): 115–118. doi :10.1093/bioinformatics/2.2.115. PMID 3450361.
^ Biemann, K; Cone, C; Webster, BR; Arsenault, GP (5 de diciembre de 1966). "Determinación de la secuencia de aminoácidos en oligopéptidos mediante interpretación por ordenador de sus espectros de masas de alta resolución". Journal of the American Chemical Society . 88 (23): 5598–606. doi :10.1021/ja00975a045. PMID 5980176.
^ Ishikawa, K.; Niwa, Y. (julio de 1986). "Secuenciación de péptidos asistida por computadora mediante espectrometría de masas de bombardeo atómico rápido". Espectrometría de masas biológica . 13 (7): 373–380. doi :10.1002/bms.1200130709.
^ Siegel, MM; Bauman, N (15 de marzo de 1988). "Un algoritmo eficiente para la secuenciación de péptidos utilizando datos espectrales de masas de bombardeo de átomos rápidos". Espectrometría de masas biomédica y ambiental . 15 (6): 333–43. doi :10.1002/bms.1200150606. PMID 2967723.
^ Johnson, RS; Biemann, K (noviembre de 1989). "Programa informático (SEQPEP) para ayudar en la interpretación de espectros de masas en tándem de colisión de alta energía de péptidos". Espectrometría de masas biomédica y ambiental . 18 (11): 945–57. doi :10.1002/bms.1200181102. PMID 2620156.
^ Scoble, Hubert A.; Biller, James E.; Biemann, Klaus (1987). "Una estrategia orientada a la visualización de gráficos para la secuenciación de aminoácidos de péptidos mediante espectrometría de masas en tándem". Zeitschrift für Analytische Chemie de Fresenius . 327 (2): 239–245. doi :10.1007/BF00469824. S2CID 97665981.
^ Bartels, Christian (junio de 1990). "Algoritmo rápido para la secuenciación de péptidos mediante espectroscopia de masas". Espectrometría de masas biológica . 19 (6): 363–368. doi :10.1002/bms.1200190607. PMID 24730078.
^ Fernández-de-Cossío, J; Gonzalez, J; Besada, V (agosto de 1995). "Un programa informático para ayudar a la secuenciación de péptidos en experimentos de descomposición activada por colisión". Aplicaciones informáticas en las biociencias . 11 (4): 427–34. doi :10.1093/bioinformatics/11.4.427. PMID 8521052.
^ Taylor, JA; Johnson, RS (1997). "Búsquedas en bases de datos de secuencias mediante secuenciación de péptidos de novo por espectrometría de masas en tándem". Rapid Communications in Mass Spectrometry . 11 (9): 1067–75. Bibcode :1997RCMS...11.1067T. doi :10.1002/(sici)1097-0231(19970615)11:9<1067::aid-rcm953>3.0.co;2-l. PMID 9204580.
^ Dančík, Vlado; Addona, Theresa A.; Clauser, Karl R.; Vath, James E.; Pevzner, Pavel A. (octubre de 1999). "Secuenciación de péptidos mediante espectrometría de masas en tándem". Revista de biología computacional . 6 (3–4): 327–342. CiteSeerX 10.1.1.128.2645 . doi :10.1089/106652799318300. PMID 10582570.
^ ab Tran, Ngoc Hieu, et al. "Secuenciación de péptidos de novo mediante aprendizaje profundo". Actas de la Academia Nacional de Ciencias 114.31 (2017): 8247-8252.
^ abc Qiao, Rui, et al. "Secuenciación de péptidos de novo independiente de la resolución del instrumento computacionalmente para dispositivos de alta resolución". Nature Machine Intelligence 3.5 (2021): 420-425.
^ Karunratanakul, Korrawe, et al. "Descubrimiento de miles de nuevos péptidos con un marco de secuenciación de péptidos híbrido de novo con búsqueda de máscara de secuencia". Molecular & Cellular Proteomics 18.12 (2019): 2478-2491.
^ Andreotti, S; Klau, GW; Reinert, K (2012). "Antilope: un enfoque de relajación lagrangiana para el problema de secuenciación de péptidos de novo". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 9 (2): 385–94. arXiv : 1102.4016 . doi :10.1109/tcbb.2011.59. PMID 21464512. S2CID 593303.
^ Grossmann, J; Roos, FF; Cieliebak, M; Lipták, Z; Mathis, LK; Müller, M; Gruissem, W; Baginsky, S (2005). "AUDENS: una herramienta para la secuenciación automatizada de novo de péptidos". Revista de investigación del proteoma . 4 (5): 1768–74. CiteSeerX 10.1.1.654.169 . doi :10.1021/pr050070a. PMID 16212431.
^ Mo, L; Dutta, D; Wan, Y; Chen, T (1 de julio de 2007). "MSNovo: un algoritmo de programación dinámica para la secuenciación de péptidos de novo mediante espectrometría de masas en tándem". Química analítica . 79 (13): 4870–8. doi :10.1021/ac070039n. PMID 17550227.
^ Fischer, B; Roth, V; Roos, F; Grossmann, J; Baginsky, S; Widmayer, P; Gruissem, W; Buhmann, JM (15 de noviembre de 2005). "NovoHMM: un modelo oculto de Markov para la secuenciación de péptidos de novo". Química Analítica . 77 (22): 7265–73. CiteSeerX 10.1.1.507.1610 . doi :10.1021/ac0508853. PMID 16285674.
^ Ma, Bin; Zhang, Kaizhong; Hendrie, Christopher; Liang, Chengzhi; Li, Ming; Doherty-Kirby, Amanda; Lajoie, Gilles (30 de octubre de 2003). "PEAKS: potente software para la secuenciación de péptidos de novo mediante espectrometría de masas en tándem". Comunicaciones rápidas en espectrometría de masas . 17 (20): 2337–2342. Bibcode :2003RCMS...17.2337M. doi :10.1002/rcm.1196. PMID 14558135.
^ Frank, A; Pevzner, P (15 de febrero de 2005). "PepNovo: secuenciación de péptidos de novo mediante modelado de redes probabilísticas". Química analítica . 77 (4): 964–73. doi :10.1021/ac048788h. PMID 15858974.
^ Chi, H; Chen, H; He, K; Wu, L; Yang, B; Sun, RX; Liu, J; Zeng, WF; Song, CQ; He, SM; Dong, MQ (1 de febrero de 2013). "pNovo+: secuenciación de péptidos de novo utilizando espectros de masas en tándem HCD y ETD complementarios". Journal of Proteome Research . 12 (2): 615–25. doi :10.1021/pr3006843. PMID 23272783.
^ Jeong, K; Kim, S; Pevzner, PA (15 de agosto de 2013). "UniNovo: una herramienta universal para la secuenciación de péptidos de novo". Bioinformática . 29 (16): 1953–62. doi :10.1093/bioinformatics/btt338. PMC 3722526 . PMID 23766417.
^ Ma, Bin (30 de junio de 2015). "Novor: software de secuenciación de novo de péptidos en tiempo real". Revista de la Sociedad Estadounidense de Espectrometría de Masas . 26 (11): 1885–1894. Bibcode :2015JASMS..26.1885M. doi :10.1007/s13361-015-1204-0. PMC 4604512 . PMID 26122521.
^ Pevtsov, S.; Fedulova, I.; Mirzaei, H.; Buck, C.; Zhang, X. (2006). "Evaluación del rendimiento de los algoritmos de secuenciación de novo existentes". Journal of Proteome Research . 5 (11): 3018–3028. doi :10.1021/pr060222h. PMID 17081053.
^ Abadi, Martín, et al. "Tensorflow: Un sistema para aprendizaje automático a gran escala". 12º Simposio de USENIX sobre diseño e implementación de sistemas operativos ({OSDI} 16). 2016.
^ Adam, et al. "Pytorch: una biblioteca de aprendizaje profundo de alto rendimiento y estilo imperativo". Avances en sistemas de procesamiento de información neuronal 32 (2019): 8026-8037.