stringtranslate.com

Base de datos de identificaciones proteómicas

PRIDE ( base de datos de identificación de proteínas ) es un repositorio público de datos proteómicos basados ​​en espectrometría de masas , y es mantenido por el Instituto Europeo de Bioinformática como parte del Equipo de Proteómica. [1]

PRIDE fue diseñado originalmente por Lennart Martens en 2003 durante una estancia en el Instituto Europeo de Bioinformática como becario Marie Curie de la Comisión Europea en el Programa "Calidad de Vida" (número de contrato: QLRI-1999-50595), y se estableció como un servicio de producción en 2005. [2] El documento de solicitud de subvención original de junio de 2013 para iniciar la construcción de PRIDE se ha publicado desde entonces en un artículo de opinión. [3] [4] Se han creado varias bases de datos proteómicas similares, incluidas GPMDB, PeptideAtlas , Proteinpedia y NCBI Peptidome. [1]

La base de datos PRIDE constituye un repositorio de datos estructurado y almacena los datos experimentales originales de los investigadores sin control editorial sobre los datos enviados.

En total, PRIDE contiene datos de alrededor de 60 especies, la mayor parte de las cuales provienen de muestras humanas (incluidos los datos de los dos borradores de proteomas humanos [5] [6] ), seguidos por la mosca de la fruta Drosophila melanogaster y el ratón. [1]

Formatos y proceso de envío

Dado que actualmente no es posible extraer datos proteómicos detallados de la literatura existente, la fuente de los datos PRIDE son únicamente los envíos de investigadores académicos.

PRIDE es un repositorio público que cumple con los estándares, lo que significa que su propio formato de intercambio de datos basado en XML para presentaciones, PRIDE XML, se creó en torno al estándar mzData de la Proteomics Standards Initiative para espectrometría de masas . Recientemente, PRIDE se ha adaptado para funcionar con los estándares modernos mzML [7] y mzIdentML [8] de la Proteomics Standards Initiative . [9] Se puede utilizar un formato adicional, denominado mzTab, como una forma simplificada de enviar datos proteómicos cuantitativos. [10]

Como actualmente hay muchos tipos de instrumentos de espectrometría de masas diferentes y formatos de software en el mercado, los científicos de laboratorio húmedo sin una sólida formación en bioinformática o soporte informático tenían problemas para convertir sus datos a PRIDE XML. El desarrollo de PRIDE Converter ayudó a abordar esta situación. [11] PRIDE Converter es una herramienta, escrita en el lenguaje de programación Java , que convierte 15 formatos diferentes de datos de espectrometría de masas de entrada en PRIDE XML a través de una interfaz gráfica de usuario tipo asistente. Está disponible de forma gratuita y es de código abierto bajo la licencia permisiva Apache . En 2012 se lanzó una nueva versión de PRIDE Converter como PRIDE Converter 2. [12] Esta nueva versión constituyó una reescritura completa, centrada en la fácil adaptabilidad a diferentes (y en evolución) fuentes de datos.

Navegación, búsqueda y minería de datos PRIDE

Actualmente, los datos pueden consultarse desde PRIDE a través de la interfaz web de PRIDE, mediante el cliente Java independiente PRIDE Inspector, [13] o acoplados directamente a varios motores de búsqueda a través de PeptideShaker. [14] Además, una nueva API RESTful permite un acceso programático conveniente al archivo PRIDE. [15]

El uso extensivo de vocabularios controlados (CV) y ontologías para la anotación flexible pero sensible al contexto de datos, junto con la capacidad de realizar consultas inteligentes mediante estas anotaciones, son características clave de PRIDE. [16]

Participación en ProteomeXchange

El consorcio ProteomeXchange se ha creado para proporcionar una presentación coordinada de datos de proteómica de EM a los principales repositorios de proteómica existentes y para fomentar la difusión óptima de los datos. [17] El consorcio contiene varias bases de datos miembros, incluidas PRIDE y PeptideAtlas . La primera concepción de ProteomeXchange surge de una reunión en la conferencia HUPO 2005 en Munich, [18] donde los principales repositorios de datos de proteómica en ese momento acordaron en principio intercambiar sus datos y, de este modo, proporcionar un medio para que el usuario encuentre datos de proteómica públicos en cualquiera de las bases de datos participantes. Debido al rápido desarrollo del campo y la necesidad de desarrollar primero estándares adecuados para el intercambio de datos, pasaron casi diez años desde esa reunión para implementar realmente este sistema, un esfuerzo que fue financiado por la subvención de la Acción de Coordinación 'ProteomeXchange' del Séptimo Programa Marco de la Comisión Europea. [19]

Recuperación de datos tras la discontinuación de Peptidome

La base de datos Peptidome del NCBI se suspendió en 2011, pero un esfuerzo conjunto de los equipos PRIDE y Peptidome dio como resultado la transferencia de todos los datos de Peptidome a PRIDE. [20] [21] [22]

Referencias

  1. ^ abc Vizcaíno, JA; Côté, R; Reisinger, F; Barsnes, H; Foster, JM; Rameseder, J; Hermjakob, H; Martens, L (2010). "Base de datos de identificaciones proteómicas: actualización de 2010". Nucleic Acids Res . 38 (Base de datos): D736–42. doi :10.1093/nar/gkp964. PMC  2808904 . PMID  19906717.
  2. ^ Martas, L; Hermjakob, H; Jones, P; Adamski, M; Taylor, C; Estados, D; Gevaert, K; Vandekerckhove, J; Apweiler, R (agosto de 2005). "PRIDE: La base de datos de PRoteomics IDEntifications". Proteómica . 5 (13): 3537–45. doi : 10.1002/pmic.200401303 . PMID  16041671. S2CID  28998489.
  3. ^ "Solicitud de formación en el sitio de formación Marie Curie del EMBL-EBI de la UE" (PDF) .
  4. ^ Martens, Lennart (marzo de 2016). "Datos públicos de proteómica: cómo el campo ha evolucionado desde la investigación escéptica hasta la promesa de la proteómica in silico". EuPA Open Proteomics . 11 : 42–44. doi :10.1016/j.euprot.2016.02.005. PMC 5988554 . PMID  29900110. 
  5. ^ Guillermo, M; Schlegl, J; Hahne, H; Moghaddas Gholami, A; Lieberenz, M; Savitski, MM; Ziegler, E; Butzmann, L; Gessulat, S; Marx, H; Mathieson, T; Lemeer, S; Schnatbaum, K; Reimer, U; Wenschuh, H; Mollenhauer, M; Slotta-Huspenina, J; Boese, JH; Bantscheff, M; Gerstmair, A; Faerber, F; Kuster, B (29 de mayo de 2014). "Borrador del proteoma humano basado en espectrometría de masas". Naturaleza . 509 (7502): 582–7. Código Bib :2014Natur.509..582W. doi : 10.1038/naturaleza13319. Número de modelo: PMID  24870543. Número de modelo: S2CID  4467721.
  6. ^ Kim, EM; Pinto, SM; Getnet, D; Nirujogi, RS; Manda, SS; Chaerkady, R; Madugundu, Alaska; Kelkar, DS; Isserlin, R; Jainista, S; Thomas, JK; Muthusamy, B; Leal-Rojas, P; Kumar, P; Sahasrabuddhe, NA; Balakrishnan, L; Advani, J; Jorge, B; Renusa, S; Selván, LD; Patil, AH; Nanjappa, V; Radhakrishnan, A; Prasad, S; Subbannayya, T; Raju, R; Kumar, M; Sreenivasamurthy, SK; Marimuthu, A; Sathe, GJ; Chaván, S; Datta, KK; Subbannayya, Y; Sahu, A; Yelamanchi, SD; Jayaram, S; Rajagopalan, P; Sharma, J; Murthy, KR; Syed, N; Goel, R; Khan, AA; Ahmad, S; Dey, G; Mudgal, K; Chatterjee, A; Huang, TC; Zhong, J; Wu, X; Shaw, PG; Freed, D; Zahari, MS; Mukherjee, KK; Shankar, S; Mahadevan, A; Lam, H; Mitchell, CJ; Shankar, SK; Satishchandra, P; Schroeder, JT; Sirdeshmukh, R; Maitra, A; Leach, SD; Drake, CG; Halushka, MK; Prasad, TS; Hruban, RH; Kerr, CL; Bader, GD; Iacobuzio-Donahue, CA; Gowda, H; Pandey, A (29 de mayo de 2014). "Un mapa preliminar de la proteoma". Nature . 509 (7502): 575–81. Código Bibliográfico : 2014Natur.509..575K. doi :10.1038/nature13302. PMC 4403737. PMID 24870542  . 
  7. ^ Martens, L; Chambers, M; Sturm, M; Kessner, D; Levander, F; Shofstahl, J; Tang, WH; Römpp, A; Neumann, S; Pizarro, AD; Montecchi-Palazzi, L; Tasman, N; Coleman, M; Reisinger, F; Souda, P; Hermjakob, H; Binz, PA; Deutsch, EW (enero de 2011). "mzML: un estándar comunitario para datos de espectrometría de masas". Proteómica molecular y celular . 10 (1): R110.000133. doi : 10.1074/mcp.R110.000133 . PMC 3013463 . PMID  20716697. 
  8. ^ Jones, AR; Eisenacher, M; Mayer, G; Kohlbacher, O; Siepen, J; Hubbard, SJ; Selley, JN; Searle, BC; Shofstahl, J; Seymour, SL; Julian, R; Binz, PA; Deutsch, EW; Hermjakob, H; Reisinger, F; Griss, J; Vizcaíno, JA; Chambers, M; Pizarro, A; Creasy, D (julio de 2012). "El estándar de datos mzIdentML para resultados de proteómica basada en espectrometría de masas". Molecular & Cellular Proteomics . 11 (7): M111.014381. doi : 10.1074/mcp.M111.014381 . PMC 3394945 . PMID  22375074. 
  9. ^ Deutsch, EW; Albar, JP; Binz, PA; Eisenacher, M; Jones, AR; Mayer, G; Omenn, GS; Orchard, S; Vizcaíno, JA; Hermjakob, H (mayo de 2015). "Desarrollo de estándares de representación de datos por la iniciativa de estándares de proteómica de la organización del proteoma humano". Revista de la Asociación Estadounidense de Informática Médica . 22 (3): 495–506. doi :10.1093/jamia/ocv001. PMC 4457114 . PMID  25726569. 
  10. ^ Griss, J; Jones, AR; Sachsenberg, T; Walzer, M; Gatto, L; Hartler, J; Thallinger, GG; Salek, RM; Steinbeck, C; Neuhauser, N; Cox, J; Neumann, S; Fan, J; Reisinger, F; Xu, QW; Del Toro, N; Pérez-Riverol, Y; Ghali, F; Bandeira, N; Xenarios, I; Kohlbacher, O; Vizcaíno, JA; Hermjakob, H (octubre de 2014). "El formato de intercambio de datos mzTab: comunicación de resultados experimentales de proteómica y metabolómica basados ​​en espectrometría de masas a una audiencia más amplia". Molecular & Cellular Proteomics . 13 (10): 2765–75. doi : 10.1074/mcp.o113.036681 . Número de modelo : PMID 24980485  . 
  11. ^ Barsnes, H; Vizcaíno, JA; Eidhammer, I; Martens, L (2009). "PRIDE Converter: facilitando el intercambio de datos proteómicos". Nat Biotechnol . 27 (7): 598–9. doi :10.1038/nbt0709-598. PMID  19587657. S2CID  205269351.
  12. ^ Costa, RG; Griss, J; Dianes, JA; Wang, R; Wright, JC; van den Toorn, HW; van Breukelen, B; Diablos, AJ; Hulstaert, N; Martens, L; Reisinger, F; Csordas, A; Ovelleiro, D; Pérez-Rivevol, Y; Barsnes, H; Hermjakob, H; Vizcaíno, JA (diciembre de 2012). "El marco PRoteomics IDEntification (PRIDE) Converter 2: un conjunto mejorado de herramientas para facilitar el envío de datos a la base de datos PRIDE y al consorcio ProteomeXchange". Proteómica molecular y celular . 11 (12): 1682–9. doi : 10.1074/mcp.o112.021543 . PMC 3518121 . Número de modelo:  PMID22949509. 
  13. ^ Wang, R; Fabregat, A; Ríos, D; Ovelleiro, D; fomentar, JM; Côté, RG; Griss, J; Csordas, A; Pérez-Riverol, Y; Reisinger, F; Hermjakob, H; Martens, L; Vizcaíno, JA (febrero de 2012). "PRIDE Inspector: una herramienta para visualizar y validar datos proteómicos de MS". Biotecnología de la Naturaleza . 30 (2): 135–7. doi :10.1038/nbt.2112. PMC 3277942 . PMID  22318026. 
  14. ^ Vaudel, M; Burkhart, JM; Zahedi, RP; Oveland, E; Berven, FS; Sickmann, A; Martens, L; Barsnes, H (enero de 2015). "PeptideShaker permite el reanálisis de conjuntos de datos proteómicos derivados de MS". Nature Biotechnology . 33 (1): 22–4. doi :10.1038/nbt.3109. PMID  25574629. S2CID  27922651.
  15. ^ Reisinger, F; Del-Toro, N; Ternent, T; Hermjakob, H; Vizcaíno, JA (22 de abril de 2015). "Presentación de los servicios web RESTful de PRIDE Archive". Nucleic Acids Research . 43 (W1): W599–604. doi :10.1093/nar/gkv382. PMC 4489246 . PMID  25904633. 
  16. ^ Vizcaíno, JA; Côté, R; Reisinger, F; Mueller, M; Foster, JM; Rameseder, J; Hermjakob, H; Martens, L (2009). "Una guía para la proteómica". Base de datos de identificaciones Repositorio de datos de proteómica . 9 (18): 4276–83. doi :10.1002/pmic.200900402. PMC 2970915 . PMID  19662629. 
  17. ^ Vizcaíno, JA; Deutsch, EW; Wang, R; Csordas, A; Reisinger, F; Ríos, D; Dianes, JA; Sol, Z; Farrah, T; Bandeira, N; Binz, Pensilvania; Xenarios, yo; Eisenacher, M; Mayer, G; Gato, L; Campos, A; Chalkley, RJ; Kraus, HJ; Alba, JP; Martínez-Bartolomé, S; Apweiler, R; Presagio, GS; Martens, L; Jones, AR; Hermjakob, H (marzo de 2014). "ProteomeXchange proporciona envío y difusión de datos proteómicos coordinados a nivel mundial". Biotecnología de la Naturaleza . 32 (3): 223–6. doi :10.1038/nbt.2839. PMC 3986813 . PMID  24727771. 
  18. ^ Hermjakob, H; Apweiler, R (febrero de 2006). "La base de datos de identificaciones proteómicas (PRIDE) y el consorcio ProteomExchange: haciendo accesibles los datos proteómicos". Expert Review of Proteomics . 3 (1): 1–3. doi : 10.1586/14789450.3.1.1 . PMID  16445344.
  19. ^ "Comisión Europea: CORDIS: Proyectos y resultados: Intercambio internacional de datos y estándares de representación de datos para la proteómica". cordis.europa.eu . Consultado el 22 de septiembre de 2017 .
  20. ^ Csordas, A; Wang, R; Ríos, D; Reisinger, F; Foster, JM; Slotta, DJ; Vizcaíno, JA; Hermjakob, H (mayo de 2013). "Del Peptidome a PRIDE: migración de datos proteómicos públicos a gran escala". Proteómica . 13 (10–11): 1692–5. doi :10.1002/pmic.201200514. PMC 3717177 . PMID  23533138. 
  21. ^ Martens, L (mayo de 2013). "Resiliencia en el ecosistema de datos de proteómica: cómo el campo cuida sus datos". Proteomics . 13 (10–11): 1548–50. doi :10.1002/pmic.201300118. hdl : 1854/LU-4166053 . PMID  23596016. S2CID  8041195.
  22. ^ "Peptidome - NCBI Peptide Data Resource" (Recurso de datos sobre péptidos del NCBI). www.ncbi.nlm.nih.gov . Archivado desde el original el 7 de julio de 2009.

Enlaces externos