stringtranslate.com

Fundición OBO

La Fundición de Ontologías Biológicas y Biomédicas Abiertas ( OBO ) es un grupo de personas dedicadas a construir y mantener ontologías relacionadas con las ciencias de la vida . [1] OBO Foundry establece un conjunto de principios para el desarrollo de ontologías para crear un conjunto de ontologías de referencia interoperables en el dominio biomédico. Actualmente, existen más de cien ontologías que siguen los principios de OBO Foundry .

El esfuerzo de OBO Foundry facilita la integración de resultados biomédicos y la realización de análisis en bioinformática . Lo hace ofreciendo una referencia estructurada para términos de diferentes campos de investigación y sus interconexiones (por ejemplo, un fenotipo en un modelo de ratón y su fenotipo relacionado en el pez cebra ). [2]

Introducción

La iniciativa Foundry tiene como objetivo mejorar la integración de datos en las ciencias de la vida. Un enfoque para la integración es la anotación de datos de diferentes fuentes utilizando vocabularios controlados . Idealmente, dichos vocabularios controlados toman la forma de ontologías , que respaldan el razonamiento lógico sobre los datos anotados utilizando los términos del vocabulario.

La formalización de conceptos en el ámbito biomédico es especialmente conocida a través del trabajo del Gene Ontology Consortium, parte de OBO Foundry. Esto ha llevado al desarrollo de ciertos principios propuestos de buenas prácticas en el desarrollo de ontologías, que ahora se están poniendo en práctica en el marco del consorcio Open Biomedical Ontologies a través de su iniciativa OBO Foundry. Las ontologías OBO forman parte de los recursos del Centro Nacional de Ontología Biomédica , donde forman un componente central del BioPortal del NCBO.

Ontologías biológicas y biomédicas abiertas

Open Biological and Biomedical Ontologies (OBO; anteriormente Open Biomedical Ontologies) es un esfuerzo para crear ontologías ( vocabularios controlados ) para su uso en dominios biológicos y médicos. Un subconjunto de las ontologías OBO originales ha iniciado OBO Foundry, que lidera los esfuerzos de OBO desde 2007. [1]

La creación de OBO en 2001 se inspiró en gran medida en los esfuerzos del proyecto Gene Ontology . [3] OBO forma parte de los recursos del Centro Nacional de Ontología Biomédica de EE. UU. (NCBIO) y un elemento central del BioPortal del NCBO. Es una iniciativa liderada por OBO Foundry.

Reglas de participación

OBO Foundry está abierta a la participación de cualquier persona interesada. Las ontologías que pretenden ser oficialmente parte de OBO Foundry deben adherirse a los principios de OBO y pasar una serie de revisiones realizadas por los miembros, cuando "los coordinadores de Foundry sirven como análogos de los editores de revistas". [1] Hay ontologías que siguen los principios de OBO pero que no son oficialmente parte de OBO, como la ontología de aplicación de reactivos de eagle-i . [4] y la ontología Animales en contexto. [5]

Se ha propuesto una integración en OBO de la teoría de la rigidez de OntoClean como un paso para estandarizar las ontologías candidatas. Esta integración facilitaría el desarrollo de software para verificar automáticamente a los candidatos. [6]

Herramientas

La comunidad de OBO Foundry también se dedica a desarrollar herramientas para facilitar la creación y el mantenimiento de ontologías. La mayoría de los desarrolladores de ontologías en OBO utilizan el editor de ontologías Protégé y Web Ontology Language (OWL) para crear ontologías. Para facilitar la gestión de la línea de comandos de ontologías en un formato compatible con Protégé y OWL, OBO Foundry ha desarrollado la herramienta ROBOT (ROBOT es una herramienta OBO). ROBOT agrega funciones para tareas rutinarias en el desarrollo de ontologías, es de código abierto y puede usarse a través de la línea de comandos o como una biblioteca para cualquier lenguaje en la Máquina Virtual Java . [7]

Otra herramienta relacionada con el esfuerzo de OBO es OBO-Edit , [8] un editor y razonador de ontologías financiado por Gene Ontology Consortium . También existen complementos para OBO-Edit que facilitan el desarrollo de ontologías, como el generador de ontologías semiautomático DOG4DAG. [9]

El formato de archivo OBO

El formato de archivo OBO es un lenguaje orientado a la biología para crear ontologías. Se basa en los principios del lenguaje de ontología web (OWL) .

Como esfuerzo comunitario, se han creado asignaciones comunes estándar para transformaciones de ida y vuelta sin pérdidas entre el formato Open Biomedical Ontologies (OBO) y OWL. [10] [11] La investigación contiene un examen metódico de cada una de las construcciones de OBO y un pastel de capas para OBO, similar a la pila de Web Semántica. [12]

Ontologías de fundición OBO

El conjunto inicial de ontologías de OBO Foundry estaba compuesto por ontologías maduras (como Gene Ontology , GO y Foundational Model of Anatomy , FMAO), por fusiones de ontologías previamente existentes (por ejemplo: Cell Ontology, [13] CL, formada de diferentes ontologías dedicadas, [14] [15] y partes relacionadas en GO y FMAO) y mediante el desarrollo de nuevas ontologías basadas en sus principios. [dieciséis]

El conjunto original de ontologías también incluía la ontología anatómica del pez cebra [17] (una parte de la red de información del pez cebra ), la ontología CheBI , la ontología de enfermedades , la ontología de plantas , la ontología de secuencias , la ontología para investigaciones biomédicas y la ontología de proteínas . [dieciséis]

El número de ontologías en OBO ha aumentado al orden de cientos y están reunidas en la lista de ontologías de OBO Foundry .

Fundición OBO y Wikidata

También se han integrado varias ontologías diferentes de OBO Foundry al gráfico de conocimiento de Wikidata . [18] [19] Esto ha llevado a la integración de ontologías estructuradas de OBO a datos de otras bases de datos que no son de OBO. Por ejemplo, la integración de Human Disease Ontology [20] a Wikidata ha permitido su enlace a la descripción de líneas celulares del recurso Cellosaurus . [21] Uno de los objetivos de la integración de OBO Foundry a Wikidata ha sido reducir las barreras para que los no ontólogos contribuyan y utilicen ontologías. Podría decirse que Wikidata es más fácil de entender y utilizar que los modelos de ontología tradicionales (que requieren un alto grado de experiencia específica). [22]

Principios

Resumen de los principios de OBO Foundry [23] para el desarrollo de una ontología de ciencias biológicas compatible con OBO :

Franqueza

Las ontologías están disponibles abiertamente y deben publicarse bajo la licencia CC-BY 3.0 o bajo el dominio público ( CC0 ). [24] La apertura de las ontologías ha permitido, por ejemplo, la importación de términos de Gene Ontology (una de las ontologías que siguen los principios de OBO) al proyecto Wikidata . [25]

Formato común

Las ontologías tienen que estar disponibles en un lenguaje formal común . En la práctica, eso significa que las ontologías que forman parte de la fundición OBO necesitan describir elementos en los formatos OWL/ OWL2 u OBO utilizando una sintaxis RDF/XML para maximizar la interoperabilidad. [26]

Ortogonalidad

Asignación de ID de OBO a identificadores de recursos unificados (URI) de OBO, únicos para cada elemento. [10]

Los términos deben ser únicos en el espacio OBO, lo que significa que cada elemento tiene un prefijo de ontología único (como CHEBI , GO , PRO ) y un identificador numérico local dentro de la ontología. [27] La ​​elección de una identificación numérica se realizó con el fin de mejorar el mantenimiento y la evolución de los recursos. [28] Para participar en OBO Foundry, las ontologías tienen que ser ortogonales y los conceptos que modelan deben ser únicos dentro de OBO, por lo que cada concepto tiene un único Identificador Uniforme de Recursos (URI). Las nuevas ontologías tienen, entonces, que reutilizar el trabajo realizado en otros esfuerzos. [28]

A pesar del ideal de unicidad de los términos e interoperabilidad, en la práctica esto es difícil de hacer cumplir, lo que lleva a la duplicación de términos. Además, algunas ontologías no reutilizan términos o incluso los reutilizan de manera inapropiada. [29]

Versionado

Las ontologías evolucionan con el tiempo, refinando conceptos y descripciones de acuerdo con los avances en el conocimiento de sus dominios específicos. [30] Para garantizar que las nuevas versiones se actualicen, pero que las herramientas que utilizan versiones anteriores de las ontologías sigan funcionando, OBO aplica un sistema de sistemas de control de versiones , en el que cada versión de la ontología recibe un identificador único, ya sea en el formato de una fecha. o un sistema de numeración y datos de metadatos . [31]

Alcance

Las ontologías deben tener un alcance claramente especificado (el dominio que pretenden cubrir). [32]

Tener definiciones textuales

Las ontologías deben tener definiciones textuales para cada elemento, de forma legible por humanos . Eso significa que además de la identificación alfanumérica de cada elemento, estos deben describirse en lenguaje natural mediante afirmaciones lógicas siguiendo la lógica aristotélica de una manera única dentro de la ontología. [33]

Relaciones estandarizadas y Ontología de Relación (RO)

Las ontologías deben utilizar relaciones entre elementos de la Ontología de Relaciones (RO) . Esto garantiza que diferentes ontologías puedan integrarse sin problemas, lo cual es especialmente importante para la inferencia lógica . [34]

La Relation Ontology (RO) es una ontología diseñada para representar las relaciones entre diferentes conceptos biomédicos. [35] Describe rigurosamente relaciones como "parte_de", "ubicado_en" y "precedido_por" que son reutilizadas por muchas ontologías de OBO Foundry.

Documentación

Las ontologías OBO deben estar minuciosamente documentadas. Con frecuencia, esto se hace a través de repositorios de GitHub para cada ontología específica (consulte la Lista de ontologías de OBO Foundry ). [36]

Pluralidad de usuarios

Las ontologías deberían ser útiles para varias personas diferentes y los desarrolladores de ontologías deberían documentar la evidencia de su uso. Este criterio es importante para el proceso de revisión. Los ejemplos de uso incluyen enlaces a términos de otras ontologías, uso en proyectos de web semántica , uso en anotaciones u otras aplicaciones de investigación. [37]

Apertura a colaboraciones

Las ontologías deben desarrollarse de manera que permitan colaboraciones con otros miembros de OBO Foundry. [38]

Lugar de autoridad

Las ontologías deben tener una persona responsable de la ontología que media la interacción con la comunidad. [39]

Convenciones de nombres

Las convenciones de nomenclatura para ontologías OBO tienen como objetivo hacer que las etiquetas primarias sean inequívocas y únicas dentro de la ontología (y preferiblemente, dentro de OBO). Las etiquetas y sinónimos deben estar escritos en inglés, evitando el uso de guiones bajos y mayúsculas y minúsculas . [40] OBO carece de un mecanismo para soporte multilingüe, a diferencia de Wikidata , que permite etiquetas en diferentes sistemas. El sistema de nombres en OBO se basa en una serie de estudios para catalogar las convenciones de nombres de las ontologías actuales, así como descubrir cuestiones relacionadas con estas convenciones. [41]

Mantenimiento

Las ontologías deben actualizarse en función de los cambios en el consenso científico . OBO Foundry define el consenso científico como "múltiples publicaciones de laboratorios independientes durante un año llegan a la misma conclusión, y no hay opiniones disidentes publicadas o son limitadas (<10%) en el mismo período de tiempo". [42]

Ver también

Referencias

  1. ^ abc Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, et al. (noviembre de 2007). "The OBO Foundry: evolución coordinada de ontologías para apoyar la integración de datos biomédicos". Biotecnología de la Naturaleza . 25 (11): 1251–5. doi :10.1038/nbt1346. PMC  2814061 . PMID  17989687.
  2. ^ Mungall, Christopher J; Gkoutos, Georgios V; Smith, Cynthia L; Haendel, Melissa A ; Lewis, Suzanna E; Ashburner, Michael (2010). "Integración de ontologías de fenotipos en múltiples especies". Biología del genoma . 11 (1): R2. doi : 10.1186/gb-2010-11-1-r2 . ISSN  1465-6906. PMC 2847714 . PMID  20064205. 
  3. ^ Shimoyama, María; Dwinell, Melinda; Jacob, Howard (5 de agosto de 2009). "Múltiples ontologías para integrar conjuntos de datos de fenotipos complejos". Antecedentes de la naturaleza . doi : 10.1038/npre.2009.3554 . ISSN  1756-0357.
  4. ^ Pincel MH, Vasilevsky N, Torniai C, Johnson T, Shaffer C, Haendel M (2011). "Desarrollo de una ontología de aplicación de reactivos dentro del marco de fundición OBO". Actas del taller CEUR . 833 : 234–236.
  5. Santamaría SL (2012). Desarrollo de la ontología Animales en contexto (PDF) . Actas de la Conferencia Internacional sobre Ontología Biomédica. Graz.
  6. ^ Seyed, Patrice y Stuart C. Shapiro. (2011). Aplicación de rigidez para estandarizar ontologías candidatas de OBO Foundry (PDF) . Actas de la Conferencia Internacional sobre Ontología Biomédica (CEUR 993).{{cite conference}}: CS1 maint: multiple names: authors list (link)
  7. ^ Jackson RC, Balhoff JP, Douglass E, Harris NL, Mungall CJ, Overton JA (julio de 2019). "ROBOT: una herramienta para automatizar flujos de trabajo de ontologías". Bioinformática BMC . 20 (1): 407. doi : 10.1186/s12859-019-3002-3 . PMC 6664714 . PMID  31357927. 
  8. ^ Day-Richter J, Harris MA, Haendel M, Lewis S (agosto de 2007). "OBO-Edit: un editor de ontologías para biólogos". Bioinformática . 23 (16): 2198–200. doi : 10.1093/bioinformática/btm112 . PMID  17545183.
  9. ^ Wächter T, Schroeder M (junio de 2010). "Generación de ontologías semiautomatizada dentro de OBO-Edit". Bioinformática . 26 (12): 188-96. doi : 10.1093/bioinformática/btq188 . PMC 2881373 . PMID  20529942. 
  10. ^ ab Tirmizi, Syed; Aitken, Estuardo; Moreira, Dilván A; Mungall, Chris; Sequeda, Juan; Shah, Nigam H; Miranker, Daniel P (2011). "Mapeo entre los lenguajes de ontología OBO y OWL". Revista de Semántica Biomédica . 2 (Suplemento 1): T3. doi : 10.1186/2041-1480-2-s1-s3 . ISSN  2041-1480. PMC 3105495 . PMID  21388572. 
  11. ^ Golbreich, Christine; Horridge, Mateo; Horrocks, Ian; Motik, Boris; Shearer, Rob (2007), "OBO y OWL: Aprovechamiento de las tecnologías de la web semántica para las ciencias biológicas", La web semántica , Lecture Notes in Computer Science, vol. 4825, Springer Berlin Heidelberg, págs. 169–182, Bibcode :2007LNCS.4825..169G, doi : 10.1007/978-3-540-76298-0_13 , ISBN 978-3-540-76297-3
  12. ^ Antezana, E.; Egaña, M.; De Baets, B.; Kuiper, M.; Mirónov, V. (2008). "ONTO-PERL: Una API para apoyar el desarrollo y análisis de bioontologías". Bioinformática . 24 (6): 885–887. doi : 10.1093/bioinformática/btn042 . PMID  18245124.
  13. ^ Diehl, Alexander D.; Meehan, Terrence F.; Bradford, Yvonne M.; Cepillo, Matthew H.; Dahdul, Wasila M.; Dougall, David S.; Él, Yongqun; Osumi-Sutherland, David; Rutenberg, Alan; Sarntivijai, Sirarat; Van Slyke, Ceri E. (4 de julio de 2016). "The Cell Ontology 2016: contenido mejorado, modularización e interoperabilidad de ontologías". Revista de Semántica Biomédica . 7 (1): 44. doi : 10.1186/s13326-016-0088-7 . ISSN  2041-1480. PMC 4932724 . PMID  27377652. 
  14. ^ Bardo, Jonathan; Rhee, Seung Y.; Ashburner, Michael (14 de enero de 2005). "Una ontología para tipos de células". Biología del genoma . 6 (2): R21. doi : 10.1186/gb-2005-6-2-r21 . ISSN  1474-760X. PMC 551541 . PMID  15693950. 
  15. ^ Kelso, J. (12 de mayo de 2003). "eVOC: un vocabulario controlado para unificar datos de expresión genética". Investigación del genoma . 13 (6): 1222-1230. doi :10.1101/gr.985203. ISSN  1088-9051. PMC 403650 . PMID  12799354. 
  16. ^ ab Smith, Barry; Ashburner, Michael; Rosse, Cornelio; Bardo, Jonathan; Error, William; Ceusters, Werner; Goldberg, Luis J; Eilbeck, Karen; Irlanda, Amelia; Mungall, Christopher J; Leontis, Neocles (noviembre de 2007). "The OBO Foundry: evolución coordinada de ontologías para apoyar la integración de datos biomédicos". Biotecnología de la Naturaleza . 25 (11): 1251-1255. doi :10.1038/nbt1346. ISSN  1087-0156. PMC 2814061 . PMID  17989687. 
  17. ^ Van Slyke, Ceri E.; Bradford, Yvonne M.; Westerfield, Monte; Haendel, Melissa A. (25 de febrero de 2014). "La anatomía del pez cebra y ontologías escénicas: representando la anatomía y desarrollo de Danio rerio". Revista de Semántica Biomédica . 5 (1): 12. doi : 10.1186/2041-1480-5-12 . ISSN  2041-1480. PMC 3944782 . PMID  24568621. 
  18. ^ Waagmeester, Andra; Stupp, Gregorio; Burgstaller-Muehlbacher, Sebastián; Bueno, Benjamín M; Griffith, Malaquías; Griffith, Obi L; Hanspers, Cristina; Hermjakob, Henning; Hudson, Toby S; Hybiske, Kevin; Keating, Sarah M (17 de marzo de 2020). Rodgers, Peter; Mungall, Chris (eds.). "Wikidata como gráfico de conocimiento para las ciencias biológicas". eVida . 9 : e52614. doi : 10.7554/eLife.52614 . ISSN  2050-084X. PMC 7077981 . PMID  32180547. 
  19. ^ Turki, Houcemeddine; Shafee, Thomas; Hadj Taieb, Mohamed Ali; Ben Aouicha, Mohamed; Vrandecic, Denny; Das, Diptanshu; Hamdi, Helmi (1 de noviembre de 2019). "Wikidata: una base de datos médica ontológica colaborativa a gran escala". Revista de Informática Biomédica . 99 : 103292. doi : 10.1016/j.jbi.2019.103292 . ISSN  1532-0464. PMID  31557529.
  20. ^ Schriml, Lynn M.; Mitraka, Elvira; Munro, James; Tauber, Becky; Schor, Mike; Níquel, lanza; Félix, Víctor; Jeng, Linda; Portador, Cynthia; Lichenstein, Richard; Bisordi, Katharine (8 de enero de 2019). "Actualización de Human Disease Ontology 2018: clasificación, contenido y expansión del flujo de trabajo". Investigación de ácidos nucleicos . 47 (D1): D955–D962. doi : 10.1093/nar/gky1032. ISSN  0305-1048. PMC 6323977 . PMID  30407550. 
  21. ^ "Hela". www.wikidata.org . Consultado el 4 de mayo de 2020 .
  22. ^ Jacobsen, Annika; Waagmeester, Andra; Kaliyaperumal, Rajaram; Stupp, Gregorio S.; M. Schriml, Lynn; Thompson, Marcos; I. Su, Andrés; Roos, Marco (4 de diciembre de 2018). "Wikidata como recurso intuitivo para el modelado de datos semánticos en la FAIRificación de datos". Compartir higo . doi : 10.6084/m9.figshare.7415282.v2.
  23. ^ "Descripción general". obofoundry.org . Consultado el 6 de febrero de 2020 .
  24. ^ "Abierto (principio 1)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  25. ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J, et al. (01/01/2016). "Wikidata como marco semántico para la iniciativa Gene Wiki". Base de datos . 2016 : baw015. doi : 10.1093/base de datos/baw015. PMC 4795929 . PMID  26989148. 
  26. ^ "Formato común (principio 2)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  27. ^ "URI/Espacio de identificador (principio 3)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  28. ^ ab Courtot M, Mungall C, Brinkman RR, Ruttenberg A (2010). Construyendo la política de OBO Foundry: una a la vez . Actas de CEURS: Conferencia internacional sobre ontologías biomédicas.
  29. ^ Ghazvinian A, Noy NF, Musen MA (mayo de 2011). "¿Cuán ortogonales son las ontologías de OBO Foundry?". Revista de Semántica Biomédica . 2 (Suplemento 2): T2. doi : 10.1186/2041-1480-2-s2-s2 . PMC 3102891 . PMID  21624157. 
  30. ^ Groß, Anika; Pruski, Cédric; Rahm, Erhard (2016). "Evolución de ontologías y mapeos biomédicos: descripción general de enfoques recientes". Revista de Biotecnología Computacional y Estructural . 14 : 333–340. doi : 10.1016/j.csbj.2016.08.002 . ISSN  2001-0370. PMC 5018063 . PMID  27642503. 
  31. ^ "Control de versiones (principio 4)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  32. ^ "Alcance (principio 5)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  33. ^ "Definiciones textuales (principio 6)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  34. ^ "Relaciones (principio 7)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  35. ^ Smith, Barry; Ceusters, Werner; Klagges, Bert; Kohler, Jacob; Kumar, Anand; Lomax, Jane; Mungall, Chris; Neuhaus, Fabián; Rector, Alan L; Rosse, Cornelio (2005). "Relaciones en ontologías biomédicas". Biología del genoma . 6 (5): R46. doi : 10.1186/gb-2005-6-5-r46 . PMC 1175958 . PMID  15892874. 
  36. ^ "Documentación (principio 8)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  37. ^ "Pluralidad documentada de usuarios (principio 9)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  38. ^ "Compromiso de colaboración (principio 10)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  39. ^ "Locus de autoridad (principio 11)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  40. ^ "Convenciones de nomenclatura (principio 12)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  41. ^ Schober, Daniel; Smith, Barry; Lewis, Suzanna E; Kusnierczyk, Wacław; Lomax, Jane; Mungall, Chris; Taylor, Chris F; Rocca-Serra, Philippe; Sansone, Susanna-Assunta (2009). "Convenciones de nomenclatura basadas en encuestas para su uso en el desarrollo de ontologías de OBO Foundry". Bioinformática BMC . 10 (1): 125. doi : 10.1186/1471-2105-10-125 . ISSN  1471-2105. PMC 2684543 . PMID  19397794. 
  42. ^ "Mantenimiento (principio 16)". obofoundry.org . Consultado el 6 de febrero de 2020 .

enlaces externos