stringtranslate.com

Fundición OBO

La Fundación de Ontologías Biológicas y Biomédicas Abiertas ( OBO ) es un grupo de personas que crean y mantienen ontologías relacionadas con las ciencias de la vida . [1] La Fundación OBO establece un conjunto de principios para el desarrollo de ontologías con el fin de crear un conjunto de ontologías de referencia interoperables en el ámbito biomédico. Actualmente, hay más de cien ontologías que siguen los principios de la Fundación OBO .

El esfuerzo de OBO Foundry facilita la integración de resultados biomédicos y la realización de análisis en bioinformática , ofreciendo una referencia estructurada para términos de diferentes campos de investigación y sus interconexiones (por ejemplo, un fenotipo en un modelo de ratón y su fenotipo relacionado en el pez cebra ). [2]

Introducción

La iniciativa Foundry tiene como objetivo mejorar la integración de datos en las ciencias de la vida. Un enfoque de la integración es la anotación de datos de diferentes fuentes mediante vocabularios controlados . Lo ideal es que dichos vocabularios controlados adopten la forma de ontologías , que respaldan el razonamiento lógico sobre los datos anotados utilizando los términos del vocabulario.

La formalización de conceptos en el ámbito biomédico es especialmente conocida a través del trabajo del Gene Ontology Consortium, parte de OBO Foundry. Esto ha llevado al desarrollo de ciertos principios propuestos de buenas prácticas en el desarrollo de ontologías, que ahora se están poniendo en práctica en el marco del consorcio Open Biomedical Ontologies a través de su iniciativa OBO Foundry. Las ontologías OBO forman parte de los recursos del National Center for Biomedical Ontology , donde forman un componente central del BioPortal del NCBO.

Ontologías biológicas y biomédicas abiertas

Las ontologías biológicas y biomédicas abiertas (OBO, anteriormente Open Biomedical Ontologies) son un esfuerzo para crear ontologías ( vocabularios controlados ) para su uso en los dominios biológicos y médicos. Un subconjunto de las ontologías OBO originales ha iniciado la OBO Foundry, que lidera los esfuerzos de OBO desde 2007. [1]

La creación de OBO en 2001 se inspiró en gran medida en los esfuerzos del proyecto Gene Ontology . [3] OBO forma parte de los recursos del Centro Nacional de Ontología Biomédica de Estados Unidos (NCBIO) y es un elemento central del BioPortal del NCBO. Es una iniciativa liderada por OBO Foundry.

Normas de participación

La OBO Foundry está abierta a la participación de cualquier persona interesada. Las ontologías que deseen formar parte oficialmente de la OBO Foundry deben adherirse a los principios de la OBO y pasar una serie de revisiones realizadas por los miembros, en las que "los coordinadores de la Foundry actúan como análogos de los editores de revistas". [1] Existen ontologías que siguen los principios de la OBO pero que no forman parte oficialmente de la OBO, como la Reagent Application Ontology de eagle-i [4] y la Animals in Context Ontology [5] .

Se ha propuesto la integración en OBO de la teoría de rigidez de OntoClean como un paso hacia la estandarización de las ontologías candidatas. Esta integración facilitaría el desarrollo de software para verificar automáticamente las candidatas. [6]

Herramientas

La comunidad de OBO Foundry también se dedica a desarrollar herramientas para facilitar la creación y el mantenimiento de ontologías. La mayoría de los desarrolladores de ontologías en OBO utilizan el editor de ontologías Protégé y el lenguaje de ontologías web (OWL) para crear ontologías. Para facilitar la gestión de ontologías desde la línea de comandos en un formato compatible con Protégé y OWL, OBO Foundry ha desarrollado la herramienta ROBOT (ROBOT es una herramienta OBO). ROBOT agrega funciones para tareas rutinarias en el desarrollo de ontologías, es de código abierto y se puede utilizar tanto a través de la línea de comandos como como una biblioteca para cualquier lenguaje en la máquina virtual Java . [7]

Otra herramienta relacionada con el esfuerzo OBO es OBO-Edit , [8] un editor y razonador de ontologías financiado por el Gene Ontology Consortium . También existen complementos para OBO-Edit que facilitan el desarrollo de ontologías, como el generador de ontologías semiautomático DOG4DAG. [9]

El formato de archivo OBO

El formato de archivo OBO es un lenguaje orientado a la biología para la creación de ontologías. Se basa en los principios del lenguaje de ontología web (OWL) .

Como parte de un esfuerzo comunitario, se han creado asignaciones comunes estándar para transformaciones de ida y vuelta sin pérdida entre el formato de Ontologías Biomédicas Abiertas (OBO) y OWL. [10] [11] La investigación contiene un examen metódico de cada uno de los constructos de OBO y una estructura de capas para OBO, similar a la pila de la Web Semántica. [12]

Ontologías de OBO Foundry

El conjunto inicial de ontologías de OBO Foundry estaba compuesto por ontologías maduras (como la Ontología Genética , GO, y el Modelo Fundacional de Anatomía , FMAO), por fusiones de ontologías previamente existentes (por ejemplo: la Ontología Celular, [13] CL, formada a partir de diferentes ontologías dedicadas, [14] [15] y partes relacionadas en GO y FMAO) y por el desarrollo de nuevas ontologías basadas en sus principios. [16]

El conjunto original de ontologías también incluía la Ontología Anatómica del Pez Cebra [17] (una parte de la Red de Información del Pez Cebra ), la ontología CheBI , la Ontología de Enfermedades , la Ontología de Plantas , la Ontología de Secuencias , la Ontología para Investigaciones Biomédicas y la Ontología de Proteínas . [16]

El número de ontologías en OBO ha crecido hasta el orden de cientos, y están reunidas en la lista de ontologías de OBO Foundry .

Fundición OBO y Wikidata

También se han integrado varias ontologías diferentes de OBO Foundry en el gráfico de conocimiento de Wikidata . [18] [19] Esto ha llevado a la integración de ontologías estructuradas de OBO con datos de otras bases de datos que no son de OBO. Por ejemplo, la integración de la Ontología de Enfermedades Humanas [20] en Wikidata ha permitido su vinculación con la descripción de líneas celulares del recurso Cellosaurus . [21] Uno de los objetivos de la integración de OBO Foundry en Wikidata ha sido reducir las barreras para que los no ontólogos contribuyan y utilicen ontologías. Se podría decir que Wikidata es más fácil de entender y utilizar que los modelos de ontología tradicionales (que requieren un alto grado de experiencia específica). [22]

Principios

Resumen de los principios de OBO Foundry [23] para el desarrollo de una ontología de ciencias de la vida compatible con OBO :

Franqueza

Las ontologías están disponibles abiertamente y deben publicarse bajo la licencia CC-BY 3.0 o bajo el dominio público ( CC0 ). [24] La apertura de las ontologías ha permitido, por ejemplo, la importación de términos de la Ontología Genética (una de las ontologías que siguen los Principios OBO) al proyecto Wikidata . [25]

Formato común

Las ontologías deben estar disponibles en un lenguaje formal común . En la práctica, eso significa que las ontologías que forman parte de la fundición OBO deben describir elementos en los formatos OWL/ OWL2 u OBO utilizando una sintaxis RDF/XML para maximizar la interoperabilidad. [26]

Ortogonalidad

Mapeo de identificadores OBO a identificadores de recursos unificados (URI) OBO, únicos para cada elemento. [10]

Los términos deben ser únicos en el espacio OBO, lo que significa que cada elemento tiene un prefijo de ontología único (como CHEBI , GO , PRO ) y un identificador numérico local dentro de la ontología. [27] La ​​elección de un identificador numérico se realizó con el fin de mejorar el mantenimiento y la evolución de los recursos. [28] Para participar en OBO Foundry, las ontologías deben ser ortogonales y los conceptos que modela deben ser únicos dentro de OBO, por lo que cada concepto tiene un único Identificador Uniforme de Recurso (URI). Las nuevas ontologías tienen, entonces, que reutilizar el trabajo realizado en otros esfuerzos. [28]

A pesar del ideal de unicidad de términos e interoperabilidad, en la práctica esto es difícil de hacer cumplir, lo que lleva a la ocurrencia de duplicación de términos. Además, algunas ontologías no reutilizan términos o incluso lo hacen de manera inapropiada. [29]

Control de versiones

Las ontologías evolucionan con el tiempo, refinando conceptos y descripciones de acuerdo con los avances en el conocimiento de sus dominios específicos. [30] Para garantizar que las nuevas versiones se actualicen, pero que las herramientas que usan versiones anteriores de las ontologías sigan funcionando, OBO aplica un sistema de control de versiones , en el que cada versión de la ontología recibe un identificador único, ya sea en formato de fecha o de sistema de numeración, y metadatos dags. [31]

Alcance

Las ontologías deben tener un alcance claramente especificado (el dominio que pretende cubrir). [32]

Tener definiciones textuales

Las ontologías deben tener definiciones textuales para cada elemento, de manera legible para el ser humano . Esto significa que además de la identificación alfanumérica de cada elemento, estos deben ser descritos en lenguaje natural mediante afirmaciones lógicas siguiendo la lógica aristotélica de una manera que sea única dentro de la ontología. [33]

Relaciones estandarizadas y la ontología de relaciones (OR)

Las ontologías deben utilizar relaciones entre elementos de la Ontología de Relaciones (RO) . Esto garantiza que las diferentes ontologías puedan integrarse sin problemas, lo que es especialmente importante para la inferencia lógica . [34]

La ontología de relaciones (RO) es una ontología diseñada para representar las relaciones entre diferentes conceptos biomédicos. [35] Describe rigurosamente relaciones como "parte_de", "ubicado_en" y "precedido_por" que son reutilizadas por muchas ontologías de OBO Foundry.

Documentación

Las ontologías OBO deben documentarse exhaustivamente. Con frecuencia, esto se hace a través de repositorios de GitHub para cada ontología específica (consulte la Lista de ontologías de OBO Foundry ). [36]

Pluralidad de usuarios

Las ontologías deben ser útiles para distintas personas y los desarrolladores de ontologías deben documentar la evidencia de su uso. Este criterio es importante para el proceso de revisión. Algunos ejemplos de uso incluyen la vinculación a términos de otras ontologías, el uso en proyectos de web semántica , el uso en anotaciones u otras aplicaciones de investigación. [37]

Apertura a colaboraciones

Las ontologías deben desarrollarse de manera que permitan colaboraciones con otros miembros de OBO Foundry. [38]

Lugar de autoridad

Las ontologías deben tener una persona responsable de la ontología que medie la interacción con la comunidad. [39]

Convenciones de nombres

Las convenciones de nombres para las ontologías OBO tienen como objetivo hacer que las etiquetas primarias sean inequívocas y únicas dentro de la ontología (y preferiblemente, dentro de OBO). Las etiquetas y los sinónimos deben escribirse en inglés, evitando el uso de guiones bajos y camel case . [40] OBO carece de un mecanismo para soporte multilingüe, en contraste con Wikidata , que permite etiquetas en diferentes sistemas. El sistema de nombres en OBO se basa en una serie de encuestas para catalogar las convenciones de nombres de las ontologías actuales, así como para descubrir problemas relacionados con estas convenciones. [41]

Mantenimiento

Las ontologías deben actualizarse en función de los cambios en el consenso científico . La OBO Foundry define el consenso científico como "múltiples publicaciones de laboratorios independientes a lo largo de un año que llegan a la misma conclusión, y no hay opiniones discrepantes publicadas o hay pocas (<10%) en el mismo período de tiempo". [42]

Véase también

Referencias

  1. ^ abc Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, et al. (noviembre de 2007). "The OBO Foundry: evolución coordinada de ontologías para apoyar la integración de datos biomédicos". Nature Biotechnology . 25 (11): 1251–5. doi :10.1038/nbt1346. PMC  2814061 . PMID  17989687.
  2. ^ Mungall, Christopher J; Gkoutos, Georgios V; Smith, Cynthia L; Haendel, Melissa A ; Lewis, Suzanna E; Ashburner, Michael (2010). "Integración de ontologías fenotípicas en múltiples especies". Genome Biology . 11 (1): R2. doi : 10.1186/gb-2010-11-1-r2 . ISSN  1465-6906. PMC 2847714 . PMID  20064205. 
  3. ^ Shimoyama, Mary; Dwinell, Melinda; Jacob, Howard (5 de agosto de 2009). "Múltiples ontologías para la integración de conjuntos de datos de fenotipos complejos". Nature Precedings . doi : 10.1038/npre.2009.3554 . ISSN  1756-0357.
  4. ^ Brush MH, Vasilevsky N, Torniai C, Johnson T, Shaffer C, Haendel M (2011). "Desarrollo de una ontología de aplicación de reactivos dentro del marco de trabajo de fundición OBO". Actas del taller CEUR . 833 : 234–236.
  5. ^ Santamaria SL (2012). Desarrollo de la ontología de los animales en contexto (PDF) . Actas de la Conferencia Internacional sobre Ontología Biomédica. Graz.
  6. ^ Seyed, Patrice y Stuart C. Shapiro. (2011). Aplicación de la rigidez a la estandarización de ontologías candidatas a la fundición OBO (PDF) . Actas de la Conferencia Internacional sobre Ontología Biomédica (CEUR 993).{{cite conference}}: CS1 maint: multiple names: authors list (link)
  7. ^ Jackson RC, Balhoff JP, Douglass E, Harris NL, Mungall CJ, Overton JA (julio de 2019). "ROBOT: una herramienta para automatizar flujos de trabajo de ontología". BMC Bioinformatics . 20 (1): 407. doi : 10.1186/s12859-019-3002-3 . PMC 6664714 ​​. PMID  31357927. 
  8. ^ Day-Richter J, Harris MA, Haendel M, Lewis S (agosto de 2007). "OBO-Edit: un editor de ontología para biólogos". Bioinformática . 23 (16): 2198–200. doi : 10.1093/bioinformatics/btm112 . PMID  17545183.
  9. ^ Wächter T, Schroeder M (junio de 2010). "Generación de ontología semiautomatizada dentro de OBO-Edit". Bioinformática . 26 (12): i88-96. doi : 10.1093/bioinformatics/btq188 . PMC 2881373 . PMID  20529942. 
  10. ^ ab Tirmizi, Syed; Aitken, Stuart; Moreira, Dilvan A; Mungall, Chris; Sequeda, Juan; Shah, Nigam H; Miranker, Daniel P (2011). "Mapeo entre los lenguajes de ontología OBO y OWL". Journal of Biomedical Semantics . 2 (Suppl 1): S3. doi : 10.1186/2041-1480-2-s1-s3 . ISSN  2041-1480. PMC 3105495 ​​. PMID  21388572. 
  11. ^ Golbreich, Christine; Horridge, Matthew; Horrocks, Ian; Motik, Boris; Shearer, Rob (2007), "OBO y OWL: aprovechamiento de las tecnologías de la Web semántica para las ciencias de la vida", The Semantic Web , Lecture Notes in Computer Science, vol. 4825, Springer Berlin Heidelberg, págs. 169–182, Bibcode :2007LNCS.4825..169G, doi : 10.1007/978-3-540-76298-0_13 , ISBN 978-3-540-76297-3
  12. ^ Antezana, E.; Egana, M.; De Baets, B.; Kuiper, M.; Mironov, V. (2008). "ONTO-PERL: Una API para apoyar el desarrollo y análisis de bioontologías". Bioinformática . 24 (6): 885–887. doi : 10.1093/bioinformatics/btn042 . PMID  18245124.
  13. ^ Diehl, Alexander D.; Meehan, Terrence F.; Bradford, Yvonne M.; Brush, Matthew H.; Dahdul, Wasila M.; Dougall, David S.; He, Yongqun; Osumi-Sutherland, David; Ruttenberg, Alan; Sarntivijai, Sirarat; Van Slyke, Ceri E. (4 de julio de 2016). "The Cell Ontology 2016: contenido mejorado, modularización e interoperabilidad de ontologías". Journal of Biomedical Semantics . 7 (1): 44. doi : 10.1186/s13326-016-0088-7 . ISSN  2041-1480. PMC 4932724 . PMID  27377652. 
  14. ^ Bard, Jonathan; Rhee, Seung Y.; Ashburner, Michael (14 de enero de 2005). "Una ontología para los tipos celulares". Genome Biology . 6 (2): R21. doi : 10.1186/gb-2005-6-2-r21 . ISSN  1474-760X. PMC 551541 . PMID  15693950. 
  15. ^ Kelso, J. (12 de mayo de 2003). "eVOC: un vocabulario controlado para unificar los datos de expresión génica". Genome Research . 13 (6): 1222–1230. doi :10.1101/gr.985203. ISSN  1088-9051. PMC 403650 . PMID  12799354. 
  16. ^ ab Smith, Barry; Ashburner, Michael; Rosse, Cornelius; Bard, Jonathan; Bug, William; Ceusters, Werner; Goldberg, Louis J; Eilbeck, Karen; Ireland, Amelia; Mungall, Christopher J; Leontis, Neocles (noviembre de 2007). "La OBO Foundry: evolución coordinada de ontologías para apoyar la integración de datos biomédicos". Nature Biotechnology . 25 (11): 1251–1255. doi :10.1038/nbt1346. ISSN  1087-0156. PMC 2814061 . PMID  17989687. 
  17. ^ Van Slyke, Ceri E.; Bradford, Yvonne M.; Westerfield, Monte; Haendel, Melissa A. (25 de febrero de 2014). "La anatomía del pez cebra y las ontologías de los estadios: representación de la anatomía y el desarrollo de Danio rerio". Revista de semántica biomédica . 5 (1): 12. doi : 10.1186/2041-1480-5-12 . ISSN  2041-1480. PMC 3944782 . PMID  24568621. 
  18. ^ Waagmeester, Andra; Stupp, Gregory; Burgstaller-Muehlbacher, Sebastian; Good, Benjamin M; Griffith, Malachi; Griffith, Obi L; Hanspers, Kristina; Hermjakob, Henning; Hudson, Toby S; Hybiske, Kevin; Keating, Sarah M (17 de marzo de 2020). Rodgers, Peter; Mungall, Chris (eds.). "Wikidata como un gráfico de conocimiento para las ciencias de la vida". eLife . 9 : e52614. doi : 10.7554/eLife.52614 . ISSN  2050-084X. PMC 7077981 . PMID  32180547. 
  19. ^ Turki, Houcemeddine; Shafee, Thomas; Hadj Taieb, Mohamed Ali; Ben Aouicha, Mohamed; Vrandecic, Denny; Das, Diptanshu; Hamdi, Helmi (1 de noviembre de 2019). "Wikidata: una base de datos médica ontológica colaborativa a gran escala". Revista de Informática Biomédica . 99 : 103292. doi : 10.1016/j.jbi.2019.103292 . ISSN  1532-0464. PMID  31557529.
  20. ^ Schriml, Lynn M.; Mitraka, Elvira; Munro, James; Tauber, Becky; Schor, Mike; Nickle, Lance; Felix, Victor; Jeng, Linda; Bearer, Cynthia; Lichenstein, Richard; Bisordi, Katharine (8 de enero de 2019). "Actualización de Human Disease Ontology 2018: expansión de la clasificación, el contenido y el flujo de trabajo". Nucleic Acids Research . 47 (D1): D955–D962. doi :10.1093/nar/gky1032. ISSN  0305-1048. PMC 6323977 . PMID  30407550. 
  21. ^ "HeLa". www.wikidata.org . Consultado el 4 de mayo de 2020 .
  22. ^ Jacobsen, Annika; Waagmeester, Andra; Kaliyaperumal, Rajaram; Stupp, Gregorio S.; M. Schriml, Lynn; Thompson, marca; I. Su, Andrés; Roos, Marco (4 de diciembre de 2018). "Wikidata como recurso intuitivo para el modelado de datos semánticos en la FAIRificación de datos". Compartir higo . doi : 10.6084/m9.figshare.7415282.v2.
  23. ^ "Descripción general". obofoundry.org . Consultado el 6 de febrero de 2020 .
  24. ^ "Apertura (principio 1)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  25. ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J, et al. (1 de enero de 2016). "Wikidata como marco semántico para la iniciativa Gene Wiki". Base de datos . 2016 : baw015. doi :10.1093/database/baw015. PMC 4795929 . PMID  26989148. 
  26. ^ "Formato común (principio 2)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  27. ^ "URI/Espacio de identificadores (principio 3)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  28. ^ ab Courtot M, Mungall C, Brinkman RR, Ruttenberg A (2010). Building the OBO Foundry-One Policy at a Time (Construyendo la Fundición OBO: una política a la vez) . Actas del CEURS: Conferencia internacional sobre ontologías biomédicas.
  29. ^ Ghazvinian A, Noy NF, Musen MA (mayo de 2011). "¿Cuán ortogonales son las ontologías de OBO Foundry?". Journal of Biomedical Semantics . 2 (Suppl 2): ​​S2. doi : 10.1186/2041-1480-2-s2-s2 . PMC 3102891 . PMID  21624157. 
  30. ^ Groß, Anika; Pruski, Cédric; Rahm, Erhard (2016). "Evolución de las ontologías y mapeos biomédicos: descripción general de los enfoques recientes". Revista de biotecnología estructural y computacional . 14 : 333–340. doi : 10.1016/j.csbj.2016.08.002 . ISSN  2001-0370. PMC 5018063 . PMID  27642503. 
  31. ^ "Versioning (principio 4)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  32. ^ "Alcance (principio 5)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  33. ^ "Definiciones textuales (principio 6)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  34. ^ "Relaciones (principio 7)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  35. ^ Smith, Barry; Ceusters, Werner; Klagges, Bert; Köhler, Jacob; Kumar, Anand; Lomax, Jane; Mungall, Chris; Neuhaus, Fabian; Rector, Alan L; Rosse, Cornelius (2005). "Relaciones en ontologías biomédicas". Genome Biology . 6 (5): R46. doi : 10.1186/gb-2005-6-5-r46 . PMC 1175958 . PMID  15892874. 
  36. ^ "Documentación (principio 8)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  37. ^ "Pluralidad documentada de usuarios (principio 9)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  38. ^ "Compromiso con la colaboración (principio 10)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  39. ^ "Locus de autoridad (principio 11)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  40. ^ "Convenciones de nomenclatura (principio 12)". obofoundry.org . Consultado el 6 de febrero de 2020 .
  41. ^ Schober, Daniel; Smith, Barry; Lewis, Suzanna E; Kusnierczyk, Waclaw; Lomax, Jane; Mungall, Chris; Taylor, Chris F; Rocca-Serra, Philippe; Sansone, Susanna-Assunta (2009). "Convenciones de nomenclatura basadas en encuestas para su uso en el desarrollo de ontologías de OBO Foundry". BMC Bioinformatics . 10 (1): 125. doi : 10.1186/1471-2105-10-125 . ISSN  1471-2105. PMC 2684543 . PMID  19397794. 
  42. ^ "Mantenimiento (principio 16)". obofoundry.org . Consultado el 6 de febrero de 2020 .

Enlaces externos