La Fundición de Ontologías Biológicas y Biomédicas Abiertas ( OBO ) es un grupo de personas dedicadas a construir y mantener ontologías relacionadas con las ciencias de la vida . [1] OBO Foundry establece un conjunto de principios para el desarrollo de ontologías para crear un conjunto de ontologías de referencia interoperables en el dominio biomédico. Actualmente, existen más de cien ontologías que siguen los principios de OBO Foundry .
El esfuerzo de OBO Foundry facilita la integración de resultados biomédicos y la realización de análisis en bioinformática . Lo hace ofreciendo una referencia estructurada para términos de diferentes campos de investigación y sus interconexiones (por ejemplo, un fenotipo en un modelo de ratón y su fenotipo relacionado en el pez cebra ). [2]
La iniciativa Foundry tiene como objetivo mejorar la integración de datos en las ciencias de la vida. Un enfoque para la integración es la anotación de datos de diferentes fuentes utilizando vocabularios controlados . Idealmente, dichos vocabularios controlados toman la forma de ontologías , que respaldan el razonamiento lógico sobre los datos anotados utilizando los términos del vocabulario.
La formalización de conceptos en el ámbito biomédico es especialmente conocida a través del trabajo del Gene Ontology Consortium, parte de OBO Foundry. Esto ha llevado al desarrollo de ciertos principios propuestos de buenas prácticas en el desarrollo de ontologías, que ahora se están poniendo en práctica en el marco del consorcio Open Biomedical Ontologies a través de su iniciativa OBO Foundry. Las ontologías OBO forman parte de los recursos del Centro Nacional de Ontología Biomédica , donde forman un componente central del BioPortal del NCBO.
Open Biological and Biomedical Ontologies (OBO; anteriormente Open Biomedical Ontologies) es un esfuerzo para crear ontologías ( vocabularios controlados ) para su uso en dominios biológicos y médicos. Un subconjunto de las ontologías OBO originales ha iniciado OBO Foundry, que lidera los esfuerzos de OBO desde 2007. [1]
La creación de OBO en 2001 se inspiró en gran medida en los esfuerzos del proyecto Gene Ontology . [3] OBO forma parte de los recursos del Centro Nacional de Ontología Biomédica de EE. UU. (NCBIO) y un elemento central del BioPortal del NCBO. Es una iniciativa liderada por OBO Foundry.
OBO Foundry está abierta a la participación de cualquier persona interesada. Las ontologías que pretenden ser oficialmente parte de OBO Foundry deben adherirse a los principios de OBO y pasar una serie de revisiones realizadas por los miembros, cuando "los coordinadores de Foundry sirven como análogos de los editores de revistas". [1] Hay ontologías que siguen los principios de OBO pero que no son oficialmente parte de OBO, como la ontología de aplicación de reactivos de eagle-i . [4] y la ontología Animales en contexto. [5]
Se ha propuesto una integración en OBO de la teoría de la rigidez de OntoClean como un paso para estandarizar las ontologías candidatas. Esta integración facilitaría el desarrollo de software para verificar automáticamente a los candidatos. [6]
La comunidad de OBO Foundry también se dedica a desarrollar herramientas para facilitar la creación y el mantenimiento de ontologías. La mayoría de los desarrolladores de ontologías en OBO utilizan el editor de ontologías Protégé y Web Ontology Language (OWL) para crear ontologías. Para facilitar la gestión de la línea de comandos de ontologías en un formato compatible con Protégé y OWL, OBO Foundry ha desarrollado la herramienta ROBOT (ROBOT es una herramienta OBO). ROBOT agrega funciones para tareas rutinarias en el desarrollo de ontologías, es de código abierto y puede usarse a través de la línea de comandos o como una biblioteca para cualquier lenguaje en la Máquina Virtual Java . [7]
Otra herramienta relacionada con el esfuerzo de OBO es OBO-Edit , [8] un editor y razonador de ontologías financiado por Gene Ontology Consortium . También existen complementos para OBO-Edit que facilitan el desarrollo de ontologías, como el generador de ontologías semiautomático DOG4DAG. [9]
El formato de archivo OBO es un lenguaje orientado a la biología para crear ontologías. Se basa en los principios del lenguaje de ontología web (OWL) .
Como esfuerzo comunitario, se han creado asignaciones comunes estándar para transformaciones de ida y vuelta sin pérdidas entre el formato Open Biomedical Ontologies (OBO) y OWL. [10] [11] La investigación contiene un examen metódico de cada una de las construcciones de OBO y un pastel de capas para OBO, similar a la pila de Web Semántica. [12]
El conjunto inicial de ontologías de OBO Foundry estaba compuesto por ontologías maduras (como Gene Ontology , GO y Foundational Model of Anatomy , FMAO), por fusiones de ontologías previamente existentes (por ejemplo: Cell Ontology, [13] CL, formada de diferentes ontologías dedicadas, [14] [15] y partes relacionadas en GO y FMAO) y mediante el desarrollo de nuevas ontologías basadas en sus principios. [dieciséis]
El conjunto original de ontologías también incluía la ontología anatómica del pez cebra [17] (una parte de la red de información del pez cebra ), la ontología CheBI , la ontología de enfermedades , la ontología de plantas , la ontología de secuencias , la ontología para investigaciones biomédicas y la ontología de proteínas . [dieciséis]
El número de ontologías en OBO ha aumentado al orden de cientos y están reunidas en la lista de ontologías de OBO Foundry .
También se han integrado varias ontologías diferentes de OBO Foundry al gráfico de conocimiento de Wikidata . [18] [19] Esto ha llevado a la integración de ontologías estructuradas de OBO a datos de otras bases de datos que no son de OBO. Por ejemplo, la integración de Human Disease Ontology [20] a Wikidata ha permitido su enlace a la descripción de líneas celulares del recurso Cellosaurus . [21] Uno de los objetivos de la integración de OBO Foundry a Wikidata ha sido reducir las barreras para que los no ontólogos contribuyan y utilicen ontologías. Podría decirse que Wikidata es más fácil de entender y utilizar que los modelos de ontología tradicionales (que requieren un alto grado de experiencia específica). [22]
Resumen de los principios de OBO Foundry [23] para el desarrollo de una ontología de ciencias biológicas compatible con OBO :
Las ontologías están disponibles abiertamente y deben publicarse bajo la licencia CC-BY 3.0 o bajo el dominio público ( CC0 ). [24] La apertura de las ontologías ha permitido, por ejemplo, la importación de términos de Gene Ontology (una de las ontologías que siguen los principios de OBO) al proyecto Wikidata . [25]
Las ontologías tienen que estar disponibles en un lenguaje formal común . En la práctica, eso significa que las ontologías que forman parte de la fundición OBO necesitan describir elementos en los formatos OWL/ OWL2 u OBO utilizando una sintaxis RDF/XML para maximizar la interoperabilidad. [26]
Los términos deben ser únicos en el espacio OBO, lo que significa que cada elemento tiene un prefijo de ontología único (como CHEBI , GO , PRO ) y un identificador numérico local dentro de la ontología. [27] La elección de una identificación numérica se realizó con el fin de mejorar el mantenimiento y la evolución de los recursos. [28] Para participar en OBO Foundry, las ontologías tienen que ser ortogonales y los conceptos que modelan deben ser únicos dentro de OBO, por lo que cada concepto tiene un único Identificador Uniforme de Recursos (URI). Las nuevas ontologías tienen, entonces, que reutilizar el trabajo realizado en otros esfuerzos. [28]
A pesar del ideal de unicidad de los términos e interoperabilidad, en la práctica esto es difícil de hacer cumplir, lo que lleva a la duplicación de términos. Además, algunas ontologías no reutilizan términos o incluso los reutilizan de manera inapropiada. [29]
Las ontologías evolucionan con el tiempo, refinando conceptos y descripciones de acuerdo con los avances en el conocimiento de sus dominios específicos. [30] Para garantizar que las nuevas versiones se actualicen, pero que las herramientas que utilizan versiones anteriores de las ontologías sigan funcionando, OBO aplica un sistema de sistemas de control de versiones , en el que cada versión de la ontología recibe un identificador único, ya sea en el formato de una fecha. o un sistema de numeración y datos de metadatos . [31]
Las ontologías deben tener un alcance claramente especificado (el dominio que pretenden cubrir). [32]
Las ontologías deben tener definiciones textuales para cada elemento, de forma legible por humanos . Eso significa que además de la identificación alfanumérica de cada elemento, estos deben describirse en lenguaje natural mediante afirmaciones lógicas siguiendo la lógica aristotélica de una manera única dentro de la ontología. [33]
Las ontologías deben utilizar relaciones entre elementos de la Ontología de Relaciones (RO) . Esto garantiza que diferentes ontologías puedan integrarse sin problemas, lo cual es especialmente importante para la inferencia lógica . [34]
La Relation Ontology (RO) es una ontología diseñada para representar las relaciones entre diferentes conceptos biomédicos. [35] Describe rigurosamente relaciones como "parte_de", "ubicado_en" y "precedido_por" que son reutilizadas por muchas ontologías de OBO Foundry.
Las ontologías OBO deben estar minuciosamente documentadas. Con frecuencia, esto se hace a través de repositorios de GitHub para cada ontología específica (consulte la Lista de ontologías de OBO Foundry ). [36]
Las ontologías deberían ser útiles para varias personas diferentes y los desarrolladores de ontologías deberían documentar la evidencia de su uso. Este criterio es importante para el proceso de revisión. Los ejemplos de uso incluyen enlaces a términos de otras ontologías, uso en proyectos de web semántica , uso en anotaciones u otras aplicaciones de investigación. [37]
Las ontologías deben desarrollarse de manera que permitan colaboraciones con otros miembros de OBO Foundry. [38]
Las ontologías deben tener una persona responsable de la ontología que media la interacción con la comunidad. [39]
Las convenciones de nomenclatura para ontologías OBO tienen como objetivo hacer que las etiquetas primarias sean inequívocas y únicas dentro de la ontología (y preferiblemente, dentro de OBO). Las etiquetas y sinónimos deben estar escritos en inglés, evitando el uso de guiones bajos y mayúsculas y minúsculas . [40] OBO carece de un mecanismo para soporte multilingüe, a diferencia de Wikidata , que permite etiquetas en diferentes sistemas. El sistema de nombres en OBO se basa en una serie de estudios para catalogar las convenciones de nombres de las ontologías actuales, así como descubrir cuestiones relacionadas con estas convenciones. [41]
Las ontologías deben actualizarse en función de los cambios en el consenso científico . OBO Foundry define el consenso científico como "múltiples publicaciones de laboratorios independientes durante un año llegan a la misma conclusión, y no hay opiniones disidentes publicadas o son limitadas (<10%) en el mismo período de tiempo". [42]
{{cite conference}}
: CS1 maint: multiple names: authors list (link)