stringtranslate.com

Espectro semántico

El espectro semántico , a veces denominado espectro ontológico , continuo de datos inteligentes o precisión semántica , es una serie de definiciones cada vez más precisas o más bien semánticamente expresivas para elementos de datos en representaciones de conocimiento , especialmente para uso de máquinas.

En el extremo inferior del espectro se encuentra una simple vinculación de una sola palabra o frase y su definición. En el extremo superior se encuentra una ontología completa que especifica las relaciones entre los elementos de datos mediante URI precisos para las relaciones y las propiedades.

Una mayor especificidad conlleva una mayor precisión y la capacidad de utilizar herramientas para integrar sistemas automáticamente, pero también un mayor coste para construir y mantener un registro de metadatos .

Algunos pasos en el espectro semántico incluyen los siguientes:

  1. Glosario : una lista simple de términos y sus definiciones. Un glosario se centra en crear una lista completa de la terminología de términos y acrónimos específicos de un dominio . Es útil para crear definiciones claras e inequívocas de términos y, dado que se puede crear con herramientas de procesamiento de texto simples, se necesitan pocas herramientas técnicas.
  2. Vocabulario controlado : una lista simple de términos, definiciones y convenciones de nomenclatura. Un vocabulario controlado suele tener algún tipo de proceso de supervisión asociado con la adición o eliminación de definiciones de elementos de datos para garantizar la coherencia. Los términos suelen definirse en relación con los demás.
  3. Diccionario de datos : términos, definiciones, convenciones de nomenclatura y una o más representaciones de los elementos de datos en un sistema informático. Los diccionarios de datos suelen definir tipos de datos, comprobaciones de validación como valores enumerados y las definiciones formales de cada uno de los valores enumerados.
  4. Modelo de datos : Términos, definiciones, convenciones de nomenclatura, representaciones y una o más representaciones de los elementos de datos, así como el comienzo de la especificación de las relaciones entre los elementos de datos, incluidas abstracciones y contenedores.
  5. Taxonomía : Un modelo de datos completo en una jerarquía de herencia donde todos los elementos de datos heredan sus comportamientos de un único "superelemento de datos". La diferencia entre un modelo de datos y una taxonomía formal es la disposición de los elementos de datos en una estructura de árbol formal donde cada elemento del árbol es un concepto definido formalmente con propiedades asociadas.
  6. Ontología : Una especificación completa y legible por máquina de una conceptualización que utiliza URI (y luego IRI ) para todos los elementos de datos, propiedades y tipos de relación. El lenguaje estándar del W3C para representar ontologías es el Lenguaje de Ontología Web (OWL). Las ontologías contienen frecuentemente reglas de negocios formales formadas en declaraciones de lógica discreta que relacionan elementos de datos entre sí.

Preguntas típicas para determinar la precisión semántica

La siguiente es una lista de preguntas que pueden surgir al determinar la precisión semántica.

Exactitud:
¿Cómo se puede garantizar que la sintaxis y la semántica sean correctas? ¿Existen herramientas (como XML Schema ) disponibles para validar la sintaxis de los intercambios de datos?
Adecuación/Expresividad/Alcance:
¿El sistema representa todo lo que es de utilidad práctica para el propósito? ¿Se hace hincapié en los datos que se externalizan (se exponen o transfieren entre sistemas)?
Eficiencia:
¿Con qué eficiencia se puede buscar/consultar la representación y, posiblemente, razonar sobre ella?
Complejidad:
¿Qué tan empinada es la curva de aprendizaje para definir nuevos conceptos, consultarlos o restringirlos? ¿Existen herramientas adecuadas para simplificar los flujos de trabajo típicos? (Véase también: editor de ontologías )
Traducibilidad:
¿Es posible transformar fácilmente la representación (por ejemplo, mediante una transformación basada en vocabulario ) en una representación equivalente de modo que se garantice la equivalencia semántica ?

Determinación de la ubicación en el espectro semántico

En la actualidad, muchas organizaciones están creando un registro de metadatos para almacenar sus definiciones de datos y publicar metadatos . Con frecuencia surge la pregunta de dónde se encuentran en el espectro semántico. Para determinar dónde se encuentran sus sistemas, algunas de las siguientes preguntas suelen ser útiles.

  1. ¿Existe un glosario centralizado de términos para el tema en cuestión?
  2. ¿El glosario de términos incluye definiciones precisas de cada término?
  3. ¿Existe un repositorio central para almacenar elementos de datos que incluya información sobre los tipos de datos?
  4. ¿Existe un proceso de aprobación asociado con la creación y los cambios de los elementos de datos?
  5. ¿Se enumeran completamente los elementos de datos codificados? ¿Cada enumeración tiene una definición completa?
  6. ¿Existe un proceso establecido para eliminar elementos de datos duplicados o redundantes del registro de metadatos?
  7. ¿Existe uno o más esquemas de clasificación utilizados para clasificar elementos de datos?
  8. ¿Se crean intercambios de documentos y servicios web utilizando los elementos de datos?
  9. ¿Puede utilizarse el registro central de metadatos como parte de una arquitectura basada en modelos ?
  10. ¿Hay personal capacitado para extraer elementos de datos que puedan reutilizarse en estructuras de metadatos?

Naturaleza estratégica de la semántica

En la actualidad, gran parte de la World Wide Web se almacena en lenguaje de marcado de hipertexto . Los motores de búsqueda se ven seriamente obstaculizados por su incapacidad para comprender el significado de las páginas web publicadas. Estas limitaciones han dado lugar al surgimiento del movimiento de la web semántica . [1]

En el pasado, muchas organizaciones que creaban aplicaciones de bases de datos personalizadas utilizaban equipos aislados de desarrolladores que no publicaban formalmente sus definiciones de datos. Estos equipos utilizaban con frecuencia definiciones de datos internas que eran incompatibles con otros sistemas informáticos. Esto hacía que la integración de aplicaciones empresariales y el almacenamiento de datos fueran extremadamente difíciles y costosos. Hoy en día, muchas organizaciones exigen que los equipos consulten un registro de datos centralizado antes de crear nuevas aplicaciones.

El título del puesto de trabajo de una persona responsable de coordinar los datos de una organización es arquitecto de datos .

Historia

La primera referencia a este término se produjo en el Panel de Ontologías de la AAAI de 1999. El panel fue organizado por Chris Welty, quien, a instancias de Fritz Lehmann y en colaboración con los panelistas (Fritz, Mike Uschold , Mike Gruninger y Deborah McGuinness ), ideó un "espectro" de tipos de sistemas de información que, en ese momento, se denominaban ontologías. La imagen del "espectro de ontologías" apareció impresa en la introducción de Formal Ontology and Information Systems: Proceedings of the 2001 Conference. El espectro de ontologías también se presentó en una charla en la reunión de Semantics for the Web en 2000 en Dagstuhl por Deborah McGuinness. McGuinness produjo un artículo que describe los puntos de ese espectro que aparecieron en el libro que surgió (mucho después) de ese taller llamado "Spinning the Semantic Web". Más tarde, Leo Obrst amplió el espectro a dos dimensiones (lo que técnicamente ya no es realmente un espectro) y agregó muchos más detalles, que se incluyeron en su libro, La Web Semántica: Una guía para el futuro de XML, los servicios web y la gestión del conocimiento.

El concepto de precisión semántica en los sistemas de negocios fue popularizado por Dave McComb en su libro Semántica en sistemas de negocios: La guía del gerente inteligente publicado en 2003, donde utiliza con frecuencia el término Precisión semántica .

Esta discusión se centró en una partición de 10 niveles que incluía los siguientes niveles (enumerados en orden de precisión semántica creciente):

  1. Catálogo simple de elementos de datos
  2. Glosario de términos y definiciones
  3. Tesauros , Términos específicos, Relaciones
  4. Relaciones informales tipo " es-un "
  5. Relaciones formales "Es-un"
  6. Instancias formales
  7. Marcos (propiedades)
  8. Restricciones de valor
  9. Disyunción , Inversa, Parte de
  10. Restricciones lógicas generales

Obsérvese que anteriormente había un énfasis especial en la adición de relaciones formales tipo es-un al espectro, lo cual ha sido eliminado.

La empresa Cerebra también ha popularizado este concepto al describir los formatos de datos que existen dentro de una empresa en su capacidad de almacenar metadatos semánticamente precisos . Su lista incluye:

  1. HTML
  2. PDF
  3. Documentos de procesamiento de textos
  4. Microsoft Excel
  5. Bases de datos relacionales
  6. XML
  7. Esquema XML
  8. Taxonomías
  9. Ontologías

Lo que estos conceptos tienen en común es la capacidad de almacenar información con creciente precisión para facilitar la existencia de agentes inteligentes.

Véase también

Referencias

  1. ^ Lassila, Tim Berners-Lee, James Hendler y Ora (1 de mayo de 2001). "La Web semántica". Scientific American . Consultado el 5 de mayo de 2024 .{{cite web}}: CS1 maint: multiple names: authors list (link)