ISO 25964 es el estándar internacional para tesauros , publicado en dos partes como sigue:
ISO 25964 Información y documentación - Tesauros e interoperabilidad con otros vocabularios Parte 1: Tesauros para recuperación de información [publicada en agosto de 2011] Parte 2: Interoperabilidad con otros vocabularios [publicada en marzo de 2013]
Fue emitida por ISO , la Organización Internacional de Normalización, y su sitio web oficial [1] es mantenido por su secretaría en NISO , la Organización Nacional de Estándares de Información de EE. UU. Cada parte de la norma se puede comprar por separado a ISO o a cualquiera de sus organismos miembros nacionales (como ANSI , BSI , AFNOR , DIN , etc.). Algunas partes están disponibles de forma gratuita en el sitio web oficial.
La primera norma internacional para tesauros fue la ISO 2788 , Directrices para el establecimiento y desarrollo de tesauros monolingües , publicada originalmente en 1974 y actualizada en 1986. En 1985 se le unió la norma complementaria ISO 5964 , Directrices para el establecimiento y desarrollo de tesauros multilingües . Con el paso de los años, la ISO 2788 y la ISO 5964 se adoptaron como normas nacionales en varios países, por ejemplo, Canadá, Francia y el Reino Unido. En el Reino Unido se les dieron los números de alias BS 5723 y BS 6723 respectivamente. Y fue en el Reino Unido, a principios de siglo, donde se empezó a trabajar para revisarlas para las necesidades de redes del nuevo milenio. Esto dio como resultado, durante 2005 - 2008, la publicación de la Norma Británica de 5 partes BS 8723, como sigue:
BS 8723 Vocabularios estructurados para recuperación de información - Guía Parte 1: Definiciones, símbolos y abreviaturas Parte 2: Tesauros Parte 3: Vocabularios distintos de los tesauros Parte 4: Interoperabilidad entre vocabularios Parte 5: Formatos de intercambio y protocolos para interoperabilidad
Incluso antes de que se publicara la última parte de la BS 8723, se comenzó a trabajar para adoptarla y adaptarla como estándar internacional para reemplazar a la ISO 2788 y la ISO 5964. El proyecto fue dirigido por un Grupo de Trabajo del Subcomité 9 (Identificación y descripción) del Comité Técnico 46 de ISO (Información y documentación ), conocido como “Vocabularios Estructurados ISO TC46/SC9/WG8”.
Las normas ISO 2788 e ISO 5964 fueron retiradas en 2011, cuando fueron reemplazadas por la primera parte de la norma ISO 25964. La segunda parte de la norma ISO 25964 se emitió en marzo de 2013, completando el proyecto.
La norma ISO 25964 está destinada a tesauros destinados a respaldar la recuperación de información y, específicamente, a guiar la elección de términos utilizados en la indexación, el etiquetado y las consultas de búsqueda.
El objetivo principal se resume así en la introducción de la norma:
"Si tanto el indexador como el buscador son guiados a elegir el mismo término para el mismo concepto, entonces se recuperarán documentos relevantes".
Mientras que la mayoría de las aplicaciones previstas para las normas ISO 2788 e ISO 5964 eran bases de datos en un único dominio, a menudo internas o para sistemas en papel, la norma ISO 25964 proporciona orientación adicional para el nuevo contexto de aplicaciones en red, incluida la Web semántica . Un tesauro es uno de los varios tipos de vocabulario controlado que se utilizan en este contexto.
Un tesauro que cumple con la norma ISO 25964-1 (como se conoce a la Parte 1) enumera todos los conceptos disponibles para indexar en un contexto determinado y etiqueta cada uno de ellos con un término preferido, así como con los sinónimos que correspondan. Se muestran las relaciones entre los conceptos y entre los términos, lo que facilita la navegación por el campo mientras se crea una consulta de búsqueda. Los principales tipos de relación incluyen:
En los tesauros multilingües, la equivalencia también se aplica entre términos correspondientes en diferentes lenguas naturales. Establecer correspondencia no siempre es fácil, y la norma proporciona recomendaciones para abordar las dificultades que suelen surgir.
La norma ISO 25964-1 explica cómo crear un tesauro monolingüe o multilingüe, cómo visualizarlo y cómo gestionar su desarrollo. Hay un modelo de datos que se utiliza para gestionar los datos del tesauro (especialmente cuando se intercambian datos entre sistemas) y un esquema XML para codificar los datos. Se puede acceder tanto al modelo como al esquema las 24 horas del día, los 7 días de la semana, de forma gratuita, en el sitio web oficial alojado por NISO. La norma también establece las características que se deben tener en cuenta al elegir el software para gestionar el tesauro.
La norma ISO 25964-2 aborda los desafíos de utilizar un tesauro en combinación con otro y/o con algún otro tipo de vocabulario controlado o sistema de organización del conocimiento (KOS). Los tipos que cubre incluyen esquemas de clasificación , taxonomías , esquemas de encabezamientos de materia , ontologías , listas de autoridades de nombres , terminologías y anillos de sinónimos . Dentro de una misma organización es habitual encontrar varios KOS diferentes utilizados en contextos como el sistema de gestión de registros, el catálogo de la biblioteca, la intranet corporativa, el laboratorio de investigación, etc. Para ayudar a los usuarios con el desafío de ejecutar una única búsqueda en todas las colecciones disponibles, la norma ISO 25964-2 proporciona orientación sobre la correlación entre los términos y conceptos de un tesauro y los de los otros KOS. Cuando la correlación no es una opción sensata, la norma recomienda otras formas de uso de vocabulario complementario.
De manera similar, en Internet existe la posibilidad de realizar búsquedas simultáneas en repositorios y bases de datos indexados con diferentes sistemas de organización del conocimiento, a una escala aún mayor. La interoperabilidad entre las diferentes redes, plataformas, aplicaciones de software y lenguajes (tanto naturales como artificiales) depende de la adopción de numerosos protocolos y estándares. La norma ISO 25964-2 es la que aborda la interoperabilidad entre vocabularios estructurados, especialmente cuando se trata de un tesauro.
Desde que se publicó la Parte 1 de la norma ISO 25964, los organismos nacionales de normalización de varios países la han adoptado. Por ejemplo, la British Standards Institution (BSI) del Reino Unido la ha adoptado y la ha etiquetado sin cambios como BS ISO 25964-1. En el momento de redactar este artículo, se está estudiando de forma similar la Parte 2. La norma estadounidense ANSI/NISO Z39.19 - Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies cubre parte del mismo terreno que la norma ISO 25964-1. Se ocupa de listas monolingües, anillos de sinónimos y taxonomías, así como de tesauros, pero no proporciona un modelo de datos ni aborda vocabularios multilingües u otros aspectos de la interoperabilidad, como la correspondencia entre sistemas de organización del conocimiento. Cuando las dos normas se superponen, son ampliamente compatibles entre sí. La NISO participa activamente en ambas normas, habiendo participado en el trabajo de desarrollo de la norma ISO 25964, así como dirigiendo su secretaría. La recomendación SKOS ( Simple Knowledge Organization System ) del W3C tiene una estrecha relación con la norma ISO 25964 en el contexto de la Web semántica. SKOS se aplica a todo tipo de “sistemas de organización del conocimiento simples” que se pueden encontrar en la Web, incluidos los tesauros y otros. Mientras que la norma ISO 25964-1 aconseja sobre la selección y el ajuste de conceptos, términos y relaciones para crear un buen tesauro, SKOS aborda el siguiente paso: trasladar el tesauro a la Web. Y mientras que la norma ISO 25964-2 recomienda el tipo de asignaciones que se pueden establecer entre un sistema de organización del conocimiento y otro, SKOS presenta una forma de expresar las asignaciones cuando se publican en la Web.