En la recuperación de información , un término de índice (también conocido como término temático , encabezamiento temático , descriptor o palabra clave ) es un término que captura la esencia del tema de un documento. Los términos de índice forman un vocabulario controlado para su uso en registros bibliográficos . Son una parte integral del control bibliográfico , que es la función mediante la cual las bibliotecas recopilan, organizan y difunden documentos. Se utilizan como palabras clave para recuperar documentos en un sistema de información, por ejemplo, un catálogo o un motor de búsqueda . Una forma popular de palabras clave en la web son las etiquetas , que son directamente visibles y pueden ser asignadas por personas no expertas. Los términos de índice pueden consistir en una palabra, frase o término alfanumérico. Se crean analizando el documento ya sea manualmente con indexación temática o automáticamente con indexación automática o métodos más sofisticados de extracción de palabras clave. Los términos de índice pueden provenir de un vocabulario controlado o ser asignados libremente.
Las palabras clave se almacenan en un índice de búsqueda . Las palabras comunes como los artículos (a, an, the) y las conjunciones (and, or, but) no se tratan como palabras clave porque es ineficiente. Casi todos los sitios en inglés de Internet tienen el artículo " the ", por lo que no tiene sentido buscarlo. El motor de búsqueda más popular, Google , eliminó palabras clave como "the" y "a" de sus índices durante varios años, pero luego las volvió a introducir, lo que hizo posible de nuevo ciertos tipos de búsquedas precisas.
El término "descriptor" fue acuñado por Calvin Mooers en 1948. Se utiliza en particular para referirse a un término preferido de un diccionario de sinónimos .
El lenguaje del Sistema Simple de Organización del Conocimiento (SKOS) proporciona una forma de expresar términos de índice con el Marco de Descripción de Recursos para su uso en el contexto de la Web Semántica . [1]
La mayoría de los motores de búsqueda web están diseñados para buscar palabras en cualquier parte de un documento: el título, el cuerpo, etc. Siendo este el caso, una palabra clave puede ser cualquier término que exista dentro del documento. Sin embargo, se da prioridad a las palabras que aparecen en el título, las palabras que se repiten numerosas veces y las palabras que se asignan explícitamente como palabras clave dentro de la codificación. [2] Los términos de índice se pueden refinar aún más utilizando operadores booleanos como "AND, OR, NOT". "AND" normalmente es innecesario ya que la mayoría de los motores de búsqueda lo infieren. "OR" buscará resultados con un término de búsqueda u otro o ambos. "NOT" elimina una palabra o frase de la búsqueda, deshaciéndose de cualquier resultado que la incluya. También se pueden encerrar varias palabras entre comillas para convertir los términos de índice individuales en una frase de índice específica . Todos estos modificadores y métodos ayudan a refinar los términos de búsqueda, para maximizar mejor la precisión de los resultados de búsqueda. [3]
Las palabras clave de los autores son una parte integral de la literatura. [1] Muchas revistas y bases de datos brindan acceso a términos de indexación creados por los autores de los respectivos artículos. La calificación del proveedor determina la calidad tanto de los términos de indexación proporcionados por el indexador como de los términos de indexación proporcionados por el autor. La calidad de estos dos tipos de términos de indexación es de interés para la investigación, particularmente en relación con la recuperación de información . En general, un autor tendrá dificultades para proporcionar términos de indexación que caractericen su documento en relación con otros documentos en la base de datos.