El sistema de recuperación de información SMART (Sistema para el análisis mecánico y recuperación de texto) es un sistema de recuperación de información desarrollado en la Universidad de Cornell en la década de 1960. [1] Muchos conceptos importantes en recuperación de información se desarrollaron como parte de la investigación sobre el sistema SMART, incluido el modelo de espacio vectorial , la retroalimentación de relevancia y la clasificación de Rocchio .
Gerard Salton dirigió el grupo que desarrolló SMART. Entre otros colaboradores se encontraba Mike Lesk .
El sistema SMART también proporciona un conjunto de corpus, consultas y clasificaciones de referencias, extraídos de diferentes temas, en particular:
Al legado del sistema SMART pertenece la denominada notación triple SMART, un esquema mnemotécnico para denotar variantes de ponderación tf-idf en el modelo de espacio vectorial. El mnemotécnico para representar una combinación de ponderaciones adopta la forma ddd.qqq
, donde las primeras tres letras representan la ponderación del término del vector de documento de colección y las segundas tres letras representan la ponderación del término para el vector de documento de consulta. Por ejemplo, ltc.lnn
representa la ltc
ponderación aplicada a un documento de colección y la lnn
ponderación aplicada a un documento de consulta.
Las siguientes tablas establecen la notación SMART: [2]
Las letras grises en la primera, quinta y novena columnas son el esquema utilizado por Salton y Buckley en su artículo de 1988. [4] Las letras en negrita en la segunda, sexta y décima columnas son el esquema utilizado en los experimentos informados posteriormente.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )