El sistema de recuperación de información SMART (Sistema para el análisis mecánico y la recuperación de texto) es un sistema de recuperación de información desarrollado en la Universidad de Cornell en la década de 1960. [1] Muchos conceptos importantes en la recuperación de información se desarrollaron como parte de la investigación sobre el sistema SMART, incluido el modelo de espacio vectorial , la retroalimentación de relevancia y la clasificación de Rocchio .
Gerard Salton dirigió el grupo que desarrolló SMART. Otros contribuyentes incluyeron a Mike Lesk .
El sistema SMART también proporciona un conjunto de corpus, consultas y clasificaciones de referencia, tomadas de diferentes temas, en particular
Al legado del sistema SMART pertenece la llamada notación triple SMART, un esquema mnemotécnico para denotar variantes de ponderación tf-idf en el modelo de espacio vectorial. El mnemotécnico para representar una combinación de ponderaciones toma la forma ddd.qqq
, donde las primeras tres letras representan la ponderación del término del vector del documento de colección y las tres segundas letras representan la ponderación del término para el vector del documento de consulta. Por ejemplo, ltc.lnn
representa la ltc
ponderación aplicada a un documento de colección y la lnn
ponderación aplicada a un documento de consulta.
Las siguientes tablas establecen la notación SMART: [2]
Las letras grises en las columnas primera, quinta y novena son el esquema utilizado por Salton y Buckley en su artículo de 1988. [4] Las letras en negrita en las columnas segunda, sexta y décima son el esquema utilizado en los experimentos informados a partir de entonces.
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )