Recuperación difusa

Hay dos modelos clásicos de recuperación difusa: Mínimo y Máximo Mixto (MMM - Mixed Min and Max) y el modelo de Paice.

Ambos modelos no proveen una vía para la evaluación ponderada de las consultas, lo cual si es considerado por el algoritmo norma-P.

Por ello, es posible definir la similitud de un documento para la consulta o como max(dA, dB) y la similitud de un documento con la consulta y como min(dA, dB).

El modelo MMM intenta suavizar los operadores Booleanos al considerar la similitud consulta-documento como una combinación lineal del mínimo y máximo de los pesos de los documentos.

Si miramos en documentos sobre un aproximamiento puro de Tf-idf, incluso eliminando los stop words, habrán palabras más relevantes con el tópico del documento que otras y tendrán el mismo peso porque tienen la misma frecuencia de términos.

Adicionalmente extendió el modelo Booleano extendido difuso: El modelo propuesto hace posible capturar imprecisión e incertidumbre concerniente a la representación y recuperación de información textual.