stringtranslate.com

Modelo de relevancia probabilística

El modelo de relevancia probabilística [1] [2] fue ideado por Stephen E. Robertson y Karen Spärck Jones como marco para los modelos probabilísticos futuros. Es un formalismo de recuperación de información útil para derivar funciones de clasificación utilizadas por los motores de búsqueda y los motores de búsqueda web para clasificar los documentos coincidentes según su relevancia para una consulta de búsqueda determinada.

Es un modelo teórico que estima la probabilidad de que un documento d j sea relevante para una consulta q . El modelo supone que esta probabilidad de relevancia depende de la consulta y de las representaciones del documento. Además, supone que hay una parte de todos los documentos que el usuario prefiere como conjunto de respuestas para la consulta q . Este conjunto de respuestas ideal se denomina R y debería maximizar la probabilidad general de relevancia para ese usuario. La predicción es que los documentos de este conjunto R son relevantes para la consulta, mientras que los documentos que no están presentes en el conjunto no son relevantes.

Modelos relacionados

Este marco tiene algunas limitaciones que deben abordarse mediante un mayor desarrollo:

Para abordar estas y otras preocupaciones, se han desarrollado otros modelos a partir del marco de relevancia probabilística, entre ellos el Modelo de Independencia Binaria del mismo autor. Los derivados más conocidos de este marco son el esquema de ponderación Okapi (BM25) y su refinamiento multicampo, BM25F.

Referencias

  1. ^ Robertson, SE; Jones, K. Spärck (mayo de 1976). "Ponderación de relevancia de los términos de búsqueda". Revista de la Sociedad Americana de Ciencias de la Información . 27 (3): 129–146. doi :10.1002/asi.4630270302.
  2. ^ Robertson, Stephen; Zaragoza, Hugo (2009). "El marco de relevancia probabilística: BM25 y más allá". Fundamentos y tendencias en recuperación de información . 3 (4): 333–389. CiteSeerX 10.1.1.156.5282 . doi :10.1561/1500000019.