La inferencia incierta fue descrita por primera vez por CJ van Rijsbergen [1] como una forma de definir formalmente una consulta y una relación entre documentos en la recuperación de información . Esta formalización es una implicación lógica con una medida de incertidumbre adjunta.
Rijsbergen propone que la medida de incertidumbre de un documento d ante una consulta q sea la probabilidad de su implicación lógica, es decir:
La consulta de un usuario puede interpretarse como un conjunto de afirmaciones sobre el documento deseado. La tarea del sistema es inferir , dado un documento en particular, si las afirmaciones de la consulta son verdaderas. Si lo son, se recupera el documento. En muchos casos, el contenido de los documentos no es suficiente para afirmar las consultas. Se necesita una base de conocimiento de hechos y reglas, pero algunos de ellos pueden ser inciertos porque puede haber una probabilidad asociada a su uso para la inferencia. Por lo tanto, también podemos referirnos a esto como inferencia plausible . La plausibilidad de una inferencia es una función de la plausibilidad de cada afirmación de la consulta. En lugar de recuperar un documento que coincida exactamente con la consulta, deberíamos clasificar los documentos en función de su plausibilidad con respecto a esa consulta. Dado que d y q son ambos generados por los usuarios, son propensos a errores; por lo tanto, es incierto. Esto afectará la plausibilidad de una consulta determinada.
Al hacer esto se logran dos cosas:
Los documentos multimedia , como las imágenes o los vídeos, tienen distintas propiedades de inferencia para cada tipo de datos. También son distintas de las propiedades de los documentos de texto. El marco de inferencia plausible nos permite medir y combinar las probabilidades que surgen de estas diferentes propiedades.
La inferencia incierta generaliza las nociones de la lógica autoepistémica , donde los valores de verdad son conocidos o desconocidos, y cuando se conocen, son verdaderos o falsos.
Si tenemos una consulta del formato:
donde A, B y C son afirmaciones de consulta, entonces para un documento D queremos la probabilidad:
Si transformamos esto en probabilidad condicional y si las afirmaciones de la consulta son independientes, podemos calcular la probabilidad general de la implicación como el producto de las probabilidades de las afirmaciones individuales.
Croft y Krovetz [2] aplicaron la inferencia incierta a un sistema de recuperación de información para documentos de oficina que llamaron OFFICER . En los documentos de oficina, el supuesto de independencia es válido ya que la consulta se centrará en sus atributos individuales. Además de analizar el contenido de los documentos, también se puede consultar sobre el autor, el tamaño, el tema o la colección, por ejemplo. Idearon métodos para comparar los atributos de los documentos y las consultas, inferir su plausibilidad y combinarlos en una calificación general para cada documento. Además de eso, también se tuvo que abordar la incertidumbre del contenido de los documentos y las consultas.
Las redes lógicas probabilísticas son un sistema para realizar inferencias inciertas; los valores de verdad verdaderos o falsos se reemplazan no solo por una probabilidad, sino también por un nivel de confianza, que indica la certeza de la probabilidad.
Las redes lógicas de Markov permiten realizar inferencias inciertas; las incertidumbres se calculan utilizando el principio de máxima entropía , en analogía con la forma en que las cadenas de Markov describen la incertidumbre de las máquinas de estados finitos .