La metodología de conocimiento identifica tres tipos de información para que lo utilice el sistema de recomendación: [1] Sobre la base de datos de esta información, la afinidad que el usuario tiene se calcula para algunos productos y los productos con mayor afinidad se recomiendan para el usuario.
Se espera que las fuentes que proporcionan información oportuna, exacta y pertinente sean utilizadas con más frecuencia que las fuentes que proporcionan información irrelevante.
Uno de los retos más importantes tanto en un sistema de comercialización como en un sistema de recomendación es obtener información útil sobre el cliente o usuario de un determinado producto o servicio.
En general, el primer paso es buscar información analizando cualquier fuente disponible.
Sin embargo, el principal problema que surge es la utilidad de esta información.
Por lo tanto, a priori, es necesario un mecanismo que proporcione pruebas sobre la pertinencia de esta información para las recomendaciones.
Para evitar hacer una búsqueda sin fin en la enorme pila de datos disponibles, ya que se utilizan demasiados recursos, la información debe ser previamente clasificada o indexada por ser fácilmente encontrada.
Esta metodología se ha definido específicamente para las fuentes de información estructurada.
Para saber cómo de pertinente es una fuente debemos mirar ciertas características: Dado un conjunto
La diversidad (D) se calcula como la entropía, donde cada
y dividido por el número de usuarios
También hay categorías que recogen los usuarios que han interaccionado con la fuente según periodos de tiempo: La puntualidad (P) de las interacciones de una fuente
y dividido por el número de usuarios
Finalmente conseguimos una medida de relevancia: Dado un conjunto
es la cantidad de atributos D sin S, llamado
La confianza de una fuente se define como la probabilidad de que una fuente sea evaluada por utilizar su información, es un valor entre 0 y 1.
Este valor es la confianza ob-tenida a partir de observaciones del comportamiento pasado de las fuentes.
La información necesaria para calcular el grado de éxito de las recomendaciones se guarda y se utiliza para evaluar las recomendaciones hechas con información de una fuente como exitosa (= 1) o no exitosa (= 0).
El algoritmo se compone de tres elementos: