Filtrado colaborativo

El filtrado colaborativo ( CF ) es una técnica utilizada por los sistemas de recomendación . ^[1] El filtrado colaborativo tiene dos sentidos, uno estrecho y otro más general. ^[2]

En un sentido más nuevo y más estricto, el filtrado colaborativo es un método para hacer predicciones automáticas (filtrado) sobre los intereses de un usuario mediante la recopilación de preferencias o información sobre gustos de muchos usuarios (colaboración). El supuesto subyacente del enfoque es que si las personas A y B tienen la misma opinión sobre un tema, es más probable que estén de acuerdo en otros temas que A y una persona elegida al azar. Por ejemplo, un sistema de recomendación de filtrado colaborativo para preferencias en programación televisiva podría hacer predicciones sobre qué programa de televisión le debería gustar a un usuario dada una lista parcial de los gustos de ese usuario (gustos o disgustos). ^[3] Estas predicciones son específicas para el usuario, pero utilizan información obtenida de muchos usuarios. Esto difiere del enfoque más simple de dar una puntuación promedio (no específica) para cada elemento de interés, por ejemplo, en función de su número de votos .

En un sentido más general, el filtrado colaborativo es el proceso de filtrar información o patrones utilizando técnicas que implican la colaboración entre múltiples agentes, puntos de vista, fuentes de datos, etc. ^[2] Las aplicaciones del filtrado colaborativo suelen implicar conjuntos de datos muy grandes. Los métodos de filtrado colaborativo se han aplicado a muchos tipos de datos, entre ellos: datos de detección y monitorización, como en la exploración minera, la detección medioambiental en grandes áreas o con múltiples sensores; datos financieros, como los de las instituciones de servicios financieros que integran muchas fuentes financieras; y datos de usuarios de comercio electrónico y aplicaciones web.

Este artículo se centra en el filtrado colaborativo de datos de usuario, pero algunos de los métodos también se aplican a otras aplicaciones importantes.

Descripción general

El crecimiento de Internet ha hecho que sea mucho más difícil extraer de manera efectiva información útil de toda la información disponible en línea. ^{[ ¿según quién? ]} La abrumadora cantidad de datos requiere mecanismos para filtrar la información de manera eficiente . ^{[ ¿según quién? ]} El filtrado colaborativo es una de las técnicas utilizadas para abordar este problema.

La motivación para el filtrado colaborativo proviene de la idea de que las personas a menudo obtienen las mejores recomendaciones de alguien con gustos similares a los suyos. ^{[ cita requerida ]} El filtrado colaborativo abarca técnicas para unir personas con intereses similares y hacer recomendaciones sobre esta base.

Los algoritmos de filtrado colaborativo a menudo requieren (1) la participación activa de los usuarios, (2) una forma sencilla de representar los intereses de los usuarios y (3) algoritmos capaces de unir a personas con intereses similares.

Normalmente, el flujo de trabajo de un sistema de filtrado colaborativo es:

Un usuario expresa sus preferencias mediante la calificación de elementos (por ejemplo, libros, películas o grabaciones musicales) del sistema. Estas calificaciones pueden considerarse una representación aproximada del interés del usuario en el dominio correspondiente.
El sistema compara las calificaciones de este usuario con las de otros usuarios y encuentra a las personas con gustos más "similares".
Con usuarios similares, el sistema recomienda elementos que los usuarios similares han calificado altamente pero que aún no han sido calificados por este usuario (presumiblemente, la ausencia de calificación a menudo se considera como la falta de familiaridad con un elemento)

Un problema clave del filtrado colaborativo es cómo combinar y ponderar las preferencias de los usuarios vecinos. A veces, los usuarios pueden calificar inmediatamente los elementos recomendados. Como resultado, el sistema obtiene una representación cada vez más precisa de las preferencias de los usuarios a lo largo del tiempo.

Metodología

Los sistemas de filtrado colaborativo tienen muchas formas, pero muchos sistemas comunes se pueden reducir a dos pasos:

Busque usuarios que compartan los mismos patrones de calificación con el usuario activo (el usuario para quien es la predicción).
Utilice las calificaciones de los usuarios con ideas afines que se encontraron en el paso 1 para calcular una predicción para el usuario activo.

Esto se enmarca en la categoría de filtrado colaborativo basado en el usuario. Una aplicación específica de esto es el algoritmo de vecino más cercano basado en el usuario .

Como alternativa, el filtrado colaborativo basado en artículos (los usuarios que compraron x también compraron y) se realiza de manera centrada en el artículo:

Construir una matriz elemento-elemento determinando las relaciones entre pares de elementos
Inferir los gustos del usuario actual examinando la matriz y haciendo coincidir los datos de ese usuario.

Véase, por ejemplo, la familia de filtrado colaborativo basado en elementos Slope One .

Otra forma de filtrado colaborativo puede basarse en observaciones implícitas del comportamiento normal del usuario (en contraposición al comportamiento artificial impuesto por una tarea de calificación). Estos sistemas observan lo que ha hecho un usuario junto con lo que han hecho todos los usuarios (qué música ha escuchado, qué artículos ha comprado) y utilizan esos datos para predecir el comportamiento del usuario en el futuro, o para predecir cómo le gustaría comportarse a un usuario si tuviera la oportunidad. Estas predicciones luego deben filtrarse a través de la lógica empresarial para determinar cómo podrían afectar las acciones de un sistema empresarial. Por ejemplo, no es útil ofrecerle a alguien venderle un álbum de música en particular si ya ha demostrado que posee esa música.

Confiar en un sistema de puntuación o calificación que se promedia entre todos los usuarios ignora las demandas específicas de un usuario y es particularmente deficiente en tareas en las que hay una gran variación en los intereses (como en la recomendación de música). Sin embargo, existen otros métodos para combatir la explosión de información, como la búsqueda web y la agrupación de datos .

Tipos

Basado en la memoria

El enfoque basado en la memoria utiliza datos de calificación de los usuarios para calcular la similitud entre usuarios o elementos. Ejemplos típicos de este enfoque son la similitud basada en la vecindad y las recomendaciones top-N basadas en elementos/usuarios. Por ejemplo, en los enfoques basados en los usuarios, el valor de las calificaciones que el usuario u otorga al elemento i se calcula como una agregación de las calificaciones del elemento de algunos usuarios similares:

r_{u,i}=\operatorname {aggr} _{u^{\prime }\in U}r_{u^{\prime },i}

donde U denota el conjunto de los N usuarios principales que son más similares al usuario u que calificó el elemento i . Algunos ejemplos de la función de agregación incluyen:

r_{u,i}={\frac {1}{N}}\suma \límites _{u^{\prime }\in U}r_{u^{\prime },i}

r_{u,i}=k\sum \limits _{u^{\prime }\in U}\operatorname {simil} (u,u^{\prime })r_{u^{\prime },i}

donde k es un factor normalizador definido como , y $k=1/\sum _{u^{\prime }\in U}|\operatorname {simil} (u,u^{\prime })|$

r_{u,i}={\bar {r_{u}}}+k\sum \limits _{u^{\prime }\in U}\operatorname {simil} (u,u^{\prime })(r_{u^{\prime },i}-{\bar {r_{u^{\prime }}}})

¿Dónde está la calificación promedio del usuario u para todos los elementos calificados por u ? ${\bar {r_{u}}}$

El algoritmo basado en el vecindario calcula la similitud entre dos usuarios o elementos y produce una predicción para el usuario tomando el promedio ponderado de todas las calificaciones. El cálculo de la similitud entre elementos o usuarios es una parte importante de este enfoque. Para ello, se utilizan múltiples medidas, como la correlación de Pearson y la similitud basada en el vector coseno .

La similitud de correlación de Pearson de dos usuarios x , y se define como

\operatorname {simil} (x,y)={\frac {\suma \límites _{i\in I_{xy}}(r_{x,i}-{\bar {r_{x}}})(r_{y,i}-{\bar {r_{y}}})}{{\sqrt {\suma \límites _{i\in I_{xy}}(r_{x,i}-{\bar {r_{x}}})^{2}}}{\sqrt {\suma \límites _{i\in I_{xy}}(r_{y,i}-{\bar {r_{y}}})^{2}}}}}

donde I _xy es el conjunto de elementos calificados tanto por el usuario x como por el usuario y .

El enfoque basado en coseno define la similitud de coseno entre dos usuarios x e y como: ^[4]

\operatorname {simil} (x,y)=\cos({\vec {x}},{\vec {y}})={\frac {{\vec {x}}\cdot {\vec {y}}}{||{\vec {x}}||\times ||{\vec {y}}||}}={\frac {\sum \limits _{i\in I_{xy}}r_{x,i}r_{y,i}}{{\sqrt {\sum \limits _{i\in I_{x}}r_{x,i}^{2}}}{\sqrt {\sum \limits _{i\in I_{y}}r_{y,i}^{2}}}}}

El algoritmo de recomendación top-N basado en el usuario utiliza un modelo vectorial basado en la similitud para identificar los k usuarios más similares a un usuario activo. Una vez que se encuentran los k usuarios más similares, se agregan sus matrices de usuario-elemento correspondientes para identificar el conjunto de elementos que se recomendarán. Un método popular para encontrar usuarios similares es el hash sensible a la localidad , que implementa el mecanismo del vecino más cercano en tiempo lineal.

Las ventajas de este enfoque incluyen: la explicabilidad de los resultados, que es un aspecto importante de los sistemas de recomendación; fácil creación y uso; fácil facilitación de nuevos datos; independencia del contenido de los elementos que se recomiendan; buen escalamiento con elementos co-calificados.

Este enfoque también tiene varias desventajas. Su rendimiento disminuye cuando los datos son escasos , lo que es común en los elementos relacionados con la Web. Esto dificulta la escalabilidad de este enfoque y crea problemas con grandes conjuntos de datos. Aunque puede manejar nuevos usuarios de manera eficiente porque se basa en una estructura de datos , agregar nuevos elementos se vuelve más complicado porque esa representación generalmente se basa en un espacio vectorial específico . Agregar nuevos elementos requiere la inclusión del nuevo elemento y la reinserción de todos los elementos en la estructura.

Basado en modelos

Una alternativa a los métodos basados en la memoria es aprender modelos para predecir la calificación de los usuarios de elementos no calificados. Los algoritmos de CF basados en modelos incluyen redes bayesianas , modelos de agrupamiento , modelos semánticos latentes como la descomposición en valores singulares , análisis semántico latente probabilístico , factores multiplicativos múltiples, asignación de Dirichlet latente y modelos basados en procesos de decisión de Markov . ^[5]

Mediante este enfoque, los métodos de reducción de dimensionalidad se utilizan principalmente para mejorar la robustez y la precisión de los métodos basados en la memoria. Específicamente, métodos como la descomposición en valores singulares y el análisis de componentes principales , conocidos como modelos de factores latentes, comprimen una matriz de usuario-ítem en una representación de baja dimensión en términos de factores latentes. Esto transforma la matriz grande que contiene muchos valores faltantes en una matriz mucho más pequeña. Una matriz comprimida se puede utilizar para encontrar vecinos de un usuario o un elemento como se indicó en la sección anterior. La compresión tiene dos ventajas en datos grandes y dispersos : es más precisa y se escala mejor. ^[6]

Híbrido

Varias aplicaciones combinan los algoritmos CF basados en memoria y en modelos. Estos superan las limitaciones de los enfoques CF nativos y mejoran el rendimiento de la predicción. Es importante destacar que superan los problemas de CF como la escasez y la pérdida de información. Sin embargo, tienen una mayor complejidad y son costosos de implementar. ^[7] Por lo general, la mayoría de los sistemas de recomendación comerciales son híbridos, por ejemplo, el sistema de recomendación de noticias de Google. ^[8]

Aprendizaje profundo

En los últimos años, se han propuesto muchas técnicas de aprendizaje profundo y neuronal para el filtrado colaborativo. Algunas generalizan los algoritmos tradicionales de factorización matricial a través de una arquitectura neuronal no lineal ^[9] o aprovechan nuevos tipos de modelos como los autocodificadores variacionales [ ^10] . El aprendizaje profundo se ha aplicado a muchos escenarios (consciente del contexto, consciente de la secuencia, etiquetado social, etc.).

Sin embargo, la eficacia del aprendizaje profundo para la recomendación colaborativa ha sido cuestionada. Un análisis sistemático de publicaciones que utilizan el aprendizaje profundo o métodos neuronales para el problema de recomendación top-k, publicado en las principales conferencias (SIGIR, KDD, WWW, RecSys), encontró que, en promedio, menos del 40% de los artículos son reproducibles, y solo el 14% en algunas conferencias. En general, el estudio identifica 18 artículos, solo 7 de ellos podrían reproducirse y 6 podrían ser superados por líneas de base más antiguas y simples correctamente ajustadas. El artículo destaca los problemas potenciales en los estudios de investigación actuales y pide prácticas científicas mejoradas. ^[11] Otros han detectado problemas similares ^[12] y también en los sistemas de recomendación con reconocimiento de secuencias. ^[13]

Filtrado colaborativo sensible al contexto

Muchos sistemas de recomendación simplemente ignoran otra información contextual que existe junto con la calificación del usuario al proporcionar recomendaciones de artículos. ^[14] Sin embargo, debido a la disponibilidad generalizada de información contextual, como la hora, la ubicación, la información social y el tipo de dispositivo que utiliza el usuario, es cada vez más importante que un sistema de recomendación exitoso proporcione una recomendación sensible al contexto. Según Charu Aggrawal, "los sistemas de recomendación sensibles al contexto adaptan sus recomendaciones a información adicional que define la situación específica en la que se realizan las recomendaciones. Esta información adicional se conoce como el contexto". ^[6]

Si tomamos en consideración la información contextual, tendremos una dimensión adicional para la matriz de calificación de usuario-ítem existente. Como ejemplo, supongamos un sistema de recomendación de música que proporciona diferentes recomendaciones según la hora del día. En este caso, es posible que un usuario tenga diferentes preferencias de música en diferentes momentos del día. Por lo tanto, en lugar de utilizar la matriz de usuario-ítem, podemos utilizar un tensor de orden 3 (o superior para considerar otros contextos) para representar las preferencias de los usuarios sensibles al contexto. ^[15]^[16]^[17]

Para aprovechar el filtrado colaborativo y, en particular, los métodos basados en el vecindario, los enfoques se pueden extender desde una matriz de calificación bidimensional a un tensor de orden superior ^{[ cita requerida ]} . Para este propósito, el enfoque es encontrar los usuarios más similares/con ideas afines a un usuario objetivo; se puede extraer y calcular la similitud de las porciones (por ejemplo, la matriz de tiempo del elemento) correspondientes a cada usuario. A diferencia del caso insensible al contexto para el cual se calcula la similitud de dos vectores de calificación, en los enfoques conscientes del contexto , la similitud de las matrices de calificación correspondientes a cada usuario se calcula utilizando coeficientes de Pearson . ^[6] Una vez que se encuentran los usuarios con ideas más afines, se agregan sus calificaciones correspondientes para identificar el conjunto de elementos que se recomendarán al usuario objetivo.

La desventaja más importante de tener en cuenta el contexto en el modelo de recomendación es poder trabajar con un conjunto de datos más grande que contiene muchos más valores faltantes en comparación con la matriz de calificación de elementos de usuario ^{[ cita requerida ]} . Por lo tanto, de manera similar a los métodos de factorización matricial , las técnicas de factorización tensorial se pueden utilizar para reducir la dimensionalidad de los datos originales antes de utilizar cualquier método basado en el vecindario ^{[ cita requerida ]} .

Aplicación en la web social

A diferencia del modelo tradicional de los medios masivos, en el que hay pocos editores que fijan las pautas, las redes sociales con filtrado colaborativo pueden tener una gran cantidad de editores y el contenido mejora a medida que aumenta el número de participantes. Servicios como Reddit , YouTube y Last.fm son ejemplos típicos de medios basados en el filtrado colaborativo. ^[18]

Un ejemplo de aplicación de filtrado colaborativo es recomendar información interesante o popular según la opinión de la comunidad. Como ejemplo típico, las historias aparecen en la página principal de Reddit a medida que la comunidad las "vota" (las califica positivamente). A medida que la comunidad se hace más grande y más diversa, las historias promocionadas pueden reflejar mejor el interés promedio de los miembros de la comunidad.

Wikipedia es otra aplicación del filtrado colaborativo. Los voluntarios contribuyen a la enciclopedia filtrando los hechos y las falsedades. ^[19]

Otro aspecto de los sistemas de filtrado colaborativo es la capacidad de generar recomendaciones más personalizadas mediante el análisis de la información de la actividad pasada de un usuario específico o del historial de otros usuarios que se consideran de gustos similares a los de un usuario determinado. Estos recursos se utilizan para crear perfiles de usuario y ayudan al sitio a recomendar contenido según el usuario. Cuanto más utiliza un usuario determinado el sistema, mejores son las recomendaciones, ya que el sistema obtiene datos para mejorar su modelo de ese usuario.

Problemas

Un sistema de filtrado colaborativo no siempre consigue que el contenido coincida automáticamente con las preferencias de cada uno. A menos que la plataforma consiga una diversidad y una independencia de opiniones excepcionalmente buenas, un punto de vista siempre dominará a otro en una comunidad determinada. Al igual que en el escenario de recomendación personalizada, la introducción de nuevos usuarios o nuevos elementos puede provocar el problema del arranque en frío , ya que no habrá suficientes datos sobre estas nuevas entradas para que el filtrado colaborativo funcione con precisión. Para hacer recomendaciones adecuadas para un nuevo usuario, el sistema debe primero conocer las preferencias del usuario analizando sus votaciones o actividades de calificación anteriores. El sistema de filtrado colaborativo requiere que una cantidad sustancial de usuarios califique un nuevo elemento antes de que se pueda recomendar dicho elemento.

Desafíos

Escasez de datos

En la práctica, muchos sistemas de recomendación comerciales se basan en grandes conjuntos de datos. Como resultado, la matriz de usuario-ítem utilizada para el filtrado colaborativo puede ser extremadamente grande y dispersa, lo que genera desafíos en el rendimiento de la recomendación.

Un problema típico causado por la escasez de datos es el problema del arranque en frío . Como los métodos de filtrado colaborativo recomiendan elementos en función de las preferencias anteriores de los usuarios, los nuevos usuarios deberán calificar una cantidad suficiente de elementos para que el sistema pueda captar sus preferencias con precisión y, por lo tanto, brindar recomendaciones confiables.

De manera similar, los artículos nuevos también tienen el mismo problema. Cuando se agregan artículos nuevos al sistema, deben ser calificados por una cantidad sustancial de usuarios antes de que puedan recomendarse a usuarios que tienen gustos similares a los que los calificaron. El problema de los artículos nuevos no afecta las recomendaciones basadas en contenido , porque la recomendación de un artículo se basa en su conjunto discreto de cualidades descriptivas en lugar de sus calificaciones.

Escalabilidad

A medida que aumenta el número de usuarios y artículos, los algoritmos CF tradicionales sufrirán graves problemas de escalabilidad ^{[ cita requerida ]} . Por ejemplo, con decenas de millones de clientes y millones de artículos , un algoritmo CF con la complejidad de ya es demasiado grande. Además, muchos sistemas necesitan reaccionar inmediatamente a los requisitos en línea y hacer recomendaciones para todos los usuarios independientemente de sus millones de usuarios, y la mayoría de los cálculos se realizan en máquinas con memoria muy grande. ^[20] $O(M)$ $O(N)$ ${\estilo de visualización n}$

Sinónimos

Los sinónimos hacen referencia a la tendencia de varios artículos iguales o muy similares a tener nombres o entradas diferentes. La mayoría de los sistemas de recomendación no pueden descubrir esta asociación latente y, por lo tanto, tratan estos productos de manera diferente.

Por ejemplo, los elementos aparentemente diferentes "película infantil" y "film infantil" en realidad se refieren al mismo elemento. De hecho, el grado de variabilidad en el uso de términos descriptivos es mayor de lo que comúnmente se sospecha. ^{[ cita requerida ]} La prevalencia de sinónimos disminuye el rendimiento de recomendación de los sistemas CF. El modelado de temas (como la técnica de asignación de Dirichlet latente ) podría resolver esto agrupando diferentes palabras que pertenecen al mismo tema. ^{[ cita requerida ]}

Oveja gris

Las ovejas grises son los usuarios cuyas opiniones no coinciden ni discrepan de forma sistemática con las de ningún grupo de personas y, por lo tanto, no se benefician del filtrado colaborativo. Las ovejas negras son un grupo cuyos gustos idiosincrásicos hacen que las recomendaciones sean casi imposibles. Aunque esto es un fallo del sistema de recomendación, los recomendadores no electrónicos también tienen grandes problemas en estos casos, por lo que tener ovejas negras es un fallo aceptable. ^{[ disputado – discutir ]}

Ataques de chelines

En un sistema de recomendaciones en el que todos pueden dar valoraciones, es posible que la gente dé muchas valoraciones positivas a sus propios artículos y negativas a los de sus competidores. A menudo es necesario que los sistemas de filtrado colaborativo introduzcan precauciones para desalentar este tipo de manipulaciones.

Diversidad y la larga cola

Se espera que los filtros colaborativos aumenten la diversidad porque nos ayudan a descubrir nuevos productos. Sin embargo, algunos algoritmos pueden hacer lo contrario sin querer. Como los filtros colaborativos recomiendan productos basados en ventas o valoraciones pasadas, normalmente no pueden recomendar productos con datos históricos limitados. Esto puede crear un efecto de "los ricos se hacen más ricos" para los productos populares, similar a una retroalimentación positiva . Este sesgo hacia la popularidad puede impedir que se produzcan mejores coincidencias entre el producto y el consumidor. Un estudio de Wharton detalla este fenómeno junto con varias ideas que pueden promover la diversidad y la " larga cola ". ^[21] Se han desarrollado varios algoritmos de filtrado colaborativo para promover la diversidad y la " larga cola " ^[22] recomendando artículos novedosos, ^[23] inesperados ^[24] y fortuitos. ^[25]

Innovaciones

Se han desarrollado nuevos algoritmos para CF a raíz del premio Netflix .
Filtrado colaborativo entre sistemas, en el que los perfiles de usuario de varios sistemas de recomendación se combinan de manera multitarea; de esta manera, se logra compartir patrones de preferencias entre los modelos. ^[26]
Filtrado colaborativo robusto , donde la recomendación es estable frente a intentos de manipulación. Esta área de investigación aún está activa y no está completamente resuelta. ^[27]

Información auxiliar

La matriz de usuario-ítem es una base fundamental de las técnicas tradicionales de filtrado colaborativo y sufre de problemas de escasez de datos (es decir, inicio en frío ). Como consecuencia, a excepción de la matriz de usuario-ítem, los investigadores están tratando de reunir más información auxiliar para ayudar a impulsar el rendimiento de las recomendaciones y desarrollar sistemas de recomendación personalizados. ^[28] En general, hay dos tipos populares de información auxiliar: información de atributos e información de interacción. La información de atributos describe las propiedades de un usuario o de un elemento. Por ejemplo, el atributo de usuario puede incluir un perfil general (por ejemplo, género y edad) y contactos sociales (por ejemplo, seguidores o amigos en redes sociales ); el atributo de elemento significa propiedades como categoría, marca o contenido. Además, la información de interacción se refiere a los datos implícitos que muestran cómo interactúan los usuarios con el elemento. La información de interacción ampliamente utilizada contiene etiquetas, comentarios o reseñas e historial de navegación, etc. La información auxiliar juega un papel importante en una variedad de aspectos. Los vínculos sociales explícitos, como un representante confiable de confianza o amistad, siempre se emplean en el cálculo de similitud para encontrar personas similares que comparten intereses con el usuario objetivo. ^[29]^[30] La información asociada a la interacción (etiquetas) se toma como una tercera dimensión (además del usuario y el elemento) en el filtrado colaborativo avanzado para construir una estructura tensorial tridimensional para la exploración de recomendaciones. ^[31]

Véase también

Lenguaje de marcado para perfiles de atención (APML)
Arranque en frío
Modelo colaborativo
Motor de búsqueda colaborativo
Inteligencia colectiva
Compromiso del cliente
Democracia delegativa , el mismo principio aplicado a la votación en lugar del filtrado
Marcadores empresariales
Firefly (sitio web) , un sitio web desaparecido que se basaba en el filtrado colaborativo
Burbuja de filtro
PageRank (rango de página)
Elicitación de preferencias
Filtrado psicográfico
Sistema de recomendación
Relevancia (recuperación de información)
Sistema de reputación
Filtrado colaborativo robusto
Búsqueda de similitud
Pendiente Uno
Translucidez social

Referencias

^ Francesco Ricci y Lior Rokach y Bracha Shapira, Introduction to Recommender Systems Handbook Archivado el 2 de junio de 2016 en Wayback Machine , Recommender Systems Handbook, Springer, 2011, págs. 1–35
^ ab Terveen, Loren ; Hill, Will (2001). "Más allá de los sistemas de recomendación: ayudar a las personas a ayudarse mutuamente" (PDF) . Addison-Wesley. pág. 6 . Consultado el 16 de enero de 2012 .
^ Un enfoque integrado para las recomendaciones de TV y VOD Archivado el 6 de junio de 2012 en Wayback Machine.
^ John S. Breese, David Heckerman y Carl Kadie, Análisis empírico de algoritmos predictivos para filtrado colaborativo, 1998 Archivado el 19 de octubre de 2013 en Wayback Machine.
^ Xiaoyuan Su, Taghi M. Khoshgoftaar, Un estudio de técnicas de filtrado colaborativo, Archivo de Avances en Inteligencia Artificial, 2009.
^ Sistemas de recomendación abc : el libro de texto | Charu C. Aggarwal | Springer. Springer. 2016. ISBN 9783319296579.
^ Ghazanfar, Mustansar Ali; Prügel-Bennett, Adam; Szedmak, Sandor (2012). "Algoritmos del sistema de recomendación de mapeo de kernel". Ciencias de la Información . 208 : 81-104. CiteSeerX 10.1.1.701.7729 . doi :10.1016/j.ins.2012.04.012. S2CID 20328670.
^ Das, Abhinandan S.; Datar, Mayur; Garg, Ashutosh; Rajaram, Shyam (2007). "Personalización de noticias de Google". Actas de la 16.ª conferencia internacional sobre la World Wide Web – WWW '07 . pág. 271. doi :10.1145/1242572.1242610. ISBN 9781595936547. Número de identificación del sujeto 207163129.
^ He, Xiangnan; Liao, Lizi; Zhang, Hanwang; Nie, Liqiang; Hu, Xia; Chua, Tat-Seng (2017). "Filtrado colaborativo neuronal". Actas de la 26.ª Conferencia internacional sobre la World Wide Web. Comité directivo de las conferencias internacionales sobre la World Wide Web. págs. 173–182. arXiv : 1708.05031 . doi :10.1145/3038912.3052569. ISBN . 9781450349130. S2CID 13907106 . Consultado el 16 de octubre de 2019 .
^ Liang, Dawen; Krishnan, Rahul G.; Hoffman, Matthew D.; Jebara, Tony (2018). "Autocodificadores variacionales para filtrado colaborativo". Actas de la Conferencia Mundial sobre la Web de 2018 sobre la World Wide Web – WWW '18 . Comité Directivo de las Conferencias Internacionales sobre la World Wide Web. págs. 689–698. arXiv : 1802.05814 . doi : 10.1145/3178876.3186150 . ISBN. 9781450356398.
^ Ferrari Dacrema, Maurizio; Cremonesi, Paolo; Jannach, Dietmar (2019). "¿Realmente estamos logrando muchos avances? Un análisis preocupante de los enfoques de recomendación neuronal recientes". Actas de la 13.ª Conferencia de la ACM sobre sistemas de recomendación . ACM. págs. 101–109. arXiv : 1907.06902 . doi :10.1145/3298689.3347058. hdl :11311/1108996. ISBN . 9781450362436. S2CID 196831663 . Consultado el 16 de octubre de 2019 .
^ Anelli, Vito Walter; Bellogin, Alejandro; Di Noia, Tommaso; Jannach, Dietmar; Pomo, Claudio (2022). "Top-N Recommendation Algorithms: A Quest for the State-of-the-Art". Actas de la 30.ª Conferencia de la ACM sobre Modelado, Adaptación y Personalización de Usuarios . ACM: 121–131. arXiv : 2203.01155 . doi :10.1145/3503252.3531292. ISBN. 9781450392075. S2CID 247218662 . Consultado el 1 de marzo de 2022 .
^ Ludewig, Malte; Mauro, Noemi; Latifi, Sara; Jannach, Dietmar (2019). "Comparación del rendimiento de los enfoques neuronales y no neuronales para la recomendación basada en sesiones". Actas de la 13.ª Conferencia de la ACM sobre sistemas de recomendación . ACM. págs. 462–466. doi : 10.1145/3298689.3347041 . ISBN. 9781450362436.
^ Adomavicius, Gediminas; Tuzhilin, Alexander (1 de enero de 2015). Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación . Springer US. págs. 191–226. doi :10.1007/978-1-4899-7637-6_6. ISBN 9781489976369.
^ Bi, Xuan; Qu, Annie; Shen, Xiaotong (2018). "Factorización tensorial multicapa con aplicaciones a sistemas de recomendación". Anales de Estadística . 46 (6B): 3303–3333. arXiv : 1711.01598 . doi :10.1214/17-AOS1659. S2CID 13677707.
^ Zhang, Yanqing; Bi, Xuan; Tang, Niansheng; Qu, Annie (2020). "Sistemas dinámicos de recomendación de tensores". arXiv : 2003.05568v1 [estadística.ME].
^ Bi, Xuan; Tang, Xiwei; Yuan, Yubai; Zhang, Yanqing; Qu, Annie (2021). "Tensores en estadística". Revisión anual de estadística y su aplicación . 8 (1): annurev. Bibcode :2021AnRSA...842720B. doi : 10.1146/annurev-statistics-042720-020816 . S2CID 224956567.
^ Filtrado colaborativo: elemento vital de la Web social Archivado el 22 de abril de 2012 en Wayback Machine.
^ Gleick, James (2012). La información: una historia, una teoría, una inundación (1.ª edición de Vintage Books, 2012). Nueva York: Vintage Books. pág. 410. ISBN 978-1-4000-9623-7.OCLC 745979816 .
^ Pankaj Gupta, Ashish Goel, Jimmy Lin, Aneesh Sharma, Dong Wang y Reza Bosagh Zadeh WTF: El sistema de a quién seguir en Twitter, Actas de la 22.ª conferencia internacional sobre la World Wide Web
^ Fleder, Daniel; Hosanagar, Kartik (mayo de 2009). "El próximo ascenso o caída de la cultura Blockbuster: el impacto de los sistemas de recomendación en la diversidad de ventas". Management Science . 55 (5): 697–712. doi :10.1287/mnsc.1080.0974. SSRN 955984.
^ Castells, Pablo; Hurley, Neil J.; Vargas, Saúl (2015). "Novedad y diversidad en los sistemas de recomendación". En Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación (2.ª ed.). Springer US. pp. 881–918. doi :10.1007/978-1-4899-7637-6_26. ISBN 978-1-4899-7637-6.
^ Choi, Jeongwhan; Hong, Seoyong; Park, Noseong; Cho, Sung-Bae (2022). "Modelos de proceso de desenfoque y nitidez para filtrado colaborativo". arXiv : 2211.09324 [cs.IR].
^ Adamopoulos, Panagiotis; Tuzhilin, Alexander (enero de 2015). "Sobre lo inesperado en los sistemas de recomendación: o cómo esperar mejor lo inesperado". ACM Transactions on Intelligent Systems and Technology . 5 (4): 1–32. doi :10.1145/2559952. S2CID 15282396.
^ Adamopoulos, Panagiotis (octubre de 2013). "Más allá de la precisión de la predicción de la calificación". Actas de la 7.ª conferencia de la ACM sobre sistemas de recomendación . págs. 459–462. doi :10.1145/2507157.2508073. ISBN 9781450324090.S2CID1526264 .
^ Chatzis, Sotirios (octubre de 2013). "Filtrado colaborativo multitarea bayesiano no paramétrico". CIKM '13: Actas de la 22.ª conferencia internacional de la ACM sobre gestión de la información y el conocimiento . Portal.acm.org. págs. 2149–2158. doi :10.1145/2505515.2505517. ISBN . 9781450322638.S2CID10515301 .
^ Mehta, Bhaskar; Hofmann, Thomas; Nejdl, Wolfgang (19 de octubre de 2007). Actas de la conferencia ACM de 2007 sobre sistemas de recomendación – Rec Sys '07 . Portal.acm.org. pág. 49. CiteSeerX 10.1.1.695.1712 . doi :10.1145/1297231.1297240. ISBN 9781595937308. Número de identificación del sujeto 5640125.
^ Shi, Yue; Larson, Martha; Hanjalic, Alan (2014). "Filtrado colaborativo más allá de la matriz de usuario-ítem: un estudio del estado del arte y los desafíos futuros". Encuestas de computación de ACM . 47 : 1–45. doi :10.1145/2556270. S2CID 5493334.
^ Massa, Paolo; Avesani, Paolo (2009). Computación con confianza social . Londres: Springer. pp. 259–285.
^ Groh Georg; Ehmig Christian. Recomendaciones en dominios relacionados con el gusto: filtrado colaborativo vs. filtrado social . Actas de la conferencia internacional ACM de 2007 sobre apoyo al trabajo en grupo. págs. 127–136. CiteSeerX 10.1.1.165.3679 .
^ Symeonidis, Panagiotis; Nanopoulos, Alexandros; Manolopoulos, Yannis (2008). "Recomendaciones de etiquetas basadas en la reducción de la dimensionalidad del tensor". Actas de la conferencia ACM de 2008 sobre sistemas de recomendación . págs. 43–50. CiteSeerX 10.1.1.217.1437 . doi :10.1145/1454008.1454017. ISBN . 9781605580937. Número de identificación del sujeto 17911131.

Enlaces externos

Más allá de los sistemas de recomendación: ayudar a las personas a ayudarse entre sí, página 12, 2001
Sistemas de recomendación. Prem Melville y Vikas Sindhwani. En Encyclopedia of Machine Learning, Claude Sammut y Geoffrey Webb (Eds), Springer, 2010.
Sistemas de recomendación en contextos industriales: tesis doctoral (2012) que incluye una descripción general completa de muchos sistemas de recomendación colaborativos
Hacia la próxima generación de sistemas de recomendación: un estudio del estado del arte y las posibles extensiones. Adomavicius, G. y Tuzhilin, A. IEEE Transactions on Knowledge and Data Engineering 06.2005
Evaluación de sistemas de recomendación de filtrado colaborativo (DOI: 10.1145/963770.963772)
Artículos de investigación de GroupLens.
Filtrado colaborativo potenciado por contenido para mejorar las recomendaciones. Prem Melville, Raymond J. Mooney y Ramadass Nagarajan. Actas de la Decimoctava Conferencia Nacional sobre Inteligencia Artificial (AAAI-2002), págs. 187-192, Edmonton, Canadá, julio de 2002.
Una colección de proyectos de "filtrado de información" pasados y presentes (incluido el filtrado colaborativo) en el MIT Media Lab
Eigentaste: Un algoritmo de filtrado colaborativo en tiempo constante. Ken Goldberg, Theresa Roeder, Dhruv Gupta y Chris Perkins. Recuperación de información, 4(2), 133–151. Julio de 2001.
Un estudio de técnicas de filtrado colaborativo Su, Xiaoyuan y Khoshgortaar, Taghi. M
Personalización de Google News: filtrado colaborativo escalable en línea Abhinandan Das, Mayur Datar, Ashutosh Garg y Shyam Rajaram. Conferencia internacional sobre la World Wide Web, Actas de la 16.ª conferencia internacional sobre la World Wide Web
Tener en cuenta a los vecinos: filtrado colaborativo escalable y preciso Yehuda Koren, Transactions on Knowledge Discovery from Data (TKDD) (2009)
Predicción de calificación mediante filtrado colaborativo
Sistemas de recomendación Archivado el 11 de febrero de 2013 en Wayback Machine
Filtrado colaborativo de Berkeley