Sistemas Recomendadores Híbridos

IIC 3633 - Sistemas Recomendadores

Denis Parra
Profesor Asistente, DCC, PUC CHile

TOC

En esta clase

  1. Motivación
  2. Clasificación General
  3. Modelos de Hibridización
  4. Ejemplos

Motivación

Diferentes métodos tienen distintas debilidades y fortalezas

  • Filtrado Colaborativo es preciso, pero sufre de sparsity, cold start y new item problem

  • Filtrado Basado en contenido no sufre tanto por sparsity y permite con facilidad para extraer features del contenido. Sin embargo, también sufre de "new user problem", es menos preciso de el F.C. y presenta sobre-especialización.

  • Knowledge-based: No los hemos visto hasta ahora. Casos típicos son Constrait-Based y Case-Based. Basados en un paradigma más interactivo, también los llaman “Conversacionales” (Burke, 2002). Su principal debilidad es el costo de mantener las reglas actualizadas.

Categorización de RecSys de Burke (2002)

Ref: Burke, R. (2002). Hybrid recommender systems: Survey and experiments. User modeling and user-adapted interaction, 12(4), 331-370.

Knowledge-Based Systems I

Ref: Jannach, D., Zanker, M., Felfernig, A., & Friedrich, G. (2010). Recommender systems: an introduction. Cambridge University Press.

Knowledge-Based Systems II

Ref: Jiyong Zhang, Nicolas Jones, and Pearl Pu. 2008. A visual interface for critiquing-based recom-mender systems. In Proceedings of the 9th Conference on Electronic Commerce (EC ’08). 230–239.

Modelo Caja Negra de RecSys (Jannach et al. 2010)

Ref: Jannach, D., Zanker, M., Felfernig, A., & Friedrich, G. (2010). Recommender systems: an introduction. Cambridge University Press.

Combinar Métodos Content-based y Filtrado Colaborativo

Según (Adomavicius et al., 2005)

  • Implementar métodos CF y CB separadamente y combinar las predicciones
  • Incorporar características de métodos CB dentro de un método CF
  • Incorporar características colaborativas dentro de modelo CB
  • Construir un modelo que de manera unificada incorpore características basadas en contenido y colaborativas

Ref: Adomavicius, G., & Tuzhilin, A. (2005). Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. Knowledge and Data Engineering, IEEE Transactions on, 17(6), 734-749.

Cómo combinar Métodos de Recomendación?

Burke (2002) distingue 7 estrategias de hibridización

Jannach (2012) resume las 7 estrategias en 3 diseños generales

  • Monolítico
  • Paralelizado
  • Pipeline

7 Estrategias de Hibridización (Burke 2002)

Hibridización Monolítica

Hibridización Paralela

Hibridización Pipeline

Hibridización Monolítica

Estrategias de Combinación:

  • Feature Combination
  • Feature Augmentation

H. Monolítica: Feature Combination

H. Monolítica: Feature Combination I

H. Monolítica: Feature Combination II

H. Monolítica: Feature Augmentation

  • A diferencia de "feature combination"", este híbrido no sólo combina y procesa distintos tipos de entrada, sino que aplica algunos pasos de transformación más compleja.

H. Monolítica: Feature Augmentation

Hibridización Paralela

Tres mecanismos principales:

  • Weighted
  • Mixed
  • Switching

H. Paralela: Weighted I

  • La idea principal calcular una suma ponderada de los scores de items recomendados por diferentes recomendadores.


  • La métrica de error MAE es ajustada:

H. Paralela: Weighted II

H. Paralela: Weighted III

H. Paralela: Weighted IV

  • Ejemplo

H. Paralela: Weighted V

  • Asumiendo que Alice compró ítems 1 y 4

H. Paralela: Mixed I

H. Paralela: Mixed II

H. Paralela: Mixed III

H. Paralela: Mixed IV

H. Paralela: Switching I

  • De un grupo de recomendadores, activar un recomendador a la vez.

  • Podría ser especialmente útil considerando los learning rate de algunos métodos.

  • Ejemplo: Elegir entre un clasificador Bayesiano y un recomendador Item-based como en: Ghazanfar, M., & Prugel-Bennett, A. (2010). An Improved Switching Hybrid Recommender System Using Naive Bayes Classifier and Collaborative Filtering.

H. Paralela: Switching II

Hibridización Pipeline

Dos mecanismos principales:

  • Cascade
  • Meta-Level

H. Pipeline: Cascade

H. Pipeline: Cascade (Moodplay)

H. Pipeline: Cascade (Moodplay)


H. Pipeline: Meta-Level

El modelo aprendido por un recomendador es usado para un segundo recomendador. Transfer Learning:

Tutorial on Cross-domain recommender systemshttp://recsys.acm.org/wp-content/uploads/2014/10/recsys2014-tutorial-cross_domain.pdf

Blending: Learn from the masters

  • Netflix prize winners (BigChaos)

    • Jahrer, M., Töscher, A., & Legenstein, R. (2010, July). Combining predictions for accurate recommender systems. In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 693-702). ACM.
    • Töscher, A., Jahrer, M., & Bell, R. M. (2009). The bigchaos solution to the netflix grand prize. Netflix prize documentation, 1-52.
    • Töscher, A., & Jahrer, M. (2008). The bigchaos solution to the netflix prize 2008. Netflix Prize, Report.

Blending: Learn from the masters

  • Similar problem: CTR

    • Jahrer, M., Toscher, A., Lee, J. Y., Deng, J., Zhang, H., & Spoelstra, J. (2012). Ensemble of collaborative filtering and feature engineered models for click through rate prediction. In KDDCup Workshop.

Referencias

  • Burke, R. (2002). Hybrid recommender systems: Survey and experiments. User modeling and user-adapted interaction, 12(4), 331-370.
  • Adomavicius, G., & Tuzhilin, A. (2005). Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. Knowledge and Data Engineering, IEEE Transactions on, 17(6), 734-749.
  • Burke, R. (2007). Hybrid web recommender systems. In The adaptive web (pp. 377-408). Springer Berlin Heidelberg.
  • Jannach, D., Zanker, M., Felfernig, A., & Friedrich, G. (2010). Recommender systems: an introduction. Cambridge University Press. Chicago