Maybaygiare.org

Blog Network

Une Introduction Simple au Filtrage Collaboratif

De nos jours, que vous regardiez une vidéo sur YouTube, un film sur Netflix ou un produit sur Amazon, vous obtiendrez des recommandations pour plus de choses à voir, à aimer ou à acheter. Vous pouvez remercier l’avènement des algorithmes d’apprentissage automatique et des systèmes de recommandation pour ce développement.

Les systèmes de recommandation ont une vaste portée, nous allons donc nous concentrer sur une approche importante appelée filtrage collaboratif, qui filtre les informations en utilisant les interactions et les données collectées par le système auprès d’autres utilisateurs. Il est basé sur l’idée que les personnes qui ont accepté dans leur évaluation de certains éléments sont susceptibles d’être de nouveau d’accord à l’avenir.

Une introduction rapide Sur les systèmes de recommandation

Un système de recommandation est une sous-classe de filtrage d’informations qui cherche à prédire la « note » ou la « préférence » qu’un utilisateur donnera à un article, tel qu’un produit, un film, une chanson, etc.

Les systèmes de recommandation fournissent des informations personnalisées en apprenant les intérêts de l’utilisateur à travers des traces d’interaction avec cet utilisateur. Tout comme les algorithmes d’apprentissage automatique, un système de recommandation effectue une prédiction basée sur les comportements passés d’un utilisateur. Plus précisément, il est conçu pour prédire la préférence de l’utilisateur pour un ensemble d’éléments en fonction de l’expérience.

Mathématiquement, une tâche de recommandation est définie comme étant:

  • Ensemble d’utilisateurs (U)
  • Ensemble d’éléments (I) qui doivent être recommandés à U
  • Apprendre une fonction basée sur les données d’interaction passées de l’utilisateur qui prédit la probabilité de l’élément I pour U

Les systèmes de recommandation sont généralement classés en deux types en fonction des données utilisées pour faire des inférences:

  1. Filtrage basé sur le contenu, qui utilise des attributs d’élément.
  2. Filtrage collaboratif, qui utilise le comportement de l’utilisateur (interactions) en plus des attributs d’élément.

Voici quelques exemples clés de systèmes de recommandation au travail ::

  • Recommandations de produits sur Amazon et d’autres sites commerciaux
  • Recommandations de films et d’émissions de télévision sur Netflix
  • Recommandations d’articles sur les sites d’information

Qu’est-ce que le filtrage collaboratif ?

Le filtrage collaboratif filtre les informations en utilisant les interactions et les données collectées par le système auprès d’autres utilisateurs. Il est basé sur l’idée que les personnes qui ont accepté dans leur évaluation de certains éléments sont susceptibles d’être de nouveau d’accord à l’avenir.

Le concept est simple: lorsque nous voulons trouver un nouveau film à regarder, nous demandons souvent à nos amis des recommandations. Naturellement, nous avons une plus grande confiance dans les recommandations d’amis qui partagent des goûts similaires aux nôtres.

La plupart des systèmes de filtrage collaboratifs appliquent la technique dite basée sur l’indice de similarité. Dans l’approche basée sur le voisinage, un certain nombre d’utilisateurs sont sélectionnés en fonction de leur similitude avec l’utilisateur actif. L’inférence pour l’utilisateur actif est faite en calculant une moyenne pondérée des notes des utilisateurs sélectionnés.

Les systèmes de filtrage collaboratif se concentrent sur la relation entre les utilisateurs et les éléments. La similitude des articles est déterminée par la similitude des notes de ces articles par les utilisateurs qui ont évalué les deux articles.

Il existe deux classes de filtrage collaboratif :

  • Basé sur l’utilisateur, qui mesure la similitude entre les utilisateurs cibles et les autres utilisateurs.
  • Basé sur les éléments, qui mesure la similitude entre les éléments avec lesquels les utilisateurs cibles évaluent ou interagissent et les autres éléments.

Filtrage collaboratif Utilisant Python

Les méthodes collaboratives sont généralement élaborées à l’aide d’une matrice d’utilitaires. La tâche du modèle de recommandation est d’apprendre une fonction qui prédit l’utilité de l’ajustement ou de la similitude pour chaque utilisateur. La matrice d’utilité est généralement très clairsemée, énorme et a supprimé des valeurs.

Dans les matrices suivantes, chaque ligne représente un utilisateur, tandis que les colonnes correspondent à différents films de Pixar. La similarité cosinus est l’algorithme le plus simple nécessaire pour trouver la similitude des vecteurs. La dernière, qui est la matrice d’utilité qui suit la première matrice, ne contient que des données partielles, nécessaires pour prédire la probabilité de la notation attendue par la « racine » qui pourrait être donnée par l’utilisateur.

Dans les matrices suivantes, chaque ligne représente un utilisateur, tandis que les colonnes correspondent à des films différents, sauf la dernière qui enregistre la similitude entre cet utilisateur et l’utilisateur cible. Chaque cellule représente la note que l’utilisateur donne à ce film.

cosine_similarité(p, q) = p.q

/p|.|q/

table de filtrage collaboratif

cosine_similarity(joe, beck) =

filtrage collaboratif avec python

Lorsqu’un nouvel utilisateur rejoint la plate-forme, nous appliquons l’algorithme le plus simple qui calcule la similarité de cosinus ou de corrélation des lignes (utilisateurs) ou des colonnes (films) et recommande des éléments qui sont k – voisins les plus proches.

CF tableau 2

Ce sont de nombreuses équations qui peuvent traiter la question des mesures de similitude, quelques-unes incluent:

  • Similitude Pearson
  • Similitude Jaccard
  • Corrélation de rang Spearman
  • Différences quadratiques moyennes
  • Similitude Proximité–impact–popularité

Liéen Savoir plus Sur La Science Des données

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.