Animint

  Anime & manga

 
 
“Animint traite des dessins animés japonais et du manga. Outre ce blog, le site comporte plusieurs milliers de pages de texte illustré.”

Un moteur de recommandation pour vous conseiller des titres

Par le :: Webmastering

series , naruto , evangelion , animes

Un thème récurrent vu dans le forum concerne les questions de visiteurs qui cherchent de nouveaux anime à regarder et qui ignorent quels titres choisir parmi la masse de la production japonaise. Des autres fans leur répondent en mettant en avant leurs propres préférences et en fonction aussi de ce qu'ils connaissent. Ces messages montrent qu'un outil automatique pour aider à choisir un titre a sa raison d'être. Reste à voir la forme qu'il doit prendre et comment le mettre en place.

La première solution, la plus traditionnelle, est de proposer un moteur de recherche multicritères. Dans un site de vente de vêtements, par exemple, l'acheteur potentiel indique des caractéristiques sur le produit qu'il cherche : Vêtement homme, femme ou enfant, type de vêtement, ou encore prix.  Le système filtre alors les données pour ne renvoyer que les produits qui correspondent aux souhaits du visiteur.

Dans le cas de la base de données encyclopédique, j'ai appliqué ce principe pour effectuer des filtres sur des critères objectifs : Le format du titre, le genre de l'histoire et même la durée en terme d'épisode si l'internaute recherche une série pas trop longue à regarder, par exemple.
Le moteur présente l'avantage d'être une solution éprouvée et simple d'utilisation. L'ajout de fonctionnalités Web 2.0, avec, entre autres, une recherche à la volée sans avoir à appuyer sur le bouton de validation, confère un côté très tendance au niveau de l'interface, alors que le concept est vieux comme Mathusalem.

L'outil présente cependant des limitations. Pour que les filtres soient efficaces, il faut renseigner les différents critères pour chaque entrée mais la tâche est relativement lourde à accomplir, surtout lorsque beaucoup de fiches sont encore incomplètes. L'autre soucis, plus gênant, est que le nombre de critères objectifs est restreint, sorti des paramètres que nous avons déjà dans le moteur de recherche, dans le cas de notre base.

Je pourrai mettre un filtre additionnel sur les studios ou les membres du staff, mais là, les listes seraient trop longues et nous basculons plus dans un système de navigation à facettes. C'est en partie la navigation classique au sein de la base en choisissant son critère de tri, soit par ordre alphabétique, soit par années, soit par studios ou soit par principales personnes. Le moteur de recherche global du site implémente un exemple complet de navigation multi facettes, où la simple visite de clic en clic permet de réduire le nombre d'items.

Ensuite, il est possible de retenir des critères subjectifs telles que les notes données par les visiteurs. Des sites vous propose ainsi leur top 10 des produits en suivant une méthode très simple : Ils font la moyenne des notes décernées sur un produit pour en déduire sa note globale, puis son classement. Sur Animint, j'aurai pu également rajouter un critère pour sélectionner les titres notés avec plus de n étoiles.

Cependant, le résultat n'est guère fiable pour de multiples raisons : La première est qu'une fiche notée 4,90 sur 5 par 200 visiteurs sera classée derrière un item jugé 5 sur 5 par une seule personne, alors que l'inverse serait plus logique étant donnés les volumes de votes. D'autre part, une personne peut très bien être très contente d'un titre et en dire des louanges dans son commentaire, tout en ne donnant que 4 sur 5 car elle ne met jamais 5 sur 5. Son vote est en quelque sorte tronqué, alors que son 4 sur 5 vaut un 5 sur 5. Idem pour quelqu'un qui met un 3 sur 5 alors qu'en lisant sa critique cela équivaut à un 0 pointé pour la moyennes des gens, mais lui, ne met jamais en dessous de 3.

La dernière raison que j'évoquerai est que les notes des autres ont plus ou moins d'affinité avec les vôtres. Imaginons le cas où tous les fans de Naruto ont donné un 5 sur à 5 à Evangelion. Vous, vous  cherchez une série de science fiction mais vous détestez Naruto et vous aimez énormément Fruits Basket. Supposons que les fans de Fruits Basket aient tous donné un 1 sur 5 à Evangelion, mais que leur volume de votes ne représente que 10% de ceux des fans de Naruto. En effectuant le calcul global, Evangelion est bien noté mais dans votre cas, si nous savons que vous êtes fan de Fruits Basket, la note est plutôt à 1 sur 5 et il faut mieux vous proposer un autre titre.

Nous touchons là l'essence fonctionnelle du moteur de recommandation collaboratif : A partir d'un critère subjectif, il doit réussir à vous rapprocher des gens qui ont les mêmes goûts que vous, et à partir de ce qu'ils ont aimé et que vous ne connaissez pas, vous proposer un nouveau titre.

Si vous réfléchissez à l'implémentation d'un point de vue informatique, vous pouvez rapidement attraper mal au crâne : Pour arriver à comparer les notes d'une personne avec celles de toutes les autres, vous pouvez partir sur de multiples boucles et des tonnes de requêtes vers la base de données. Vous risquez de prendre le problème par le mauvais bout, un peu comme si vous vous acharnez à calculer tous les coups possibles si vous deviez modéliser un jeu d'échec.

Heureusement, d'autres éminents chercheurs ont travaillé avant nous et ils ont sorti les algorithmes appropriés, les algorithmes Slop One. Je vous passe les détails mais l'approche simplifie les calculs de façon drastique et permet de mettre en place un moteur de recommandation, en brassant des milliers, voir des millions de notes.

En sous-produit, la recommandation peut s'effectuer suivant une autre logique : Le moteur déduit à partir des bonnes notes sur un titre, quel autre titre est aussi aimé en moyenne. Ainsi de manière globale, à ceux qui ont aimé Bleach, il recommande One Piece, par exemple.

Pour que le moteur fonctionne pour suivre vos goûts, vous devez ouvrir un profil, c'est-à-dire vous inscrire sur le forum si ce n'est pas déjà fait et notez quelques titres dans la base de données. Le test d'affinité , disponible dans votre profil, peut également servir à cet effet. Le moteur vous indiquera alors quelques titres. Si vous les connaissez déjà, marquez les comme tels, et le moteur remettra à jour votre liste des recommandations, dans la foulée.

Est-ce que le moteur fonctionne ? Techniquement, oui. Le système est en place depuis mars 2008. Après, cela dépend du contenu que nous lui donnons à digérer. Il faut tout d'abord que les titres soient dans la base de données pour qu'ils puissent vous être proposés. Il en manque énormément pour la partie manga mais cela est plus du ressort du côté d'Animint, avec le projet d'injecter la liste des parutions mensuelles dans la base.

Cependant, si des entrées existantes ne sont jamais proposées, c'est que trop peu de monde les ont notées et là, vous pouvez intervenir en donnant votre avis sur un titre que personne ne connaît mais que vous aimez beaucoup. Cela permettra à d'autres visiteurs de les découvrir. Même message, si vous voulez plomber une série à éviter.


Moteur de recommandation

Discuter de ce billet sur le forum - - Laisser un commentaire »

Cet article vous a plu?

Faites-le connaître ou votez pour cet article sur les sites suivants :

  • anime manga aggregator sama
  • Partager sur del.li.cious
  • Partager sur Facebook
  • Partager sur Google

Ajoutez votre commentaire:

Merci de bien vouloir soigner votre orthographe et de proscrire le style SMS.


Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

 

↑ Haut de page