22 novembre 2021 1263 mots, 6 min. de lecture Dernière mise à jour : 15 mars 2022

Comment favoriser la découverte avec les algorithmes de recommandation

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
La conférence ReCSys 2021 sur les algorithmes de recommandation vient de se terminer. Le mode hybride n’a pas facilité les interactions mais les présentations intéressantes se sont succédé et n’auront pas manqué de susciter, çà et là, de nouvelles idées. […]

La conférence ReCSys 2021 sur les algorithmes de recommandation vient de se terminer. Le mode hybride n’a pas facilité les interactions mais les présentations intéressantes se sont succédé et n’auront pas manqué de susciter, çà et là, de nouvelles idées. Tel a été le cas de la keynote de Cynthia Liem (Delft University of Technology). 

Cynthia a la particularité de combiner 2 talents : elle est chercheuse en informatique mais également pianiste émérite. C’est sur cette double compétence qu’elle a bâti sa keynote intitulée « Key Notes from Keys and Notes: Pianist Perspectives on Recommendation » lors de la conférence RecSys 2021. Je l’ai trouvée particulièrement intéressante car elle éclaire les limites des algorithmes de recommandation.

Si vous n’avez que 30 secondes

Dans sa keynote à la conférence RecSys 2021 sur les algorithmes de recommandation, Cynthia Liem a mis en exergue plusieurs faiblesses des algorithmes de recommandation dans le domaine de la musique :

  • ils ne permettent pas de faire le tri entre plusieurs versions d’un même morceau
  • ils se basent sur la réaction à une première écoute pour décider d’inclure ou d’exclure de nouveaux types de morceaux
  • ils peuvent permettre de découvrir des pans nouveaux du monde qui nous entoure
  • ils devraient inclure des fonctionnalités qui exposent de nouveau l’utilisateur à des contenus qu’il n’a pas apprécié la première fois

La musique (classique) est affaire d’interprétation

En tant que musicienne classique, Cynthia a mis le doigt sur une évidence que nous avons tendance à trop oublier : la musique classique est affaire d’interprétation puisque l’interprétation originale du compositeur n’a pas traversé le temps. Il s’en suit que chaque musicien réinterprète l’œuvre d’un compositeur « à sa manière ». En d’autres termes, le musicien interprète les intentions du compositeur en fonction de sa propre histoire, ce qui peut donner naissance à des versions très différentes. J’ai beaucoup apprécié la manière dont Cynthia a illustré cette capacité d’interprétation en prenant l’exemple de l’Ave Maria de Gounod.

Il en résulte un élément essentiel de notre mode de consommation de contenus musicaux online : de multiples versions d’un même morceau sont disponibles sans que nous puissions a priori les différencier. Les algorithmes de recommandation ne sont d’aucune aide sur cet aspect pour le moment.



Bach aurait été éliminé si les algorithmes de recommandation avaient existé à son époque.



Spotify : la duplication des contenus nuit à l’expérience utilisateur

Le problème de la duplication est évident sur toute plateforme d’écoute et il n’est pas limité à la musique classique. Voici le résultat d’une recherche sur Spotify sur un titre de jazz bien connu « Mack The Knife »
Comme vous pouvez le constater il est difficile de faire un choix, tant les versions sont nombreuses.

mack the knife on spotify

Pourtant, chaque morceau est bien différent. L’algorithme de recommandation n’est donc d’aucune aide ici.


Apprécier un contenu demande du temps et des expositions répétées

L’autre idée cardinale développée par Cynthia concerne l’exposition à un nouveau type de contenu. A l’image de certains aliments qu’on n’apprécie qu’après les avoir mangés plusieurs fois, il faut consommer plusieurs fois un nouveau type de contenu pour le trouver à son goût. Le défaut des algorithmes de recommandation c’est qu’ils peuvent occulter tout un pan de contenus suite à une première exposition ratée.

N’oublions pas en outre que la popularité d’un morceau est souvent postérieure à la mort de son auteur. Bach est mort en 1750 et ce n’est que bien après que sa musique est devenue populaire. Comme l’a rappelé Cynthia, « Bach aurait été éliminé si les algorithmes de recommandation avaient existé à son époque ».


popularity of musicians after their deaths (by Cynthia Liem)

Popularité de 3 compositeurs au fil du temps.
Crédits : Cynthia Liem, RecSys 2021


L’expérience de Cynthia au sein du Magma Duo est à ce titre tout à fait enrichissante. Prenant l’exemple du compositeur néerlandais Matthijs Vermeulen, Cynthia a montré que la distance du public par rapport à ses morceaux s’estompait avec le nombre de concerts. Un algorithme de recommandation privilégiant la diversité devrait donc embarquer une fonctionnalité qui expose quand même l’utilisateur à des contenus que ce dernier n’aurait pas appréciés.  

bibliothèque de calgary / calgary public library

Dans une bibliothèque l’étendue des connaissances disponibles est visible et se limite à l’espace du lieu. Avec l’avènement de l’internet nous avons perdu la notion de « limites » des connaissances et nous ne pouvons plus visuellement identifier les espaces encore à découvrir.


Comment découvrir ce qu’on ne connaît pas encore ?

La question de l’exploration d’un domaine est intimement liée à notre perception de l’étendue de ce domaine. En d’autres termes, comment découvrir ce dont on ignore encore l’existence ? Ce problème est particulièrement prononcé dans le domaine de la musique puisqu’une variété infinie de styles existent et que nous consommons toujours la même chose. Les algorithmes de recommandation peuvent être ici d’une aide précieuse à condition de les programmer de la bonne manière.



La bibliothèque municipale délimitait auparavant visuellement le monde des connaissances.



Je trouve la discussion sur les limites du savoir absolument passionnante. Cynthia en a donné une illustration très parlante : celle de la bibliothèque. Pour ceux qui comme moi ont connu l’ère pré-internet, la bibliothèque municipale délimitait auparavant visuellement le monde des connaissances. L’internet a effacé cette perception physique de la connaissance, à tel point que les Millenials ne comprennent plus l’idée même d’ordonnancement des données. Cet article publié dans The Verge montre ainsi que les jeunes sont étrangers au concept de classification sur un ordinateur.  Les fichiers sont donc enregistrés pêle-mêle ce qui nuit grandement à la découverte et à l’innovation.

Mundaneum Mons Belgium

Le Mundaneum avait pour ambition de cataloguer toutes les connaissances du monde. Les 12 millions de fiches didactiques, aujourd’hui exposées à Mons (Belgique), sont classées dans des tiroirs. Cette notion de « rangement » a tendance à disparaître depuis l’avènement du web.

Sans vouloir digresser de trop, j’aimerais rappeler que la structuration des connaissances est une des pierres angulaires de la capacité de création de l’être humain. Darwin n’aurait pas développé sa théorie de l’évolution sans organiser ses connaissances dans un commonplace book, et le sociologue Lühmann n’aurait pas écrit 70 livres et 500 articles sans son système de Zettelkasten. Dans un cas comme dans l’autre, le « rangement » de l’information était la clé de la réussite.


Conclusion

Cette discussion sur les limites des algorithmes de recommandation nous amène à mieux cerner notre rôle en tant qu’humain. Je ne répéterai jamais assez que les algorithmes sont des outils et qu’il n’y a d’intelligence artificielle qu’insufflée par l’intelligence humaine. A l’image de l’artiste dont l’œuvre reflète la personnalité, les possibilités de l’algorithme sont définies par son concepteur. Je pense donc que toute conception algorithmique doit se faire sur la base d’objectifs clairement définis. Il s’ensuit que les métriques utilisées doivent être choisies avec beaucoup de prudence pour atteindre ces objectifs. Or c’est souvent là que le bât blesse. Comme l’illustre avec humour le dessin ci-dessous, des erreurs dans le choix des métriques sont fréquentes et elles peuvent avoir des conséquences désastreuses sur l’expérience utilisateur.

click-through-rate (CTR) as a metrics for customer satisfaction

Credits : Karl Higley
@karlhigley via Twitter

 

 

 

 

 

 

 



Publié dans Data et IT.

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *