21 juin 2017 624 mots, 3 min. de lecture

Big Data et éthique : premier meetup réussi à DigitYser

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Le 15 juin 2017, mon ami Philippe Van Impe m’a donné l’occasion d’organiser le premier Meetup dans le nouveau temple du Big Data à Bruxelles: DigitYser. Quel succès ! Le sujet de ce premier Meetup était « Big Data et éthique« , […]

Le 15 juin 2017, mon ami Philippe Van Impe m’a donné l’occasion d’organiser le premier Meetup dans le nouveau temple du Big Data à Bruxelles: DigitYser. Quel succès !
Le sujet de ce premier Meetup était « Big Data et éthique« , un sujet d’importance pour les data scientists de tout poil mais encore insuffisamment abordé.
L’idée de cette rencontre a germé lors de ma keynote au Data Innovation Summit; certains participants ont tweeté pendant que j’intervenais sur l’importance du sujet et en quelques minutes les intervenants pour un premier événement étaient réunis. Ce sont là les miracles des social media.

Philippe a eu la gentillesse de s’occuper de l’organisation début avril et nous avons fini ce marathon avec quelque 175 participants enregistrés sur le site Meetup.com, un nombre conséquent compte tenu de la non technicité du sujet, les Meetup organisés dans le passé étant plutôt destinés aux plus techniciens d’entre nous. Finalement ce sont quelques 75 personnes qui étaient présentes le Jour J, un nombre déjà très suffisant car nous n’étions pas prêts à en accueillir davantage (il faudra penser à acheter des chaises pour les prochains Meetup:-).

Après une courte introduction de Philippe sur l’inauguration du DigitYser et quelques mots par moi-même pour lancer la soirée et le débat, nous avons eu le plaisir d’écouter le Prof. Michael Ekstrand (Université d’Etat de Boise, Idaho) que j’avais rencontré pour la première fois lors de la conférence RecSys en 2016 au MIT à Boston, MA. Michael, qui venait d’atterrir quelques heures plus tôt des États-Unis, a donné une présentation très inspirante sur l’éthique des algorithmes et les valeurs sous-jacentes. Voici quelques points particulièrement importants que j’ai retenus de sa présentation :

  • L’expérience utilisateur d’un système peut être conçue pour répondre aux intérêts de la majorité, ignorant de facto les effets néfastes sur des groupes minoritaires. Ces dernières pourraient, selon Michael, se retrouver avec des résultats de plus mauvaises qualités qu’auparavant. Cela pose une question d’éthique de manière générale (respect des intérêts particuliers) et de satisfaction de l’utilisateur en particulier. J’ai noté également la référence faite par Michael à une recherche scientifique publiée par Microsoft Research (Mehrotra et al., 2016), qui analysait les modes de consommation (utilisation d’un moteur de recherche vs. recherches d’informations) en fonction des groupes d’utilisateurs (utilisateurs fréquents vs. nouveaux utilisateurs). Les résultats montrent clairement que différents segments coexistent dont certains pourraient être affectés négativement par des changements effectués en vue de satisfaire les segments majoritaires.
  • L’éthique d’un système dépend de sa finalité. Si un système tente de maximiser les clics, des pages de mauvaise qualité (clickbait) pourraient être recommandées ce qui pose un problème éthique (un système contribue-t-il à l’intérêt général en favorisant des pages d’aussi piètre qualité ?)
  • Prenez garde aux systèmes de recommandation mal entraînés ! Michael a donné l’exemple édifiant d’un moteur de recommandation de restaurants sur Twitter (qui, heureusement, est resté au stade expérimentale), qui classaient systématiquement en dernier les restaurants mexicains. Le système de recommandation avait été entraîné sur un corpus de textes à partir duquel il avait appris une association entre les mots «mexicain» et «illégal». Cet apprentissage avait conduit à créer une corrélation entre « mexicain » et « mauvais ». Cette corrélation n’est pas exactement ce que l’on peut appeler éthique.

Big Data and ethics meetup : slides presentation michael ekstrand from RTBF


Publié dans Data et IT, Innovation.

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *