28 mars 2022 1120 mots, 5 min. de lecture

Sur Linkedin les femmes sont 17,3% plus virales que les hommes

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Vaut-il mieux être une femme pour être influenceur Linkedin ? C’est en tout cas ce que laissait entrevoir une étude préliminaire que nous avions réalisée. Aujourd’hui nous étendons cette étude à près de 5 millions de posts Linkedin. Les résultats […]

Vaut-il mieux être une femme pour être influenceur Linkedin ? C’est en tout cas ce que laissait entrevoir une étude préliminaire que nous avions réalisée. Aujourd’hui nous étendons cette étude à près de 5 millions de posts Linkedin. Les résultats montrent qu’au-delà de 500 réactions, les posts des femmes recueillent 17,3% de réactions en plus. Des différences notables existent toutefois en fonction de la langue.

Si vous n’avez que 30 secondes

  • A l’échelle mondiale, seuls 0,5% des posts sur Linkedin recueillent plus de 500 réactions. Parmi eux, environ la moitié (0,3%) ont comme auteur un utilisateur de Linkedin possédant moins de 25000 connexions.
  • Dans la catégorie des posts avec plus de 500 réactions, les posts dont l’auteur est une femme recueillent en moyenne 17,3% de réactions de plus que ceux des hommes.
  • Cette domination des femmes diffère toutefois en fonction des langues. En allemand, italien, espagnol, ce sont les hommes qui, en moyenne, recueillent le plus de réactions
  • C’est en néerlandais que la différence est la plus grande : les femmes recueillent 1972 réactions en moyenne, contre 1106 pour les hommes

 

Sommaire


Méthodologie

Le dataset utilisé est le même que celui qui avait été exploité pour analyser les facteurs de viralité sur Linkedin, le rôle des émojis et des hashtags.

Anatella a été utilisé pour préparer les données. Comme d’habitude le traitement est ultra-rapide (environ 60 secondes pour 4,6 millions de lignes).

Les opérations suivantes ont été effectuées :

  • lecture et réconciliation de 2 bases de données json (celle des profils et celle des posts)
  • détection de la langue
  • détection du sexe sur base d’un dictionnaire de +/- 70.000 prénoms
  • export au format. hyper

D’un point de vue technique, on notera que l’export au format .hyper a été déterminant. C’est en effet le seul format qui a permis l’exploitation de la base de données sous Tableau. On se souviendra dès lors que les formats de sortie sont un facteur assez décisif lorsqu’il s’agit de choisir un ETL. Dans ce domaine c’est Anatella qui remportait la palme dans mon classement.

ETL anatella Linkedin

Le schéma de traitement des données Linkedin sous Anatella


Les hommes plus nombreux sur Linkedin

Dans une étude précédente, nous avions défini la viralité sur Linkedin comme un post qui récoltait 100 réactions ou plus. Cela correspondait à environ 3,7% des 4,6 millions de messages que nous avions étudiés. Pour ne pas créer d’asymétrie dans les résultats, nous avions exclu de notre analyse tous les utilisateurs de Linkedin disposant de plus de 25000 connexions. De cette manière nous étudions le phénomène de la viralité sous l’angle de la majorité des utilisateurs.

Dans le graphique ci-dessous nous apportons plus de précision quant à la distribution des réactions sur Linkedin.

distribution of Linkedin posts per number of likes and comments on Linkedin

Nous voyons d’abord que la grande majorité (92,9%) des posts sur Linkedin recueillent moins de 50 réactions. Toutes langues confondues, seuls 0,3% des posts parviennent à cumuler 500 réactions ou plus. Assez curieusement, on observe que plus le nombre de réactions augmente, plus la part que représentent les posts de femmes dans le total diminue.  Ce n’est qu’au-delà de 500 réactions qu’on observe un changement puisque les posts des femmes cumulent soudainement beaucoup plus de réactions.


C’est l’effet combiné de posts ultra viraux et de la sous-représentation des femmes sur Linkedin qui permet à ces dernières de dominer le classement.



Les femmes dominent pour les posts les plus viraux

La prédominance, en nombre, des hommes dans les posts viraux est bien visible dans le graphique ci-dessous. Comme dans le précédent, l’ensemble du corpus est analysé sans distinction de langue.

Dans la catégorie des posts les plus viraux (>500 réactions ou plus), on voit bien que les posts des femmes recueillent en moyenne plus de réactions (1650 contre 1418) que ceux des hommes. En-deçà de 500 réactions, cette différence n’est pas observée. La catégorie des posts les plus viraux méritait donc une analyse plus poussée.

distribution of Linkedin posts by gender and number of reactins (Likes+comments)


Influence sur Linkedin : une question de langue ?

Dans la dernière analyse, nous nous sommes donc concentrés sur l’ensemble des posts qui avaient recueilli 500 réactions ou plus. Nous les avons analysés en fonction de leur langue. Nous n’avons retenu que les langues pour lesquelles nous disposions d’un échantillon d’au moins 100 posts viraux. Cette limite n’a été atteinte que pour le néerlandais, l’anglais, le français, l’allemand, l’italien, le portugais, et l’espagnol.

L’analyse par langue offre une lecture différente du phénomène précédemment observé. On voit que les hommes devancent les femmes en allemand, italien, espagnol, mais sont clairement en 2ème position dans toutes les autres langues. L’effet que nous avions mis en exergue dans notre étude préliminaire en français est donc confirmé.

number of reactions (likes + comments) on Linkedin by gender and by language


Analyse et conclusions

Gardons-nous de toute conclusion hâtive sur les différences entre langues. Pour certaines d’entre elles, les échantillons restent assez minces. Ce n’est bien sûr pas anormal puisque Linkedin est largement dominé par l’anglais et que seuls 0,3% des posts dépassent les 500 réactions.

Certains pourraient attribuer les différences observées à une asymétrie dans les distributions. Un test sur les valeurs médianes s’impose. On constate qu’elles sont relativement proches entre hommes et femmes quelle que soit la langue. Des différences subsistent toutefois qui confirment les effets pour le néerlandais, l’anglais, le français, et l’espagnol. La situation est par contre inversée en portugais. median values of reactions (likes + comments) on Linkedin per gender and per language for viral posts (>500 reactions)

Les effets d’outliers peuvent donc être anticipés. Il s’agit de posts Linkedin qui ont amassé un nombre inhabituellement élevé de réactions. Le cas de l’anglais est particulièrement intéressant car il va nous permettre de reparler des émojis sur Linkedin, et en particulier du panda.

Avec 223800 réactions, le trophée du post Linkedin le plus viral revient à un Français : Laurent Botroix. Il est l’auteur du fameux post « voyez-vous le panda ? » qui a rendu fou l’algorithme de Linkedin en 2020. Chyna Hill occupe la deuxième place du classement avec 153250 réactions sur un seul post.

Au final, c’est l’effet combiné de posts ultra viraux et de la sous-représentation des femmes sur Linkedin (1 femme pour 2 hommes), qui permet à ces dernières de dominer le classement.  



Publié dans Data et IT.

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *