31 mai 2021 2128 mots, 9 min. de lecture

Les 3 facteurs qui déterminent 55% du succès de vos posts Linkedin

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Comprendre le fonctionnement de l’algorithme de Linkedin est une nécessité pour rester visible sur ce réseau social. Dans cet article je vous révèle les résultats d’une analyse que j’ai réalisé sur 4,599 millions de posts Linkedin dans 193 pays. Les […]

Comprendre le fonctionnement de l’algorithme de Linkedin est une nécessité pour rester visible sur ce réseau social. Dans cet article je vous révèle les résultats d’une analyse que j’ai réalisé sur 4,599 millions de posts Linkedin dans 193 pays. Les résultats sont étonnants et mettent à mal pas mal de préconçus. Seulement 3 facteurs jouent un rôle sur la visibilité des posts Linkedin. Cet article reprend en outre les résultats des études que j’ai déjà publiées sur l’effet des hashtags, l’influence du nombre de mots et l’impact des émojis sur la popularité de vos posts Linkedin.

Si mes analyses vous intéressent, pensez à vous inscrire à ma newsletter ci-dessous (veillez à bien valider le lien de confirmation qui vous sera envoyé) et à m’envoyer une demande de connexion sur … Linkedin ? et le rapport complet avec des résultats supplémentaires au format pdf est disponible ici. Téléchargez-le gratuitement.

Sommaire


crédits : Shutterstock

Introduction

Comprendre le fonctionnement des algorithmes est une gageure pour tous ceux qui sont actifs sur les réseaux. Les algorithmes déterminent en effet  la visibilité de vos contributions à l’ensemble du réseau. Linkedin ne fait pas exception. Le « Dwell Time » est le principe qui régit la visibilité sur ce réseau professionnel.  Mais comment « hacker » l’algorithme sans avoir recours à des méthodes interdites (achats de like, pods) ?

Pour répondre à cette question j’ai utilisé un dataset de 4,599 millions de posts Linkedin fourni par Linkalyze. Je l’ai préparé en utilisant les solutions de data science proposées par la société Timi : Anatella pour la data preparation, Modeler pour la modélisation statistique. Je vous invite à lire la partie de cet article dédié à la méthodologie dans laquelle vous trouverez tous les détails techniques ainsi que la recette technique permettant de préparer les données avec Anatella et les « faire parler » avec Modeler.

Résultats en bref

  • seuls 3 facteurs ont une influence statistiquement significative sur la visibilité des posts Linkedin ; le nombre de personnes dans votre réseau, le nombre de mots, le nombre d’émojis.
  • Les variables telles que les hashtags, la langue du post ou le pays n’ont pas d’influence significative sur la visibilité des posts Linkedin.
  • la taille de votre réseau explique 34% de la visibilité de vos posts Linkedin.
  • le nombre de mots utilisés dans vos posts Linkedin explique 19,1% de leur visibilité
  • les émojis ne comptent que pour 2,4% dans la probabilité de recueillir 100 réactions ou plus.
  • 51,04% des utilisateurs de Linkedin ont moins de 1442 connexions, seulement 7% en ont plus de 10000 et 1,3% plus de 20000.
  • 80,3% des messages publiés sur Linkedin comptent moins de 92 mots.
  • 2,2% des posts Linkedin comptent plus de 200 mots.
  • 80,12% des posts sur Linkedin ne contiennent pas d’émojis.

Résultats détaillés : les 3 facteurs qui influencent la visibilité de vos posts Linkedin

Avant toute chose il est important de définir le terme « visibilité » sur Linkedin. Dans cette analyse j’ai exploré la probabilité d’obtenir 100 réactions (Likes et commentaires confondus) pour des membres disposant de 25000 connexions au maximum. J’ai donc posé 2 choix arbitraires qui s’explique par :

  • ma volonté de définir un objectif binaire (100 réactions) qui est probable mais reste rare
  • la nécessité d’éliminer les comptes qui biaisent les résultats (les personnalités suivies par des centaines de milliers voire des millions de personnes)

Note méthodologique : variables prises en compte dans le modèle

Dans une analyse précédente j’avais étudié le rôle des hashtags. Dans cette analyse préliminaire les émojis n’avaient pas été inclus. Or il apparaît que l’impact des émojis, bien que modeste, surpasse celui des hashtags au point de rendre ces derniers insignifiants.

Ce type de phénomène est tout à fait courant et apparaît lorsque de nouvelles variables sont prises en compte dans un modèle de prédiction.

Les résultats sont donc susceptibles d’évoluer au fur et à mesure de l’inclusion de nouvelles variables dans le modèles. Actuellement le modèle de prédiction prend en compte  les variables suivantes :

  • taille du réseau
  • nombre de hashtags
  • nombre d’émojis
  • nombre de mots
  • langue
  • pays

Au final seuls 3 facteurs jouent un rôle sur le nombre de réactions (et donc sur la visibilité) de vos posts Linkedin :

  • 34% de l’effet est expliqué par la taille du réseau
  • 19,1% par le nombre de mots
  • 2,4% par les émojis

Ces 3 facteurs expliquent donc 55% de la visibilité. Les facteurs qui constituent les 45% restants ne sont pas connus.


Les facteurs qui n’ont aucune influence : langue, pays et … hashtags

Le pays et la langue n’ont pas d’influence sur votre probabilité d’obtenir 100 réactions sur un post Linkedin. C’est une bonne nouvelle car cela veut dire qu’il n’est pas nécessaire d’habiter aux Etats-Unis ou d’écrire en anglais pour réussir ce tour de force.

Par contre, la surprise qui apparaît lorsque toutes les variables sont prises en compte dans le même modèle, c’est que les hashtags n’ont aucune influence statistique. En d’autres termes, les hashtags n’influencent pas significativement la probabilité d’obtenir 100 réactions. Dans le premier modèle dont j’avais parlé sur mon blog les émojis n’avait pas encore été pris en compte, « laissant la place » aux hashtags pour exercer leur effet. Mais dès que les émojis ont été rentrés dans le modèle, leur effet, bien que modeste (2,4% de l’ensemble), a « écrasé » celui des hashtags.


Facteur n°1 : la taille de votre réseau influence la visibilité de vos posts Linkedin

L’analyse de ces 4,599 millions de posts Linkedin montre clairement l’effet de la taille du réseau. C’est au final très logique : plus le réseau d’un membre Linkedin est grand, plus sa probabilité de récolter sur un de ces posts est élevée.

Ce qui est étonnant par contre c’est de voir le poids que cette variable joue : 34%. En gros, atteindre 100 réactions sur Linkedin est conditionné pour 1/3 par la taille du réseau. Pour faire simple, la probabilité de récolter 100 réactions augmente de 1% par fraction de 500 connexions.

effet de la taille du réseau sur la visibilité des posts Linkedin

50% des utilisateurs de Linkedin ont moins de 1442 connexions. Avec 1442 connexions, vous avez une chance sur 50 de décrocher 100 likes / commentaires (2%).

Par contre, lorsque vous avez 24000 connexions, la probabilité monte à 19%. C’est quasiment 10x plus.

Conclusion n°1 : si vous voulez être visible sur Linkedin, assurez-vous d’avoir un réseau de grande taille. C’est la clé du succès n°1. Malheureusement Linkedin vient de limiter à 100 le nombre d’invitations que vous pouvez envoyer chaque semaine. Il va donc falloir développer des stratégies alternatives comme je l’ai expliqué dans cet article.


Facteur n°2 : le nombre de mots compte pour 19,1% dans la viralité des posts Linkedin

Le second facteur majeur c’est le nombre de mots du post Linkedin. Il compte pour quasiment 20% dans la probabilité d’atteindre 100 likes et/ou commentaires.

Un post contenant 220-230 mots a 6x plus de chances d’obtenir 100 likes / commentaires que la moyenne.
Comme je l’ai expliqué en détail dans cet article, l’effet n’est pas linéaire. Un point d’inflexion est visible vers 150-170 mots. Cela signifie qu’il y a un intérêt certain à dépasser cette limite lors de la rédaction du contenu.

effet nombre de mots sur visibilité post Linkedin

Cet effet s’explique par les changements opérés sur l’algorithme de Linkedin en 2020. Le « dwell time » est devenu la variable qui conditionne la visibilité d’un post à l’intérieur du réseau Linkedin et donc sa capacité à être liké ou commenté. Le « dwell time » mesure le temps passé à interagir avec un contenu. Plus l’utilisateur passe du temps sur un contenu, plus l’algorithme infère que ce contenu est intéressant et mérite d’être exposé à d’autres personnes du réseau. Un contenu de 224 mots a forcément plus de chances de mobiliser longtemps l’utilisateur qu’un contenu de 50 mots. L’effet était donc prévisible mais est quantifié pour la première fois.

En ce qui concerne le point d’inflexion visible vers 150-170 mots je n’ai pas d’explications sur ce qu’il peut représenter.

Conclusion n°2 : si vous voulez attirer les likes et commentaires sur Linkedin, mieux vaut écrire de longs posts, en tout état de cause supérieurs à 176 mots.


Facteur n°3 : le nombre d’émojis influence le succès de vos posts Linkedin

La dernière variable dont l’effet est significatif est le nombre d’émojis. J’en ai parlé en détail ici.
On constate un effet positif dès le 1er émoji. En d’autres termes, mettre un seul émoji dans un post Linkedin vous permet déjà d’augmenter vos chances d’obtenir 100 likes / commentaires.

effet nombre d'émojis sur la visibiité des posts Linkedin

La raison est assez simple à comprendre lorsqu’on voit la distribution statistique des posts Linkedin en termes d’émojis. 80% des posts n’en contiennent pas un seul. Inclure 16 émojis, comme on peut le voir sur le graphique ci-dessous, est un optimum. Avec 16 émojis vos chances de dépasser les 100 réactions sont multipliées par 2,5.

Ce que l’analyse ne dit pas c’est où ces émojis doivent être inclus ni de quels émojis il doit s’agir.

Conclusion n°3 : mettez des émojis dans vos publications Linkedin, et mettez-en de préférence beaucoup. Mon intuition me dit que des émojis visibles sur les 3 premières lignes du posts sont déterminants mais il faut encore que je le prouve


Méthodologie détaillée

Timi Modeler a été utilisé pour trouver le modèle de prédiction le plus performant.
Concrètement 6 variables indépendantes ont été prises en considération :

  • le nom d’abonnés de la personne ayant posté le message
  • le pays renseigné sur le profil de l’auteur
  • la langue dans laquelle le post a été écrit
  • le nombre de mots
  • le nombre d’émojis
  • le nombre de hashtags

Pour éviter d’introduire des biais, les membres Linkedin disposant d’un réseau de plus de 25000 abonnés ont été éliminés du dataset. Les VIP n’ont en effet aucun mal à récolter 100 likes au contraire des simples mortels comme vous et moi.

qualité modélisation facteurs visibilité posts Linkedin

La variable prédite a été modélisée sous forme binaire. Plutôt que d’essayer de prédire le nombre de likes ou de commentaires, j’ai cherché à prédire la probabilité de dépasser 100 réactions (likes + commentaires).
Cette limite de 100 réactions a été choisie de manière arbitraire car j’ai constaté que moins de 3% des posts sur Linkedin atteignaient ce seuil. Moi-même, jusqu’à récemment, ne l’avais atteint qu’une seule fois.

Plusieurs types de modélisations ont été testées (CART, random forest) mais au final c’est l’algorithme « maison » de Timi Modeler qui a donné les meilleurs résultats. l’AUC (Area Under the Curve) est de 62% avec 3 variables. Cela signifie que 3 variables sur les 6 ont une « contribution » significative dans la prédiction du résultat.


crédits : Shutterstock

Conclusion générale

Ces premiers résultats donnent un aperçu objectif sur le poids des différents facteurs dans la visibilité des posts Linkedin. Ces résultats remettent en cause des hypothèses développées sur les effets supposés de telle ou telle pratique.

Néanmoins il faut garder à l’esprit :

  • que seules 6 variables ont été prises en compte et que d’autres effets restent à investiguer
  • que le lien de causalité entre ces facteurs (émojis, nombre de mots) et le nombre de réactions est encore inconnu. Il est en effet impossible à ce stade de dire si c’est l’algorithme qui pousse les posts contenant des émojis, ou si les émojis attirent l’attention des utilisateurs qui cliquent plus dessus et envoient un signal positif à l’algorithme.

Le chemin est donc encore long avant de comprendre toutes les finesses de l’algorithme de Linkedin (si tant est qu’il soit possible de le comprendre).


Remerciements

A l’issue de de cette première analyse j’aimerais remercier la Sylvain Tillon, Thomas Pons et Laetitia Verrière de la société Linkalyze qui m’ont fourni le dataset.
Mes remerciements les plus chaleureux vont également à Frank Vanden Berghen pour la mise à disposition de la suite Timi utilisée dans le cadre de ce travail.


Rapport à télécharger

statistiques-linkedin-analyse-engagement-viralite


Publié dans Data et IT.

2 commentaires

  1. Merci 🙂

  2. Merci pour cet article très instructif sur le fonctionnement de l’algo LinkedIn. 🙂

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *