Article-cohort2

Un des buzzwords de l’année dans le petit monde de l’Analytique est assurément la notion de  cohorte. Mais qu’en est-il vraiment de son utilité réelle ? Ne serait-ce qu’un « buzzword » de plus, ou au contraire une contribution majeure au bénéfice de l’analyste ?

Pour commencer, qu’est-ce qu’une cohorte ?

Utilisée depuis longtemps en médecine et surtout en démographie, la cohorte est un échantillon de population ayant vécu un même évènement majeur au cours d’une même période.

En quoi cela ouvre-t-il de nouvelles perspectives ? N’est-ce pas tout simplement de la segmentation ? Il s’agit bien d’une technique de segmentation, mais sa particularité est d’explorer une dimension jusqu’alors inexploitée : le temps (la période de référence).

La cohorte fige le triptyque visiteur/action/période dans un segment. Il devient alors possible d’étudier le comportement de cette population dans le temps.

Dans quel cas la cohorte résout-elle un problème que la segmentation classique ne sait pas traiter ? Dans tous les cas qui nécessitent de coupler un évènement à une période de référence. On peut ainsi multiplier les exemples qui démontrent la valeur analytique de la cohorte.

Le cas d’un site E-commerce

Prenons l’exemple d’un site de e-commerce qui a dans l’année deux pics de vente, les soldes d’été et les soldes d’hiver. Le responsable marketing veut étudier la population des acheteurs d’été, leur provenance, les campagnes auxquelles ils ont été exposés, leur profil comportemental, mais aussi la part de ceux qui ont (ou n’ont pas) acheté à nouveau en hiver, etc. En segmentation classique, il crée un segment « conversion » (= population ayant acheté).

  • En se positionnant sur la période des soldes d’été, il obtient 1000 conversions.
  • En se positionnant sur la période des soldes d’hiver, il obtient 2000 conversions.
  • Aucune information sur le renouvellement d’achat ou l’abandon, ni sur l’acquisition.

Mais s’il crée une cohorte, par exemple population ayant acheté en été :

  • En se positionnant sur la période d’été, il obtient cette même valeur de 1000 conversions
  • En se positionnant sur la période d’hiver, il obtient 600 conversions. Quelles sont les conclusions ?
    • parmi les 1000 acheteurs en été, 600 sont revenus acheter en hiver
      • =60% de clients fidélisés
      • =40% de clients perdus
    • Parmi les 2000 acheteurs en hiver, 1400 sont donc de nouveaux clients
      • =30% de clients fidèles
      • =70% de clients nouveaux

On voit bien dans ce simple exemple la qualité de l’information obtenue : le gestionnaire peut dès lors travailler sur une segmentation plus fine pour mieux qualifier (et donc mieux solliciter par la suite) :

  • ceux qui ont acheté deux fois (quels sont leurs points communs, ont-ils été exposés à une offre particulière, ont–ils été séduits par des produits spécifiques, etc. ?)
  • ceux qui n’ont pas renouvelé l’achat
  • les nouveaux venus de fin d’année

Cohorte-schema1

Le segment classique nous permet d’étudier deux segments

  • ont acheté en été
  • ont acheté en hiver

La cohorte permet d’étudier trois segments supplémentaires

  • ont acheté en été mais pas en hiver
  • ont acheté en été et en hiver
  • ont acheté en hiver mais pas en été

L’analyste doit ensuite rechercher les points de similitude et les points de différenciation afin d’obtenir des profils puis d’élaborer des plans d’actions efficaces ciblés sur ces segments. On peut donc affirmer que l’utilisation de cohortes est un apport majeur au travail de l’analyste dans sa recherche d’efficience. Cela n’implique pas de choisir entre le segment classique et la cohorte, mais bien de combiner ces deux approches.

Les attributs de segment

Plus généralement il est ensuite nécessaire d’ajouter une étape supplémentaire pour requalifier les segments obtenus au regard de nouveaux critères : les attributs (graphique ci-dessous) de chaque segment obtenu doivent ainsi être étudiés en détail pour en extraire les éléments distinctifs.

Cohorte-Schema2

Exemple d’analyse d’attributs sur le segment : ont acheté en été et en hiver :

  • 70% femmes
  • 85% entre 35 et 50 ans
  • 68% CSP+
  • 57% venus par la newsletter
  • 73% ont lu un commentaire
  • 59% ont laissé un commentaire
  • 89% ont regardé la vidéo produit
  • 93% ont consulté les frais de port
  • 81% ont commandé en port gratuit
  • Etc.

Dans cet exemple, la prochaine campagne d’été sera annoncée sur la newsletter, comportera une vidéo et un lien vers les commentaires, annoncera le montant de commande ouvrant gratuité du port et présentera des produits plutôt orientés femmes actives, milieu voire haut de gamme, etc.

Conclusion

La cohorte offre un apport essentiel au processus de segmentation par l’introduction d’un référentiel temps lié à un type d’action ou de comportement. Elle peut être utilisée isolément, mais la meilleure performance sera obtenue en combinaison avec la segmentation classique, et l’analyste devra quand même pousser plus loin son travail.

La dernière étape reste en tous les cas de requalifier la population obtenue sur des critères sociodémographiques, comportementaux, etc. qui eux-mêmes façonneront les messages les plus pertinents pour les cibles visées.

À ce point de la réflexion, une citation vient nous bousculer l’esprit, celle de Pangloss (in Candide, de Voltaire) : « Tout va pour le mieux dans le meilleur des mondes ». Mais soyons objectifs : ce qui précède est avéré, mais se heurte à de réelles réserves quand il s’agit de son application dans la vie réelle :

  • Tout d’abord, l’utilisation de critères sociodémographiques présuppose d’une part l’utilisation de visiteurs identifiés et d’autre part l’existence d’une base qualifiée (un CRM, par exemple), ce qui est loin d’être le cas le plus fréquent.
  • Même si nous éliminons ces critères, perdure encore le problème des cookies, de leur durée de vie,  des « privacy policies », etc.

Bien évidemment, un sujet aussi important mériterait un article dédié complet, c’est pourquoi je ne me lancerai pas ici et maintenant dans cette fastidieuse entreprise. Mais contrairement à un discours de « gourou » (qui peut se contenter de traiter un sujet par la théorie et s’affranchir de certaines contraintes),  il est de notre responsabilité d’acteur majeur du Digital Analytics de rappeler combien nous sommes sensibilisés et vigilants sur ces enjeux majeurs. Ce nécessaire rappel étant fait, nous pouvons maintenir la conclusion sur l’utilité de travailler sur les cohortes et sur l’avancée qu’elles représentent dans le processus de segmentation, dans le respect d’une durée de vie raisonnable du cookie et d’une politique de confidentialité cohérente.

 

Author

Knowledge Manager Formé aux achats et à la gestion par Carrefour, à la vente par Procter & Gamble, JM a évolué dans la grande distribution à des postes de direction pour de grands groupes en hypermarché, centrale d’achats puis logistique, avec une expérience expatriée en Afrique en qualité de Directeur Central. Fin 1995, JM crée une start up internet puis après trois ans (fin 1998) rejoint l’équipe AT Internet d’Alain Llorens dans laquelle il prend des responsabilités commerciales et est au cœur de l’aventure pionnière du Web analytics. A près de 55 ans et 13 ans d’ancienneté, JM exerce (depuis 2009) la fonction de Knowledge Manager."

3 Comments

  1. Pingback: La cohorte, le buzz et la performance | Webseonews

  2. Alain FOUERE

    Je ne suis pas statisticien, mais dans le cas des soldes d’été et d’hiver avec des personnes physiques achetant dans un magasin physique (si, si, ça existe encore !), comment fait-on pour identifier ceux d’été qui sont revenus en hiver, sans demander un nom (ou tout autre identifiant quelconque) à l’ensemble de la population acheteuse ???
    Et avec internet, comment crée t’on une cohorte sans utiliser des cookies ?

  3. Jean Marie Camiade

    Bonjour, Alain
    Merci pour votre message.
    En effet, le cookie est nécessaire. Tout comme dans le magasin on utilisera la carte de fidélité ou la carte bancaire. On peut cependant affirmer que le cookie est beaucoup moins intrusif que la carte de fidélité, ou que l’identifiant unique de Google ou d’Apple, qui contiennent une masse considérable d’informations (qui en plus sont nominatives), portant sur des activités multiples… et pouvant être croisées, bien évidemment.
    Par ailleurs le terme de cohorte est emprunté au langage médical, et là aussi les études épidémiologiques nécessitent un suivi donc un identifiant (dossier médical). Et on ne peut dans ce dernier cas soupçonner d’une utilisation abusive des données.
    En conclusion, cookie, oui, mais c’est sans doute une des formes les plus anodines et les plus anonymisées parmi la masse des « trackers » que nous subissons tous au quotidien.