Article-SMX-SEO1

Benoit Arson, consultant Business Analytics chez AT Internet, présentait en juin dernier lors du salon SMX Paris 2013 plusieurs astuces pour pallier la perte d’information due à la hausse des mots-clés «not provided» et travailler votre SEO malgré les différents changements mis en place par Google qui ont eu lieu au cours de ces derniers mois.

 

Avec les «not provided» keywords de Google, vous perdez l’exhaustivité des mots-clés.

L’analyse des mots-clés, analyse très populaire et présente depuis la création des outils de mesure d’audience, est de plus en plus impactée par les changements mis en place par Google. Ci-dessous une chronologie des changements.

Conséquence de ces changements : vous savez que la visite vient de Google mais vous n’avez pas connaissance du mot-clé.

La sécurisation des recherches de Google impacte tous les sites, dans des proportions différentes selon les navigateurs.

L’étude ci-dessous, réalisée sur un total de 10 000 sites en France, affiche l’évolution du taux de mots-clés perdus entre novembre 2012 et avril 2013. La forte hausse observée entre février et mars 2013 correspond au passage en mode sécurisé de recherches sur la nouvelle version 25 de Chrome.

La sécurisation des recherches de Google varie selon les navigateurs. Ainsi le graphique ci-dessous, issu d’une étude AT Internet datant de décembre 2012 et portant sur environ 8000 sites, montre que la part de mots-clés non reconnus est bien supérieure pour Firefox que pour les autres navigateurs.

Quelle méthodologie de webanalytics utiliser en SEO face aux mots-clés «not provided» ? Que faire face à cette perte d’informations ?

Les responsables de sites et web analystes peuvent, pour contourner la perte des mots-clés et déterminer malgré le https les expressions qui ont mené les visiteurs sur leur site, étudier les pages de destination.

Prenons un exemple : j’effectue une recherche en mode sécurisé,  c’est-à dire en mode connecté, et je cherche le mot « podomètres ». Je clique sur le lien proposé par Google qui mène sur le site Décathlon, et j’arrive sur la page de destination qui est une page de liste de produits de podomètres.

Le responsable du site Décathlon sait que la visite provient de Google, avec un mot-clé inconnu, mais il sait aussi que la page d’entrée traite des podomètres.

La solution consiste à s’appuyer sur les pages de destinations pour deviner ce qui a été recherché par l’internaute. Le trafic «not provided» arrive sur différentes pages d’entrées : de ces pages d’entrées, le responsable du site va pouvoir extraire la thématique et de la thématique, en déduire le mot-clé.

La première façon d’atténuer la perte d’informations liée aux mots-clés « not provided » est donc de segmenter sur le trafic «not provided» et analyser les pages d’entrées.

Cette solution reste cependant incomplète, il nous manque un niveau de détail. Car si la page d’entrée traite des podomètres, on en déduit que l’expression-clé recherchée tourne autour du podomètre, mais sans connaître l’expression exacte : « podomètre », ou « podomètre pas cher », « podometre decathlon », « podometre de couleur rouge »,… ?

Votre notoriété (Brand keywords) diminue peut-être de manière artificielle. 

Les recherches sécurisées peuvent également avoir un impact sur la notoriété d’un site, car les mots-clés «not provided» touchent aussi les recherches comportant le nom de votre marque : les brand keywords.

Les mots-clés non reconnus peuvent comporter votre marque.

Avec la hausse des recherches sécurisées, qui comprend les expressions-clés contenant votre marque, la courbe de votre trafic Notoriété décline peu à peu, tandis que ces mots-clés liés à votre Notoriété sont absorbés par le trafic Moteurs, dont la courbe croit : la notoriété perd les visites des mots non reconnus qui comportent la marque, et ces visites viennent approvisionner la courbe du trafic moteur.

Dans ce contexte, comment continuer à mesurer votre trafic Notoriété?

Voici la solution, mise au point par notre département Etudes, que nous recommandons : appliquer la part des visites de notoriété dans les expressions connues. Vous prenez la part de brand keywords parmi les mots-clés reconnus, et vous appliquez cette part au trafic « not provided ». Vous obtenez alors le trafic estimé de brand keywords dans les mots-clés non-reconnus, que vous pouvez ajouter au trafic Notoriété que vous connaissez déjà grâce aux mots-clés reconnus pour obtenir le trafic global estimé des brand keywords !

Avec cette solution, nous faisons l’hypothèse que la part de brand keywords est la même parmi les mots-clés reconnus et les «not provided» !

Pour en savoir plus sur l’impact des mots-clés «not provided» sur le trafic Notoriété et la solution pour remédier à cette perte d’informations, nous vous recommandons de lire l’article « Longtemps, j’ai cru que la notoriété de mon site peu à peu s’affaiblissait » .

L’impact des mots-clés «not provided» sur la longue traine (long tail)

Avec les «not provided» keywords, Google raccourcit la Longue Traîne (Long Tail).

Pour rappel, en SEO, la longue traine correspond aux mots-clés qui génèrent chacun extrêmement peu de recherches, mais qui sont très nombreux et qui représentent une fois leur trafic respectif additionné la plus grosse proportion des recherches sur les moteurs.

Voici une comparaison de la longue traine avant et après le phénomène des mots-clés «not provided» :

Avant le phénomène des mots-clés «not provided», nous avions, à l’extrême gauche, les expressions qui génèraient le plus de visites, puis ensuite, tous les autres mots-clés qui composaient la longue traine (qui représentaient chacun peu de visites mais qui additionnés représentaient une part non négligeable du trafic).

Après, nous observons l’apparition d’un mot-clé qui capte une très grande partie du trafic Moteurs (le fameux [-] des mots-clés «not provided»), puis une courbe de la longue traine beaucoup plus courte.

Cette perte d’informations sur la longue traine est très dommageable pour les responsables de sites, responsables SEO et web analystes, car ils ne peuvent plus savoir s’ils arrivent à capter ce trafic de longue traine, qui est un très intéressant composé d’expressions-clés très précises recherchées par des visiteurs qui savent ce qu’ils veulent et très proches de l’achat…

Comment évaluer le trafic de la longue traine ?

La solution, pour pallier la perte d’information due aux mots-clés «not provided» et mesurer malgré tout le trafic de la longue traine, est de comptabiliser le nombre de pages d’entrées différentes accueillant le trafic Moteurs. Plus vous comptabilisez de pages d’entrée différentes pour le trafic Moteurs, plus il y a de chances que vous arriviez à capter le trafic de longue traine.

En conclusion, notons la contradiction entre une époque où nous avons de plus en plus de données à notre disposition, et la perte de l’exhaustivité de ces données. Plus de données oui, mais des données plus floues qu’avant : «  Google, Firefox et Apple nous font passer du big data au blur data. »

Author

Diplômée d’un Master in International Business de BEM Bordeaux Ecole de Management, Marie travaille au sein de l’équipe Corporate Marketing comme Digital Marketing Manager et s’occupe de la promotion de la marque AT Internet sur les supports digitaux. Son challenge quotidien : mettre à profit les données digital analytics collectées chaque jour pour optimiser la stratégie web, SEO et SEA de l’entreprise, perfectionner le site et étendre sa visibilité en France et à l’international, sur tous les nouveaux marchés sur lesquels AT Internet s’est développée."

24 Comments

  1. Pingback: Comment travailler votre SEO malgré la hausse des mots-clés «not provided» ? Méthodologie webanalytics et indicateurs utiles. | Formation 2.0

  2. Avant on travaillait une sélection de mots-clés prédéfinie, aujourd’hui les changements de Google nous obligent à travailler un champ lexical global. Le temps où l’on référençait 3-4 expressions concurrentielles pour un client est terminé je pense, c’est le meilleur moyen de se planter.

  3. Pingback: Blog référencement - Comment travailler votre SEO malgré la hausse des mots-clés «not provided» ? Méthodologie webanalytics et indicateurs utiles. | Blog AT Internet - Blog référencement

  4. Une analyse bien détaillée qui pourrait expliquer en partie la perte de positionnement sur Google. Je vais suivre tes recommandations et faire les rectifications nécessaires. Merci!

  5. Jérémy

    Autant sur les données, je n’ai rien à dire. Ce que vous avancez est véridique.

    Autant, sur vos solutions, je suis loin de partager votre point de vue.

    En effet, une page bien optimisée ne vas pas sortir sur un seul mot-clé ou un champ lexical précis puisque la longue traîne permet de drainer du trafic de différents mots-clés et de champs lexicaux totalement différents.

    De même, on peut très bien avoir un nombre de page faible sur un site, mais avoir une importante longue traîne si les articles sont de qualités.

    En conclusion, le constat et les données sont justes, mais pour ma part les solutions sont très loin d’être suffisantes et satisfaisantes !

    De plus, vous ne mentionnez pas le problème rencontré depuis iOS6, bien que le problème soit différent, le sujet n’est pas si éloigné.

  6. Merci pour cette analyse. J’avais par moi même déjà déduis certaines des régles expliquées içi mais ca fait plaisir de constater que je ne m’étais pas planté (même si j’avais pas été aussi loin dans la réflexion). Merci encore.

  7. Timidité

    Superbe article. Je viens d’un autre blog qui ma envoyer vers cette article et j’ai découvert plein de chose.
    Je me suis toujours demander pourquoi il y avait autant de mot introuvable et pourquoi on ne pouvais pas les définir. Bref j’en sais un peu plus. MERCI

  8. Merci pour cet article. J’utilise un peu plus Webmaster Tools pour conserver de la visibilité sur les requêtes où je demeure visible.
    Mais je préfère travailler sur Google Analytics, c’est quand même plus pratique pour analyser les parcours utilisateurs. 😉

  9. Benoit Arson

    @Jérémy
    Les solutions proposées ne sont pas infaillibles, elles permettent cependant de fournir quelques infos sur le mot-clé inconnu. Vous avez raison, une page peut attirer des mots-clés de champs lexicaux différents même si c’est difficile d’être positionné sur deux champs lexicaux avec une seule page. Il vaut mieux, pour espérer être bien positionné, axer le contenu d’une page sur un champ lexical.
    La solution sur la longue traine n’est valable, je le reconnais, que pour les sites qui comportent de nombreuses pages. Pour les sites à peu de pages, c’est plus difficile. Cependant, pour capter le trafic de longue traine, une des solutions est de créer du contenu et donc de créer de nouvelles pages.
    Merci pour votre commentaire.

  10. Je rejoins l’avis précédent comme quoi en optimisant une page il n’y aura pas qu’un seul mot clé qui en ressortira, ce serait peine perdue de travailler le reste des mots clés et partir sur du bourrin (pénalisant d’ailleurs!)En tout cas travailler le contenu tant dans la quantité que la qualité reste toujours la solution.

  11. Avec du quasi 100% désormais, on va réellement avoir besoin de multiplier les astuces…

  12. Idée à la con et utopique : on bloque le référencement des sites pour Google (erreur 404) comme ça Google n’a plus rien à mettre dans son index et il ne sert plus à rien. Peut-être que cela lui fera comprendre qu’il faut arrêter de se prendre pour le roi du Web et faire croire à nos grand parents que c’est lui internet…..

  13. article d’une grande utilité pour mesurer les différents keyword du site cependant il faudra x nombres de pages pour x nombres de requêtes…On ne va plus en finir.
    Même si on met x mots clés dans un champ lexical précis pour un article et une page dédiée, ça va être difficile de savoir par quel(s) mot(s) clé(s) l’internaute est venu sur le blog…

  14. Tout a fait d accord avec Mica:
    « on bloque le référencement des sites pour Google (erreur 404) »
    et puis good by google 😉

  15. retrouver mot de passe facebook

    Merci bien pour ce sujet il est vrai que je suis une néophyte sur le sujet mais votre sujet ma donné envie de peaufiner mes recherches. Il est devenu rare de voir un article écrit aussi bien. Je vais poursuivre ma navigation sur votre site. En espérant pouvoir vous relire , bonne chance pour la suite. Cordialement .

  16. Pingback: Comment travailler votre SEO malgré la hausse des mots-clés «not provided» ? Méthodologie webanalytics et indicateurs utiles. | Webseonews

  17. Pingback: Comment travailler votre SEO malgré la hausse des mots-clés «not provided» ? Méthodologie webanalytics et indicateurs utiles. | Blog AT Internet - Agence Digitalis

  18. Pingback: [Portrait] Sarah Alem, chargée d’acquisition web chez Havas Voyages - Blog AT Internet

  19. Pingback: [Humeur] Big data : quand le Far West dicte sa loi | Blog AT Internet

  20. Merci pour cette analyse qui est bien détaillée.
    Le client qui va faire une recherche est sans doute protégé par son compte au détriment du client webmaster qui se retrouve un peu dans le brouillard. Celui-ci va regarder ses anciennes statistiques avec nostalgie.

  21. De même, on peut très bien avoir un nombre de page faible sur un site, mais avoir une importante longue traîne si les articles sont de qualités.

  22. Article toujours d’actualité, malgré les années !

    Quand on travaille sur un champ lexical varié sur une page, difficile de trouver telle ou telle combinaison de mot-clef qui a été tapée. Des outils comme Semrush peuvent pallier un peu, mais cela ne donnera jamais la thématique complète des mots-clefs