Fin 2019, Google a dévoilé sa mise à jour « BERT ». Vous en avez certainement déjà entendu parler. Cette mise à jour basée sur de l’IA et du 3Natural Language Processing » NLP ainsi que sur une machine learning. Elle est dans la lignée de RankBrain dévoilé quelques années avant et elle a pour objectif de mieux comprendre la requête qui est saisie par les internautes dans le moteur de recherche. Avec BERT Google ne va pas se contenter de comparer la requête avec les différents contenus qu’il a dans son index.
Il va surtout essayer de fournir le meilleur résultat possible et il va tenter de déterminer le besoin informationnel réel, l’intention de recherche qui se cache derrière ce que vous avez tapé dans le moteur de recherche. Dopé à l’intelligence artificielle et au machine learning, BERT va donc s’auto améliorer et il va de mieux en mieux comprendre et cerner le sens des requêtes. Et notamment, il va être de plus en plus fort pour comprendre les 15 pour cent de requêtes journalières qui sont nouvelles et qui n’ont jamais été saisies avant et pour lequel il n’a aucun historique.
Allez aujourd’hui, on va donc étudier ces différentes intentions de recherche et on va voir quel est l’impact de notre travail SEO et plus précisément dans notre travail de création de contenu.
Allez, on y va!
Salut, je suis Christophe Vidal. Aujourd’hui, on va donc parler de l’intention de recherche et, vous l’avez compris, cette intention de recherche, ce besoin informationnel, c’est vraiment l’une des composantes principales de notre métier aujourd’hui en SEO. Alors, l’objectif de Google, c’est de présenter les meilleurs résultats possibles aux questions des internautes.
Et pourtant, ce n’est pas simple. Souvent, quand on tape une requête, on va taper une requête avec quelques mots et donc comprendre réellement notre besoin informationnel caché, notre besoin informationnel réel, c’est une tâche qui est complexe pour un moteur de recherche. Ce mécanisme va s’appuyer sur un processus d’apprentissage continu et va améliorer ses résultats en fonction de différents critères de qualité.
Allez, revenons tout d’abord au fonctionnement d’un moteur de recherche pour bien comprendre tout ça. Alors avant de commencer, je me dois malheureusement de rappeler la triste réalité de démystifier certaines croyances et aussi me corrigez moi même sur certains abus de langage.
Je dois rappeler que l’intelligence artificielle est malheureusement bien peu intelligente et très artificielle. Ce que je veux dire par là, c’est qu’un moteur de recherche comme Google et au sens large, les différents algorithmes d’intelligence artificielle. Ils ne comprennent pas un seul mot de ceux qu’ils lisent. Ils ne sont pas du tout capables de comprendre les choses, peut-être qu’un jour, ils le seront. On pourra peut-être un peu plus parler d’intelligence artificielle à ce moment là, mais aujourd’hui, ce sont tout simplement des algorithmes qui vont créer des modèles mathématiques et les utiliser pour finalement comparer les choses entre les autres.
Or, ça tombe plutôt bien pour un moteur de recherche comme Google, il n’a pas du tout besoin de comprendre ce qu’il lit. Il a juste besoin de comparer différents éléments afin de vous rendre un classement et vous présenter et vous présenter une page de résultats. Alors si Google, il ne comprend pas ce qu’il lit, malgré tout, comment est-ce- qu’il fait pour répondre aux requêtes et vous donner les résultats les meilleurs possibles? Eh bien, c’est un processus mathématique. On va pas forcément rentrer dans les détails, mais qui va transformer le texte en un modèle mathématique basé sur des vecteurs: la vectorisation du contenu. Donc un vecteur, c’est tout simplement un tableau qui va reprendre les différents mots d’un texte et leur attribuer un certain nombre de points. On se rapproche des vecteurs qu’on a pu voir au collège ou au lycée. Le moteur va donc créer un vecteur pour la requête, que vous avez saisie dans le moteur de recherche, un vecteur pour les contenus qu’il a indexés. Et il va comparer ces deux représentations mathématiques avant de vous fournir les meilleurs résultats. Je vais vous montrer un peu comment ça marche en images?
Nous voilà donc devant une belle représentation graphique en 3D des vecteurs. Donc, on va rester ici sur un modèle avec trois mots: mot 1, mot 2, mot 3, parce que c’est pratique à représenter d’un point de vue visuel. Bien évidemment, dans la vraie vie, le modèle utilise des vecteurs avec beaucoup plus de dimensions que cela.
Donc, pour comparer ces différents vecteurs, je vous explique rapidement. On retrouve donc en vert ici la représentation de la requête qui sera saisie par l’internaute, en rouge et en violet, deux contenus candidats qui désirent se positionner sur cette expression clé. L’algorithme il va donc tout simplement venir calculer un angle qui sépare la requête et les documents. On voit ici que le contenu de type B est plus proche à un angle plus petit que le contenu de type A.
Donc, le contenu de type B va venir mieux se positionner dans le moteur de recherche. En tout cas, en ignorant tous les autres critères qui pourront entrer en compte, tels que les critères techniques et les critères de popularité.
Cette notion d’angle, entre la requête et les documents, c’est ce qu’on appelle le fameux glissement sémantique et qu’on pourra aussi retrouver sous le nom de « Cosinus de Salton » du nom de son créateur Gérard Salton, qui a été l’inventeur du modèle vectoriel.
Et pour la petite histoire, ça ne date pas d’hier cette notion de modèle vectoriel, puisque Gérard Salton a présenté son modèle vectoriel dans les années 60.
À ce stade là, normalement, vous devriez me poser la question: « Ok, mais tu nous a parlé de BERT, qu’est ce que vient faire l’algo de BERT dans tout ça? » Dans la pratique, on devrait déjà parler d’un autre algo qui existait bien avant l’algo BERT. C’est l’algo de Rocchio, du nom de son créateur John Rocchio. Là, on se situe dans les années 70, à peu près pour l’algo de Rocchio. Alors, en se basant sur le cosinus de Salton, le moteur va donner les meilleurs résultats, mais il peut aussi se tromper. Et donc, il va analyser les résultats qu’il a fournis pour s’assurer que l’être humain qui a posé la question est content et satisfait de la qualité de ses résultats. C’est là que Rocchio va intervenir puisqu’il a créé les premiers algorithmes de machine learning qui vont se baser sur une analyse de la qualité des pages vis-à-vis des attentes des internautes, en s’appuyant sur des retours d’informations sur la pertinence des contenus.
L’algo va ainsi se rendre compte si le résultat est de bonne qualité et plutôt que d’adapter l’algorithme, ce qu’il va faire c’est qu’il va venir faire varier la requête, il va faire un glissement de la requête pour venir la rapprocher du bon contenu. Je vous montre ça en images.
Ok, nous retrouvons donc notre visualisation graphique avec notre contenu A et notre contenu B et la requête. La méthode du cosinus de Salton nous avait indiqué que le contenu B était celui de meilleure qualité et qu’il devait être celui qui convenait le mieux à l’internaute.
Le moteur, finalement par apprentissage et par retour sur la qualité du contenu va se rendre compte que ce contenu B n’est pas si pertinent que cela et il va petit à petit apprendre que finalement, c’est le contenu A qui est de meilleure qualité. En tout cas, il va faire différents essais pour arriver jusque là. Il va donc venir de manière totalement invisible, sans qu’on s’en rende compte. Modifier les mots, en tout cas le poids des mots à l’intérieur de la requête, et voilà ce qui va se passer.
On voit qu’après apprentissage, la requête a été modifiée pour donner plus d’importance à certains mots et venir se rapprocher du contenu A. Et ça ne sera donc plus le contenu B qui va être présenté à l’internaute, mais bel et bien ce nouveau contenu A, qui est de meilleure qualité. Bon, mais je vous ai toujours pas parlé de notre copine BERT. Alors rassurez vous BERT est finalement, c’est une amélioration de cet algorithme de Rocchio puisque au fil des années, on aura pu emmagasiner énormément de data, énormément de données et donc BERT va pouvoir calculer de manière automatique sans réellement passer par les premières étapes de l’algorithme de Rocchio en temps réel, le meilleur vecteur pour votre requête par rapport au contenu dont il dispose. Et il va calculer donc le meilleur vecteur qui correspond à votre besoin informationnel réel, votre besoin informationnel caché, votre réelle intention de recherche.
Or, quels impacts est-ce-que cela va avoir sur la création de nos contenus? Vous l’avez compris, nous devons créer nos contenus non pas en fonction de ce que l’internaute va réellement taper sur Google, mais sur ce que Google va comprendre de cette expression, en tout cas de comment il va l’interpréter et donc du besoin informationnel, de l’intention de recherche qu’il aura décidé pour cette requête.
Donc, il y a plusieurs possibilités de faire ça. Si vous avez des outils, on en reparlera un peu rapidement après, vous pouvez coller au mieux à ce besoin d’information. Vous pouvez aussi analyser tout simplement les SERP en tapant les expressions clés dans Google et voir quels types de résultats vont sortir. Et en analysant ces pages de résultats, vous allez comprendre quelles sont les intentions de recherche que Google a sélectionnées et vous allez pouvoir vous aligner là dessus et créer les contenus qui correspondent à ce que Google attend.
Pour vous aider dans vos créations de contenu, on va détailler les quatre grands types d’intention de recherche qu’on a pu mettre en avant jusqu’à aujourd’hui. Allez, je vous présente ça en images. Voici donc ces 4 grandes intentions de recherche.
La première, c’est l’intention de recherche navigationnelle, puis informationnelle, transactionnelle et commerciale. Rentrons un peu plus dans le détail: L’intention de Recherche navigationnelle, correspond vraiment à un acte de navigation. Vous savez là où vous voulez aller, donc le moteur va vous y rendre le plus naturellement possible, donc ça va être vraiment souvent des expressions de type branding comme YouTube ou Google Maps. Je sais exactement où je veux aller, mais si je tape aussi FNAC Xiaomi Note 10, très clairement je veux aller acheter un Xiaomi Note 10 chez la FNAC. Donc, on va venir créer des pages d’accueil, voire des pages catégorie, voire des pages produits. Mais on a assez peu de marge de manœuvre, en tout cas pour manipuler le moteur de recherche sur ces requêtes là. On va, le cas échéant, venir optimiser notre information: name, adresse, phone si nécessaire, peut être travailler sur des annuaires, travailler sur du branding, mais c’est vraiment l’intention de recherche sur lequel on pourra finalement avoir le moins d’impact.
Le deuxième niveau, qui est celle qui va nous permettre d’acquérir un maximum de trafic, c’est la recherche informationnelle. Elle représente la plus grosse partie des recherches qui sont faites sur Google. Quelques exemples: « Différences Xiaomi Note 10 et Xiaomi Note 11. Comment faire du béton? ». On est vraiment sur de la pure recherche d’information. Il n’y a pas d’acte d’achat immédiat, en tout cas derrière ces requêtes là, voire aucun acte d’achat si on va sur « comment faire du béton? ». Malgré tout, il y a de fortes chances que la personne qui tape comment faire du béton ait besoin d’acheter un sac de ciment un jour. Les contenus qu’on va créer dans ce cas là, ça va être des contenus de type blog, des contenus de type guides et des contenus de type tutoriaux. On va vraiment essayer de répondre rapidement à l’intention de l’internaute en présentant du contenu informatif de qualité.
N’oubliez pas que sur ces requêtes informationnelles, une grosse partie de celles ci va être réalisée sur un device de type smartphone, donc pensez à optimiser ces pages là pour une navigation en mobile.
Troisième type d’intention de recherche, les intentions de type transactionnel. Cette fois, on va être sur quelque chose où l’internaute a la carte bleue en main. Je pense à des requêtes de type » Xiaomi Note 10 promo, vol Paris-Londres ». Ici, il n’y a pas trop de discussions, on va venir présenter une page d’achat, une page produit. Cette page va contenir des images, du contenu simple et clair, des « call to action » bien visibles et on viendra potentiellement venir rajouter des contenus de réassurance, des contenus présentant l’utilisation du produit, etc.
Dernier type d’intention de recherche les intentions de type commercial. Ces intentions qui vont se rapprocher des intentions transactionnelles, mais on est moins proche de l’acte d’achat. Je pense par exemple à des recherches telles que « Comment choisir un vélo électrique? Quel est le meilleur téléphone à moins de 500 euros? ». On n’a pas encore la carte bleue en main, mais on a quand même cette vraie envie d’acheter, on est dans une recherche commerciale. Donc dans ces cas-là, on va essayer de créer des contenus de type avis, de type comparatif. On va donner un maximum d’informations et surtout, on va penser à lier ces pages commerciales avec les pages transactionnelles dont on vient de parler juste au dessus, puisque même si on n’a pas encore tout à fait la carte bleue en main, notre objectif, c’est quand même d’acheter.
Pour créer vos contenus, vous avez plusieurs possibilités, soit vous arrivez à comprendre cette expression de requêtes cachées, soit en utilisant des outils comme « yourtext.guru » des frères Peyronnet, soit en analysant la SERP et vous allez pouvoir créer le contenu exactement recherché par Google, soit vous allez multiplier les contenus en essayant de couvrir l’ensemble des intentions et vous assurer du coup de créer ce que le moteur attend. C’est une des stratégies qu’on peut retrouver dans la création d’un cocon sémantique.
Dans tous les cas, gardez en tête de bien classer vos mots clés par type d’intention et à observer les résultats de la SERP. En conclusion de cette vidéo, je voudrais faire un clin d’œil, à mon ami Laurent Bourrelly, avec son expression « Il faut sentir l’odeur de la SERP ». C’est certainement l’un des meilleurs conseils qu’on peut donner à toutes les personnes qui veulent faire du SEO.
Voilà, c’est terminé pour aujourd’hui, j’espère que ça vous a plu, surtout j’espère que ça vous sera pratique. Ça va vous aider à mieux créer vos contenus en analysant les intentions de recherche et en allant exactement à ce qu’attend Google. Alors, n’hésitez pas à aimer la vidéo et pourquoi pas, à la commenter, ça fait toujours plaisir d’avoir un retour, d’avoir votre Feedback. Dans tous les cas, je vous invite à vous abonner à la chaîne Semrush qui est toujours riche en contenu. Et puis, cliquez sur la petite cloche, comme ça, vous êtes sûr de ne louper aucune de nos prochaines vidéos. Allez à très vite.