LinkedIn Link to LinkedIn Twitter Link to Twitter

RankBrain - Un algorithme pour la recherche sémantique

Mis à jour le 09/08/2022 | Publié le 04/07/2022 | 0 commentaires

Conception de site webSEOGoogleAlgorithmesRankBrain

Officiellement annoncé et confirmé le 26 octobre 2015, RankBrain est basé sur l’apprentissage automatique. Il aide Google à traiter les résultats de recherche et à fournir des résultats de recherche plus pertinents aux utilisateurs.

Si vous êtes sérieux au sujet du référencement, vous devez optimiser votre site Web pour l’algorithme RankBrain.

Pourquoi ?

Google a annoncé que RankBrain est le troisième signal de classement le plus important pour apparaître en 1ere page.

Et, il interviendrait en moyenne sur 15% des requêtes.

Dans ce guide, vous apprendrez tout ce que vous devez savoir sur l'algorithme RankBrain de Google. Et comment optimiser votre site Web pour RankBrain.

RankBrain et référencement sémantique

Si RankBrain voit un mot ou une phrase qu’il ne connaît pas, l’algorithme peut deviner quels mots ou phrases pourraient être similaires et changer le résultat en conséquence, ce qui la rend plus efficace pour gérer des requêtes de recherche exotique.

RankBrain cherche également des entités (choses) ou groupes de mots qui ont les meilleures chances de correspondre. Par conséquent, RankBrain tente de deviner ce que les gens veulent dire et change les résultats, ce qui permet d’obtenir une meilleure satisfaction pour les utilisateurs.

RankBrain et la recherche sémantique

RankBrain est liée à la recherche sémantique. Parce que RankBrain est une IA qui s’appuie sur BERT, le Knowledge Graph et d'autres choses liée au moteur de recherche sémantique qu’est Google. Il interprète les mots comme des entités, des choses et non pas des chaînes de caractères.

Cela peut aussi inclure l'utilisation de mots vides dans une requête de recherche (« le », « et », etc.) : des mots historiquement ignorés par Google, mais qui sont parfois d'une importance majeure pour bien comprendre le sens ou l' intention derrière la requête de recherche d'une personne. Il est également capable d'analyser des modèles entre des recherches qui ne sont apparemment pas liées, pour comprendre en quoi ces recherches sont similaires les unes aux autres. Ceci est notamment lié à BERT.

Une fois que les résultats de RankBrain sont vérifiés par l'équipe de Google , le système est mis à jour et redevient opérationnel.

RankBrain vs Hummingbird

À la base, RankBrain est un système d'apprentissage automatique qui s'appuie sur Hummingbird, qui a fait passer Google d'un environnement de « chaînes de caractères » à « entités et relations ».

Derrière le brevet le plus probable derrière RankBrain, Google donne entre autre un exemple telle que :

  1. Requête originale = "New York Yankees Stadium"
  2. Requête révisée = "Yankees?Baseball ("New York": "Stadium")"

Ici, le moteur de substitution détermine que le terme "Baseball" est fréquemment un terme de substitution pour le terme "Yankees" dans le contexte des concepts combinés "New York" et "Stadium", et envoie une indication à la collection de règles de substitution pour ajouter la règle de substitution "Yankees?Baseball ("New York": "Stadium")" à la collection. Pour les requêtes utilisateur ultérieures contenant les termes de requête d'origine "New York Yankees Stadium", le moteur de substitution peut alors appliquer la règle de substitution "Yankees?Baseball ("New York": "Stadium")" et communiquer avec le moteur de révision de requête pour inclure le remplacer le terme "Baseball" dans la requête révisée.

Ce brevet est “Using concepts as contexts for query term substitutions” que l’on peut traduire en bon français : “Utilisation de concepts comme contextes pour les substitutions de termes de requête” :
https://patents.google.com/patent/US9104750B1/en

Le brevet de RankBrain - Un brevet pour la recherche sémantique

Quant à Humminbird, l’algorithme permettait de remplacer les termes de requêtes de la même manière que RankBrain.
Le brevet Hummingbird pour améliorer la recherche sémantique

Sur cette infographie du brevet le plus probable derrière Hummingbird, en bas vous pouvez voir que “place” est identique à “restaurant”. La requête est tout en haut à gauche.

Ce qui veut dire que pour cette requête Google détermine ainsi que le mot “endroit” est égal au mot “restaurant”, donc Hummingbird renvoyais les mêmes résultats de recherche en fonction des mots signifiant la même chose mais décrit d’une autre manière..

En outre, RankBrain s’appuie sur l’intelligence artificielle pour aboutir à la même chose qu’Hummingbird. Sauf que Humminbird n'était pas une intelligence artificielle et qu’elle n'était pas forcément connecté aux algorithmes sémantiques.

RankBrain pourrait s’appuyer sur des modèles NLP et BERT pour changer les termes de requêtes de manière à convenir aux besoins des utilisateurs dans un Web sémantique.

Aussi, une dernière chose intéressante à signaler, est que chaque jour, Google voit de nouvelle requêtes qu’ils n’avaient pas vu. Cela tombe bien car si RankBrain voit un mot ou une phrase qui ne lui est pas familier, la machine peut deviner quels mots ou phrases pourraient avoir une signification similaire et filtrer le résultat en conséquence, ce qui la rend plus efficace pour gérer des requêtes de recherche inédites.

Optimiser RankBrain pour la recherche sémantique

Une mine de désinformation s'est écroulée sur les SERP lorsque Google avait déclaré que RankBrain jouais un rôle déterminant dans le classement des pages, c'est-à-dire l’un des 3 plus grands facteurs.
Alors tout le monde à écrit sur “comment optimiser pour RankBrain”. Parsemé d’incohérence plus notable les unes que les autres.

Du coup les gens n’optimisent pas pour RankBrain.

Et bien pour faire simple, vous devez ajouter dans votre texte des synonymes et des cooccurrences, ou des mots d’un même champ lexical voir mentionner des entités. Vous pouvez vous aider d'outils de rédaction sémantique pour ce faire tels que SEOQuantum, YourTextGuru ou encore Inlinks.
Vous pouvez également commencer à écrire des titres (Hn) vers un langage plus naturel.

C’est ça optimiser pour RankBrain.

Espace vectoriel et Rankbrain

Google transforme les mots en vecteurs, c’est ainsi qu’il à été fait pour classer les documents. Rankbran utilise les espaces vectoriels pour comprendre ce qui se cache derrière la requête et ce que pense l’humain d’une certaine mesure :

Des modes de réalisation particuliers de l'objet décrit dans cette spécification peuvent être mis en œuvre pour réaliser un ou plusieurs des avantages suivants. Premièrement, les mots inconnus dans des séquences de mots peuvent être prédits efficacement si les mots environnants sont connus. Deuxièmement, les mots entourant un mot connu dans une séquence de mots peuvent être efficacement prédits. Troisièmement, des représentations numériques de mots dans un vocabulaire de mots peuvent être facilement et efficacement générées. Quatrièmement, les représentations numériques peuvent révéler des similitudes et des relations sémantiques et syntaxiques entre les mots qu'elles représentent.

En utilisant un système de prédiction de mots ayant une architecture à deux couches et en parallélisant le processus d'apprentissage, le système de prédiction de mots peut être efficacement entraîné sur des corpus de mots étendus, par exemple, des corpus qui contiennent de l'ordre de 200 milliards de mots, ce qui entraîne une meilleure qualité numérique. représentations que celles obtenues par des systèmes d'entraînement sur des corpus de mots relativement plus petits. En outre, les mots peuvent être représentés dans des espaces de très grande dimension, par exemple des espaces de l'ordre de 1000 dimensions, ce qui donne des représentations de meilleure qualité que lorsque les mots sont représentés dans des espaces de dimension relativement inférieure. De plus, le temps nécessaire pour former le système de prédiction de mots peut être considérablement réduit.

Ainsi, une requête incomplète ou ambiguë contenant certains mots pourrait utiliser ces mots pour prédire les mots manquants qui pourraient être liés. Ces mots prédits pourraient ensuite être utilisés pour renvoyer des résultats de recherche que les mots d'origine pourraient avoir des difficultés à renvoyer. Le brevet qui décrit ce processus de prédiction de l'approche des vecteurs de mots est :

Calcul de représentations numériques de mots dans un espace de grande dimension

Inventeurs : Tomas Mikolov, Kai Chen, Gregory S. Corrado et Jeffrey A. Dean
Cessionnaire : Google Inc.
Brevet américain : 22 août 2017

Encore et toujours, ajouter un champ lexical large pour améliorer la compréhension de votre texte pour Google et apparaître pour plus de variations de mots-clés.

Si vous n’êtes pas familier avec TFIDF et les espaces vectoriels, rendez vous sur notre article : Comment Google comprend un contenu et lui donne un score de qualité

RankBrain pondère les facteurs de classement

RankBrain peut aider Google à comprendre chacune des requêtes, c'est la partie où RankBrain détermine une partie de l'intention du chercheur.
RankBrain se demandera essentiellement : "Maintenant que j’ai compris les besoins, quels signaux me conviennent pour afficher les bon résultats ?"

Exemple de métriques sur lesquels pourraient agir RankBrain

Est-ce qu’il y à des mots pertinents à la requête ? Si oui, est-ce que ça compte ?

Par exemple une fiche produit e-commerce, quel plus value donner au niveau du contenu par rapport au autre fiche produit ? Probablement aucun.

Alors, il regarde plutôt la diversité des backlinks, la fraîcheur du contenu, l’engagement, les avis, la proximité locale, etc .

Ici en l'occurrence, il donnera probablement un coefficient plus élevé au backlinks, et au avis. S' il s’agit d’un produit qui peut être trouvé localement, il accordera également une grande importance sur les facteurs de classement local.

Les algorithmes de Google ont toujours beaucoup de vertical. Ainsi, optimiser Rankbrain consiste également à mesurer la satisfaction des internautes sur les résultats de recherche. Et cela est très important à connaître pour optimiser son référencement naturel.
Les algorithmes de Google analysent si les internautes sont satisfaits des résultats de recherche.

Le fonctionnement de RankBrain

Il est possible que selon le mot-clé, RankBrain augmente ou diminue l'importance des backlinks, la fraîcheur du contenu, la longueur du contenu, l'autorité du domaine, etc. Dit autrement, il pondère les facteurs de classement en fonction d’une requête.

Sans doute que RankBrain s’appuie sur le Learning To Rank.

Ensuite, il examine comment les chercheurs Google interagissent avec les nouveaux résultats de recherche. Si les utilisateurs aiment mieux le nouveau classement, il reste. Sinon, RankBrain recommence.

Comment Rankbrain mesure la satisfaction des utilisateurs ?

RankBrain peut essayer de comprendre de nouveaux mots-clés, ou il est aidé par d'autres algorithmes comme hummingbird.

Mais la question plutôt est :
Une fois que RankBrain affiche un ensemble de résultats, comment sait-il s'ils sont réellement bons ?

Eh bien, il pourrait éventuellement observer, de la même manière que l’on fait du A/B testing :

RankBrain, les facteurs de classement relié à l'UX (user experience)

En d'autres termes, RankBrain montre un ensemble de résultats de recherche qu'ils pensent que vous aimerez. Si beaucoup de gens aiment une page particulière dans les résultats, ils donneront à cette page un coup de pouce dans le classement.

Et si vous détestez un contenu ? Ils supprimeront cette page et la remplaceront par une autre page. Et la prochaine fois que quelqu'un recherchera ce mot-clé (ou un terme similaire), il verra ses performances.

Il porte une attention particulière à la façon dont vous interagissez avec les résultats de recherche.

Concrètement, il s'agit de :

  • Taux de clics organique
  • Temps de séjour
  • Taux de rebond
  • Pogo-sticking

Imaginons qu’un internaute recherche de l’aide pour faire du SEO, mais qu’il tombe sur une définition ennuyeuse sur le référencement et qu’il n’est pas satisfait du contenu.
RankBrain évalue le taux de rebond sur les résultats de recherche

Donc, vous retournez en arrière puis sélectionnez un autre contenu. Celui-ci n'est pas beaucoup mieux. Il est plein de conseils génériques.
Alors vous recommencez.

Schéma du pogo sticking sur les résultats de recherche

Puis vous tombez enfin sur un contenu qui va vous aider à approfondir vos connaissances.

Puis, au lieu de cliquer sur "retour", vous passez 5 minutes à lire le contenu, voir à cliquer sur de nouveau liens du même site pour en savoir davantage.

Ce va-et-vient est appelé « Pogo-sticking ».

Si Google remarque que les gens quittent rapidement une page pour cliquer sur un autre résultat de recherche, cela envoie un message fort à Google : "Cette page est nulle !".

Rankbrain modifie le classement due au CTR

Et si Google remarque que beaucoup de gens arrêtent de partir et revenir sur un résultat spécifique, ils vont donner un coup de pouce à cette page pour la rendre plus facile à trouver.

RankBrain peut améliorer la position d'un site Web si la page est beaucoup cliquée

De nombreuses études ont détecté le CTR comme possible facteur de classement car cela correspondait avec les positions des pages. Quoi qu’il en soit, en tant que bon référenceur vous devez vous en préoccuper.

Schéma global du fonctionnement de Google RankBrain

Il est également important de constater que dans le brevet indiqué au début, une phrase fait référence à l’interaction des utilisateurs :

Une règle de terme de substitution dans un contexte spécifique identifié par un concept peut être déterminée empiriquement à partir d'interactions d'utilisateurs avec des données de résultats de recherche. En étendant la formation d'un contexte au-delà de deux mots, le système de recherche peut déterminer des règles de substitution dirigées vers des contextes plus spécifiques et potentiellement améliorer les résultats de recherche.

Comment faire pour optimiser RankBrain ?

Faire un contenu pour l'expérience utilisateur.

Cela veut dire :

  • Accrochez le lecteur dès le début du contenu
  • Optimisez sa balise title et meta description pour attirer le lecteur
  • Optimiser l’intention de recherche

Optimiser sa balise title

Votre balise <title> est nulle. Vous savez, celle qui est affichée sur les résultats de recherche. Bourré de mot-clé.

Ce n’est pas du SEO.

La présence de mot-clé dans une title n'a aucun facteur de classement.

Mais optimisez sa balise title pour attirer le clic, cela est un facteur de classement. De plus, vous faites du SEO pour que les utilisateurs voient votre page, donc attirez le clic lorsque vous êtes en 1ère page.

Quel est la balise titre idéal à faire ?

Un titre accrocheur certes, mais qui suscite l’émotion chez l’internaute, c’est encore mieux.

Par exemple, voici une balise de titre générique :
Conseils de productivité : comment en faire plus

Il manque le "umph" qui pousse les gens à cliquer.

Voici comment vous pourriez transformer cette balise de titre en une centrale émotionnelle :
Écrasez votre liste de tâches avec ces 17 conseils de productivité

Ou mieux encore,
Ecrasez votre liste de tâches : 17 conseils de productivité (& TIPS)

Ou mieux encore,
je vous laisse faire vos suggestions en commentaire.

Comment réduire le taux de rebond ?

Lorsqu’un internaute arrive sur un site, il souhaite trouver directement la réponse à ces questions. Après, si le sujet l’intéresse, il faut qu’il puisse en lire davantage sur la même page. Ce qui le fera rester sur la page.

Cela en découle qu’il est très important de faire en sorte que le contenu offre la réponse directement à sa question.
Mais lorsqu’il la trouve directement, cela peut impacter votre taux de rebond.

Par exemple, des articles qui peuvent se positionner sur Google News offrent la réponse au milieu voir à la fin du contenu afin que les utilisateurs restent sur le site.

Je pense que ce n’est pas une bonne stratégie à long terme.

L’idéal, même si je vous laisse faire vos propres tests, est de fournir la réponse dès le départ, mais de donner des raisons au lecteurs de poursuivre sa lecture. Ainsi, vous ne trompez pas l’internaute tout en le gardant sur votre page.

Optimiser la sémantique pour Rankbrain

Tout d’abord, cartographiez votre site web par :

  • Type de contenu ;
  • Catégories de pages ;

Puis, comprenez comment les entités sont présentes dans votre contenu et analysez la manière dont les pages avec entités sont liées.

OnCrawl outil SEO
Inrank flow : montre comment la popularité du maillage interne se répand entre les groupes – Données OnCrawl

Pour ce faire, la première étape est de crawler votre site pour :

  • Catégoriser vos pages.
  • Extraire les entités nommées par groupes de pages.
  • Identifier les pages avec ou sans entités nommées pour ajuster votre contenu.
  • Surveiller le nombre de mots par groupes de pages.

L’objectif est de définir les métriques de contenu idéales pour maximiser votre crawlabilité.

Puis, utiliser les entités nommées dans vos ancres liées et créez des ensemble de pages liées en fonction de la typologie d’entité.

Résumé sur RankBrain

Différentes requêtes, citations, mentions peuvent affecter la perception d’une l'entité aux yeux du moteur de recherche. RankBrain est un algorithme de recherche mystérieux et non open source. Mais, chaque référenceur holistique doit savoir et se souvenir que chaque seconde, chaque facteur de classement et chaque algorithme de facteur de classement peuvent être calculés, ordonnés et réinterprétés par RankBrain.

Ainsi, penser comme dans RankBrain peut aider un référencement holistique à voir le point de vue des moteurs de recherche dans un projet de référencement.

Crawling, indexation, classements et re-classements sont tous basés sur des principes d’intelligence artificielle et de machine learning.

Le crawl consomme de l’énergie ; simplifiez la vie des bots en prêtant attention à la profondeur, aux raccourcis de navigation, au contenu dupliqué et surtout au temps de chargement et au poids des pages dans le contexte actuel d’index mobile-first. Suivez le budget de crawl avec vos logs !
L’indexation est basée sur des métriques de contenu internes/externes. Cependant, Google utilise le Knowledge Graph en tant que base d’apprentissage pour les entités nommées.
Les classements renvoient à la cohérence de toutes ces données avec les intentions des utilisateurs et dépend de la qualité (technique) et de la pertinence (sémantique) des scores. De plus, le comportement de l’utilisateur et ses intentions sont pris en compte ainsi que ses informations personnelles de recherche et visite.

Ainsi, concentrez vous sur les titres, meta descriptions, contenu, vitesse et l’UX/UI, le CTR et le taux de rebond.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée.