RankBrain – Un algorithme pour la recherche sémantique

Mis à jour le 04/12/2025 | Publié le 04/07/2022 | 0 commentaires

Conception de site webSEOGoogleAlgorithmesRankBrain

Officiellement annoncé et confirmé le 26 octobre 2015, RankBrain est basé sur l'apprentissage automatique qui analyse les signaux de comportement utilisateur. Il aide Google à traiter les résultats de recherche et à fournir des résultats de recherche plus pertinents aux utilisateurs.

Si vous êtes sérieux au sujet du référencement, vous devez optimiser votre site Web pour l’algorithme RankBrain.

Pourquoi ?

Google a annoncé que RankBrain est le troisième signal de classement le plus important pour apparaître en 1ere page.

Et, il interviendrait en moyenne sur 15% des requêtes.

Dans ce guide, vous apprendrez tout ce que vous devez savoir sur l’algorithme RankBrain de Google. Et comment optimiser votre site Web pour RankBrain.

RankBrain et référencement sémantique

Si RankBrain voit un mot ou une phrase qu’il ne connaît pas, l’algorithme peut deviner quels mots ou phrases pourraient être similaires et changer le résultat en conséquence, ce qui la rend plus efficace pour gérer des requêtes de recherche exotique.

RankBrain cherche également des entités (choses) ou groupes de mots qui ont les meilleures chances de correspondre. Par conséquent, RankBrain tente de deviner ce que les gens veulent dire et change les résultats, ce qui permet d’obtenir une meilleure satisfaction pour les utilisateurs.

RankBrain et la recherche sémantique

RankBrain est liée à la recherche sémantique. Parce que RankBrain est une IA qui s’appuie sur BERT, le Knowledge Graph et d’autres choses liée au moteur de recherche sémantique qu’est Google. Il interprète les mots comme des entités, des choses et non pas des chaînes de caractères.

Cela peut aussi inclure l’utilisation de mots vides dans une requête de recherche (« le », « et », etc.) : des mots historiquement ignorés par Google, mais qui sont parfois d’une importance majeure pour bien comprendre le sens ou l’ intention derrière la requête de recherche (d’une manière différente de BERT).

Une fois que les résultats de RankBrain sont vérifiés par l’équipe de Google , le système est mis à jour et redevient opérationnel.

RankBrain vs Hummingbird

À la base, RankBrain est un système d’apprentissage automatique qui s’appuie sur Hummingbird, qui a fait passer Google d’un environnement de « chaînes de caractères » à « entités et relations ».

Derrière le brevet le plus probable derrière RankBrain, Google donne entre autre un exemple telle que :

  1. Requête originale = “New York Yankees Stadium”
  2. Requête révisée = "Yankees?Baseball ("New York": "Stadium")"

Ici, le moteur de substitution détermine, en tenant compte des statistiques d'usage, que le terme "Baseball" est fréquemment un terme de substitution pour le terme "Yankees" dans le contexte des concepts combinés "New York" et "Stadium", et envoie une indication à la collection de règles de substitution pour ajouter la règle de substitution "Yankees?Baseball ("New York": "Stadium")" à la collection. Pour les requêtes utilisateur ultérieures contenant les termes de requête d'origine "New York Yankees Stadium", le moteur de substitution peut alors appliquer la règle de substitution "Yankees?Baseball ("New York": "Stadium")" en tenant compte du contexte et communiquer avec le moteur de révision de requête pour inclure le remplacer le terme "Baseball" dans la requête révisée, sur la base de ce compte d'occurrences.

Ce brevet est “Using concepts as contexts for query term substitutions” que l’on peut traduire en bon français : “Utilisation de concepts comme contextes pour les substitutions de termes de requête” :
https://patents.google.com/patent/US9104750B1/en

Le brevet de RankBrain - Un brevet pour la recherche sémantique

Quant à Humminbird, l’algorithme permettait de remplacer les termes de requêtes de la même manière que RankBrain.
Le brevet Hummingbird pour améliorer la recherche sémantique

Sur cette infographie du brevet le plus probable derrière Hummingbird, un système apprentissage machine, en bas vous pouvez voir que "place" est identique à "restaurant". La requête est tout en haut à gauche.

Ce qui veut dire que pour cette requête Google détermine ainsi que le mot "endroit" est égal au mot "restaurant", donc Hummingbird renvoyait les mêmes résultats de recherche en fonction des mots signifiant la même chose mais décrit d'une autre manière..

En outre, RankBrain s’appuie sur l’intelligence artificielle pour aboutir à la même chose qu’Hummingbird. Sauf que Humminbird n’était pas une intelligence artificielle et qu’elle n’était pas forcément connecté aux algorithmes sémantiques.

RankBrain pourrait s’appuyer sur des modèles NLP et BERT pour changer les termes de requêtes de manière à convenir aux besoins des utilisateurs dans un Web sémantique.

Aussi, une dernière chose intéressante à signaler, est que chaque jour, Google voit de nouvelle requêtes qu’ils n’avaient pas vu. Cela tombe bien car si RankBrain voit un mot ou une phrase qui ne lui est pas familier, la machine peut deviner quels mots ou phrases pourraient avoir une signification similaire et filtrer le résultat en conséquence, ce qui la rend plus efficace pour gérer des requêtes de recherche inédites.

Optimiser RankBrain pour la recherche sémantique

 Et bien pour faire simple, vous devez ajouter dans votre texte des synonymes et des cooccurrences, ou des mots d’un même champ lexical voir mentionner des entités. Vous pouvez vous aider d’outils de rédaction sémantique pour ce faire tels que SEOQuantum, YourTextGuru ou encore Inlinks.
Vous pouvez également commencer à écrire des titres (Hn) vers un langage plus naturel.

C’est ça optimiser pour RankBrain. Vous pouvez également optimiser l’expérience utilisateur.

Espace vectoriel et Rankbrain

Google transforme les mots clés en vecteurs, c'est ainsi qu'il a été fait pour classer les documents. Rankbrain utilise les espaces vectoriels pour comprendre ce qui se cache derrière la requête et ses mots clés et ce que pense l'humain d'une certaine mesure :

Des modes de réalisation particuliers de l’objet décrit dans cette spécification peuvent être mis en œuvre pour réaliser un ou plusieurs des avantages suivants. Premièrement, les mots inconnus dans des séquences de mots peuvent être prédits efficacement si les mots environnants sont connus. Deuxièmement, les mots entourant un mot connu dans une séquence de mots peuvent être efficacement prédits. Troisièmement, des représentations numériques de mots dans un vocabulaire de mots peuvent être facilement et efficacement générées. Quatrièmement, les représentations numériques peuvent révéler des similitudes et des relations sémantiques et syntaxiques entre les mots qu’elles représentent.

En utilisant un système de prédiction de mots ayant une architecture à deux couches et en parallélisant le processus d’apprentissage, le système de prédiction de mots peut être efficacement entraîné sur des corpus de mots étendus, par exemple, des corpus qui contiennent de l’ordre de 200 milliards de mots, ce qui entraîne une meilleure qualité numérique. représentations que celles obtenues par des systèmes d’entraînement sur des corpus de mots relativement plus petits. En outre, les mots peuvent être représentés dans des espaces de très grande dimension, par exemple des espaces de l’ordre de 1000 dimensions, ce qui donne des représentations de meilleure qualité que lorsque les mots sont représentés dans des espaces de dimension relativement inférieure. De plus, le temps nécessaire pour former le système de prédiction de mots peut être considérablement réduit.

Ainsi, une requête incomplète ou ambiguë contenant certains mots pourrait utiliser ces mots pour prédire les mots manquants qui pourraient être liés par des liens sémantiques. Ces mots prédits pourraient ensuite être utilisés pour renvoyer des résultats de recherche avec des liens pertinents que les mots d'origine pourraient avoir des difficultés à renvoyer. Le brevet qui décrit ce processus de prédiction établissant des liens entre vecteurs de mots est :

Calcul de représentations numériques de mots dans un espace de grande dimension

Inventeurs : Tomas Mikolov, Kai Chen, Gregory S. Corrado et Jeffrey A. Dean
Cessionnaire : Google Inc.
Brevet américain : 22 août 2017

Encore et toujours, ajouter un champ lexical large pour améliorer la compréhension de votre texte pour Google et son système d'apprentissage machine learning RankBrain, et ainsi apparaître pour plus de variations de mots-clés.

Si vous n’êtes pas familier avec TFIDF et les espaces vectoriels, rendez vous sur notre article : Comment Google comprend un contenu et lui donne un score de qualité

RankBrain pondère les facteurs de classement

RankBrain peut aider Google à comprendre chacune des requêtes, c’est la partie où RankBrain détermine une partie de l’intention du chercheur.
RankBrain se demandera essentiellement : “Maintenant que j’ai compris les besoins, quels signaux me conviennent pour afficher les bon résultats ?”

Exemple de métriques sur lesquels pourraient agir RankBrain

Est-ce qu'il y à des mots pertinents à la requête ? Si oui, est-ce que ça compte sur le temps résultat ?

Prenons l'exemple type de cette question : une fiche produit e-commerce, quelle plus-value donner au niveau du contenu par rapport aux autres fiches produit ? Probablement aucune.

Alors, il regarde et tient compte plutôt de la diversité des backlinks, la fraîcheur du contenu, l'engagement, les avis, la proximité locale, etc., car tout cela compte.

Ici en l'occurrence, il donnera probablement un coefficient plus élevé aux backlinks contenant des mots clés pertinents, et aux avis mentionnant ces mots clés. S'il s'agit d'un produit qui peut être trouvé localement, il accordera également une grande importance aux facteurs de classement local, notamment la cohérence des mots clés géographiques.

Les algorithmes de Google ont toujours beaucoup de vertical. Ainsi, optimiser Rankbrain consiste également à mesurer la satisfaction des internautes sur les résultats de recherche. Et cela est très important à connaître pour optimiser son référencement naturel.
Les algorithmes de Google analysent si les internautes sont satisfaits des résultats de recherche.

Le fonctionnement de RankBrain

Il est possible que selon le mot-clé, RankBrain augmente ou diminue l’importance des backlinks, la fraîcheur du contenu, la longueur du contenu, l’autorité du domaine, etc. Dit autrement, il pondère les facteurs de classement en fonction d’une requête.

Sans doute que RankBrain s’appuie sur le Learning To Rank.

Ensuite, il examine comment les chercheurs Google interagissent avec les nouveaux résultats de recherche. Si les utilisateurs aiment mieux le nouveau classement, il reste. Sinon, RankBrain recommence, sachant déjà quels éléments ajuster.

Comment Rankbrain mesure la satisfaction des utilisateurs ?

RankBrain, système d'apprentissage, peut essayer de comprendre de nouveaux mots-clés, ou il est aidé par d'autres systèmes d'apprentissage comme hummingbird.

Mais la question plutôt est :
Une fois que RankBrain affiche un ensemble de résultats, comment sait-il s’ils sont réellement bons ?

Eh bien, il pourrait éventuellement observer l'impact, de la même manière que l'on fait du A/B testing pour mesurer l'impact :

RankBrain, les facteurs de classement relié à l'UX (user experience)

En d’autres termes, RankBrain montre un ensemble de résultats de recherche qu’ils pensent que vous aimerez. Si beaucoup de gens aiment une page particulière dans les résultats, ils donneront à cette page un coup de pouce dans le classement.

Et si vous détestez un contenu ? Ils supprimeront cette page et la remplaceront par une autre page. Et la prochaine fois que quelqu'un recherchera ce mot-clé (ou un terme similaire) sur le moteur recherche google, il verra ses performances.

En analysant beaucoup de données, il porte une attention particulière à la façon dont vous interagissez avec les résultats de recherche.

Concrètement, il s’agit de :

  • Taux de clics organique selon l'intention utilisateur
  • Temps de séjour sur les contenus sites
  • Taux de rebond
  • Pogo-sticking

Imaginons qu’un internaute recherche de l’aide pour faire du SEO, mais qu’il tombe sur une définition ennuyeuse sur le référencement et qu’il n’est pas satisfait du contenu.
RankBrain évalue le taux de rebond sur les résultats de recherche

Donc, vous retournez en arrière puis sélectionnez un autre contenu. Celui-ci n’est pas beaucoup mieux. Il est plein de conseils génériques.
Alors vous recommencez.

Schéma du pogo sticking sur les résultats de recherche

Puis vous tombez enfin sur un contenu qui va vous aider à approfondir vos connaissances.

Puis, au lieu de cliquer sur "retour", vous passez 5 minutes à lire le contenu de l'article, voire à cliquer sur de nouveaux liens du même site pour en savoir davantage, ou consulter d'autres articles similaires.

Ce va-et-vient est appelé « Pogo-sticking », un comportement qui a un impact sur le référencement.

Si Google remarque que les gens quittent rapidement une page pour cliquer sur un autre résultat de recherche, cela a un impact direct sur Google : "Cette page est nulle !".

Rankbrain modifie le classement due au CTR

Et si Google remarque que beaucoup de gens arrêtent de partir et revenir sur un résultat spécifique qui correspond à leur intention de recherche, ils vont donner un coup de pouce à cette page pour la rendre plus facile à trouver.

RankBrain peut améliorer la position d'un site Web si la page est beaucoup cliquée

De nombreuses études ont détecté le CTR comme possible facteur de classement car cela correspondait avec les positions des pages, reflétant l'apprentissage algorithmique. Quoi qu'il en soit, en tant que bon référenceur vous devez vous en préoccuper et poursuivre votre apprentissage.

Schéma global du fonctionnement de Google RankBrain

Il est également important de prendre en compte que dans le brevet indiqué au début, une phrase fait référence à l'interaction des utilisateurs :

Une règle de terme de substitution dans un contexte spécifique identifié par un concept peut être déterminée empiriquement à partir d’interactions d’utilisateurs avec des données de résultats de recherche. En étendant la formation d’un contexte au-delà de deux mots, le système de recherche peut déterminer des règles de substitution dirigées vers des contextes plus spécifiques et potentiellement améliorer les résultats de recherche.

Comment faire pour optimiser RankBrain ?

Faire un article pour l'expérience utilisateur, en partant de ce qu'ils savent déjà.

Un contenu SEO efficace veut dire :

  • Accrochez le lecteur dès le début du contenu
  • Optimisez sa balise title et meta description pour attirer le lecteur, par exemple avec une question accrocheuse
  • Optimiser l'intention de recherche des contenus

Optimiser sa balise title

Votre balise <title> est nulle. Vous savez, celle qui est affichée sur les résultats de recherche. Bourré de beaucoup de données inutiles.

Ce n'est pas du SEO, surtout à l'ère du machine learning RankBrain.

La présence de mot-clé dans une title d'article n'a aucun facteur de classement.

Mais optimisez sa balise title pour attirer le clic, cela est un facteur de classement. De plus, vous faites du SEO pour que les utilisateurs voient votre page, donc attirez le clic lorsque vous êtes en 1ère page.

Quel est la balise titre idéal à faire ?

Un titre accrocheur certes, mais qui suscite l’émotion chez l’internaute, c’est encore mieux.

Par exemple, voici une balise de titre générique :
Conseils de productivité : comment en faire plus

Il manque le "umph" qui pousse les gens à cliquer.

Voici comment vous pourriez transformer cette balise de titre en une centrale émotionnelle :
Écrasez votre liste de tâches avec ces 17 conseils de productivité

Ou mieux encore,
Ecrasez votre liste de tâches : 17 conseils de productivité (& TIPS)

Ou mieux encore,
je vous laisse faire vos suggestions en commentaire.

Comment réduire le taux de rebond ?

Lorsqu'un internaute arrive sur un site, il souhaite trouver directement la réponse à ces questions. Ces signaux comportement utilisateur ont un impact seo sites important : si le sujet l'intéresse, il faut qu'il puisse en lire davantage sur la même page. Ce qui le fera rester sur la page.

Cela en découle qu’il est très important de faire en sorte que le contenu offre la réponse directement à sa question.
Mais lorsqu’il la trouve directement, cela peut impacter votre taux de rebond.

Par exemple, des articles qui peuvent se positionner sur Google News offrent la réponse au milieu voir à la fin du contenu afin que les utilisateurs restent sur le site.

Je pense que ce n’est pas une bonne stratégie à long terme.

L’idéal, même si je vous laisse faire vos propres tests, est de fournir la réponse dès le départ, mais de donner des raisons au lecteurs de poursuivre sa lecture. Ainsi, vous ne trompez pas l’internaute tout en le gardant sur votre page.

Optimiser la sémantique pour Rankbrain

Travaillez à améliorer la sémantique de votre contenu pour RankBrain en effectuant les étapes suivantes :

  1. Cartographiez votre site web en fonction du type de contenu et des catégories de pages.
  2. Analysez la présence d’entités dans votre contenu et étudiez comment les pages contenant des entités sont liées entre elles.
  3. Utilisez les entités nommées dans vos ancres liées et créez des ensembles de pages liées en fonction de la typologie d’entité.
  4. Surveillez le nombre de mots par groupe de pages pour définir les métriques de contenu idéales pour maximiser votre crawlabilité.

 

OnCrawl outil SEO
Inrank flow : montre comment la popularité du maillage interne se répand entre les groupes – Données OnCrawl

Résumé sur RankBrain

RankBrain est un algorithme de recherche qui utilise l’intelligence artificielle et le machine learning pour effectuer un meilleur classements des pages web. Les entités nommées jouent un rôle important dans le système de RankBrain et peuvent être utilisées pour optimiser votre contenu. Il est également important de surveiller la vitesse de chargement, le poids des pages et l’expérience utilisateur pour améliorer le classement de votre site web.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Foire Aux Questions

RankBrain est un élément crucial de l'algorithme de Google qui utilise l'intelligence artificielle pour mieux comprendre les requêtes des utilisateurs. Voici les réponses aux questions les plus fréquentes sur ce composant algorithmique.

Qu'est-ce que RankBrain et quel est son rôle dans l'algorithme de Google ?

RankBrain est un système d'intelligence artificielle basé sur le machine learning, intégré à l'algorithme de Google depuis 2015. Il analyse et interprète les requêtes de recherche, notamment celles jamais vues auparavant, pour comprendre l'intention réelle de l'utilisateur. RankBrain aide Google à afficher les résultats les plus pertinents en identifiant les relations sémantiques entre les mots et les concepts. Ce système s'inscrit dans l'évolution de la recherche d'information et des moteurs de recherche modernes.

Comment RankBrain utilise-t-il l'intelligence artificielle pour la recherche sémantique ?

RankBrain utilise des algorithmes d'apprentissage automatique pour convertir les mots et expressions en vecteurs mathématiques, appelés « embeddings ». Cette technologie lui permet de comprendre les synonymes, le contexte et les nuances linguistiques. Il analyse les patterns de recherche passés pour prédire quels résultats satisferont le mieux l'utilisateur, même pour des requêtes ambiguës ou formulées de manière inhabituelle. Pour optimiser votre contenu selon cette approche sémantique, des outils comme WordLift peuvent vous aider à structurer vos données de manière compréhensible pour les algorithmes d'IA.

Quelle est la différence entre RankBrain et les autres algorithmes Google ?

Contrairement à Panda qui évalue la qualité du contenu ou Penguin qui analyse les profils de liens, RankBrain se concentre sur l'interprétation des requêtes de recherche. Il ne pénalise pas directement les sites, mais aide plutôt à mieux comprendre ce que cherchent les utilisateurs. RankBrain travaille en amont du classement, tandis que les autres algorithmes évaluent les pages elles-mêmes.

Comment optimiser son contenu web pour RankBrain ?

Pour optimiser votre contenu pour RankBrain, concentrez-vous sur l'intention de recherche plutôt que sur des mots-clés exacts. Créez du contenu complet qui répond aux questions des utilisateurs, utilisez un langage naturel et couvrez les sujets en profondeur. Intégrez des termes sémantiquement liés et structurez votre contenu de manière logique. L'expérience utilisateur et l'engagement sont des signaux importants pour RankBrain.

RankBrain peut-il impacter le référencement de mon site web ?

Oui, RankBrain influence directement votre positionnement dans les résultats de recherche. Il évalue la pertinence de votre contenu par rapport à l'intention de l'utilisateur en analysant des métriques d'engagement comme le taux de clic, le temps passé sur la page et le taux de rebond. Un contenu bien aligné avec les attentes des utilisateurs bénéficiera d'un meilleur classement grâce à RankBrain. Pour évaluer l'impact de RankBrain sur votre site, faire appel à des agences spécialisées en audit SEO peut vous fournir une analyse approfondie de vos performances.

Quels signaux comportementaux RankBrain analyse-t-il pour classer les pages ?

RankBrain examine principalement les signaux d'engagement des utilisateurs : le taux de clic (CTR) dans les résultats de recherche, le temps de séjour sur la page (dwell time), le taux de rebond et le comportement de navigation. Si les utilisateurs cliquent sur votre résultat et y restent longtemps, RankBrain considère votre page comme pertinente et peut améliorer son positionnement pour des requêtes similaires.