Learning to Rank (L2R)

Mis à jour le 20/01/2026 | Publié le 08/09/2022 | 0 commentaires

Conception de site webSEOGoogleAlgorithmesLearning to Rank (L2R)

Learning to Rank (MLR) est de l’apprentissage automatique, il permet la construction de modèles de classement comme pour les systèmes de recherche d’informations (SRI).

Les premières approches d’un algorithme similaire se trouvent chez Altavista :

Un brevet de Altavista sur un algorithme de Learning to Rank

Comme vous pouvez le voir sur ce Brevet, l’algorithme détermine les caractéristiques importantes pour le classement puis les pondères. L’algorithme regarde s’il a obtenu de meilleurs résultats, puis pondère une nouvelle fois. Et ainsi de suite.

Comprendre le Learning to Rank pour son SEO

Comment pondérer les centaines de signaux de facteurs de classement pour décider du score d’une page pour une requête donnée ? Si une page a un bon contenu mais sans backlinks ? Et si la page a beaucoup de backlinks mais pas un bon contenu ? C’est tout là le principe du Learning to Rank.

Un algorithme de Learning to Rank pondère l’ensemble des signaux en fonction d’une page donnée. Par exemple, un site e-commerce sur une requête d’intention de recherche comme « acheter machine à café » aura des critères de classement différents d’une page informationnelle qui explique comment utiliser une machine à café.

Si tous les critères de classement ne changent pas, leurs coefficients changent. Par exemple, si vous êtes en filière scientifique, le coefficient de votre note en mathématiques sera plus important que celui de votre note d’anglais.

Donc, finalement, la page avec « acheter machine à café » n’aura pas besoin de milliers de mots pour se classer sur la requête, à l’inverse de la page qui doit détailler et expliquer comment utiliser la machine à café.

Ainsi, on peut imaginer que le critère de l’importance du contenu aura un coefficient de 1 pour la première page, mais avec un coefficient de 9 en termes de popularité (backlinks). Ce qui pourrait être l’inverse pour la deuxième page, c’est-à-dire « comment utiliser une machine à café » aurait un coefficient de 9 sur le contenu et une note de 1 pour la popularité.

Que ce soit Google ou un référenceur, si quelqu’un prétend qu’il y a tel ou tel critère plus important qu’un autre, en réalité à cause ou grâce à cet algorithme, personne ne peut savoir ce qui doit être fait, même s’il travaille chez Google.

Le Learning to Rank, est à base d’intelligence artificielle, ici plus précisément de deep learning avec des réseaux de neurones (TensorFlow). En outre, rien n’est écrit noir sur blanc et personne ne peut prétendre quelle métrique sera plus importante à prendre en compte qu’une autre. Bien que statistiquement, les requêtes commerciales typiquement n’ont pas besoin de contenu révolutionnaire, il est même souvent plus apprécié de copier coller la même chose que ses concurrents pour que les internautes ne se perdent pas pour la même référence de produit. Google l’a très bien compris et ne le sanctionne pas. Il va chercher d’autres critères de classement pour juger si cette page qui vend le même produit est meilleure qu’une autre.

Vous pouvez imaginer n’importe quel critère de classement, un algorithme de Learning to Rank pourrait faire cela pour tous les signaux. Pour en citer quelques-uns :

  • La popularité : trust, PageRank thématique, spam mass, etc.
  • Backlinks depuis des sites d’autorité en .edu, .gouv
  • TF-IDF, cosinus de salton, word2vec, fasttext (le contenu est-il bon ?)
  • Présence des mots-clés dans les titres H1,H2, dans les URL…
  • TTFB, vitesse de chargement
  • Duplication de contenu (ce qui n’est pas pris en compte pour des requêtes purement commerciales justement)
  • Âge de la page, du domaine
  • etc.

Le Learning to Rank apprend des classements

Le Learning to Rank comme son nom l’indique est un algorithme qui apprend pour classer les pages. S’il pondère les critères de classement en fonction d’une page et d’une requête données, il pourrait également analyser le comportement des interactions.

Par exemple, calculer si votre site est pertinent en analysant le CTR (Click Through Rate) d’un site dans les résultats de recherche.

Le CTR est le nombre de clics par rapport au nombre d’impressions. Une impression est un affichage. Si un site est affiché 100 fois sur une requête et que son nombre de clics est de 10, le CTR est de 10 %.

Lorsqu’un internaute arrive sur une SERP (résultat de recherche), quel site va lui donner envie ? Entre extraits enrichis et l’attractivité des titres et des meta descriptions, un internaute cliquera sur un lien plutôt qu’un autre. Si personne ne clique sur un site alors qu’il est en première page, le Learning to Rank va apprendre que le site en question n’est peut être pas pertinent et fera chuter son classement. Ou inversement, si tout le monde clique sur le lien, il grimpe alors dans les résultats de recherche.

Même si cela est beaucoup plus nuancé et controversé, il est possible qu’il analyse également votre temps passé sur la page après un clic. Si vous ne correspondez pas à une moyenne de temps passé sur une page qui est cohérente par rapport à l’intention de recherche de la requête, alors il semble que vous ne soyez pas pertinent.

Par exemple la requête “comment moudre des grains à café”, imaginons que le temps passé en moyenne sur les pages référencées est de 3 minutes, si la majorité de vos internautes quitte votre site en 20 secondes c’est qu’il y a un problème.

Pour des questions de coût de calcul, le Learning to Rank serait un algorithme qui a uniquement un impact sur les pages qui sont dans le top 10. Il est donc préférable d’optimiser le CTR uniquement à partir du moment où vos pages sont en 7, 8, ou 9ème position. C’est là où travailler sur les meta descriptions par exemple aura véritablement un impact en tant que facteur de classement.

Je parle brièvement des optimisations des algorithmes dans l’article sur le référencement naturel, comme l’ajout de vidéo pour retenir le visiteur ou encore à ajouter des schema markup pour augmenter le CTR.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Foire Aux Questions

Le contenu principal est un élément fondamental de toute stratégie SEO efficace. Cette section répond aux questions les plus fréquentes sur ce concept essentiel pour optimiser la visibilité de vos pages web.

Qu'est-ce que le contenu principal d'une page web ?

Le contenu principal désigne l'information primordiale qui répond directement à l'intention de recherche de l'utilisateur. Il s'agit du texte, des images, des vidéos et autres éléments centraux qui constituent la raison d'être de la page, à l'exclusion des menus de navigation, des barres latérales, des pieds de page et autres éléments périphériques. C'est le contenu que l'utilisateur est venu consulter spécifiquement lors de la création de site internet.

Pourquoi le contenu principal est-il crucial pour le référencement naturel ?

Le contenu principal est déterminant pour le SEO car Google l'utilise comme indicateur majeur de la qualité et de la pertinence d'une page. Les algorithmes analysent ce contenu pour comprendre le sujet traité, évaluer son expertise et sa profondeur, et déterminer s'il répond efficacement aux requêtes des utilisateurs. Un contenu principal de qualité améliore significativement le positionnement dans les résultats de recherche, tout comme une stratégie de maillage interne bien pensée.

Comment Google identifie-t-il le contenu principal sur une page ?

Google utilise des algorithmes sophistiqués d'apprentissage automatique pour distinguer le contenu principal des éléments secondaires. Ces systèmes analysent la structure HTML, la position des éléments sur la page, leur taille, et le contexte sémantique. Les balises structurelles comme main, article, et les balises heading appropriées aident Google à identifier correctement ce qui constitue le cœur informationnel de la page.

Quels éléments doivent composer un contenu principal efficace ?

Un contenu principal efficace doit inclure un titre pertinent avec le mot-clé principal, une introduction claire, des paragraphes structurés avec des sous-titres, des médias enrichissants (images, vidéos), et une longueur suffisante pour traiter le sujet en profondeur. Il doit répondre directement à l'intention de recherche, être unique, apporter une réelle valeur ajoutée et maintenir un niveau de lisibilité optimal pour l'utilisateur. Des outils comme les constructeurs de page peuvent faciliter la mise en forme du contenu.

Comment optimiser le contenu principal pour améliorer ses performances SEO ?

Pour optimiser le contenu principal, concentrez-vous sur la qualité rédactionnelle, l'insertion naturelle des mots-clés, une structure hiérarchique claire avec des balises Hn appropriées, et l'enrichissement sémantique du texte. Assurez-vous que le contenu soit unique, actualisé régulièrement, et qu'il apporte des réponses complètes aux questions des utilisateurs. L'optimisation technique via un balisage HTML correct est également essentielle. Des solutions comme 1.fr peuvent vous aider à améliorer la qualité sémantique de votre contenu.

Quelle différence entre contenu principal et contenu complémentaire ?

Le contenu principal répond directement à l'objectif de la page et à l'intention de recherche de l'utilisateur, tandis que le contenu complémentaire enrichit l'expérience sans être essentiel. Les articles connexes, les commentaires, les widgets de réseaux sociaux ou les publicités sont du contenu complémentaire. Cette distinction est importante car Google accorde plus de poids au contenu principal dans son évaluation de la qualité de la page.