LinkedIn Link to LinkedIn Twitter Link to Twitter

Learning to Rank (L2R)

Publié le 08/09/2022 | 0 commentaires

Conception de site webSEOGoogleAlgorithmesLearning to Rank (L2R)

Learning to Rank (MLR) est de l'apprentissage automatique, il permet la construction de modèles de classement comme pour les systèmes de recherche d'informations (SRI).

Les premières approches d’un algorithme similaire se trouvent chez Altavista :

Un brevet de Altavista sur un algorithme de Learning to Rank

Comme vous pouvez le voir sur ce Brevet, l’algorithme détermine les caractéristiques importantes pour le classement puis les pondères. L'algorithme regarde s'il a obtenu de meilleurs résultats, puis pondère une nouvelle fois. Et ainsi de suite.

Comprendre le Learning to Rank pour son SEO

Comment pondérer les centaines de signaux de facteurs de classement pour décider du score d’une page pour une requête donnée ? Si une page a un bon contenu mais sans backlinks ? Et si la page a beaucoup de backlinks mais pas un bon contenu ? C’est tout là le principe du Learning to Rank.

Un algorithme de Learning to Rank pondère l’ensemble des signaux en fonction d’une page donnée. Par exemple, un site e-commerce sur une requête d’intention de recherche comme « acheter machine à café » aura des critères de classement différents d’une page informationnelle qui explique comment utiliser une machine à café.

Si tous les critères de classement ne changent pas, leurs coefficients changent. Par exemple, si vous êtes en filière scientifique, le coefficient de votre note en mathématiques sera plus important que celui de votre note d’anglais.

Donc, finalement, la page avec « acheter machine à café » n’aura pas besoin de milliers de mots pour se classer sur la requête, à l’inverse de la page qui doit détailler et expliquer comment utiliser la machine à café.

Ainsi, on peut imaginer que le critère de l’importance du contenu aura un coefficient de 1 pour la première page, mais avec un coefficient de 9 en termes de popularité (backlinks). Ce qui pourrait être l’inverse pour la deuxième page, c’est-à-dire « comment utiliser une machine à café » aurait un coefficient de 9 sur le contenu et une note de 1 pour la popularité.

Que ce soit Google ou un référenceur, si quelqu’un prétend qu’il y a tel ou tel critère plus important qu’un autre, en réalité à cause ou grâce à cet algorithme, personne ne peut savoir ce qui doit être fait, même s’il travaille chez Google.

Le Learning to Rank, est à base d’intelligence artificielle, ici plus précisément de deep learning avec des réseaux de neurones (TensorFlow). En outre, rien n’est écrit noir sur blanc et personne ne peut prétendre quelle métrique sera plus importante à prendre en compte qu’une autre. Bien que statistiquement, les requêtes commerciales typiquement n’ont pas besoin de contenu révolutionnaire, il est même souvent plus apprécié de copier coller la même chose que ses concurrents pour que les internautes ne se perdent pas pour la même référence de produit. Google l’a très bien compris et ne le sanctionne pas. Il va chercher d’autres critères de classement pour juger si cette page qui vend le même produit est meilleure qu’une autre.

Vous pouvez imaginer n’importe quel critère de classement, un algorithme de Learning to Rank pourrait faire cela pour tous les signaux. Pour en citer quelques-uns :

  • La popularité : trust, PageRank thématique, spam mass, etc.
  • Backlinks depuis des sites d’autorité en .edu, .gouv
  • TF-IDF, cosinus de salton, word2vec, fasttext (le contenu est-il bon ?)
  • Présence des mots-clés dans les titres H1,H2, dans les URL…
  • TTFB, vitesse de chargement
  • Duplication de contenu (ce qui n’est pas pris en compte pour des requêtes purement commerciales justement)
  • Âge de la page, du domaine
  • etc.

Le Learning to Rank apprend des classements

Le Learning to Rank comme son nom l’indique est un algorithme qui apprend pour classer les pages. S’il pondère les critères de classement en fonction d’une page et d’une requête données, il pourrait également analyser le comportement des interactions.

Par exemple, calculer si votre site est pertinent en analysant le CTR (Click Through Rate) d’un site dans les résultats de recherche.

Le CTR est le nombre de clics par rapport au nombre d’impressions. Une impression est un affichage. Si un site est affiché 100 fois sur une requête et que son nombre de clics est de 10, le CTR est de 10 %.

Lorsqu’un internaute arrive sur une SERP (résultat de recherche), quel site va lui donner envie ? Entre extraits enrichis et l’attractivité des titres et des meta descriptions, un internaute cliquera sur un lien plutôt qu’un autre. Si personne ne clique sur un site alors qu’il est en première page, le Learning to Rank va apprendre que le site en question n’est peut être pas pertinent et fera chuter son classement. Ou inversement, si tout le monde clique sur le lien, il grimpe alors dans les résultats de recherche.

Même si cela est beaucoup plus nuancé et controversé, il est possible qu’il analyse également votre temps passé sur la page après un clic. Si vous ne correspondez pas à une moyenne de temps passé sur une page qui est cohérente par rapport à l’intention de recherche de la requête, alors il semble que vous ne soyez pas pertinent.

Par exemple la requête « comment moudre des grains à café », imaginons que le temps passé en moyenne sur les pages référencées est de 3 minutes, si la majorité de vos internautes quitte votre site en 20 secondes c’est qu’il y a un problème.

Pour des questions de coût de calcul, le Learning to Rank serait un algorithme qui a uniquement un impact sur les pages qui sont dans le top 10. Il est donc préférable d’optimiser le CTR uniquement à partir du moment où vos pages sont en 7, 8, ou 9ème position. C'est là où travailler sur les meta descriptions par exemple aura véritablement un impact en tant que facteur de classement.

Je parle brièvement des optimisations des algorithmes dans l’article sur le référencement SEO technique, comme l’ajout de vidéo pour retenir le visiteur ou encore à ajouter des schema markup pour augmenter le CTR.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée.