TrustRank est un algorithme inventé et développé en 2004 par Zoltán Gyöngyi, Hector Garcia-Molina et Jan Pederson de chez Yahoo! .
TrustRank, développé par Yahoo, était destiné à évaluer plus efficacement la valeur des liens. En se fondant sur le principe du PageRank, TrustRank reprenait la même logique tout en prévenant le spam de liens, technique qui visait à gonfler de manière artificielle la popularité d’un site web.
Google a ensuite emboîté le pas en créant une marque déposée appelé TrustRank en mars 2005.
Google abandonnera la marque déposée TrustRank en avril 2008, mais dépose un brevet le 13 octobre 2009 qui s’intitule « Search Result Ranking Based On Trust ».
Fonctionnement de TrustRank
L’algorithme TrustRank a été initialement créé par Yahoo! et l’Université de Stanford en 2004 pour combattre le spam de liens, une tactique courante à l’époque où les sites essayaient d’améliorer leur positionnement dans les moteurs de recherche grâce à une multitude de liens de qualité inférieure.
Le concept de base du TrustRank est simple : les sites fiables ont plus de chances de créer des liens vers d’autres sites fiables, tandis que les sites de spam sont moins susceptibles d’obtenir des liens provenant de sites de confiance.
C’est ainsi que sont apparus les premiers “sites de semence”. L’idée consistait à créer manuellement ou de manière semi-automatique des listes de sites légitimes et non-spammy, par exemple, le New York Times (souvent cité dans les brevets de Google).
En d’autres termes, si un site obtient un lien du New York Times, alors ce site est considéré comme fiable. Il faut donc valoriser le lien reçu.
Voici comment ca ce passe, Google sélectionne ces sites et leur attribue un TrustRank de 10/10.
Ensuite, le TrustRank ce difuse comme suit :
- Harvard.edu -> votre site = meilleur transmission du TrustRank
- Harvard.edu -> un autre site -> votre site = plutôt bon
- Harvard.edu –> un autre site –> un autre site –>un autre site–>un autre site –>un autre site –>un autre site –>un autre site –> votre site = négligeable.
Le calcul précis du TrustRank peut être trouvé sur différents sites en cherchant sur Google : “Combating Web Spam with TrustRank”.
TrustRank est également la raison principale pour laquelle les sites web ayant les extensions .edu et .gov ont une meilleure puissance de lien que les autres.
Le « TrustRank » de Google
Aujourd’hui, le terme TrustRank est surtout associé à Google qui a déposé la marque “TrustRank”, peu de temps après Yahoo! en 2005.
Cependant, le TrustRank de Google est en réalité un filtre conçu pour détecter les sites nuisibles, et n’a pas de rapport direct avec l’algorithme de Yahoo.
La marque TrustRank de Google a été abandonnée en avril 2008.
Cela dit, Google a déposé un brevet le 13 octobre 2009 intitulé “Search Result Ranking Based On Trust”.
Le brevet fonctionne de la manière suivante :
- Lorsqu’une requête de recherche est reçue, le moteur de recherche sélectionne les documents pertinents à cette requête.
- Le moteur de recherche identifie également les étiquettes (mots-clés, catégories, descriptions, etc.) associées à ces documents et détermine les scores de confiance des entités qui ont fourni ces étiquettes. Une entité pourrait être un site web, un utilisateur, une entreprise, etc.
- Ces scores de confiance sont ensuite utilisés pour calculer un facteur de confiance pour chaque document. Si une entité a un score de confiance élevé, le document auquel elle a fourni des étiquettes recevra un facteur de confiance plus élevé.
- Les facteurs de confiance sont ensuite utilisés pour ajuster les scores de recherche initiaux des documents. Par exemple, un document avec un facteur de confiance élevé peut se voir attribuer un score de recherche plus élevé.
- Enfin, les résultats de la recherche sont classés en fonction de ces scores de recherche ajustés. Cela signifie que les documents associés à des entités de confiance sont plus susceptibles d’apparaître en haut des résultats de recherche.
En somme, TrustRank est un moyen pour Google de s’assurer que les documents les plus fiables et les plus pertinents sont présentés en premier dans les résultats de recherche.
Mais il n’a rien à voir avec les sites de semences du papier de TrustRank de Yahoo!
Cependant, cela ne signifie pas que Google n’utilise pas la technique des sites de semence décrite dans le document sur TrustRank de Yahoo! Comme je l’ai mentionné dans mon article sur le PageRank, le brevet de PageRank a été mis à jour le 24 avril 2018. Il est intitulé : “Producing a ranking of pages using distances in a web-link graph”. Ce brevet précise clairement que Google utilise des sites de semence pour la propagation du PageRank.
Ainsi, Google calcule la distance géodésique (le chemin le plus court) entre le site de semence et le site web.
Conclusion
En conclusion, TrustRank est un élément essentiel à prendre en compte pour les professionnels du référencement (SEO). Cet algorithme démontre l’importance de la confiance et de l’ancienneté d’un site, plutôt que simplement une forte autorité récemment acquise. Les liens provenant de sites de confiance tels que les sites .edu, .gov ou de grandes institutions comme le New York Times ont un poids significatif dans la valorisation d’un site sur les moteurs de recherche.
De plus, TrustRank a introduit l’importance dans l’histoire pour une lutte efficace contre le spam de liens, soulignant les risques associés aux tactiques de “black hat SEO“. Cette pratique, consistant à utiliser des méthodes non éthiques pour améliorer le classement d’un site, peut nuire à long terme à la visibilité et à la réputation d’un site.
Finalement, même si Google a adopté une approche légèrement différente du TrustRank de Yahoo, l’idée fondamentale reste la même : la confiance et la pertinence sont des facteurs clés dans le classement des résultats de recherche. Ainsi, pour les SEO, comprendre le principe de TrustRank dans leur stratégie peut se révéler bénéfique pour optimiser leur positionnement sur les moteurs de recherche.
0 commentaires