Cet algorithme est issu du constat suivant :
Comment juger de la qualité d’une page ?
La qualité d’un produit, d’une personne ou d’une entité quelle qu’il soit est liée à sa popularité. Plus une marque est populaire par exemple, plus il y à de chance que ses produits soient plus qualitatifs, il y a également plus de chance que l’internaute souhaite retrouver cette marque et pas une autre.
C’est pourquoi, en référencement, la création de liens redirigeant vers son site est l’une des meilleures techniques pour apparaître en première page de Google. On appelle cela, le netlinking ou le linkbuilding.
Évidemment ce système n’est pas parfait, et cet effet est appelé Matthew Effect. Cela crée une boucle qui rend de plus en plus visible un ensemble restreint de contenus.
Ce qui à d’ailleurs valu un mythe sur le référencement que l’optimisation des moteurs de recherche n’a pas besoin d’être constamment soutenu.
L’histoire du PageRank
La bibliothéconomie est à l’origine de la recherche d’informations (RI) et du fonctionnement de Google. En bibliothéconomie, l’organisation des meilleurs papiers scientifiques sont ceux les plus mentionnées.
Le PageRank se base fondamentalement sur cette même idée, classer les meilleurs documents en fonction du nombre de fois où ils sont mentionnés.
Le PR comme il a été pensé à l’époque était surtout une manière de balayer le Web afin de commencer à mieux organiser et ordonner les informations pertinentes.
Larry Page et Sergey Brin étaient tous deux étudiants, travaillant sur un moteur de recherche tout en travaillant sur leur doctorat et ont utilisé le principe des centralité d'intermédiarité découvert dans les années 1930.
En théorie des graphes et théorie des réseaux, la centralité intermédiaire est égale au nombre de fois que ce sommet est sur le chemin le plus court entre deux autres nœuds quelconque du graphe.
Mais les travaux du PR, seront principalement fondé sur des travaux de personnes intimement liée à la création du WWW comme, pour n’en citer qu’un, Massimo Marchiori (1997) :
The Quest for Correct Information on the Web: Hyper Search Engines
https://www.w3.org/People/Massimo/papers/WWW6/
Tour d’horizon sur les papiers et les brevets du PageRank
L’un des premiers papiers sur le PR : https://www.seobythesea.com/improved-text-searching-in-hypertext-systems.pdf
L’idée formulé par Larry Page et Sergey Brin :
http://infolab.stanford.edu/~backrub/google.html
Le brevet du PageRank de 1998 de Larry Page sera :
PageRank original 1988 : Méthode de classement des nœuds dans une base de données liée - Numéro de brevet : 6,285,999 - Inventeur : Larry Page
(Test du PageRank par Haveliwala le 18 octobre 1999 : http://ilpubs.stanford.edu:8090/386/1/1999-31.pdf)
Mise à jours de ce PageRank le 4 septembre 2001 : Méthode de classement des nœuds dans une base de données liée - Numéro de brevet : 6 285 999
PageRank 28 septembre 2004 : Méthode de notation des documents dans une base de données liée —Numéro de brevet : 6 799 176
Taher H. Haveliwala publie un article chez Stanford du nom de Topic-Sensitive PageRank : http://www-cs-students.stanford.edu/~taherh/papers/topic-sensitive-pagerank.pdf
PageRank 6 juin 2006 : Méthode de classement des nœuds dans une base de données liée - Numéro de brevet : 7 058 628
PageRank 11 septembre 2007 : Scoring de documents dans une base de données liée —Numéro de brevet : 7 269 587
PageRank 20 octobre 2015 (accordé en 2018) : Producing a ranking for pages using distances in a web-link graph - Numéro de brevet : 9 165 040
En 2016 la barre d’outil de Google prend fin, outils qui permettait d’afficher le PageRank des sites Web (appelé Google Toolbar PageRank). TBPR qui affichait un score de n/10.
Je vous conseille vivement la thèse de Trystan Upstill, (2005, Document ranking using web evidence) comportant de nombreux éléments sur le PageRank, mais aussi d’autres choses que fait Google pour classer les pages Web.
Aujourd’hui, le PageRank est très différent de la méthode originale, et son application pour des systèmes informatiques aussi.
En 2020, un article à montrer comment appliquer le PageRank sur 100 milliards de pages Web : https://storage.googleapis.com/pub-tools-public-publication-data/pdf/4aada2aea3fe924feb2904007f1e0f0a085e3b51.pdf - https://research.google/pubs/pub48942/
Introduction au PageRank
Avant de commencer, il est important de comprendre que toutes les pages du web n’ont pas de PageRank.
Tout simplement, si Google (les crawlers) n’ont jamais visité votre page (crawl) ils ne peuvent pas attribuer un PageRank à votre page. Mais cela ne suffit pas, ils peuvent découvrir votre page mais ne pas l’intégrer dans leurs bases de connaissances (indexation). Dans ce cas là, votre page n’a pas non plus de PageRank. C’est à dire qu’il est primordial de vérifier que la page qui vous fait un lien est bien connue et donc indexée par Google.
Ensuite, il est important de comprendre que Google ne voit pas des sites Web mais des pages Web. Cette notion est l’une des plus importantes à comprendre en optimisation du référencement naturel. Ainsi, les métriques comme l’autorité d’un domaine est factuellement fausse. Ces métriques, les plus connus comme le Domain Rating de Ahrefs ou le DA (Domain Authority) de Moz pour ne citer qu’eux sont uniquement là pour vous donner une vision éclairée.
Le calcul du PageRank
La valeur de ce fluide, de cette popularité, vaut 1. Au début toutes les pages possèdent 1/N.
Appelé « réservoir de PageRank », un site a un PR (PageRank) disponible de base proportionnel à son nombre de pages.
Selon les liens qui sont présents dans une page, la popularité sera transmise divisée par le nombre de liens (c*PR ; c’ est une constante qui vaut 0,85, c’est la constante de téléportation - appelé aussi facteur d’amortissement ou dumping factor en anglais).
Dans le schéma suivant, V1 transmet 85 % de son PageRank vers U. Alors que V3 a 2 liens, il transmet 85 % de son PageRank divisé par 2.
Ensuite le calcul continu, car il s’agit d’un calcul itératif :
À la fin de ce tour de calcul, le calcul du PageRank n’est pas encore fini. Les 15 % du PageRank qui n’ont pas été donnés, sont distribués à parts égales entre les liens.
Grâce à ces itérations, une page va hériter du PageRank de ses voisins et ainsi de suite.
Le PageRank est une probabilité (due au surfeur aléatoire, c = 0.85 ) :
Note : L’ancien PageRank et le nouveau PageRank de Google (ils ont gardés le même nom) fonctionnement avec O (N log N), mais le remplacement a une constante beaucoup plus petite sur le facteur log N car il supprime la nécessité d'itérer jusqu'à ce que l'algorithme converge. Ce qui à été inévitable en 2006 car le Web est passé d'environ 1 à 10 millions de pages,.
Cette formule indique concrètement que le fluide se diffuse proportionnellement par rapport aux nombre de liens dans la page (nous appelons cela les liens sortants - outbound links).
Ainsi, ce schéma représentatif du PageRank classique pourrait vous aider :
Cependant, ce schéma est factuellement faux car il ne prend pas en compte, par exemple, du surfeur raisonnable.
Explications classiques du PageRank par Stanford : http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf
Le surfeur aléatoire
La constante c (=0,85) vient du principe du surfeur aléatoire. L’idée était de créer un principe de téléportation pour imiter le comportement humain. Quand un visiteur arrive sur une page, il se téléporte en cliquant sur un autre lien de la page ou quitte la page. En revanche, cette téléportation comme son nom l’indique est aléatoire.
Il fallait donc régler ce problème et avoir des données plus fiables.
Le surfeur raisonnable
Le surfeur raisonnable permet de gommer les problèmes du surfeur aléatoire. La probabilité qu’un visiteur clique sur un lien de la page, du menu, ou sur un lien présent dans le contenu ou encore qu’il quitte la page n’est pas du tout aléatoire et peut être plus finement prédite.
Ainsi, le surfeur raisonnable, donne un coefficient à chaque partie d’une page. En premier lieu, il découpe le site en plusieurs parties, il découpe le menu, le footer et le contenu. Ensuite, il donne une probabilité différente si un utilisateur clique sur un lien du contenu plutôt que sur un lien du menu.
Ainsi, le premier lien sur le contenu pourrait avoir une probabilité de clic de 50 % alors qu’un lien présent dans le footer pourrait être de l’ordre de 2 %.
Ce qui est important à retenir c’est que la transmission de popularité sera beaucoup plus importante dans un lien présent dans le contenu, (et d’autant plus le premier lien), alors que les liens présents dans le footer ou le menu en auront beaucoup moins.
Pour résumer, voici un schéma simpliste :
La diffusion de la popularité entre tous les liens ne sera pas proportionnelle en fonction de la position de vos liens. Mais pas que.
Le PageRank thématique
Si le PageRank n’est pas proportionnel dû au surfeur raisonnable, ce n’est pas le seul facteur qui influe sur la différence de puissance d’autorité transférée.
Nous avons vu précédemment le « réservoir de PageRank ». Un site a un PR disponible de base proportionnel à son nombre de pages.
Alors imaginons 2 thématiques.
La première serait sur l’astrologie, la deuxième sur la chimie. Imaginons que la thématique chimie est beaucoup plus importante que l’astrologie dans le monde du Web, alors la thématique chimie a un réservoir de PageRank bien supérieur.
Si un internaute tape sur Google la requête « mercure », grâce au réservoir de PR plus important, les sites qui seront affichés proposeront en réponse que le mercure est un métal argenté brillant (thématique chimie). Alors que l’internaute pourrait aussi chercher des informations sur la planète Mercure. Le problème est qu’ en supposant que la thématique astrologie ait un réservoir plus bas de PageRank, la SERP n’affiche pas de résultat sur la planète Mercure. C’est ce que l’on appelle le masquage sémantique.
Pour l’histoire, des petits génies SEO se servaient de grands réservoirs de thématiques pour pousser l’autorité de leurs pages et cela sans beaucoup de contexte dans le lien, simplement parce que cela était beaucoup plus puissant.
Le PageRank thématique a coupé court à cette manipulation. Aujourd’hui, un lien qui est dit non thématique n’a pas ou presque pas de bénéfice pour augmenter la popularité. C’est-à-dire que si un site de thématique voiture envoie un lien vers un site de thématique jardin, alors le lien n’aura presque aucun intérêt pour votre référencement, voire aucun.
Le calcul du PageRank thématique est :
Vous pouvez retrouver le PageRank thématique dans l’outil Babbar, appelé Semantic Value. En effet, cette métrique calcule le PageRank d’une page en fonction de la proximité thématique des liens obtenus (backlinks). Mais nous en parlerons plus tard de la manière dont vous pouvez calculer votre PageRank pour l’optimisation de Google.
Pour résumer, l’autorité d’un lien ne se diffuse pas aussi simplement que ce que l’on peut imaginer.
Mise à jour du PageRank en 2018
Accordé le 24 avril 2018, le brevet s’intitule : Produire un classement des pages à l'aide des distances dans un graphique de liens Web.
Créé par Nissan Hajaj, principal ingénieur de Google, cette mise à jour donne une perspective d’EAT et de PageRank.
Derrière cette mise à jours du brevet du PageRank, nous voyons comment il pourrait éviter la manipulation du Web spam de lien en renforçant la confiance dans un graphe de liens comme cela :
Une variante possible du PageRank qui réduirait l'effet de ces techniques consiste à sélectionner quelques pages "de confiance" (également appelées pages de référence ou page de racine (seed)) et à découvrir d'autres pages susceptibles d'être bonnes en suivant les liens des pages de confiance. Par exemple, la technique peut utiliser un ensemble de pages germes de bonne qualité (s 1 , s 2 , . . . , s n ), et pour chaque page germe i = 1, 2, . . . , n, le système peut calculer itérativement les scores PageRank pour l'ensemble des pages Web P.
Le problème mit en avant par l’inventeur est que cela nécessiterait un travail manuel pour définir les sites connus et de qualité.
Par conséquent, ce dont on a besoin, c'est d'un procédé et d'un appareil pour produire un classement de pages sur le Web en utilisant de nombreuses pages de départ diversifiées sans les problèmes des techniques décrites ci-dessus.
Un mode de réalisation de la présente invention propose un système qui classe des pages sur le Web sur la base de distances entre les pages, dans lequel les pages sont interconnectées avec des liens pour former un graphe de liens. Plus précisément, un ensemble de pages de départ de haute qualité est choisi comme références pour classer les pages dans le graphe de liens. Les distances les plus courtes entre l'ensemble de pages de départ et chaque page donnée dans le graphe de liens sont calculées. Chacune des distances les plus courtes est obtenue en additionnant les longueurs d'un ensemble de liens qui suit le chemin le plus court d'une page source à une page donnée, la longueur d'un lien donné étant attribuée au lien en fonction des propriétés du lien et des propriétés de la page jointe au lien. Les distances les plus courtes calculées sont ensuite utilisées pour déterminer les scores de classement des pages associées.
Le brevet PageRank traite de l'importance de la diversité des sujets couverts par les sites de semences et de la valeur d'un grand nombre de sites de semences.
En réponse à une requête, le moteur de recherche utilise les informations de classement pour identifier les documents hautement classés qui satisfont la requête. Le moteur de recherche renvoie ensuite une réponse par l'intermédiaire du navigateur Web, la réponse contenant des pages correspondantes ainsi que des informations de classement et des références aux documents identifiés.
Image du brevet de la mise à jour de PageRank en 2018 :
Ils parlent de la "distance la plus courte" entre l'ensemble de graines et la page Web. Il ne s'agit donc pas d'une accumulation de PageRank à partir de liens, mais plutôt d'une distance d’un graphe de lien.
Dans le domaine mathématique de la théorie des graphes , la distance entre deux sommets (nœud) dans un graphe est le nombre d'arêtes (edge, relation, …) d'un chemin le plus court les reliant.
Appelé également graphe géodésique, ceci est connu sous le nom de distance géodésique ou distance du plus court chemin.
Ainsi Google pourrait calculer la distance géodésique entre les sites de semences et les autres sites Web.
En tant que SEO, votre travail pourrait être de déterminer ces sites de semences et d’avoir un profil de lien proche des sites de semences.
Car ce PageRank fonctionne également comme une sorte de fluide.
Ainsi, si vous ne pouvez pas avoir un lien direct vers des sites faisant autorité, vous devriez avoir le chemin le plus court possible vers les sites de semences.
Effectivement si A fais confiance a B et que B fais confiance a C alors A fait légèrement confiance a C.
Et cet algorithme du PageRank est quelque chose qui y accorderait du poids, mais on ne parle pas vraiment de popularité mais d’algorithmes basé sur la confiance reliée à leurs idées de EAT plus que du PageRank classique. En l'occurrence ici de distance entre les nœuds.
Pour une thématique concurrentielle, c’est quelque chose que vous devriez probablement vous consacrer plutôt que de récupérer des milliers de backlinks sans trop de valeur et sans réelle valeur de confiance (cad de distance entre les sites graines). Cela est encore plus vrai pour des sites YMYL (Your Money Your Life - site Web de thématique médical par exemple).
Le netlinking n’est pas mort, loin de là, mais pour certaines thématiques ou des thématiques concurrentielles, ce PageRank de transmission de confiance est indispensable à assimiler.
Note : Pour trouver facilement des sites de semence pour Google : https://kalicube.pro/trusted-sources . Sinon les grands et vieux journaux comme le New York Times sont aussi des sites de semences (NYT est précisé dans le brevet)..
Les algorithmes liées à l’idée du PageRank
D’autres algorithmes sont liés à l’idée derrière le PageRank, il me semble donc important de les mentionner et de les définir rapidement.
Google Penguin et le PageRank
Google Penguin est un algorithme de filtre anti-spam influent sur le PageRank, si vous tentez de manipuler l’algorithme du PR.
Ainsi, Google Penguin vérifie entres autres si :
- Utilisation d’ancre exacte de manière abusive
- Les DNS entre les noms de domaines sont identiques.
- Même
<title>
hostnames identiques
- NDD, nom de domaine identique
- Trop de liens sortants
- Octets d’IP identiques
- Extension du nom de domaine spammy
- Même adresse de contact
- Whois similaire
- PBN, (chaînes de liens).
- …
EAT (Expertise, Autorité, Confiance)
Le concept de EAT de Google est un ensemble d’algorithmes influant sur la pertinence d’un site Web. On pourrait ainsi théoriquement citer le PageRank, le PageRank de semence, l’Author Rank, le Knowledge Based Trust, Google Penguin et bien d’autres.
Il serait intéressant que vous alliez jeter un œil sur l’E-A-T car cela vous donnerait davantage de pistes pour améliorer la perception de Google pour l’autorité, l'expertise et la confiance de votre site Web.
KBT : Knowledge Based Trust
Le Knowledge Based Trust (KBT) est une mesure de fiabilité reliée aux algorithmes sémantiques. Ainsi, concentrez vous sur des articles de hautes qualités en vérifiant la factualité de vos textes.
Plus d’informations ici : https://www.vldb.org/pvldb/vol8/p938-dong.pdf
Comment optimiser son PageRank pour la création de liens (off-page) ?
Maintenant que vous avez la connaissance, place à la pratique.
Tout ceci peut être difficilement palpable alors voici 2 principales techniques pour créer des liens.
La manière artificielle : utiliser des plateformes de liens
La manière “naturelle” : contacter des sites et expliquer pourquoi ils devraient placer un lien vers vous.
La réalité est que, pour certaines thématiques, par exemple la plomberie, aucun site ne fait de lien vers les plombiers. Pourquoi le ferait-il ? La seule chose à faire est de s’inscrire sur des annuaires, et ensuite, lorsque vous vous rendrez compte que vous êtes toujours derrière quelques milliers de concurrents, probablement acheter des liens.
Si vous souhaitez en savoir plus, consultez le guide sur le netlinking (techniques diverses de créations de liens).
Globalement, voici une liste récapitulative afin d’optimiser vos liens :
- Le site qui vous envoie un backlink doit correspondre à votre thématique → Si c’est un site tel que New York Times qui évoque une multitude de thématiques, il est tout de même pertinent d’obtenir un lien de ce type de site.
- La cohérence sémantique → Si Google ne comprend pas parfaitement le sens de votre texte, il ne pourra pas comprendre le sens du lien. → Si vous le pouvez, reprenez les mêmes mots-clés entre votre page et la page qui vous envoie du jus.
- Le site ne doit pas être spammy (Citation Flow par exemple) → Majestic
- Le site doit être d’autorité (Domain Authority) mais doit aussi être dans un répertoire d’autorité (URL Rating «UR»). Si le domaine est fort mais que le backlink se situe sur une page « partenaire » peu qualitative et cachée au fin fond du site, il ne vaudra pas grand-chose.
- Vérifier que le lien est bien mis en dofollow : notre article complet sur les attributs de liens
- Rien ne vous empêche d’avoir plusieurs backlinks d’un même site mais ils seront de moins en moins puissants (nous appelons cela domaine référent).
- Si possible, le lien de votre site doit être placé au milieu ou en début de page plutôt qu’en fin de page (surfeur raisonnable).
- Pensez à une stratégie d’ancre de lien. Ancre exact ou ancre sémantique.https://createur2site.fr/seo/off-page/netlinking/ancres-liens/
- Taux de clics
Enfin, voyez comme le PageRank est un fluide et pas seulement un score. Ce n’est vraiment pas intuitif mais comprendre le fonctionnement du PR est indispensable pour comprendre les “cycles”.
Intuitivement vous pouvez tenter de créer des liens dans des sites qui parlent vraiment de la même chose que vous, ainsi le PR cycle dans une boucle de sites qui pourraient être reliés entre eux.
Et la chose non intuitive est de créer des liens vers vos concurrents afin que le PR cycle et repasse chez vous. Par exemple, A fait un lien vers B et B fait un lien vers vous. Alors, vous pouvez faire un lien vers A.
Former le Google bot de cette façon; jouer avec le surfeur raisonnable et envoyer un lien sortant qui va vous revenir, grâce à l'internaute raisonnable devrait être une partie de votre travail.
Attention à ne pas faire de choses trop borderline et de ne pas abuser d’une même technique.
Note : lorsque vous indiquez un lien à Google et que vous indiquez un deuxième lien avec la même URL, le deuxième lien n’est pas pris en compte. Ainsi, il est possible de faire un lien optimisé SEO en plein texte puis de refaire le même lien avec un « call to action » optimisé UX pour y accéder sans en faire pâtir l’optimisation d’ancrage ou encore la position du lien.
Outils SEO PageRank
Voici quelques outils qui pourront vous aidez à optimiser votre PageRank et à le “calculer”.
Babbar
Babbar est un outil SEO relativement utilisé pour ses métriques très innovantes sur la création de lien bien pensé et le PageRank de manière générale, mais il peut aussi faire d’autres choses.
Voici les 4 métriques de Babbar liée au PR :
Host Value (HV) : La puissance globale du domaine, parfois appelé Domain Rating (DR) est dit Host Value chez Babbar. Il permet de constater rapidement si le site Web dans sa globalité fait autorité.
Host Trust (HT) : La Host Trust, souvent appelé CF pour citation flow (Majestic) est une métrique pouvant donner une certaine idée de la qualité des contenus d’un site. Métrique qui mesure le niveau de confiance de la page.
PageRank thématique = Semantic Value (SV) : ceci vous permet d’évaluer l’importance d’un lien. Cette métrique ne tient pas simplement compte du PageRank des pages que vous ciblez mais aussi la connexion sémantique / thématique avec votre propre page. C'est-à-dire que la Semantic Value calcule le PageRank de la page en fonction de ses propres liens qui pointent vers pondéré par leurs pertinences thématiques. (Babbar est probablement le seul opérateur à pouvoir vous la fournir)
BAS Babbar Authority Score : score global qui agrège plusieurs informations en une seule valeur. Le BAS permet de comparer ou connaitre son PageRank “réel” rapidement sans avoir à se préoccuper de chaque métrique séparément.
Exemple :
Ainsi, imaginons un site avec un Domain Rating de 70, le Domain Rating calcule l’autorité, donc le PageRank d’un site (comme avec ahrefs). Grâce à l’outil SEO Babbar, imaginons que la Semantic Value indique un score de 20. Eh bien, dans ce cas, cela voudrait dire que le site ne fait pas vraiment autorité. Si de prime abord on peut supposer que 70/100 est très bon, dans les faits ce n’est pas le cas puisque la plupart des liens ne sont pas thématisés. La proximité sémantique des liens étant faible, sa note de popularité est très différente. Dans ce cas imaginaire, le propriétaire du site a sûrement tenté de manipuler son PageRank. Si vous faites de l’achat de domaine expiré, je vous conseille d’utiliser la métrique BAS (Babbar Autority Score) pour juger la popularité d’un site plutôt que le DR de ahrefs par exemple.
Prédire la puissance d’un backlinks (force induite)
En calculant la force induite d’un lien en s’appuyant sur les algorithmes de Babbar, il est possible de déterminer quel lien vous sera le plus profitable, en fonction de sa proximité thématique pour votre page en particulier. Si vous souhaitez en savoir plus sur la force induite, n’hésitez pas à parcourir notre article dédié.
Trouver des idées de backlinks
Si vous souhaitez trouver des idées de page Web ou vous pourriez poser un lien, l’outil Babbar propose Spot Finder afin d’obtenir tous les liens potentiels tout en les classant avec la plus forte corrélation thématique (PR thématique) par rapport à votre page Web.
Optimiser le PageRank à l'intérieur d’un site (on-page)
Voici les principaux outils SEO qui pourront vous aider à calculer, prédire le PageRank et globalement à optimiser votre maillage interne.
PageRank Sculpting
Le PageRank Sculpting est le fait de faire attention à chaque petit détail du jus qui se transmet au sein de votre site. Ainsi, pensez aux nombres de liens sortants, plus il y en a plus le PageRank ce diffuse et pensez au PageRank thématique.
Offuscation de lien
L’obfuscation ou l’offuscation de lien est une méthode de scultage de PageRank qui consiste à cacher les liens pour Google afin de mieux faire comprendre au robots de Google son site Web. Effectivement, Google semble ne prendre en compte que les liens href, ainsi, en mettant un button vous pouvez mieux contrôler la diffusion du jus.
Découvrir comment offusquer un lien.
Babbar
Internal Page Value : il s’agit de la popularité interne de la page dans le host qui la contient. C’est l’analogue du PageRank interne que vous calculerez avec, par exemple, Screaming Grog et Gephi, avec en plus un modèle de surfeur raisonnable.
Si vous souhaitez un tutoriel sur gephi, le PageRank et le SEO : https://www.briggsby.com/how-visualize-open-site-explorer-data-in-gephi
Oncrawl
Inrank est le PageRank de l’outil SEO Oncrawl. métrique basé sur le PageRank, la popularité relative d’une page est classée sur une échelle de 0 à 10 (comme le PageRank de Google).
Plusieurs représentations graphiques pourront vous mettre d’y voir plus clair, comme :
Cela permet de prédire le classement des pages, contrôler le jus de liens, optimiser la crawlabilité, et surtout dans le contexte du PR, optimiser les pages les plus stratégiques.
Ce qui compte un peu pour nous, c’est la facilité avec laquelle on peut trouver le contenu. Donc, surtout si votre page d’accueil est généralement la page la plus importante de votre site web et qu’il faut plusieurs clics pour accéder à l’un de ces magasins, il nous est beaucoup plus difficile de comprendre que ces magasins sont en fait assez importants.
D’un autre côté, s’il suffit d’un clic depuis la page d’accueil vers l’un de ces magasins, cela nous indique qu’ils sont probablement assez pertinents et que nous devrions probablement leur accorder un peu de poids dans les résultats de recherche également.
Il s’agit donc plutôt de savoir par combien de liens faut-il passer pour accéder à ce contenu.– John Mueller, 1 Juin 2018 lors du Google Webmaster Hangout
Screamingfrog
Afin de visualiser la transmission du PageRank de votre site, vous pouvez lancer un crawl à partir de Screamingfrog :
Puis cliquer sur “Visualisations” -> “Diagramme de crawl fondé sur les forces”.
Cependant ceci ne vous donne pas la diffusion du PageRank.
Ainsi, parcourez les propriétés puis choisissez “link score”.
Vous pourrez facilement constater la répartition des pages les plus liées en fonction de la taille des nœuds (c’est à dire que plus un nœud est gros plus il à de PageRank).
Remarque : on voit ici que ma page contact est beaucoup lié (par exemple). Je dois faire du PR Sculpting la-dessus.
Vous pouvez également regarder le pourcentage de score du PageRank interne sans le mode visualisation, dans ce cas la le PageRank indiqué sera sur une échelle logarithmique conviviale entre 0 et 100 points. Plus la valeur est élevée, plus la page est liée.
SEOClarity
SEOClarity pourra vous aider avec les graph de liens. Via son outil Link Graph vous pourrez trouver tout ce dont vous pourriez avoir besoin. Il peut être utilisé aussi bien pour le PageRank en dehors de vos pages ou à l'intérieur de vos pages.
En cliquant sur les nœuds vous aurez les clusters pour chaque page (ceci peut être aussi fait lorsque vous cliquez sur un nœud de Screamingfrog).
Voici quelques autres chose :
Mener des tests de PageRank interne
Lorsque vous comprendrez bien le référencement, vous serez en mesure de réfléchir par vous même, de conduire vos propres tests, et de prédire ce qui fonctionnera ou non. Si les moyens sont la, il serait plus judicieux de faire vos propres tests d’optimisation de PageRank interne sur un environnement de test.
Ainsi en 1er lieu, copier coller le site Web (staging)
Dans un 2eme temps veiller à ce qu’il soit invisible pour Google (empêcher son indexation)
Puis modifier la structure en fonction de vos présomptions
Regarder sur Oncrawl si le PageRank dans cette nouvelle structure est plus optimal.
Si cela est bon, optimiser le site dans le monde réel et mesurer les résultats que vous fournira Google (c'est-à-dire si votre trafic est devenu meilleur).
Voici un excellent e-book à ce sujet : https://fr.oncrawl.com/ebook/comment-votre-maillage-interne-influence-linrank/
FAQ :
Qu’est ce que le PageRank ?
Le PageRank est l’algorithme de Google qui calcule la popularité d'un site Web en fonction du nombre d'autres sites liés à celui-ci. La popularité permet de lui donner un indice pour mieux classer ses résultats de recherche par ordre de pertinence.
Qu’est ce que le PageRank sémantique ?
Le PageRank sémantique est l’idée d’un PageRank avec un “surfeur intelligent”. Cependant le surfeur intelligent était bien trop compliqué à mettre en place algorithmiquement, et de plus moin performant que l’idée du PR thématique. Donc il n’a jamais été mis en place. Le PR thématique quant à lui envoie effectivement une information sémantique, mais elle prend le nom de Topic-sensitive, donc nous appelons cela PageRank thématique.
Qu’est ce que le surfeur intelligent ?
Le surfeur intelligent est un calcul abandonné. Le but principal était d’obtenir de meilleures performances en calculant la probabilité qu’un surfeur suive le lien d’une page A vers une page B si l’on s’intéresse à la même requête. Un indice de continuité sémantique.
Qu’est ce que le Domain Rating ?
La métrique Domain Rating (DR) est une échelle logarithmique de 0 à 100 de Ahrefs afin de mesurer la popularité d’un site dans sa globalité.
Note : Le terme "échelle logarithmique" signifie que l'écart entre un DR 75 et DR 76 est beaucoup plus grand que celui entre DR 18 et DR 19. En d'autres termes, plus votre DR est élevé, plus il sera difficile de le faire croître.
Google classe les pages, pas les sites Web. Concentrez vous sur la production de contenu de haute qualité et l'acquisition de backlinks de haute qualité directement vers ce contenu.Votre DR et votre trafic de recherche augmenteront naturellement en tant que sous-produit de cela.
Qu’est ce que le Domain Authority ?
Le Domain Authority ou DA est la même chose que le Domain Rating de Ahrefs. Même s’il est calculé d’une autre manière, il à le même but.
En général, ces métriques permettent de connaître rapidement et approximativement la popularité du site afin de garantir que même une page sans backlinks faisant un lien vers votre contenu transmettra du PR de ses autres pages par rebond. Cependant, il est généralement indispensable d’évaluer plus en profondeur d'où viennent les liens car même si ces outils tentent de vérifier le spam, certains SEO black-hat ont trouvé des moyens de gonfler l’autorité des domaines de ces outils SEO et ont exploité cette faille pour réaliser des profits (vendre des liens plus chères car autorité de domaine important).
Comment connaître son PageRank ?
Pour connaitre son PageRank, c'est-à-dire le nombres de liens pointant vers votre page, vous pouvez utiliser Ahref, Moz ou Semrush. Cependant, si vous souhaitez prendre en compte tous les facteurs, c'est-à-dire le PageRank thématique et le modèle du surfeur raisonnable, cela est possible en insérant votre URL sur l’outil Babbar.
Quels sont les outils de calcul du PageRank ?
Les outils les plus connus pour calculer votre PageRank sont : Ahrefs, Semrush, Moz, Babbar, Oncrawl, ScreamingFrog.
Qu’est ce que le bac à sable (sandbox) ?
De nombreux référenceurs et webmasters ont remarqué que les sites Web ayant un nom de domaine récent avaient beaucoup plus de mal à se positionner. On appelle cela le bac à sable. En revanche, Google n’est pas d’accord du fait qu’il y aurait un algorithme spécifique la dessus.
Est-ce que le PageRank est mort ?
Le PageRank n’est pas mort. Google le répète chaque année, le PR est toujours utilisé dans ses algorithmes pour classer les pages.
Deux choses à prendre en compte. La 1ère est la déclaration du 16 juillet 2019, un ingénieur de recherche Google sur un fil de Hacker News a déclaré au monde que Google avait cessé d'utiliser la version Stanford de PageRank en 2006, effectivement le PR à bien changé depuis 2006. Et la 2eme est que de nombreux algorithmes similaires au PR sortent chaques années mais elle sont complémentaires mais ne remplace pas le PageRank, même s’il appellent parfois cela le PR (ceci s’explique car ils se basent sur les mêmes formules que le PR).
0 commentaires