LinkedIn Link to LinkedIn Twitter Link to Twitter

Les URL canoniques : améliorer son référencement

0 commentaires

Les URL canoniques sont une partie importante du référencement technique. Facile à mettre en place, elles permettent d’améliorer le crawl d’un site ainsi que l’indexation des pages.

Si vous ne mettez pas en place la canonicalisation, il est fortement probable que vous ayez des problèmes d’URL dupliquées ce qui, disons le, pourrait être embêtant.

C’est quoi une balise canonique ?

Une balise canonique est un extrait de code HTML qui définit la version principale d’une page.
Le code html :

  1. link rel="canonical":  Le lien dans cette balise est la version principale (canonique) de la page.
  2. href="https://exemple.fr/page/":  La page canonique correspond à cette URL précise.

Ces balises permettent d’éviter la duplication des pages identiques ou quasi-similaires. En d'autres termes, si vous avez le même contenu ou un contenu similaire disponible sous différentes URL, vous pouvez utiliser des balises canoniques pour spécifier quelle version est la principale et devant donc être indexée.

Schéma de fonctionnement des balises canoniques

Si vous pensez que vous n’êtes pas concerné, attendez la suite.

Pourquoi les balises canoniques sont-elles importantes ?

Les robots d’exploration ont besoin de savoir quel contenu est l’original, sinon ils choisiront celui qu’ils trouvent le plus pertinent. Ainsi, si vous n'indiquez pas d'URL canonique, ils identifieront ce qu’ils pensent être la meilleure version. Et Google n’a pas la science infuse.
Si les robots identifient plusieurs pages identiques ou quasi-identiques, ils n’en choisiront qu’une à indexer.

Trop de contenu dupliqué peut également affecter votre « budget de crawl ». Cela signifie que Google peut finir par perdre du temps à explorer plusieurs versions de la même page au lieu de découvrir d'autres contenus importants sur votre site web.

Du contenu dupliqué ?

Si vous ne vous sentez pas concerné, parce que vous pensez ne pas avoir créé de contenus assez similaires pour qu’ils soient identifiés comme quasi-identiques ou même identiques, détrompez-vous.
Pourquoi ? Google ne voit pas les choses comme nous, il voit des URL et non pas des pages.
Quelle est la différence ? Plein de facteurs peuvent entrer en compte modifiant l’URL de votre page.
Imaginons que vous possédez un site e-commerce. Il est impossible que vos pages produits n’aient pas d’URL filtrées, appelées aussi URL paramétrées ou encore navigation à facette.

Ainsi si vous avez une page qui propose un t-shirt en taille M / L / XL vous avez déjà possiblement 3 URL dupliquées.

Voici votre URL originale :
https://mon-site-e-com.fr/produit/t-shirt/

Après application du filtre, votre URL ressemblera à quelque chose comme ceci :
https://mon-site-e-com.fr/produit/t-shirt?taille=M

Google la voit comme une URL différente.

On peut aller plus loin, si votre page produit propose également plusieurs couleurs pour le même t-shirt :
https://mon-site-e-com.fr/produit/t-shirt?taille=M&couleur=rouge

Malheureusement, ce ne sont pas du tout les seuls facteurs pouvant créer des URL dupliquées et cela concerne n’importe quel site web s’il a été mal conçu.

Voici une liste de problèmes les plus fréquents :

  • Votre site est accessible avec et sans www (par exemple, http://exemple.fr et http://www.exemple.fr ) Vous devez donc choisir votre nom de domaine préféré.
  • Les pages sont accessibles avec http et https (par exemple, http://exemple.fr et https://exemple.fr )
  • Votre page est accessible avec et sans barre oblique finale (par exemple, https://exemple.fr/page/ et https://.exemple.fr/page )
  • URL identique avec et sans majuscule (par exemple, https://exemple.fr/page/ et https://exemple.fr/Page/)
  • Moteur de recherche au sein du site (par exemple, exemple.fr?q=search-term)
  • Navigation à filtre (par exemple, exemple.fr/blog?category=seo)
  • Avoir des versions AMP et non AMP d'une page (par exemple, exemple.fr/page et amp.exemple.fr/page )
    • ...

Imaginez tous les problèmes mis bout à bout. Cela peut faire ÉNORMÉMENT d’URL pour une seule page ! Et ce n’est pas une liste complète.

Les règles de base des URL canoniques

Pour mettre en place des URL canoniques correctement, vous devez suivre cinq règles :

Utilisez des URL absolues

John Muller a précisé sur Twitter qu’il était recommandé d'utiliser des URL absolues afin d'être sûr qu'elles soient interprétées correctement.

Vous devez donc utiliser cette structure :

<link rel="canonical" href=" https://exemple.fr/exemple-page/ " />

Et non celle-ci :

<link rel="canonical" href=” /exemple-page/ ” />

2. Utilisez des minuscules

Assurez vous que votre serveur force les URL en minuscules et que vos balises canoniques n’aient pas de majuscule.

3. Permettez uniquement l’accès à HTTPS

Si vous êtes passé sur un certificat SSL, veillez à bien vérifier que vos URL ne peuvent pas être atteintes en HTTP. Ainsi que vos images.

4. Placez toujours des URL canoniques

Si vous ne saviez pas trop, la réponse est ici. Placez toujours des URL canoniques sur vos pages. Dans le jargon SEO, cela s’appelle des balises canoniques auto-référentielles.

Si vous utilisez WordPress avec Yoast, sachez qu’il y a toujours des URL canoniques auto-référentielles par défaut. Si Yoast vous propose effectivement dans les paramétres avancés d’une page l’ajout d’une balise canonique, c’est uniquement dans le but de préciser une autre URL que celle renseignée de base. Donc, l’URL que vous avez renseignée lors de la création de votre page est égale à la balise canonique créée par défaut.

Même si votre site est parfaitement bien construit, cela évite par exemple que Google s’emmêle les pinceaux si quelqu’un vous fait un backlinks en omettant la barre oblique à la fin de l’URL. C’est pourquoi il est toujours bon d’appliquer cette pratique dans n’importe quel cas.

5. Une, et une seule balise canonique par page

Si une page comporte plusieurs balises canoniques, Google n’en considérera aucune. À défaut de déterminer la bonne il ignorera les deux.

Mettez en place les balises canoniques, correctement

Il existe cinq manières connues de spécifier des URL canoniques. C’est ce qu'on appelle les signaux de canonisation :

  1. Balise HTML (rel=canonical)
  2. Redirection 301
  3. En-tête HTTP
  4. Plan du site (sitemap)
  5. Liens internes

Nous allons voir juste après quatre grands points à considérer, l’intérêt du sitemap et des liens internes en suggestions canoniques venant d’être mentionnés. En application, ils sont si évidents que je ne vous fais pas l’injure de les expliquer..

1. Choisir le bon signal de canonisation

Pour connaître les avantages et les inconvénients de chaque méthode, consultez ce tableau, issu de la doc SEO de Google :

Méthode et description

Balise rel=canonical
<link>

Ajoutez une balise <link> au code de toutes les pages en double, redirigeant vers la page canonique.

Avantages :

Peut mettre en correspondance un nombre infini de pages en double.

Inconvénients :

Peut augmenter la taille de la page.

Gestion de la mise en correspondance complexe sur les sites volumineux ou sur ceux dont les URL changent souvent.

Fonctionne uniquement pour les pages HTML, pas pour les fichiers comme les PDF. Dans ce cas, vous pouvez utiliser l'en-tête HTTP rel=canonical.

En-tête HTTP rel=canonical

Envoyez un en-tête rel=canonical dans la réponse de votre page.

Avantages :

N'augmente pas la taille de la page.

Peut mettre en correspondance un nombre infini de pages en double.

Inconvénients :

Gestion de la mise en correspondance complexe sur les sites volumineux ou sur ceux dont les URL changent souvent.

Sitemap

Définissez vos pages canoniques dans un sitemap.

Avantages :

Facile à mettre en place et à gérer, surtout sur des sites volumineux.

Inconvénients :

Googlebot devra malgré tout trouver les pages en double associées à toutes les pages canoniques que vous désignez dans le sitemap.

Indicateur moins puissant pour Googlebot que la technique de mise en correspondance rel=canonical.

Redirection 301

Utilisez les redirections 301 pour indiquer à Googlebot qu'une URL de redirection constitue une meilleure version qu'une URL donnée. Utilisez cette méthode uniquement lorsque vous abandonnez une page en double.

Variante AMP

Si l'une de vos variantes est une page AMP, vous devrez suivre les consignes AMP pour indiquer la page canonique et la variante AMP.

Note : https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls?hl=fr

2. Définissez des canoniques avec des redirections 301

Utilisez les redirections 301 lorsque vous souhaitez envoyer le trafic d'une URL en double vers sa version canonique.

Supposons que votre page soit accessible aux URL suivantes :

  • exemple.com
  • exemple.com/index.php
  • example.com/home/

Choisissez une URL comme canonique et redirigez-y les autres URL vers l’URL canonique.
Vous devriez faire de même pour les versions sécurisées HTTPS/HTTP et www/non-www de votre site. Choisissez une version canonique et redirigez les autres vers cette version.

Note : pour WordPress, Yoast SEO propose les redirections en forfait premium. Mieux, Kinsta, un hébergement WP premium propose les redirection 301&302 directement côté serveur.

3. Entête HTTP

Pour les documents tels que les PDF, il n'y a aucun moyen de placer des balises canoniques dans la section <head>.

Dans ce cas, vous devez utiliser des entêtes HTTP pour définir les URL canoniques.

Imaginons que vous publiez un PDF, voici à quoi pourrait ressembler votre entête HTTP pour ce fichier :

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://votre-site.fr/page/canonical/>; rel="canonical"

4. CMS & Canonical

Si vous utilisez WordPress et Yoast, comme mentionné précédemment les balises canoniques se font automatiquement à chaque création de page.

Et cela vaut aussi pour les CMS populaires comme :

  • Shopify
  • Webflow
  • Squarespace
  • Wix

5 Erreurs courantes sur les balises canoniques

Voici une courte liste de problèmes fréquents sur les balises canoniques.

Dans tous les cas, utilisez des outils de crawl et des outils plus généralistes comme SemRush et la Google Search Console pour vérifier la santé de votre site web.

1. Pensez qu’un CMS vous protège

Ce n’est pas parce que votre CMS crée des balises canoniques auto-référentielles automatiquement que vous êtes protégé.

D’ailleurs les balises canoniques sont des suggestions, si Google souhaite pour une raison bizarre ne pas suivre vos recommandations, il peut le faire.

Un site bien construit, sur une base d’URL canonique auto-référentielle est idéale.

C’est-à-dire que vous devez au moins vérifier si :

  • Vous avez bien paramétré https (redirection forcé http → https) Cela devrait être fait si vous avez mis en place correctement SSL sur votre administration WP
  • Bien paramétrer votre choix de domaine principal (redirection forcée www.site → site ou site → www.site ; mais pas les deux)

Note : si vous utilisez WordPress avec l’hébergement Kinsta, il suffit d’un clic pour forcer HTTPS (si nécessaire). Il suffit aussi d’un seul clic sur un bouton pour choisir son domaine préféré..

2. Canonicaliser toutes les pages paginées vers la page mère

Les pages paginées ne doivent pas être canonisées à la première page paginée de la série.

Par exemple, un blog avec pagination est un blog qui répertorie plusieurs articles avec plusieurs pages.

Dans ce cas-là les canoniques auto-référencées doivent être utilisées sur toutes les pages paginées et non vers la première page.

Effectivement, John Mueller de Google a spécifié sur Reddit qu’il s’agissait d'une mauvaise utilisation de rel=canonical.

C’est-à-dire que la page 2 n'est pas équivalente à la page 1, donc le rel=canonical doit être auto-référencé vers la page 2. Et ainsi de suite.

3. La page canonique n’est pas identique à celle du sitemap

Un sitemap permet d’indiquer au robot des suggestions d’URL canoniques, n’utilisez donc pas une version d’URL différente entre la balise canonique et celle spécifiée sur votre sitemap.

4. L’URL d’Open Graph ne correspond pas à celle de l’URL canonique

Vérifiez si l'URL canonique spécifiée est la même que l'URL Open Graph spécifiée. Sinon, une version non canonique d'une page sera partagée sur les réseaux sociaux.

5. L’URL non canonique obtient des backlinks

Si une ou des pages non canoniques apparaissent dans les résultats de recherche et génèrent un trafic de recherche organique, vérifiez que les balises rel=canonical sont correctement configurées sur ces pages-là.

Auditez votre site : comprendre et corriger les erreurs

Que vous pensiez avoir un problème d’URL canonique ou non, si vous n’auditez pas votre site vous ne pouvez pas le savoir. Regardez ce que la Google Search Console vous indique.
Pour cela, utilisez l'outil d'inspection d'URL dans Google Search Console pour voir s'ils considèrent l'URL canonique spécifiée comme canonique. S'il y a une incompatibilité, recherchez l’origine du problème.

Cependant, la GSC travaille au ralenti, donc si vous souhaitez corriger une erreur lorsqu’elle a déjà été reportée sur la console, il est fortement probable que cela ait déjà impacté vos classements. C’est pourquoi il est préférable d’utiliser des outils de monitoring. Semrush et ou Ahrefs peuvent suffire pour vous informer (entre autres) des problèmes canoniques.

L'hébergement WordPress pour les sites ambitieux

Vos concurrents utilisent Kinsta. Ne les laissez pas vous devancer.

Découvrez

Vous avez besoin d'aide ?

N'hésitez pas ! Nous sommes experts en création de site et en référencement naturel.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *