Les URL canoniques : améliorer son référencement

Mis à jour le 24/11/2025 | Publié le 21/02/2022 | 0 commentaires

Les URL canoniques sont une partie importante du référencement technique. Facile à mettre en place, elles permettent d’améliorer le crawl d’un site ainsi que l’indexation des pages.

Si vous ne mettez pas en place la canonicalisation, il est fortement probable que vous ayez des problèmes d’URL dupliquées ce qui, disons le, pourrait être embêtant.

C’est quoi une balise canonique ?

Une balise canonique est un extrait de code HTML qui définit la version principale d’une page.
Le code html :

  1. link rel="canonical": Le lien dans cette balise est la version principale (canonique) de la page de monsite.
  2. href="https://exemple.fr/page/" (attribut avec protocole https): La page canonique correspond à cette URL https précise.

Ces balises Open Graph permettent d’éviter la contenus dupliqués des pages identiques ou quasi-similaires. En d’autres termes, si vous avez le même contenu ou un contenu similaire disponible sous différentes URL, vous pouvez utiliser des balises canoniques pour spécifier quelle version est la principale et devant donc être indexée.

Schéma de fonctionnement des balises canoniques

Si vous pensez que vous n’êtes pas concerné, attendez la suite.

Pourquoi les balises canoniques sont-elles importantes ?

Les fichier robots.txt d’exploration ont besoin de savoir quel contenu est l’original, sinon ils choisiront celui qu’ils trouvent le plus pertinent. Ainsi, si vous n’indiquez pas d’URL canonique, ils identifieront ce qu’ils pensent être la meilleure version. Et Google n’a pas la science infuse.
Si les robots identifient plusieurs pages identiques ou quasi-identiques, ils n’en choisiront qu’une à indexer.

Trop de contenu dupliqué peut également affecter votre « budget de crawl et indexation ». Cela signifie que Google peut finir par perdre du temps à explorer plusieurs versions de la même page au lieu de découvrir d’autres contenus importants sur votre site web.

Du contenu dupliqué ?

Si vous ne vous sentez pas concerné, parce que vous pensez ne pas avoir créé de contenus assez similaires pour qu’ils soient identifiés comme quasi-identiques ou même identiques, détrompez-vous.
Pourquoi ? Google ne voit pas les choses comme nous, il voit des URL et non pas des pages.
Quelle est la différence ? Plein de facteurs de classement Google peuvent entrer en compte modifiant l’URL de votre page.
Imaginons que vous possédez un site e-commerce. Il est impossible que vos pages produits aient  des URL filtrées, appelées aussi URL paramétrées ou encore navigation à facette.

Ainsi si vous avez une page qui propose un t-shirt en taille M / L / XL vous avez déjà possiblement 3 URL dupliquées.

Voici votre URL originale :
https://mon-site-e-com.fr/produit/t-shirt/

Après application du filtre, votre URL ressemblera à quelque chose comme ceci :
https://mon-site-e-com.fr/produit/t-shirt?taille=M

Google voit ce link comme une URL différente, traitant chaque link filtré comme un link distinct.

On peut aller plus loin, si votre page produit propose également plusieurs couleurs pour le même t-shirt :
https://mon-site-e-com.fr/produit/t-shirt?taille=M&couleur=rouge

Malheureusement, ce ne sont pas du tout les seuls facteurs pouvant créer des URL dupliquées et cela concerne n’importe quel site web s’il a été mal conçu.

Voici une liste de problèmes les plus fréquents qui permet d'identifier les erreurs HTTPS :

  • Votre site est accessible avec et sans www (par exemple, http://exemple.fr et http://www.exemple.fr ) Vous devez donc choisir votre nom de domaine préféré.
  • Les pages sont accessibles avec http et https (par exemple, http://exemple.fr et https://exemple.fr ) Il faut alors indiquer l'URL source préférée.
  • Votre page est accessible avec et sans barre oblique finale (par exemple, https://exemple.fr/page/ et https://.exemple.fr/page )
  • URL identique avec et sans majuscule (par exemple, https://exemple.fr/page/ et https://exemple.fr/Page/)
  • Moteur de recherche au sein du site (par exemple, monsite.fr?q=search-term)
  • Navigation à filtre (par exemple, exemple.fr/blog?category=seo)
  • Avoir des versions AMP et non AMP d’une page (par exemple, exemple.fr/page et amp.exemple.fr/page )
    • …

Imaginez tous les problèmes mis bout à bout. Cela peut faire ÉNORMÉMENT d'URL visibles en recherche pour une seule page ! Et ce n'est pas une liste complète.

Les règles de base des URL canoniques

Pour mettre en place correctement la balise link canonical des URL canoniques, vous devez suivre cinq règles :

Utilisez des URL absolues

John Muller a précisé sur Twitter qu'il était recommandé d'utiliser des URL absolues dans les balises link afin d'être sûr que ces éléments link soient interprétés correctement.

Vous devez donc utiliser cette structure :

<link rel=”canonical” href=” https://exemple.fr/exemple-page/ ” />

Et non celle-ci (problématique pour la gestion duplicate content sur les sites web) :

2. Utilisez des minuscules

Assurez vous que votre serveur force les URL en minuscules et que vos balises canoniques ainsi que leur attribut href n'aient pas de majuscule.

3. Permettez uniquement l’accès à HTTPS

Si vous êtes passé sur un certificat SSL, veillez à bien vérifier que vos URL ne peuvent pas être atteintes en HTTP, y compris dans les attributs href de vos liens. Ainsi que vos images.

4. Placez toujours des URL canoniques

Si vous ne saviez pas trop, la réponse est ici. Placez toujours des URL canoniques sur vos pages. Dans le jargon SEO, cela s’appelle des balises canoniques auto-référentielles.

Si vous utilisez WordPress avec Yoast, sachez qu’il y a toujours des URL canoniques auto-référentielles par défaut. Si Yoast vous propose effectivement dans les paramétres avancés d’une page l’ajout d’une balise canonique, c’est uniquement dans le but de préciser une autre URL que celle renseignée de base. Donc, l’URL que vous avez renseignée lors de la création de votre page est égale à la balise canonique créée par défaut.

Même si votre site est parfaitement bien construit, cela évite par exemple que Google s'emmêle les pinceaux si quelqu'un vous fait un backlinks en omettant la barre oblique à la fin de l'URL. C'est pourquoi il est toujours bon d'appliquer cette gestion duplicate content dans n'importe quel cas.

5. Une, et une seule balise canonique par page

Si une page comporte plusieurs balises canoniques, Google n’en considérera aucune. À défaut de déterminer la bonne il ignorera les deux.

Mettez en place les balises canoniques, correctement

Il existe cinq manières connues de spécifier des URL canoniques. C’est ce qu’on appelle les signaux de canonisation :

  1. Balise HTML (rel=canonical)
  2. redirection 301
  3. En-tête HTTP
  4. Plan du site (sitemap XML)
  5. Liens internes

Nous allons voir juste après quatre grands points à considérer, l'intérêt du sitemap et des liens internes en suggestions canoniques venant d'être mentionnés, et comment utiliser redirection SEOs. En application, ils sont si évidents que je ne vous fais pas l'injure de les expliquer..

1. Choisir le bon signal de canonisation

Pour connaître les avantages et les inconvénients de chaque méthode, consultez le contenu de ce tableau, issu de la doc SEO de Google :

Méthode et description pour indiquer URL source

Balise rel=canonical
<link>

Ajoutez une balise <link> au code de toutes les pages en double, redirigeant vers la page canonique.

Avantages :

Permet de mettre en correspondance un nombre infini de pages en double.

Inconvénients pour les robots :

Peut augmenter la taille de la page.

Gestion de la mise en correspondance complexe sur les sites volumineux ou sur ceux dont les URL changent souvent.

Fonctionne uniquement pour les pages HTML, pas pour les fichiers comme les PDF. Dans ce cas, vous pouvez utiliser l'en-tête HTTP rel=canonical pour monsite.

En-tête HTTP rel=canonical

Envoyez un en-tête rel=canonical dans la réponse de votre page.

Avantages :

N’augmente pas la taille de la page.

Permet de mettre en correspondance un nombre infini de pages en double.

Inconvénients pour les robots :

Gestion de la mise en correspondance complexe sur les sites volumineux ou sur ceux dont les URL changent souvent.

Sitemap

Définissez vos pages canoniques dans un sitemap.

Avantages :

Cette méthode permet une mise en place et une gestion faciles, surtout sur des sites volumineux.

Inconvénients pour les robots :

Googlebot devra malgré tout trouver les pages de contenu en double associées à toutes les pages canoniques de contenu que vous désignez dans le sitemap.

Indicateur moins puissant pour Googlebot que la SEO technique de mise en correspondance rel=canonical.

Redirection 301

Utilisez les redirections 301 pour indiquer à Googlebot qu’une URL de redirection constitue une meilleure version qu’une URL donnée. Utilisez cette méthode uniquement lorsque vous abandonnez une page en double.

Variante AMP

Si l’une de vos variantes est une page AMP, vous devrez suivre les consignes AMP pour indiquer la page canonique et la variante AMP.

Note : https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls?hl=fr

2. Définissez des canoniques avec des redirections 301

Utilisez les redirections 301 lorsque vous souhaitez envoyer le trafic d'une URL en double vers sa version canonique, ou indiquez cette dernière dans la balise head.

Supposons que votre page soit accessible aux URL suivantes, que les moteurs de recherche peuvent considérer comme des pages distinctes :

  • exemple.com
  • exemple.com/index.php
  • example.com/home/

Choisissez une URL comme canonique et redirigez-y les autres URL vers l’URL canonique.
Vous devriez faire de même pour les versions sécurisées HTTPS/HTTP et www/non-www de votre site. Choisissez une version canonique et redirigez les autres vers cette version.

Note : pour WordPress, Yoast SEO propose les redirections en forfait premium. Mieux, Kinsta, un hébergement WP premium propose les redirection 301&302 directement côté serveur.

3. Entête HTTP

Pour les documents indexés par les moteurs de recherche tels que les PDF, il n'y a aucun moyen de placer des balises canoniques dans la section .

Dans ce cas, pour la page source, vous devez utiliser des entêtes HTTP pour définir les URL canoniques.

Imaginons que vous publiez un PDF, voici à quoi pourrait ressembler votre entête HTTP pour ce fichier :

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://votre-site.fr/page/canonical/>; rel=”canonical”

4. CMS & Canonical

Si vous utilisez WordPress et Yoast, comme mentionné précédemment les balises canoniques se font automatiquement à chaque création de page.

Et cela vaut aussi pour les CMS populaires comme :

  • Shopify
  • Webflow
  • Squarespace
  • Wix

5 Erreurs courantes sur les balises canoniques

Voici une courte liste de problèmes fréquents sur les balises canoniques.

Dans tous les cas, utilisez des outils de crawl et des outils SEO plus généralistes comme SemRush et la Google Search Console pour vérifier la santé de votre site web.

1. Pensez qu’un CMS vous protège

Ce n’est pas parce que votre CMS crée des balises canoniques auto-référentielles automatiquement que vous êtes protégé.

D’ailleurs les balises canoniques sont des suggestions, si Google souhaite pour une raison bizarre ne pas suivre vos recommandations, il peut le faire.

Un site bien construit, sur une base d’URL canonique auto-référentielle est idéale.

C’est-à-dire que vous devez au moins vérifier si :

  • Vous avez bien paramétré https (redirection forcé http → https) Cela devrait être fait si vous avez mis en place correctement SSL sur votre administration WP
  • Bien paramétrer votre choix de domaine principal (redirection forcée www.site → site ou site → www.site ; mais pas les deux)

Note : si vous utilisez WordPress avec l’hébergement Kinsta, il suffit d’un clic pour forcer HTTPS (si nécessaire). Il suffit aussi d’un seul clic sur un bouton pour choisir son domaine préféré..

2. Canonicaliser toutes les pages paginées vers la page mère

Les pages paginées ne doivent pas être canonisées à la première page paginée de la série.

Par exemple, un blog avec pagination est un blog qui répertorie plusieurs articles avec plusieurs pages.

Dans ce cas-là les canoniques auto-référencées doivent être utilisées sur toutes les pages paginées et non vers la première page.

Effectivement, John Mueller de Google a spécifié sur Reddit qu’il s’agissait d’une mauvaise utilisation de rel=canonical.

C’est-à-dire que la page 2 n’est pas équivalente à la page 1, donc le rel=canonical doit être auto-référencé vers la page 2. Et ainsi de suite.

3. La page canonique n’est pas identique à celle du sitemap

Un sitemap permet d’indiquer au robot des suggestions d’URL canoniques, n’utilisez donc pas une version d’URL différente entre la balise canonique et celle spécifiée sur votre sitemap.

4. L’URL d’Open Graph ne correspond pas à celle de l’URL canonique

Vérifiez si l’URL canonique spécifiée est la même que l’URL Open Graph spécifiée. Sinon, une version non canonique d’une page sera partagée sur les réseaux sociaux.

5. L’URL non canonique obtient des backlinks

Si une ou des pages non canoniques apparaissent dans les résultats de recherche et génèrent un trafic de recherche organique, vérifiez que les balises rel=canonical sont correctement configurées sur ces pages-là.

Auditez votre site : comprendre et corriger les erreurs

Que vous pensiez avoir un problème d’URL canonique ou non, si vous n’auditez pas votre site vous ne pouvez pas le savoir. Regardez ce que la Google Search Console vous indique.
Pour cela, utilisez l’outil d’inspection d’URL dans Google Search Console pour voir s’ils considèrent l’URL canonique spécifiée comme canonique. S’il y a une incompatibilité, recherchez l’origine du problème.

Cependant, la GSC travaille au ralenti, donc si vous souhaitez corriger une erreur lorsqu’elle a déjà été reportée sur la console, il est fortement probable que cela ait déjà impacté vos classements. C’est pourquoi il est préférable d’utiliser des outils de monitoring. Semrush et ou Ahrefs peuvent suffire pour vous informer (entre autres) des problèmes canoniques.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Foire Aux Questions

Les URL canoniques soulèvent de nombreuses questions chez les professionnels du référencement et les créateurs de sites web. Voici les réponses aux interrogations les plus fréquentes pour vous aider à maîtriser cet outil essentiel du SEO technique.

Qu'est-ce qu'une URL canonique ?

Une URL canonique est l'URL préférée d'une page web parmi plusieurs versions similaires ou identiques. Elle est définie via la balise link rel="canonical" dans le code HTML et indique aux moteurs de recherche quelle version d'une page doit être indexée et considérée comme la référence. Cela permet d'éviter les problèmes de contenu dupliqué qui peuvent nuire à votre référencement naturel.

Pourquoi utiliser les URL canoniques pour améliorer son référencement ?

Les URL canoniques consolident le jus de lien (link juice) vers une seule version de page, évitant ainsi la dilution de votre autorité SEO. Elles empêchent Google de pénaliser votre site pour du contenu dupliqué et clarifient la structure de votre site. En concentrant les signaux de référencement sur l'URL canonique, vous améliorez le classement de vos pages dans les résultats de recherche.

Comment implémenter une balise canonical sur son site web ?

Pour implémenter une balise canonical, ajoutez la balise <link rel="canonical" href="URL-de-la-page-canonique" /> dans la section <head> de votre page HTML. Vous pouvez également la déclarer via l'en-tête HTTP ou dans votre sitemap XML. La plupart des CMS comme WordPress proposent des plugins SEO comme WP Rocket qui facilitent cette implémentation automatiquement.

Quelle est la différence entre une URL canonique et une redirection 301 ?

Une redirection 301 redirige automatiquement les visiteurs et les moteurs de recherche vers une nouvelle URL, tandis qu'une URL canonique est une suggestion aux moteurs de recherche sans rediriger les utilisateurs. La 301 est définitive et visible pour l'utilisateur, alors que la canonical est invisible et permet d'accéder aux différentes versions de la page. Utilisez la 301 pour les pages supprimées, la canonical pour les variations d'une même page.

Quelles sont les erreurs courantes à éviter avec les URL canoniques ?

Les erreurs fréquentes incluent : pointer une canonical vers une page 404 ou en redirection, utiliser des URLs canoniques relatives plutôt qu'absolues, avoir plusieurs balises canonical sur une même page, ou canoniser vers des pages paginées. Évitez aussi de canoniser vers des URLs avec des paramètres de suivi ou vers des versions HTTP au lieu de HTTPS. Vérifiez régulièrement vos canonicals avec des outils d'audit SEO.

Les URL canoniques fonctionnent-elles avec tous les moteurs de recherche ?

Oui, les principales moteurs de recherche (Google, Bing, Yahoo) respectent la balise canonical depuis 2009. Cependant, il s'agit d'une directive et non d'une commande absolue : les moteurs peuvent choisir de l'ignorer s'ils détectent des incohérences ou des erreurs. Google suit généralement les canonicals correctement implémentées à plus de 95%, mais conserve le droit de sélectionner une URL différente si elle semble plus appropriée.

Comment vérifier que mes URL canoniques sont correctement configurées ?

Pour vérifier vos URL canoniques, utilisez des outils comme Google PageSpeed Insights ou la Search Console de Google qui vous indiquera les pages avec des problèmes de canonicalisation. Inspectez également le code source de vos pages pour confirmer la présence et l'exactitude de la balise canonical. Un contrôle régulier permet d'identifier rapidement les erreurs de configuration et d'optimiser votre référencement naturel.