[Guide] URL canonique : les balises canonical pour les nuls

James Brockbank

Jun 15, 202017 min read
URL canonique

Comprendre comment utiliser correctement la canonicalisation et savoir paramétrer des URL canoniques est essentiel pour tout spécialiste SEO. Une implémentation incorrecte de ces URL peut provoquer de vastes problèmes impactant négativement la performance de votre site.

Les balises canonical ont été introduites pour la première fois en 2009 afin d'aider les webmasters à résoudre les problèmes de contenu dupliqué ou largement similaire accessible sur plusieurs URL. Mais pour utiliser les balises canonical correctement, vous devez comprendre ce qu’elles sont, maîtriser leur fonctionnement, et savoir comment les implémenter !

Qu’est-ce qu’une balise canonical & une URL canonique ?

Souvent appelées rel="canonical", les balises canonical sont une façon de dire aux moteurs de recherche qu’une URL définie est l’exemplaire original d’une page.

Elles vous permettent de préciser l’URL canonique pour une page.

Mais attention, quelle est la différence entre les balises canonical et les URL canoniques ? Y a-t-il d’autres façons de préciser ces URL ?

Balises canonical

Figurant dans la section <head></head> du code source HTML d’une page web, une balise canonical ressemble à cela :

<link rel="canonical" href="https://www.website.com/page/" />

Elle peut faire référence à elle-même (lorsqu'une balise canonical pointe vers l’URL de sa propre page) ou faire référence à l’URL d’une autre page pour consolider les signaux.

On constate souvent que les termes balises canonical et URL canoniques sont employés indifféremment, alors que ça ne devrait pas être le cas.

En effet, utiliser une balise rel="canonical" est la méthode la plus commune pour paramétrer les URL canoniques, mais ce n’est en aucun cas la seule.

URL canoniques

Alors qu’est-ce une URL canonique ? C’est l’URL choisie comme URL « originale » pour un ensemble de pages dupliquées.

Avec les mots de Google, cela donne :

Une URL canonique est l'URL de la page considérée par Google comme la plus représentative de l'ensemble de pages dupliquées sur votre site.

— Aide Google Search Console 

Vous pouvez indiquer votre URL canonique préférée. Néanmoins, pour différentes raisons, Google peut choisir une autre page que celle que vous avez désignée. Cela dit, dans la plupart des cas, quand elle est bien paramétrée, ce sera l’URL que vous avez définie qui sera choisie comme canonique.

Dit simplement, une URL canonique indique quelle page sera généralement affichée dans les résultats de recherche (à l’exception du cas où une URL dupliquée correspond mieux à l’utilisateur, par exemple une version conçue pour le mobile). L’URL canonique d’une page peut être sur un domaine différent.

Comment les URL canoniques peuvent-elles être aussi paramétrées ?

Les balises canonical ne sont pas la seule façon de préciser une URL canonique, même si c’est cette méthode que vous utiliserez la plupart du temps.

Vous pouvez aussi paramétrer les URL canoniques :

  • En définissant un en-tête de réponse HTTP rel=canonical.

  • Dans votre sitemap : mais dans ce cas, c’est Google qui décide quelles sont les pages dupliquées (s’il y en a) de toutes les pages indiquées comme canoniques dans le sitemap.

  • En utilisant des redirections 301.

Pourtant, même si ce sont des techniques recommandées par Google, elles ne correspondent pas à toutes les situations, comme nous allons le voir par la suite, et chacune a ses propres recommandations d’usage.

Sachez quand même que paramétrer des URL canoniques n’est pas une obligation, et dans les cas où vous n’en préciser pas, Google utilisera d’autres signaux pour identifier la page qui représente à ses yeux la meilleure version. Néanmoins, il est recommandé d’utiliser efficacement la canonicalisation afin de contrôler la manière dont votre site apparaît sur les moteurs de recherche et d’éviter les problèmes qui résultent du contenu dupliqué.

Les causes du contenu dupliqué

Avant d’examiner les raisons pour lesquelles vous devriez utiliser les URL canoniques et d’expliquer comment les définir sur les CMS les plus communs, vous devez comprendre pourquoi il y a du contenu dupliqué. En effet, personne ne veut créer sans raison du contenu dupliqué sur un site.

En général, cela se produit quand les systèmes de gestion de contenu créent plusieurs URL lorsque vous sortez une page, quand vous avez différentes versions indexables de votre site, quand vous avez une version alternative pour différents types d’appareil, ou quand vous utilisez des URL dynamiques.

Examinez les URL suivantes et imaginez que, pour un utilisateur, elles affichent toutes exactement le même contenu :

  1. https://www.website.com/categorie/produit-a/

  2. https://www.website.com/produit-a/

  3. https://website.com/produit-a/

  4. http://www.website.com/produit-a/

  5. http://website.com/produit-a/

  6. https://m.website.com/produit-a/

  7. https://www.website.com/produit-a

  8. https://www.website.com/produit-A/

Pour un moteur de recherche, il n’y a pas une seule page de contenu, mais huit pages dupliquées :

  • Les URL #1 et #2 sont la conséquence du fait que le CMS sauvegarde les URL de produits à la fois avec et sans le nom de la catégorie.

  • Les URL #3, #4 et #5 résultent du fait que le site est accessible aussi bien sur une version HTTP que HTTPS, ainsi que sur des versions www et non-www. 

  • L’URL #6 est la version mobile-friendly présente sur un sous-domaine.

  • L’URL #7 est la version sans barre oblique finale de l’URL #2. 

  • L’URL #8 utilise un A majuscule à la place de la minuscule utilisée ailleurs sur le site. 

Vous pouvez aussi trouver du contenu dupliqué sur différentes URL, comme :

  • https://www.website.com/

  • https://www.website.com/index.php 

Voyons maintenant si le contenu dupliqué apparaît facilement ? En réalité, de nombreux sites souffrent de ce problème sans même le savoir ; mais les URL canoniques aident les moteurs de recherche à identifier les différentes variations d’une page et à les associer à une URL unique.

risque de contenu dupliqué

Pourquoi devriez-vous utiliser des URL canoniques pour le SEO ?

Les URL canoniques existent pour vous aider à gérer les problèmes de contenu dupliqué qui peuvent affecter la performance de votre site. Plus précisément, il existe un certain nombre de raisons pour lesquelles l’utilisation d'URL canoniques ne devrait constituer qu’un aspect du SEO technique.

Précisez l’URL qui doit être affichée dans les résultats des moteurs de recherche

Lorsque vous paramétrez une URL canonique, vous donnez une indication sur la version d’une page à afficher sur les SERP.

Pensez-y de la manière suivante : sur laquelle auriez-vous le plus tendance à cliquer ?

  • https://www.domain.com/page-1/

  • https://www.domain.com/index.php?id=2

La première, très probablement. Utilisez les canonicals pour préciser l’URL que vous souhaitez voir classée par les moteurs de recherche !

Consolidez les signaux de lien sur les pages dupliquées et quasi identiques

Quand vous avez des pages dupliquées ou quasi identiques sur votre site, il y a des chances que les URL individuelles obtiennent des liens à partir de sources extérieures.

Utilisez les URL canoniques pour consolider les signaux de lien provenant de différentes pages sur une seule URL que vous précisez. Cela peut aider votre site à mieux se classer sur les moteurs de recherches, dans la mesure où les signaux dispersés sur plusieurs URL sont dès lors concentrés sur seule page plus forte.

Gérer le contenu syndiqué

Il n’est pas rare que le contenu soit syndiqué sur différents sites web pour le présenter à de nouvelles audiences.

Pour empêcher les pages dupliquées de se classer sur les SERP et s’assurer que c’est le contenu original qui sera classé, vous pouvez utiliser les URL canoniques pour consolider les signaux de ranking.

Empêchez Googlebot d’explorer les pages dupliquées

Lorsque vous travaillez sur un gros site, avec de nombreuses pages, vous pouvez utiliser les URL canoniques pour que Googlebot passe du temps à explorer vos nouvelles pages plutôt que les versions dupliquées de la même, comme celles pour desktop et mobile par exemple.

Cela dit, le budget de crawl n’est pas un problème pour la plupart des sites ; ce n’est le cas que lorsqu’ils ont des centaines de milliers de pages !

Comment implémenter correctement une balise rel=canonical

L’utilisation de la balise rel="canonical" dans l’en-tête de la page est de loin la manière la plus commune de préciser les URL canoniques.

Ajouter des balises et un code HTML peut paraître compliqué si vous n’êtes pas un développeur, mais la majorité des plateformes CMS vous offrent des solutions toutes prêtes. 

Paramétrer une URL canonique sur Magento et Magento 2

Si vous avez une boutique e-commerce sur Magento 1, suivez les étapes suivantes pour préciser les URL canoniques pour les produits et catégories.

Canonicals des pages produits sur Magento 1

Lorsque vous êtes connecté dans votre panneau admin, allez sur Système>Configuration, choisissez l’onglet Catalogue et ouvrez la section Optimisations pour les moteurs de recherche :

Canonical des pages produits sur Magento

Répondez par « oui » à « Utiliser une balise meta de lien canonique pour les produits » (Use Canonical Link Meta Tag For Products).

Canonical des pages produits sur Magento

Souvent vous constaterez que ce champ est déjà paramétré sur « oui », ce qui veut dire que vous n’avez rien à toucher.

Canonicals de catégorie sur Magento 1

Revenez à la section Optimisations pour les moteurs de recherche sur la page Catalogue et trouvez l’option « Utiliser une balise meta de lien canonique pour les catégories » (Use Canonical Link Meta Tag For Categories)

Canonical des pages produits sur Magento

Assurez-vous de bien répondre non afin de pouvoir préciser manuellement l’URL canonique pour les catégories.

Canonical des pages produits sur Magento

Rendez-vous sur la page d’édition de la catégorie que vous voulez canonicaliser, allez sur l’onglet Design personnalisé, puis dans l’encadré Mise à jour du layout personnalisé (Custom Layout Update) et ajoutez le code suivant en insérant votre propre URL.

<reference name="head">
<action method="addLinkRel">
<rel>canonical</rel>
<href>https://www.website.com/page-a/</href>
</action>
</reference>

Canonicals sur Magento 2

Si votre boutique est sur Magento 2, suivez les étapes suivantes pour préciser les URL canoniques sur votre site.

Lorsque vous êtes connecté à votre panneau admin, rendez-vous sur Magasins> Paramètres >Configuration, ouvrez le menu déroulant Catalogue, puis l’onglet Optimisation pour les moteurs de recherche.

Canonical des pages produits sur Magento 2
Crédit image : Amasty.com

Si vous répondez Oui à « Utiliser des balises meta canonical pour les catégories » (Use Canonical Meta Tags For Categories), les pages catégories de votre magasin seront paramétrées pour préciser une URL canonique à toute l’URL catégorie, comme http://www.website.com/categorie/produit.html.

Si vous répondez Oui à « Utiliser des balises meta canonical pour les produits » (Use Canonical Meta Tags For Products), les pages produits de votre magasin seront paramétrées pour préciser une URL canonique à nom-de-domaine/produit-url-cle.

Même si vous incluez le chemin de catégorie dans l’URL pour les produits, cela canonicalisera quand même à nom-de-domaine/produit-url-cle.

Il est recommandé de choisir Oui pour ajouter les canonicals à la fois pour les produits et les catégories.

Paramétrer une URL canonique sur WordPress

Paramétrer des URL canoniques sur WordPress ne saurait être plus simple. En revanche, la manière de les implémenter dépend du plugin WordPress SEO que vous utilisez. 

Nous allons voir comment faire avec deux des plugins les plus populaires : Yoast et RankMath.

Balises Canonical avec Yoast

Si vous utilisez Yoast, rendez-vous sur les options SEO Yoast sur n’importe quel page ou post, et développez l’onglet « Avancé ».

Canonical des pages produits sur Wordpress avec Yoast

Vous tomberez alors sur un champ où vous pourrez préciser l’URL canonique de la page.

Balises canonical avec RankMath

Si vous utilisez RankMath, l’implémentation est similaire. 

Sur n’importe quel page ou post, rendez-vous sur l’onglet « Avancé » de l’encadré RankMath, où vous trouverez une option pour préciser une URL canonique pour la page.

Canonical des pages produits sur Wordpress avec RankMatch

Paramétrer une URL canonique sur Wix

Par défaut, les pages Wix utilisent une balise canonical faisant référence à elle-même.

Si vous devez la changer, allez sur Menus & Pages, déplacez le curseur sur la page qui vous intéresse et cliquez sur l’icône Afficher plus, puis allez sur Options SEO > SEO avancé et « Ajouter une nouvelle balise » sous le titre Balises meta personnalisées.

Canonical des pages produits sur Wix
Crédit image : Wix

Assurez-vous d’entrer toute la balise canonical, et non pas seulement une URL.

Vous pouvez changer votre URL canonical dans ce code :

<link rel="canonical" href="{your-page-url}"/>

Paramétrer une URL canonique sur Shopify

Il existe un certain nombre de problèmes SEO avec les boutiques Shopify, ce qui rend indispensable la compréhension de la cannibalisation — sachant que la plateforme ne permet qu’à une seule page produit d’exister sur plusieurs URL.

Jetez un œil aux directives de Shopify, et vous verrez que, lorsque vous développez un thème Shopify, vous pouvez utiliser l’objet {{ canonical_url }} pour indiquer l’URL canonique de la page actuelle.

Mais soyons clair, vous ne pouvez pas préciser les URL canoniques personnalisées de la même manière que sur Magento, WordPress, ou Wix.

Le problème est que, par défaut, Shopify crée des URL produits qui se mettent à jour dynamiquement de sorte à contenir leur collection d’origine.

Vous pouvez trouver un même produit sur les URL suivantes :

  • https://www.website.com/produits/produit-a

  • https://www.website.com/collection-affiche/produits/produit-a

  • https://www.website.com/collection-ventes/produits/produit-a

Elles retournent toutes la même page produit, simplement sur des URL différentes, et bien que les balises canonical de Shopify donnent une solution pour indiquer l’URL canonique correcte, vous trouverez des liens internes pointant vers les versions dupliquées, ce qui ajoute à la confusion.

Vous pouvez nettoyer tout cela en suivant les étapes délimitées dans cet excellent guide (en anglais) de Path Interactive.

Allez dans les fichiers .liquid de votre thème et trouvez le code suivant, qui se trouve généralement dans le fichier collection-template.liquid :

{{ product.url | within: collection }}

Changez-le en :

{{ product.url }}

Vous devriez maintenant constater que les balises canonical et les liens internes sont corrects.

Comment implémenter correctement un en-tête HTTP rel="canonical"

Une alternative à l’utilisation des balises canonical consiste à implémenter un en-tête HTTP rel="canonical". C’est l’approche d’implémentation que vous devez adopter pour préciser une URL canonique pour les PDF ou d’autres documents non-HTML.Vous devez être en mesure d’accéder au fichier .htaccess de votre site pour l’implémenter. Vous pouvez alors préciser une URL canonique en utilisant le code suivant :

<Files "file-to-canonicalize.pdf">
Header add Link "< http://www.website.com/canonical-page/>; rel=\"canonical\""
</Files>

Utiliser des redirections 301 pour préciser les URL canoniques

Google affirme que vous pouvez utiliser les redirections 301 pour préciser les URL canoniques. 

Mais si vous utilisez les redirections 301, seule l’URL canonique existera vraiment. Les autres versions dupliquées redirigeront vers elle.

Cela dit, c’est en général la meilleure façon de résoudre les problèmes de contenu dupliqué pour :

  • HTTP et HTTPS

  • Non-WWW et WWW

  • URL avec et sans barre oblique à la fin (trailing slash)

Lorsque vous traitez les pages séparément, vous devez faire plus attention, et les balises canonical sont en général la meilleure solution à adopter, à moins que vous puissiez en toute confiance supprimer et rediriger une page. 

URL canoniques dans les sitemaps

En un mot : faites attention à ne pas inclure d’URL non-canoniques dans les sitemaps, car Google suppose que les URL définies dans un sitemap sont les versions canoniques.

Ce n’est pas une garantie que les URL canoniques sont bien précisées, mais c’est une bonne pratique à considérer pour structurer les sitemaps.

Meilleures pratiques pour gérer ses balises canonical

Implémenter les balises canonical n’est pas nécessairement difficile, et une fois que vous avez compris quelques bonnes pratiques, vous verrez que détecter et résoudre les problèmes de contenu dupliqué est bien plus facile.

Lorsque vous implémentez des URL canoniques, assurez-vous de :

Préciser seulement une URL canonique par page

Vous devez toujours ne préciser qu’une URL canonique par page, sinon elles seront probablement toutes ignorées.

Préciser le bon protocole de domaine 

Si votre site utilise le protocole HTTPS, assurez-vous de le référencer correctement comme votre URL canonique. Référencer le mauvais protocole est une erreur facile à commettre, alors faites en sorte de la détecter rapidement avant qu’elle ne se transforme en problème.

N’avoir que des URL avec barre oblique ou sans barre oblique

Déterminez si oui ou non votre site utilise les barres obliques à la fin des URL, et assurez-vous d’être cohérent sur ce point dans le référencement de vos URL canoniques.

N’avoir que des URL Non-WWW ou WWW 

Les versions non-WWW et WWW d’une URL sont considérées comme des pages dupliquées par les moteurs de recherche. Soyez attentif à préciser la bonne.

Utiliser des URL absolues

Les balises canonical devraient être référencées en utilisant des URL absolues, plutôt que relatives, pour s’assurer qu’elles seront correctement interprétées.

Cela veut dire que vous devriez utiliser :

<link rel="canonical" href="https://www.website.com/page-a/" />

et non pas :

<link rel="canonical" href="/page-a/" />

Utiliser des URL canoniques qui se référencent elles-mêmes si vous ne canonicalisez pas vers une URL différente. 

Même si ce n’est pas une obligation, vous devriez toujours implémenter des URL canoniques se référençant elles-mêmes quand une page n’est pas canonicalisée vers une autre URL. C’est dans ce cas que la balise canonical de la page se référence elle-même.

Erreurs communes à éviter lors de l’implémentation des balises canonical

Il n’est pas rare de commettre une erreur par inadvertance lorsqu’on implémente des balises canonical. En voici quelques-unes parmi les plus répandues :

Canonicalisation vers une redirection 301

Faites attention à ne pas canonicaliser vers une URL qui est ensuite redirigée. La canonicalisation doit plutôt se faire directement vers la page cible de la redirection.

Canonicalisation vers un protocole de domaine incorrect

Si votre site utilise le HTTPS, soyez attentif à ne pas paramétrer accidentellement vos URL canoniques avec HTTP.

Canonicalisation vers du contenu non pertinent

Vous ne devriez pas canonicaliser vos URL vers un contenu qui n’est ni dupliqué ni quasi identique.

On remarque parfois que des spécialistes SEO font passer les signaux de lien via des balises canonical à partir de contenus sans rapport afin d’essayer d’améliorer les classements. Ce n’est pas comme ça que la canonicalisation doit être envisagée, et ce type d’utilisation doit même être évité à tout prix.

Paramétrer plusieurs URL canoniques

Vous ne devez utiliser qu’une seule balise canonical, ou préciser une seule URL canonique pour chaque page ; sinon, il est probable qu’elles soient toutes ignorées.

Faites bien en sorte d’éviter d’inclure accidentellement deux balises canoniques dans le <head> de votre page. En effet cela peut se produire quand on remplace les valeurs par défaut dans certains CMS.

Pagination & canonicalisation déroutantes

Il est indéniable que la pagination, quand elle est mal implémentée, peut générer du contenu dupliqué. Mais la canonicalisation de toutes les URL d’une série vers la première page n’est pas toujours la meilleure solution.

Vous devriez plutôt les canonicaliser vers une page « afficher tous ».

Comment auditer les balises canonical sur votre site (et résoudre les problèmes)

Pour pouvoir détecter n’importe quel problème ayant trait à la canonicalisation, vous devez auditer les balises canonical de votre site.

Pour cela, vous pouvez utiliser l’outil Audit de site de SEMrush. Quand vous lancez le rapport Audit de site pour votre site, vous trouverez un certain nombre de contrôles en lien avec les balises canonical.

Audit de Site SEMrush

Passons-les en revue et voyons comment régler les problèmes.

Pages AMP sans balise canonical 

  • Quand vos pages AMP n’ont pas de balises canonical, l’outil Audit de Site le signale comme un problème.

  • Il est important de ne pas placer de canonicalisation entre les versions AMP et non-AMP de votre page.

  • Vous pouvez résoudre ce problème en ajoutant une balise rel="canonical" dans la section <head> de chaque page AMP.

Pas de redirection ou de canonical vers la page d’accueil HTTPS à partir d’une version HTTP 

Si l’on peut accéder à votre site à la fois sur la version HTTPS et HTTP, vous aurez des problèmes de contenu dupliqué et cela sera signalé dans notre outil Audit de Site.

Vous pouvez résoudre ce problème en redirigeant en 301 une version vers la version correcte ou en ajoutant une balise canonical qui référence la version HTTPS sur les pages HTTP.

Pages avec un lien canonique cassé

Si vos pages ont des liens canoniques cassés, ils ne seront pas considérés comme des URL canoniques. Cette erreur peut signifier que vos liens canoniques pointent vers des pages web non existantes et, par conséquent, compliquent le processus d’exploration et d’indexation de votre contenu.

Si vous trouvez des pages avec des liens canoniques cassés, mettez-les à jour avec les URL canoniques correctes.

Pages avec plusieurs URL canoniques

  • Vous trouverez cette erreur quand il y a plus d’une URL canonique sur une page. 

  • Pour réparer cela, vous devez supprimer les balises dupliquées et n’en laisser qu’une. 

La canonicalisation est un des concepts les plus importants à comprendre pour un spécialiste SEO, et l’utiliser de façon incorrecte peut avoir un impact négatif sur la performance de votre site.

Cela dit, une fois que vous avez compris comment ça marche et à quoi ça sert, mais aussi comment trouver et résoudre les problèmes, vous pourrez être sûr de l’utiliser efficacement et débarrasser votre site des problèmes de contenu dupliqué !

[ create-campaign bg_images="https://static.semrush.com/blog/uploads/media/54/76/5476cf573bc10e6880ca2862c0c8fc4f/website-migration-banner.png" bg_button="-success" header="Évaluez la performance de votre site" text="Créez un projet dans l'outil Audit de site"] 

Share
Author Photo
James is Managing Director of award-winning digital PR and SEO agency, Digitaloft, and has been involved in search marketing since the mid-2000s. He‘s a regular writer on topics including link building, content marketing and ecommerce, having previously contributed to the likes of Search Engine Journal.