Les erreurs hreflang les plus communes [Infographie]

Elena Terenteva

févr. 15, 20178 min de lecture
Les erreurs hreflang les plus communes [Infographie]

Les erreurs de SEO technique peuvent provoquer non seulement une mauvaise expérience utilisateur pour votre site, mais finir par nuire également à votre positionnement, à votre visibilité en ligne et à votre trafic. Pour ce qui est du SEO international, on sait en particulier que les erreurs d’intégration hreflang peuvent causer d’immenses dégâts. Nous aimerions vous le démontrer avec notre nouvelle recherche sur les erreurs d’intégration hreflang les plus communes.

Les résultats de cette recherche étaient attendus, pourtant ils nous ont aussi beaucoup surpris. Laissez-moi vous expliquer.

Si vous avez déjà eu affaire aux hreflangs, vous savez à quel point sont nombreux les détails à prendre en compte et les pages qui ont besoin d’être analysées. Au cours de notre recherche, nous avons découvert que le site multilingue moyen a environ 7 versions langue. Nous parlons donc de sites qui ont un nombre important de pages.

Naturellement, nous nous attendions à ce que la fréquence des erreurs soit grande. Mais nous étions loin de prévoir que le nombre d’erreurs hreflang soit aussi énorme !

L’année dernière, l’équipe SEMrush a réalisé une recherche sur les problèmes de SEO on site les plus communs, ce qui nous a entraînés dans un immense débat : « Le nombre de fois où je détecte telle ou telle petite erreur sur mon site est-il important ? Par exemple, un attribut ALT manquant qui n’a rien à voir avec mon positionnement ? » Alors oui, les balises ALT manquantes, ça peut être pardonné, mais les erreurs hreflang, même toutes petites, ne peuvent pas l’être.

Votre but est de réduire votre taux de rebond et d’améliorer vos conversions en vous assurant que votre audience cible arrive sur la version de votre page la mieux adaptée. Néanmoins, sans une bonne intégration hreflang, vous serez incapable d’indiquer clairement à Google quelle page indexer et afficher pour une région particulière. Ces facteurs ont un impact direct sur votre visibilité et votre trafic dans la région.

Il est vraiment étonnant de voir que le pourcentage de sites web avec le problème d’intégration hreflang le plus simple – mauvais code pays dans une valeur hreflang – est le même que celui des sites qui ont des balises ALT manquantes sur au moins une page ! Mais les conséquences de ces erreurs sont complètement différentes.

Nous espérons donc que cette recherche attirera votre attention sur les problèmes d’intégration hreflang et vous aidera à les comprendre et à estimer leur danger potentiel. Par ailleurs, nous aimerions vous suggérer les erreurs de votre site qui devraient être résolues en premier.

Comment avons-nous rassemblé toutes ces données ?

Nous avons analysé 20 000 sites ayant des versions langue multiples en utilisant l’outil SEMrush Site Audit : un puissant auditeur de site qui vérifie les sites selon environ 50 paramètres. L’outil SEMrush Site Audit offre 13 vérifications pour l’intégration hreflang. Il a été développé sur la base des normes Google. Ci-dessous, vous pouvez voir le pourcentage de sites avec des erreurs et des problèmes hreflang détectés sur au moins une page.

1. Conflits hreflang dans le code source d’une page

Dans cette section, nous avons rassemblé les problèmes d’intégration hreflang liés aux conflits dans le code source d’une page. Elles sont difficiles à détecter manuellement, puisque, pour les identifier, la totalité du code page doit être examinée, et non pas une seule ligne du code ou de la valeur hreflang. Nous avons détecté ces problèmes sur 58 % de tous les sites analysés.

58 % des sites web multilingues connaissent des conflits hreflang dans un code source de page

Pas de balise hreflang auto-référencement

C’est le problème le plus commun dans cette section. Nous avons découvert que si un site a un conflit dans le code source d’une page, dans 96 % des cas, la page ne contient pas de hreflang auto-référencement dans son ensemble d’attributs hreflang. Ça veut dire que ces attributs peuvent être ignorés ou mal interprétés.

Pour réparer cette erreur, assurez-vous d’inclure l’URL de page et le code langue dans votre ensemble d’attributs hreflang.

Balises hreflang et rel=canonical en conflit

Quand vous utilisez les balises canonical sur une page web avec les attributs hreflang, vous devez vous assurer de spécifier une balise canonical auto-référencement.

Plus d’une URL est spécifiée pour la même valeur hreflang

Si plus d’une URL est spécifiée pour la même langue et le même pays, Googlebot les ignorera toutes, parce qu’il n’y a pas de message clair indiquant la page qui doit être indexée pour cette version langue.

Pour réparer cette erreur, supprimez toutes les URLs hreflang qui posent problème et assurez-vous de n’avoir qu’une URL spécifiée pour une langue et un pays particuliers dans votre attribut hreflang.

2. Problèmes avec des liens hreflang incorrects

Le second groupe d’erreurs est lié aux liens hreflang incorrects. Vous devez indiquer à Google la bonne direction pour indexer toutes vos pages. Si le hreflang pointe vers une page qui n’existe pas (status code HTTP 4xx) ou qui est redirigée, ou bien si vous utilisez une URL relative à la place d’une absolue, ces pages peuvent être mal indexées, ou pas indexées du tout.

37 % des sites web multilingues ont des problèmes avec des liens hreflang incorrects

Le lien hreflang pointe vers une page qui est redirigée

Si votre lien hreflang pointe vers une page qui est redirigée, la nouvelle page peut ne pas être indexée ou même ne pas apparaître dans les résultats de recherche.

Lien hreflang cassé

Si votre lien hreflang pointe vers une URL qui retourne un status code HTTP 4xx ou 5xx, il sera évidemment ignoré par les moteurs de recherche.

Liens relatifs

Les URLs relatives peuvent être mal interprétées par Googlebot, et peuvent donc ne pas être indexées.

Essayez de les éviter et donnez aux crawlers le bon chemin.

3. Hreflangs potentiellement manquants

Sur un site multilingue, il est très facile d’oublier de spécifier la langue pour certaines pages.

Nous avons remarqué qu’environ 32 % des sites web ont différents ensembles de langues pour différentes pages. Nous comprenons que certains hreflangs ne soient volontairement pas spécifiés sur vos pages, mais ce n’est pas vrai pour tous les cas de ces 32 %.

Si vous voulez vous assurer que toutes vos pages ont les hreflangs qui conviennent, vous devez toutes les vérifier manuellement. Heureusement, le rapport SEO International de SEMrush permet de passer l’ensemble de votre site en revue en un clin d’œil.

4. Inadéquation de langue hreflang

Quand vous spécifiez une langue de page, il est facile de faire une erreur typographique ou d’utiliser un mauvais code langue, donnant ainsi à Google un mauvais signal. Par exemple, si vous utilisez « fi » au lieu de « fr », Googlebot pensera que cette page (écrite en français) doit être affichée pour les utilisateurs qui parlent finnois.

Pendant la recherche, nous avons vu que pour 21 % de toutes les langues de page des sites analysés, la valeur est différente de la langue détectée sur la page (d’une page au moins).

5. Problèmes avec les valeurs hreflang

Les valeurs Hreflang semblent constituer la partie la plus simple. Tout ce que vous avez à faire, c’est d’utiliser le format ISO 639-1 pour le code langue et le format ISO 3166-1 Alpha 2 pour le code pays. Mais des erreurs peuvent être facilement commises par accident, même si vous vous y connaissez en intégration hreflang. Personne n’est à l’abri d’une coquille. Vous pouvez utiliser l’outil de génération de balises hreflang de Aleyda Solis pour éviter toute erreur.

Ces codes sont très divers, nous avons donc décidé de les séparer en cinq catégories différentes.

Des problèmes avec les valeurs hreflang apparaissent sur 15 % des sites multilingues

Code langue inconnu

Le code langue dans votre attribut hreflang doit être dans le format ISO 639-1. Sinon, Google ignorera votre attribut hreflang. Les termes abrégés auxquels nous sommes habitués dans la vie de tous les jours ne fonctionnent pas ici. Par exemple, « eng » dans une valeur hreflang serait une erreur, c’est « en » qui doit être utilisé à la place.

Code pays inconnu

Il y a un autre format pour le code pays dans l’attribut hreflang : ISO 3166-1 Alpha 2. C’est la même chose : les abréviations familières ne marchent dans les hreflangs. « UK » pour les Royaum-Uni ? Non, le code hreflang correcte est « GB » (pour Grande-Bretagne). Donc, si vous n’êtes pas sûr du code à utiliser, il est préférable de vérifier deux fois.

Utilisation des tirets bas

Utiliser des tirets bas pour séparer les valeurs de la langue et du pays dans un attribut hreflang n’est pas correct. Les développeurs et les webmasters utilisent beaucoup les tirets bas, mais ce sont les traits d’union qui devraient être utilisés à la place.

Seul le code pays est utilisé

Selon les normes de Google, quand on utilise un code pays, on doit toujours fournir aussi un code langue correct. Le code pays tout seul n’est pas valide.

Ordre des valeurs hreflang non valide

Nous remarquons aussi parfois que les valeurs dans l’attribut hreflang sont spécifiées dans l’ordre inverse. Un code langue doit toujours précéder un code pays. Ce n’est pas toujours une coquille, ça peut provenir d’une mauvaise compréhension des exigences de base de Google. Heureusement, cela arrive très peu.

Conclusion

Comme vous pouvez le voir, la majorité des erreurs hreflang ont des conséquences graves : elles peuvent conduire les moteurs de recherche dans une impasse, et donc les dérouter en empêchant des pages et même des ensembles d’URLs d’être indexés. Nous espérons que ces données vous aideront à améliorer votre SEO international et à vous empêcher de commettre de nouvelles erreurs dans le futur. Faites en sorte que votre site reste en bonne santé et n’oubliez pas d’effectuer un audit de site !

Nous aimerions beaucoup entendre vos commentaires sur le genre d’erreurs d’intégration hreflang auquel vous êtes le plus souvent confronté ! Lesquels vous causent le plus de difficultés ? N’hésitez pas à partager votre expérience !

Partager
Author Photo
Elena Terenteva, Product Marketing Manager at Semrush. Elena has eight years public relations and journalism experience, working as a broadcasting journalist, PR/Content manager for IT and finance companies. Bookworm, poker player, good swimmer.