Tout ce que vous devez savoir sur le PageRank de Google

Olivier Amici

Jul 16, 202015 min de lecture
Google PageRank

Retournez dix ans en arrière, et vous verrez que le PageRank était la métrique SEO dont tout le monde parlait.

Si vous travaillez dans ce secteur depuis plusieurs années maintenant, vous vous souviendrez sans doute de l'engouement qui a suivi la mise à jour de la barre d'outils PageRank.

Avec un peu de chance, vos récents efforts auraient permis d'augmenter votre score de PageRank, sachant que cela signifierait que Google considère désormais votre site comme faisant davantage autorité qu'auparavant.

Une augmentation de votre score de PageRank permettait de démontrer que votre stratégie SEO (et en particulier votre stratégie de construction de liens) fonctionnait. 

Maintenant que nous sommes en 2020, on fait rarement mention du PageRank.

Mais ce n'est pas parce qu'il n'est plus important. C'est juste que ce n'est plus une métrique dont le public a connaissance. Et quand les référenceurs ne peuvent plus mesurer quelque chose, ils finissent par arrêter d'en parler.

Dans ce guide, nous allons approfondir tout ce que vous devez savoir sur le PageRank de Google, et son importance en 2020.

Qu'est-ce que le PageRank ?

Si vous vous souvenez du PageRank, voici ce qui vous vient probablement le mieux à l'esprit :

img-semblog

Crédit image : Softpedia

C'est la fameuse barre d'outils PageRank de Google.

Elle correspond à tout ce qui nous fait penser au PageRank et à la métrique dont les référenceurs sont obsédés partout dans le monde.

Mais le PageRank ne se limite pas à la barre d'outils.

Le PageRank — un système de classement des pages web

Le PageRank est un système de classement des pages web que les fondateurs de Google, Larry Page et Sergey Brin, ont développé à l'université de Stanford. Et ce qu'il est important de comprendre, c'est que le PageRank est une question de liens.

Plus le PageRank d'un lien est élevé, plus il fait autorité.

Nous pouvons simplifier l'algorithme du PageRank pour le décrire comme un moyen de mesurer l'importance d'une page web en analysant la quantité et la qualité des liens qui y pointent.

Le score de PageRank

Sans surprise peut-être, le PageRank est un algorithme complexe qui attribue un score d'importance à une page sur la toile.

Mais en ce qui concerne le référencement quotidien, le PageRank était une représentation linéaire d'une échelle logarithmique comprise entre 0 et 10 qui s'affichait sur la barre d'outils PageRank.

Un PageRank de 0 correspond généralement à un site Web de faible qualité, alors qu'un score de 10 ne représente que les sites les plus fiables sur Internet.

La clé pour comprendre les scores de PageRank est qu'il utilise une échelle logarithmique. Vous n'êtes pas certain de bien comprendre ?

Une échelle logarithmique est un moyen d'afficher des données numériques sur une très large plage de valeurs de manière compacte. En général, les plus grands nombres dans les données sont des centaines, voire des milliers de fois plus grands que les plus petits.

— Wikipedia

Comme indiqué par Search Engine Watch, « Sa base est estimée à entre 4 et 5. En d'autres termes, en supposant une base de 5, les liens PR2 sont comparables à 5 liens PR1 ; un lien PR6 est comparable à 5 liens PR5, et ainsi de suite. »

Très rapidement, on peut constater qu'un lien avec un PR10 est comparable à des milliers de liens avec un PR1.

La raison pour laquelle les référenceurs sont devenus si obsédés par cette métrique est que le PageRank passe d'une page à l'autre, ce qui signifie qu'un site Web peut gagner de l'autorité en étant lié à un autre dont le score de PageRank est plus élevé.

Tout simplement, le PageRank (qui est transmis entre les sites web par des liens) permet à un site Web d'être mieux classé. L'algorithme repose sur le concept qu'une page est considérée comme importante si d'autres pages importantes y sont liées.

Google utilise encore aujourd'hui le PageRank dans le cadre de son algorithme, mais le brevet original a expiré et, sous sa forme initiale, il n'a pas réellement été utilisé depuis 2006. Celui que nous observons maintenant est finalement beaucoup plus complexe.

Bref historique du PageRank de Google

Le premier brevet PageRank a été déposé le 1er septembre 1998, et il est devenu l'algorithme original que Google a utilisé pour calculer l'importance d'une page web et la classer. 

Pour faire court, Google a été littéralement créé sur la base de l'idée de Sergey Brin selon laquelle les informations sur le Web pouvaient être classées en fonction de la popularité des liens d'une page, que plus les liens pointaient vers une page, plus elle était bien classée.

Et si l'on se penche sur l'article qui a introduit Google, on peut clairement voir qu'il est fait référence au PageRank lorsqu'on explique les fonctionnalités du moteur de recherche :

Le moteur de recherche Google possède deux caractéristiques importantes qui l'aident à produire des résultats de haute précision. Premièrement, il utilise la structure des liens du Web pour calculer un classement de qualité pour chaque page. Ce classement est appelé PageRank et est décrit en détail [Page 98]. Deuxièmement, Google utilise les liens pour améliorer les résultats de recherche.

— The Anatomy of a Large-Scale Hypertextual Web Search Engine - Sergey Brin et Lawrence Page

Le PageRank est littéralement ce qui a rendu Google si unique.

L'article poursuit en expliquant que « Le graphique des citations (liens) du web est une ressource importante restée largement inutilisée dans les moteurs de recherche Web existants. »

Introduction de la barre d'outils Google

En 2000, Google introduisait la barre d'outils dont nous nous souvenons tous, nous permettant de voir le score de PageRank de notre site (et de nos concurrents).

Grâce à cet outil, les référenceurs ont commencé à se focaliser uniquement sur l'augmentation du PageRank comme métrique d'amélioration de leurs classements, en grande partie grâce à une compréhension simplifiée de l'algorithme qui suggérait qu'une page Web ayant le plus grand nombre de liens devait être nécessairement la mieux classée.

L'explication simple de l'approche adoptée par beaucoup au début des années 2000 était qu'ils avaient pour objectif d'obtenir le plus grand nombre de liens possible à partir de pages Web ayant un PageRank aussi élevé que possible.

Ceci, bien sûr, a commencé à induire des manipulations du PageRank, avec des sommes d'argent échangées contre des liens ainsi que contre des fermes de liens, un phénomène dont beaucoup d'entre nous se souviennent. 

Si on accélère un peu, on voit qu'en l’espace de presque 15 ans, Google allait cesser de mettre à jour cette barre d'outils destinée au public en 2014 (la dernière mise à jour confirmée étant en décembre 2013) et qu'il allait la retirer entièrement en 2016.

Bien sûr, cela ne signifie pas que Google a cessé d'utiliser le PageRank dans le cadre de l'algorithme, mais simplement qu'il a cessé d'être une métrique dont le public a connaissance.

Un brevet PageRank mis à jour

Le brevet PageRank original de 1998 a expiré en 2018 et, à la surprise de beaucoup, n'a pas été renouvelé. À cette époque, un ancien employé de Google avait confirmé que l'algorithme original n'avait pas été utilisé depuis 2006.

Mais cela ne signifie pas que le PageRank est mort. Loin de là.

Le brevet original a été remplacé par ce nouveau. Pour bien comprendre les différences avec l'original, nous vous recommandons de lire l'analyse de Bill Slawski ici.

Ce nouveau brevet fait référence aux "sites racine dans les ensembles racine de confiance" et les définit comme "...des pages de haute qualité spécialement sélectionnées qui offrent une bonne connectivité au Web pour les autres pages non racine," avec deux exemples qui sont l'annuaire Google (qui était encore en ligne lorsque le brevet a été déposé) et le New York Times.

« [Les sites racine] doivent être fiables, suffisamment diversifiés pour couvrir un large éventail de domaines d'intérêt public et bien reliés aux autres sites. Ils doivent avoir un grand nombre de liens sortants utiles pour faciliter l'identification d'autres pages utiles et de qualité pour servir de « hubs » sur le web. »

Le nouveau brevet a cherché à donner un score de classement à une page web en fonction de la distance qui la sépare d'un ensemble de racines. Cela dit, ce brevet ne fait pas réellement référence au PageRank (ou ne prétend pas être une version mise à jour de l'algorithme).

La communauté SEO a plutôt compris qu'il servait de modificateur du PageRank en fonction de la proximité de l'ensemble des sites racine.

img-semblog

Crédit image : US9165040B1

Comprendre le fonctionnement du PageRank

Le PageRank est tout simplement fascinant.

C'est quelque chose que chaque référenceur (et créateur de liens) doit comprendre de manière approfondie, ne serait-ce que pour fournir un contexte autour de la raison pour laquelle les liens restent l'un des 3 premiers facteurs de classement de Google.

Mais comment fonctionne le PageRank ?

Lorsque le brevet a été déposé pour la première fois et que l'algorithme initial de Google a été développé, il était basé sur la théorie selon laquelle un lien d'un site Web à un autre constituait un vote de confiance et d'autorité. Par conséquent, plus il y a de liens (votes) qui pointent vers une page, plus il faut lui faire confiance et, par conséquent, lui donner un meilleur classement.

Mais, comme défini dans le document original, « Le PageRank étend cette idée en ne comptant pas les liens de toutes les pages de manière égale, et en normalisant en fonction du nombre de liens sur une page. »

Un lien n'est pas simplement un vote direct. L'autorité d'une page est prise en compte. Un lien provenant d'une page avec un PageRank 6 est en fin de compte un vote qui fait plus autorité qu'un lien provenant d'une page avec un PageRank 2.

Et ce flux de PageRank entre les pages est parfois appelé « jus de lien » par les référenceurs.

Mais regardons les calculs qui sous-tendent le PageRank :

« Nous supposons que la page A a des pages T1...Tn qui y renvoient (c'est-à-dire des citations). Le paramètre d est un facteur d'amortissement qui peut être réglé entre 0 et 1. Nous le définissons habituellement d sur 0,85. Vous trouverez plus de détails sur le d dans la section suivante. De plus, C(A) est défini comme le nombre de liens sortant de la page A. Le PageRank d'une page A est donné comme suit :

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Notez que les PageRanks forment une distribution de probabilité sur les pages web, la somme des PageRanks de toutes les pages Web étant égale à un. »

Cela signifie, en termes plus simples, que le PageRank de la page B est calculé en multipliant le PageRank de la page A par 0,85. C'est ce qu'on appelle le facteur d'amortissement.

Si la Page B est ensuite liée à la Page C, celle-ci reçoit 85 % du PageRank de B (72,25 % de celui de A).

Si une page Web ne comporte pas de liens pointant vers elle, cette page ne commence pas par un PageRank de 0, mais plutôt de 0,15.

Mais les choses se compliquent encore en l'absence de lien externe sur une page.

Comme indiqué dans ce post de 2004 sur Search Engine Roundtable (Table ronde sur les moteurs de recherches) :

Si vous placez un lien de la page A vers la page B, la page A distribue le PageRank à la page B. Le PageRank de la page A ne se dilue pas en créant des liens vers l'extérieur, mais les liens ont une valeur moindre, en termes de valeur du PageRank, lorsqu'il y a plus de liens sur la page A.

— Barry Schwartz

Le PageRank est complexe, et pour comprendre plus en détail son fonctionnement, vous pouvez consulter ce guide détaillé qui vous fournit une introduction au PageRank pour le SEO.

Les facteurs qui influencent ou ont influencé le PageRank et qui comptent encore

Bien sûr, il y a, et il y avait, des facteurs qui influencent le PageRank.

Nous avons déjà abordé le fait que tous les liens ne sont pas égaux en termes de PageRank transmis. Mais quels sont les facteurs qui peuvent (et qui ont déjà) influencé le PageRank ?

Nous nous pencherons plus particulièrement sur les éléments suivants :

  • Texte d'ancrage
  • Probabilité de recevoir un clic
  • Liens internes
  • Liens nofollow

Vous devez comprendre non seulement quels sont ces facteurs d'influence mais aussi la manière dont ils s'appliquent au SEO en 2020, ce que vous devez utiliser et ce que vous devez éviter dans le cadre de la tactique que vous choisissez.

Texte d'ancrage

L'article original de Google faisait référence au lien texte d'ancrage en déclarant que « le texte des liens est traité de manière spéciale dans notre moteur de recherche » et que « les ancres fournissent souvent des descriptions de pages web plus précises que les pages elles-mêmes. »

Aux premiers jours de Google, le texte d'ancrage avait une influence déterminante sur le classement d'une page.

Si vous vouliez vous classer pour le terme « chaussures rouges », plus vous aviez de liens qui utilisaient ce terme comme texte d'ancrage, plus vous pouviez vous classer haut.

La construction de liens est devenue une course entre les référenceurs pour voir qui pourrait obtenir le plus grand nombre possible de liens textuels d'ancrage de correspondance exacte à partir de pages dont le PageRank était élevé.

Cela a fonctionné (pendant un certain temps) mais il s'agissait d'une pure manipulation des Consignes aux webmasters de Google et, plus précisément, d'un schéma de lien.

En avançant vite jusqu'en 2020, l'utilisation excessive de la manipulation du texte d'ancrage entraînera des liens toxiques et potentiellement une pénalité ou un ajustement de l'algorithme.

Probabilité de clic sur un lien

La probabilité de clic sur un lien est un élément clé du PageRank dont il est fait référence dans le Brevet de l'internaute raisonnable de Google.

L'algorithme de départ du PageRank attribuait un poids égal aux liens d'une page. Alors que le brevet de l'internaute raisonnable de 2004 indique que tous les liens ne sont pas aussi susceptibles les uns que les autres de recevoir un clic ; ce qui donne une valeur différente aux différents liens, en fonction de leur potentiel de recevoir un clic.

Citons comme exemple de liens ceux qui sont moins susceptibles de recevoir un clic, comme les liens relatifs aux « conditions d'utilisation » et des bannières publicitaires. Il peut également s'agir des liens dans un pied de page ou se trouvant à un emplacement similaire.

Liens internes

Les liens internes sont une tactique de référencement puissante, et il y a une bonne raison à cela.

Vous pouvez aider le PageRank à circuler sur votre site grâce à une solide structure de liens internes, et une fois que vous avez compris comment cela fonctionne, il est facile de voir pourquoi cette tactique peut avoir un impact aussi perceptible, surtout lorsqu'il s'agit de créer des liens vers des pages qui ne sont pas liées à d'autres sites.

Liens nofollow

Les liens NoFollow empêchent et ont empêché le flux de PageRank jusqu'à ce qu'il devienne récemment un indice.

Historiquement, les référenceurs utilisaient parfois l'attribut NoFollow pour sculpter le flux de PageRank en partant du principe que si une page avait 5 liens externes, le PageRank passerait tous par le lien follow si 4 sur 5 étaient des liens nofollow.

En 2009, cependant, le rapport de Google Matt Cutts a confirmé que cela ne fonctionnerait plus et que le PageRank serait réparti entre les liens même si un attribut NoFollow était présent (mais ne passait que par le lien follow).

En savoir plus sur les liens nofollow, sponsorisés et UGC

Pourquoi Google a-t-il supprimé la barre d'outils PageRank ?

Les référenceurs sont devenus obsédés par le PageRank, qui est rapidement devenu la tactique de référencement la plus utilisée, avant même la création d'un contenu de qualité et d'une solide expérience utilisateur.

Le problème était qu'en partageant publiquement un score de PageRank, il devenait plus facile à manipuler pour les référenceurs, en plus d'influencer des facteurs comme le texte d'ancrage, le nofollow et le modèle du surfeur raisonnable.

Les référenceurs savaient comment utiliser le PageRank pour améliorer le classement de leurs sites web, et ils en ont profité.

Si l'on regarde cela du point de vue de Google, c'est la barre d'outils PageRank qui a posé problème. Sans cela, il n'y avait pas de mesure précise de l'autorité d'une page web (au moins officiellement).

En fin de compte, les référenceurs ont abusé du PageRank et l'ont utilisé pour manipuler les classements, ne laissant à Google aucun autre choix réel que de retirer la barre d'outils, ce qui s'est produit en 2016.

Pourquoi le PageRank est toujours important en 2020 ?

Le PageRank est toujours important en 2020.

Ce n'est pas parce qu'il n'y a plus de barre d'outils qui nous donne le score de PageRank d'une page web qu'il n'est plus utilisé.

En fait, en 2017, Gary Illyes, de Google, a confirmé sur Twitter qu'ils utilisaient toujours le PageRank.

Le PageRank n'a jamais disparu, et comprendre comment il fonctionne ne peut que vous aider à être un meilleur référenceur. Si vous n'avez toujours pas lu l'article original de Google, nous vous recommandons de le faire.

Existe-t-il une métrique de remplacement du PageRank ?

Google n'a jamais officiellement publié une nouvelle version de la barre d'outils PageRank, mais, bien sûr, le PageRank est toujours très utilisé par Google.

Nous ne pouvons plus le mesurer avec un outil.

Un certain nombre d'outils et de plateformes SEO ont mis en place leurs propres métriques d'autorité, et chez SEMrush, il s'agit de l'Authority Score.

img-semblog

L'Authority Score est un score de domaine composé qui évalue la qualité globale d'un site web et vous indique l'impact d'un backlink d'un site sur votre référencement. Il s'appuie sur les éléments suivants :

  • Données de backlinks, y compris les domaines référents, les liens follow et nofollow, et plus encore.
  • Données de recherche organique, y compris le trafic de recherche organique et les positions des mots clés.
  • Données sur le trafic d'un site web (visites mensuelles).

Bien entendu, cette métrique utilise les données de backlink dans le cadre de l'algorithme de notation, mais elle n'est pas destinée à remplacer directement le PageRank.

Et c'est quelque chose que vous devez comprendre.

Les métriques tierces ne sont pas utilisées dans l'algorithme de Google. Elles ne l'ont jamais été et ne le seront jamais, mais elles sont destinés à vous aider à mesurer l'autorité relative d'un site par rapport à ses concurrents et à d'autres sites sur le web.


Souvenez-vous, le PageRank n'est pas mort.

Nous n'avons peut-être plus de barre d'outils, mais cela ne signifie pas que nous n'avons pas besoin de comprendre son fonctionnement et les facteurs qui l'influencent.

À bien des égards, c'est une bonne chose que les référenceurs aient cessé d'être obsédés par cette seule métrique, étant donné qu'elle a contribué à un changement qui indique, en grande partie, que l'industrie ne doit pas compter sur les tactiques de manipulation.

Les référenceurs ont abusé du PageRank, et nous avons perdu la barre d'outils à cause de cela, mais ce n'est pas nécessairement mauvais aux yeux de beaucoup.

Partager
Trouvez des idées de mots clés en quelques secondes

Boostez vos résultats SEO avec une puissante recherche de mots clés

Outil de recherche de mots clés gratuit

Author Photo
En charge du développement marketing pour le marché Français et Francophone, de l’organisation des événements en ligne, des partenariats marketing/éducatifs, de la chaîne YouTube et du blog Semrush France.
More on this