Base de connaissances
Les boîtes à outils Semrush
SEO
Audit de site
Configuration d’Audit de site

Configuration d’Audit de site

Pour configurer un Audit de site, vous devez d’abord créer un Projet pour le domaine. Une fois votre nouveau projet créé, sélectionnez le bouton « Configurer » dans la section Audit de site de votre interface de projet.

Si vous rencontrez des problèmes pour exécuter votre Audit de site, veuillez consulter la section Dépannage d’Audit de site pour obtenir de l’aide.

Domaine et limite de pages

Vous serez dirigé vers la première partie de l’assistant de configuration, Domaine et limite de pages. À partir de là, vous pouvez soit choisir de « Lancer l’audit de site », ce qui lancera immédiatement un audit de votre site avec nos paramètres par défaut, soit personnaliser les paramètres de votre audit selon vos préférences. Pas d’inquétude, vous pouvez toujours modifier vos paramètres et relancer votre audit pour explorer une zone plus spécifique de votre site après la configuration initiale.

Portée de l’exploration

Pour explorer un domaine spécifique, un sous-domaine ou un sous-dossier, vous pouvez le saisir dans le champ « Portée d’exploration ». Si vous saisissez un domaine dans ce champ, une case à cocher vous permettra d’explorer tous les sous-domaines de votre domaine.

Par défaut, l’outil analyse le domaine racine, qui inclut tous les sous-domaines et sous-dossiers de votre site. Dans les paramètres d’Audit de site, vous pouvez spécifier votre sous-domaine ou votre sous-dossier comme portée d’exploration et décocher « Explorer tous les sous-domaines » si vous ne souhaitez pas que les autres sous-domaines soient explorés.

Par exemple, si vous voulez auditer uniquement le blog de votre site Web, vous pouvez définir la portée d’exploration sur blog.semrush.com ou semrush.com/blog/  en fonction de s’il est implémenté en tant que sous-domaine ou sous-dossier.

Une fenêtre affichant les paramètres de base d’Audit de site : Portée de l’exploration, Limite de pages vérifiées et Source d’exploration. Une flèche rouge pointe vers la ligne « Afficher les exemples » sous l’option « Portée de l’exploration », qui permet d’afficher des exemples de domaine racines, de sous-domaines et de sous-dossiers.

Un GIF affichant les paramètres de base d’Audit de site. Le nombre de pages et une source d’exploration sont en train d’être sélectionnés, démontrant les options disponibles. Après avoir sélectionné le nombre de pages à explorer et une source d’exploration, un curseur se dirige vers le bouton « Lancer l’Audit de site » en vert.

Limite de pages vérifiées

Sélectionnez ensuite combien de pages vous souhaitez explorer par audit. Vous pouvez saisir un nombre personnalisé en utilisant l’option « Personnalisé ». Choisissez ce nombre judicieusement, en fonction de votre forfait et de la fréquence à laquelle vous prévoyez de réauditer votre site Web.

  • Les utilisateurs Pro peuvent explorer jusqu’à 100 000 pages par mois et 20 000 pages par audit
  • Les utilisateurs Guru peuvent explorer 300 000 pages par mois et 20 000 pages par audit
  • Les utilisateurs Business peuvent explorer jusqu’à 1 million de pages par mois et 100 000 pages par audit

Source d’exploration

La source d’exploration détermine comment le robot d’Audit de site Semrush explore votre site Web et trouve les pages à auditer. En plus de définir la source d’exploration, vous pouvez définir des masques et des paramètres à inclure/exclure de l’audit dans les étapes 3 et 4 de l’assistant de configuration.

Il existe 4 options pour définir la source d’exploration de votre audit : site Web, sitemap sur le site, sitemap par URL et fichier d’URL.

1. L’exploration à partir du site Web permet d’explorer votre site comme le GoogleBot, en utilisant un algorithme de parcours en largeur et en naviguant à travers les liens présents dans le code de votre page, en commençant par la page d’accueil.

Si vous souhaitez explorer les pages les plus importantes d’un site Web, l’exploration à partir du sitemap plutôt qu’à partir du site Web permettra à l’audit d’explorer les pages les plus importantes plutôt que les plus accessibles à partir de la page d’accueil.

2. L’exploration à partir du sitemap sur le site signifie que nous ne parcourons que les URL trouvées dans le sitemap à partir du fichier robots.txt.

3. L’exploration à partir du sitemap par URL est la même que l’exploration à partir des « Sitemaps sur le site », mais cette option vous permet de saisir directement l’URL de votre sitemap.

Étant donné que les moteurs de recherche utilisent les sitemaps pour comprendre quelles pages ils doivent explorer, veillez à toujours garder votre sitemap aussi à jour que possible et l’utiliser comme source d’exploration avec notre outil pour obtenir un audit précis.

Remarque : Audit de site ne peut utiliser qu’une seule URL de sitemap comme source d’exploration à la fois, donc si votre site Web a plusieurs sitemaps, l’option suivante (Exploration à partir d’un fichier d’URL) peut fonctionner comme solution de contournement.

4. L’exploration à partir d’un fichier d’URL vous permet d’auditer un ensemble de pages très spécifiques sur un site Web. Assurez-vous que votre fichier est correctement formaté en .csv ou .txt avec une URL par ligne, et importez-le directement sur Semrush depuis votre ordinateur.

Cette méthode est utile pour analyser des pages spécifiques et préserver votre budget d’exploration. Si vous avez apporté des modifications à seulement un petit nombre de pages sur votre site que vous souhaitez les analyser, vous pouvez utiliser cette méthode pour exécuter un audit spécifique et ne pas gaspiller de budget d’exploration.

Après avoir importé votre fichier, l’assistant vous indiquera combien d’URL ont été détectées afin que vous puissiez vérifier que l’importation a bien fonctionné avant de lancer l’audit.

Fenêtre des paramètres d’Audit de site. Pour la source d’exploration, l’option « URL depuis un fichier » est sélectionnée et mise en évidence. À titre d’exemple, un fichier a été importé. L’outil a fourni un certain nombre d’URL détectées dans le fichier (97 URL). Le nombre est également surligné dans ce menu.

Exploration JavaScript

Si vous utilisez JavaScript sur votre site, vous pouvez activer le rendu JS dans les paramètres de votre campagne Audit de site.

Site Audit settings window with the second tab, Crawler settings, on display. The JS rendering part, which is the last one on this tab, is highlighted to make this option easier to find.

Veuillez noter que cette fonctionnalité est uniquement disponible avec les forfaits Guru et Business.

Audit des AMP

La case à cocher « Explorer d’abord les pages AMP » garantit que votre audit explorera vos pages AMP pour vérifier les problèmes les plus importants liés à l’implémentation des pages AMP. À l’heure actuelle, les contrôles AMP ne sont disponibles qu’avec le forfait Business.

Après avoir configuré ces paramètres, vous pouvez maintenant exécuter votre Audit de site. Cependant, si vous souhaitez retirer des paramètres ou ajouter des masques et définir votre calendrier, utilisez la configuration avancée et les instructions ci-dessous. 

Configuration avancée

Remarque : les quatre étapes suivantes de la configuration sont avancées et facultatives.

Paramètres du robot d’exploration

C’est ici que vous pouvez choisir l’agent utilisateur (user agent) à utiliser pour explorer votre site. Tout d’abord, définissez l’agent utilisateur de votre audit en choisissant entre la version pour mobile ou ordinateur du SiteAuditBot ou du GoogleBot.

Par défaut, nous analysons votre site avec notre robot d’exploration mobile qui permet d’auditer votre site Web de la même manière que le robot d’exploration mobile de Google. Vous pouvez changer et passer au robot d’exploration Semrush Desktop Crawler à tout moment. 

Menu des paramètres d’Audit de site. Dans le deuxième onglet, intitulé « Paramètres du robot d’exploration », la section « User-agent » est mise en évidence. Le User-agent sélectionné est SiteAuditBot-Mobile, l’option par défaut.

Lorsque vous modifiez l’agent utilisateur, vous verrez également le code dans la boîte de dialogue ci-dessous changer. Il s’agit du code de l’agent utilisateur qui peut être utilisé dans une commande URL client si vous voulez tester l’agent utilisateur vous-même.

Options du délai d’exploration

Vous pouvez définir le délai d’exploration sur trois options différentes : Délai minimum entre les pages, Respecter le fichier robots.txt et 1 URL toutes les 2 secondes.

Avec l’option « Délai minimum entre les pages », le robot explorera votre site Web à sa vitesse normale. Par défaut, le SiteAuditBot attendra environ une seconde avant de commencer à explorer une autre page.

Si vous avez un fichier robots.txt sur votre site et que vous y avez spécifié un délai d’exploration, vous pouvez sélectionner l’option « Respecter le fichier robots.txt » afin que le robot d’exploration d’Audit de site respecte le délai indiqué dans ce fichier.

Voici un exemple de délai d’exploration indiqué dans un fichier robots.txt :

Crawl-delay: 20

Si notre robot d’exploration ralentit votre site Web et que le fichier robots.txt ne contient pas de directive de délai d’exploration, vous pouvez demander à Semrush d’explorer 1 URL toutes les 2 secondes. Cela peut entrainer une durée d’audit plus longue, mais cela causera moins de problèmes de vitesse potentiels pour les utilisateurs réels sur votre site Web au cours de l’audit.

Autoriser/interdire les URL

Cette option vous permettra d’explorer ou de bloquer certains sous-dossiers spécifiques d’un site Web. Pour ce faire, vous devrez inclure tout ce qui se trouve dans l’URL après le domaine de premier niveau (TLD). Par exemple, si vous voulez explorer le sous-dossier http://www.exemple.fr/chaussures/hommes/, vous devez saisir : « /chaussures/hommes/ » dans l’encadré « Autoriser » sur la gauche.

L’étape Autoriser/Interdire les URL dans les paramètres d’Audit de site. La capture d’écran montre deux champs pour les masques allow/disallow. Dans le champ « Autoriser » (allow)  l’exemple suivant est ajouté : /shoes/mens/. Une flèche rouge pointe dessus pour indiquer qu’il s’agit du format que les masques doivent avoir pour s’appliquer correctement.

Pour empêcher l’exploration de sous-dossiers spécifiques, vous devriez saisir le chemin de ce sous-dossier dans l’encadré « Interdire ». Par exemple, pour explorer la catégorie des chaussures pour hommes, mais pas la sous-catégorie des chaussures de randonnée pour hommes (https://exemple.fr/chaussures/hommes/chaussures-randonnée/), vous devez saisir /chaussures/hommes/chaussures-randonnée/ dans l’encadré « Interdire ».

Exemple sur la façon de spécifier davantage les paramètres du masque d’autorisation/d’interdiction. Dans le champ « Autoriser » (allow), une flèche rouge pointe vers le même exemple /shoes/mens/. Dans la section « Interdire », une deuxième flèche pointe vers /shoes/mens/hiking-boots pour indiquer que certains sous-dossiers peuvent être exclus malgré les directives de la section « Autoriser » (allow).

Si vous oubliez de saisir le / à la fin de l’URL dans l’encadré « Interdire » (par exemple : /chaussures), alors Semrush ignorera toutes les pages du sous-dossier /chaussures/ ainsi que toutes les URL qui commencent par /chaussures (par exemple, www.exemple.fr/chaussures-hommes). 

Supprimer les paramètres de l’URL

Les paramètres d’URL (également chaînes de requête) sont des éléments d’une URL qui ne s’inscrivent pas dans la structure hiérarchique du chemin. À la place, ils sont ajoutés à la fin de l’URL et donnent des instructions logiques au navigateur Web.

Les paramètres d’URL sont toujours composés d’un ? suivi du nom du paramètre (page, utm_medium, etc) et =.

Par exemple, « ?page=3 » est un simple paramètre d’URL qui pourrait indiquer la 3e page de défilement sur une seule URL.

La 4e étape de la configuration d’Audit de site vous permet de spécifier les paramètres d’URL utilisés par votre site Web afin de les supprimer des URL lors de l’exploration. Cela permet à Semrush d’éviter d’explorer deux fois la même page lors de votre audit. En effet, si un bot voit deux URL, une avec un paramètre et une sans, il peut explorer les deux pages et gaspiller votre budget d’exploration.

L’étape Supprimer les paramètres de l’URL dans la configuration d’Audit de site. Dans les champs des paramètres, plusieurs options d’exemple sont affichées. Une flèche rouge pointe vers celles-ci afin d’attirer l’attention sur le format requis pour que le paramètre d’URL fonctionne correctement.

Par exemple, si vous ajoutez « page » dans cet encadré, toutes les URL qui incluent « page » dans l’extension de l’URL seront ignorées. Il s’agira d’URL avec des valeurs telles que ?page=1, ?page=2, etc. Ainsi la même page ne sera pas explorée deux fois (par exemple, « /chaussures » et « /chaussures/?page=1 » seront considérées comme une seule URL).

Les paramètres d’URL sont généralement utilisés pour gérer les pages, les langues et les sous-catégories. Ces types de paramètres sont utiles pour les sites Web proposant une grande quantité de produits ou d’informations. Un autre type courant de paramètre d’URL est l’UTM, qui est utilisé pour le suivi des clics et du trafic provenant des campagnes marketing.

Si vous avez déjà configuré un projet et souhaitez modifier vos paramètres, vous pouvez le faire en utilisant l’icône Paramètres :

Rapport Vue d’ensemble d’Audit de site avec le menu Paramètres ouvert via l’icône d’engrenage en haut à droite. Le menu des paramètres est un menu déroulant qui peut être défilé vers le bas pour afficher plus d’options de paramètres. La liste de ces options et l’icône en forme d’engrenage sont mises en évidence en rouge, pour les rendre plus faciles à trouver.

Vous utiliserez les mêmes indications que ci-dessus en sélectionnant les options « Masques » et « Paramètres supprimés ».

Contourner les restrictions du site Web

Pour auditer un site Web en pré-production ou protégé par une authentification d’accès standard, l’étape 5 propose deux options :

  1. Ignorer la directive disallow dans le robots.txt et la méta balise robots
  2. Explorer à l’aide de vos identifiants pour accéder aux zones protégées par mot de passe

Si vous souhaitez contourner les directives disallow du fichier robots.txt ou la balise meta,

vous devrez importer le fichier .txt fourni par Semrush dans le dossier principal de votre site Web.

Vous pouvez importer ce fichier de la même façon que pour la vérification GSC, directement dans le dossier principal de votre site Web. Ce processus permet de vérifier que vous êtes bien propriétaire du site Web et nous permet de l’explorer.

L’étape « Contourner les restrictions du site Web des paramètres » d’Audit de site. Chaque widget de cette étape est mis en évidence en rouge. Une flèche rouge sous le numéro 1 pointe vers l’option « Ignorer la directive disallow dans le robots.txt » et la méta balise robots » qui est cochée. La deuxième flèche sous le numéro 2 pointe vers l’option « Explorer à l’aide de vos identifiants ». L’option « Explorer à l’aide de vos identifiants » est également activée, ce qui affiche les champs nom d’utilisateur et mot de passe.

Une fois le fichier importé, vous pouvez lancer Audit de site et consulter les résultats.

Pour explorer avec vos identifiants, il vous suffit de saisir le nom d’utilisateur et le mot de passe que vous utilisez pour accéder à la partie cachée de votre site Web. Notre robot utilisera ensuite vos identifiants de connexion pour accéder aux zones cachées et vous fournir les résultats de l’audit.

Programmation

Enfin, sélectionnez à quelle fréquence vosu souhaitez faire auditer automatiquement votre site Web. Les options sont :

  • Toutes les semaines (choisissez n’importe quel jour de la semaine)
  • Tous les jours
  • Une seule fois

Vous pourrez toujours relancer l’audit à votre convenance au sein du Projet.

Un exemple d’options de programmation sur le dernier onglet du menu de configuration d’Audit de site. Un menu déroulant est ouvert, affichant l’option hebdomadaire pour chaque jour de la semaine, l’option quotidienne et l’option d’exploration unique.

Après avoir indiqué tous les paramètres souhaités, sélectionnez « Lancer l’Audit de site ».

Dépannage

Si une boîte de dialogue indiquant que « l’audit du domaine a échoué » s’affiche, vérifiez que notre robot d’exploration d’Audit de site n’est pas bloqué par votre serveur. Pour garantir une exploration correcte, veuillez suivre les étapes de dépannage d’Audit de site afin de mettre notre robot sur liste blanche. 

Vous pouvez également télécharger le fichier journal généré lorsque l’exploration échoue et le fournir à votre webmaster afin qu’il puisse analyser la situation et essayer de trouver la cause du problème.

Associer Google Analytics et Audit de site

Après avoir terminé les étapes de l’assistant de configuration, vous pourrez associer votre compte Google Analytics afin d’inclure les problèmes liés à vos pages les plus consultées. 

Si vous rencontrez toujours des problèmes lors de l’exécution d’Audit de site, essayez de dépanner Audit de site ou contactez notre service d’assistance qui sera ravie de vous aider.

En savoir plus
En savoir plus
En savoir plus