Pourquoi quelques pages seulement de mon site web sont-elles explorées ?
Si vous avez remarqué que seules 4 à 6 pages de votre site web sont explorées (votre page d'accueil, les URL des sitemaps et le fichier robots.txt), c'est très probablement parce que notre robot n'a pas pu trouver de liens internes sortants sur votre page d'accueil. Vous trouverez ci-dessous les raisons possibles de ce problème.
Il se peut qu'il n'y ait pas de liens internes sortants sur la page principale ou qu'ils soient en JavaScript. Notre robot ne peut pas analyser le contenu JavaScript, donc si votre page d'accueil contient des liens vers le reste de votre site cachés dans des éléments JavaScript, nous ne pourrons pas les lire et explorer ces pages.
Bien que nous ne puissions pas explorer le contenu JavaScript, nous pouvons explorer le HTML d'une page contenant des éléments JS, et nous pouvons examiner les paramètres de vos fichiers JS et CSS avec nos contrôles de performance.
Dans les deux cas, il existe un moyen de s'assurer que notre robot explorera vos pages. Pour cela, vous devez changer la source d'exploration de "Site web" à "Sitemap" ou "URL du fichier" dans les paramètres de votre campagne :
"Site web" est la source par défaut. Cela signifie que nous allons parcourir votre site web en utilisant un algorithme de parcours en largeur (ou BFS, pour Breadth-First Search en anglais) et naviguer à travers les liens que nous voyons dans le code de votre page, en commençant par la page d'accueil.
Si vous choisissez l'une des autres options, nous explorerons les liens qui se trouvent dans le sitemap ou dans le fichier que vous téléchargez.
Notre robot d'exploration a pu être bloqué sur certaines pages dans le fichier robots.txt du site ou par des balises noindex/nofollow. Vous pouvez vérifier si c'est le cas dans votre rapport Pages explorées :
Vous pouvez examiner votre fichier Robots.txt à la recherche de toute commande disallow qui empêcherait les robots d'exploration comme le nôtre d'accéder à votre site web.
Si vous voyez le code suivant sur la page principale d'un site web, il nous indique que nous ne sommes pas autorisés à indexer/suivre des liens sur ce site et que notre accès est bloqué. Ou encore, une page contenant "nofollow" ou "none" entraînera une erreur d'exploration.
<meta name="robots" content="noindex, nofollow">
Vous trouverez plus d'informations sur ces erreurs dans notre article de dépannage.
Audit de site est équipé actuellement pour analyser les pages d'accueil dont la taille ne dépasse pas 4 Mo.
La limite pour les autres pages de votre site web est de 2 Mo. Dans le cas où une page a une taille HTML trop importante, vous verrez l'erreur suivante :
- What Issues Can Site Audit Identify?
- How many pages can I crawl in a Site Audit?
- Combien de temps faut-il pour explorer un site web ? Il semble que mon audit soit bloqué.
- How do I audit a subdomain?
- Can I manage the automatic Site Audit re-run schedule?
- Can I set up a custom re-crawl schedule?
- How is Site Health Score calculated in the Site Audit tool?
- How Does Site Audit Select Pages to Analyze for Core Web Vitals?
- How do you collect data to measure Core Web Vitals in Site Audit?
- Why is there a difference between GSC and Semrush Core Web Vitals data?
- Pourquoi quelques pages seulement de mon site web sont-elles explorées ?
- Pourquoi des pages actives de mon site web apparaissent-elles comme cassées ?
- Why can’t I find URLs from the Audit report on my website?
- Why does Semrush say I have duplicate content?
- Why does Semrush say I have an incorrect certificate?
- What are unoptimized anchors and how does Site Audit identify them?
- What do the Structured Data Markup Items in Site Audit Mean?
- Can I stop a current Site Audit crawl?
- How to Disable JS Rendering and Inspect a Page
- Configurer Audit de site
- Dépannage pour Audit de site
- Site Audit Overview Report
- Site Audit Thematic Reports
- Reviewing Your Site Audit Issues
- Site Audit Crawled Pages Report
- Site Audit Statistics
- Compare Crawls and Progress
- Exporting Site Audit Results
- Comment optimiser la vitesse d'exploration dans Audit de site ?
- Comment intégrer Zapier à Audit de site
- JS Impact Report