Le sitemap est un outil important pour faire découvrir votre site aux moteurs de recherche. Vous pouvez également ajouter un sitemap à la Search Console de Google pour améliorer l’indexation de votre site.
En matière de référencement, il est essentiel de disposer d’un plan de site pour que toutes vos pages soient indexées, pour démontrer la valeur de ces pages et pour qu’elles soient visitées régulièrement. Si vos pages sont supprimées, même brièvement, des résultats de recherche, vous risquez de perdre des rangs (in fine du trafic) et cela peut prendre beaucoup de temps pour les regagner. Les sitemaps sont un excellent moyen de s’assurer que le statut de votre index est stable.
Nous avons donc mis au point un guide simple sur la façon d’ajouter un plan de site (sitemap) dans Google Search Console.
Qu’est-ce que la Search Console, et à quoi sert-elle ?
Search Console s’appelait auparavant Webmaster Tools, mais a depuis été rebaptisé. Il s’agit d’un outil gratuit qui permet aux propriétaires d’entreprises, aux spécialistes du marketing et aux webmasters de comprendre comment leur site apparaît dans l’index de recherche de Google, et qui leur fournit des ressources pour maintenir un site sain et résoudre les problèmes dès qu’ils apparaissent. Il permet également à Google d’émettre des avertissements sur d’éventuels problèmes ou de notifier les propriétaires de sites en cas de pénalités.
Il existe également un espace spécialement imaginé pour gérer les sitemaps (plan de site) dans la Google Search Console.
Qu’est-ce qu’un sitemap exactement ?
Un plan de site ou aussi appelé sitemap, est un fichier que vous placez dans votre domaine et qui contient des informations sur les pages, les vidéos et les autres fichiers de votre site, ainsi que sur les relations entre eux. Google peut lire ce fichier et l’utiliser comme un répertoire rapide et facile pour trouver et explorer les pages de votre site. Il peut également indiquer à Google : la date de la dernière mise à jour de la page, la fréquence de modification de la page et toute version linguistique alternative d’une page. Il s’agit d’un élément essentiel du fonctionnement de l’exploration et de l’indexation du Googlebot. Googlebot s’appuie sur des liens hypertextes pour passer d’une page à l’autre, et un plan du site est un moyen de lui fournir une liste simple et claire de chacun de ces liens.
Il s’agit d’une partie importante de l’optimisation des moteurs de recherche, car pour améliorer le classement et augmenter le trafic de recherche, il faut d’abord être indexé. À mesure que les entreprises et les sites Web en ligne élaborent une stratégie de référencement, il est essentiel de s’assurer que votre site (et tous vos produits) est en mesure d’apparaître dans les recherches.
Sans sitemap, il est possible que votre référencement soit très peu performant.
Est-il nécessaire d’ajouter un sitemap à Search Console ?
Techniquement, non. Pour que votre site Internet soit référencé sur Google, il est possible de ne rien faire et de laisser Google trouver et découvrir votre site naturellement. Pour les sites de petite ou moyenne taille, cela fonctionnera (mais il faut avoir conscience que ce sera plus lent). Dans ce cas, un sitemap n’est peut-être même pas nécessaire.
Pour les sites plus importants, vous pouvez avoir besoin d’un sitemap si vous voulez éviter une indexation peu fiable, que vos pages soient retirées de l’index de Google ou que des pages profondes (celles qui sont en bout de queu de l’arborescence) ne soient pas indexées du tout.
Si les pages de votre site sont reliées entre elles et peuvent être consultées à partir d’autres parties du site, Google peut généralement découvrir la majeure partie de votre site. Mais un plan de site peut améliorer l’exploration et réduire les ressources du serveur.
Vous pouvez consulter le guide d’aide de la Search Console de Google pour savoir dans quels cas il est utile de soumettre un plan de site :
- Votre site est très volumineux. Plus votre site est volumineux, plus il est probable que Googlebot passe à côté de certaines pages, en particulier pour les sites volumineux tels que les sites e-commerce ou les marketplace.
- Votre site comporte de nombreuses pages de blog, de pages isolées ou de pages qui ne sont pas reliées entre elles.
- Votre site est nouveau et n’a pas beaucoup ou pas du tout de liens retour (backlinks). Étant donné que Googlebot s’appuie sur des liens pour découvrir des pages, il utilise aussi généralement des liens provenant d’autres domaines pour arriver jusqu’à votre site. Si d’autres sites n’ont pas encore commencé à créer des liens vers vous, votre site mettra plus de temps à être indexé.
- Votre site contient beaucoup de contenu multimédia (vidéos, images, etc.) ou apparaît dans Google Actualités. Dans certains cas, Google peut utiliser les sitemaps pour obtenir un contexte supplémentaire.
Selon Google, un petit site est défini comme étant d’environ 500 pages. Si votre site est plus petit que cela (ou même plus grand), vous pouvez faire une évaluation approximative du nombre de pages indexées en suivant quelques étapes.
Tout d’abord, vous pouvez effectuer une recherche « site: » sur votre domaine dans Google. Cela vous donnera une idée approximative de la part de votre site qui est déjà indexée par Google. La requête « site : » vous permet d’obtenir des résultats de recherche pour votre site uniquement et Google vous dira combien de pages apparaissent dans les résultats. N’oubliez pas cependant que Google vous indique le nombre de résultats « approximatif », ce qui n’est pas parfaitement fiable.
En fait, il est possible que vous ayez plusieurs URL non canoniques pour les mêmes pages qui sont indexées, ce qui donne l’impression que vous avez plus de pages indexées qu’en réalité. Si l’opérateur de recherche « site : » donne moins de résultats que prévu, cela signifie probablement que toutes vos pages ne sont pas indexées.
Dans ce cas, prendre les mesures nécessaires pour ajouter un sitemap à la Google Search Console ne peut certainement pas faire de mal.
Si vous avez déjà configuré la Search Console, vous pouvez également vérifier votre indexation en consultant le rapport « Couverture » dans la section « Index« . De là, vous pouvez vérifier les pages « valides » pour voir si elles correspondent à ce que vous attendez, vous pouvez même voir la liste des pages exclues pour vérifier si c’est anormale ou non.
Si vous n’avez pas soumis de sitemap dans Search Console, il se peut que vos pages soient répertoriées comme « indexées, mais non soumises dans le sitemap ». Vous pouvez également voir plusieurs autres messages qui pourraient indiquer que Google n’indexe pas les pages :
- Explorée, actuellement non indexée
- Exclue par la balise « noindex »
- Détectée, actuellement non indexée
- Introuvable (404)
- Soft 404
- Page avec redirection
- Page en double sans URL canonique sélectionnée par l’utilisateur
- Autre page avec balise canonique correcte
Ces messages peuvent être des indications de plusieurs problèmes. Il est possible que Google pense que ces pages ont un contenu limité ou qu’elles n’ont pas assez de valeur pour être indexées. Ou bien que Googlebot a épuisé le “budget crawl” d’exploration de votre site et n’a pas exploré ces URL par crainte de surcharger votre serveur, ou encore Googlebot a d’autres problèmes, comme l’impossibilité d’afficher les pages.
Dans ces cas, vous pouvez effectuer un audit SEO technique de votre site pour voir si d’autres facteurs peuvent causer des problèmes. Mais dans certains cas, ces messages sont bénins et, avec le temps, Google indexera ces pages.
Comment soumettre un sitemap dans Google Search Console ?
Si vous avez décidé que l’ajout d’un sitemap est intéressant pour vous, voici comment procéder, étape par étape.
- Trouvez votre page sitemap sur votre site en ligne. Tous les sites ne placent pas le plan du site au même endroit ou avec la même structure URL. Vous pouvez effectuer une recherche sur Google en tapant “ /sitemap_index.xml “ à la suite de votre URL par exemple « http://www.netstaff.fr/ /sitemap_index.xml ». Vous devriez tomber sur une page similaire :
Dans notre cas, nous utilisons un plugin dédié qui génère un sitemap à envoyer à Google.
Si vous disposez d’une page HTML accessible aux visiteurs du site, cela fonctionne aussi, elle se trouve souvent dans le pied de page. Vous pouvez également vérifier votre fichier robots.txt et voir si le sitemap y est lié.
- Allez dans votre compte Search Console et localisez la bonne propriété (votre site). Il est important que vous vous assuriez que vous trouviez la propriété correspondant au domaine exact pour lequel vous souhaitez soumettre un sitemap (celui qui est accessible aux visiteurs). Pour vérifier ou sélectionner la bonne propriété, il suffit d’aller en haut à gauche de votre search console :
N’oubliez pas que http:// et https:// ne sont pas les mêmes propriétés et que example.com et www.example.com ne sont pas les mêmes non plus.
- Accédez à « Sitemaps » sous « Index » dans le volet de navigation gauche du site.
- Supprimez les anciens sitemaps périmés s’ils ont été soumis. Cliquez sur les trois points empilés dans le coin supérieur droit pour trouver cette option.
- Sous « Ajouter un nouveau sitemap », vous pouvez ajouter l’URL de votre sitemap et cliquer sur « Envoyer ».
REMARQUE : vous ne devez soumettre que la fin de l’URL, et non la portion de domaine. Tant que le fichier sitemap est enregistré sur le domaine qui correspond à votre propriété Search Console.
- Google vérifiera que le sitemap peut être trouvé et lu. Il peut s’écouler un certain temps avant que votre sitemap ne soit exploré.
Suivez ces étapes pour soumettre un sitemap dans la Google Search Console. À ce même endroit, vous pourrez voir si et quand un sitemap a déjà été soumis, quand il a été « lu » pour la dernière fois par Googlebot et combien d’URL Google a découvertes dans votre sitemap. Dans ce cas, « découvert » n’est pas synonyme d’indexé, ni même d’exploration, car il faut parfois plusieurs jours pour que chaque page soit explorée et indexée.
Une fois qu’un sitemap a été soumis, vous n’avez pas besoin de le soumettre à nouveau, sauf si l’URL de localisation du sitemap change.
Comme nous l’avons décrit dans la section ci-dessus, le rapport « Couverture » de Search Console peut vous indiquer l’état de l’indexation des pages de votre sitemap soumises.
Que devez-vous mettre dans votre sitemap ?
Votre sitemap ne doit contenir que les URL de statut 200 de votre site (c’est-à-dire les pages actives). N’incluez pas les URLs redirigées, les pages 404 ou les URLs non statiques telles que les URL générées par une session.
Vous ne devez pas non plus inclure d’URL non canoniques ou plusieurs URLs différentes pour la même page. Si vous n’utilisez pas de balises canoniques sur votre site, il est probable que Google choisisse lui-même les versions canoniques ou qu’il choisisse les URLs de votre sitemap comme canoniques. L’important, cependant, est de vous assurer que vous n’avez qu’une seule URL pour chaque page de votre plan. Si vous avez plusieurs URL pour chaque page, ou si votre sitemap est encombré de redirections et de 404, Google aura du mal à indexer votre site ou votre budget de crawl peut être épuisé trop rapidement.
Assurez-vous que le protocole (http:// ou https://) et le sous-domaine « www » sont inclus s’ils existent sur votre site réel. Les structures d’URL dans votre sitemap doivent correspondre aux pages réelles.
Suivez ces autres directives importantes pour les sitemaps :
- Publiez votre sitemap à la racine du site (en tant qu’enfant du domaine principal) si vous voulez que votre sitemap fonctionne pour l’ensemble du site. Les sitemaps n’affectent que les descendants du répertoire parent.
- Indiquez à Google les versions linguistiques alternatives d’une URL à l’aide des balises hreflang.
- Les fichiers sitemap doivent être codés en UTF-8 et les URLs doivent être échappées de manière appropriée.
Si tous ces termes ne vous parlent pas (ce qui est normal), dites vous qu’il y a des plugins (variable en fonction de votre CMS), qui gèrent à la perfection la création des sitemaps. Parmi les plus connus sous WordPress nous retrouvons Rank Math et Yoast.
Ajout de plusieurs sitemaps à votre console de recherche Google
Si votre site est vaste, il peut être judicieux de diviser votre plan du site en plusieurs plans du site plus petits. Dans ce cas, la meilleure pratique consiste à utiliser un fichier sitemap index, dont le format est très similaire à celui d’un sitemap ordinaire, mais qui inclut d’autres sitemaps. En fait, il s’agit d’un sitemap de sitemaps.
Vous pouvez consulter les conseils de Google sur la façon de construire et de soumettre des sitemaps de cette manière.
De cette façon, il suffit de soumettre le seul fichier d’index à la Search Console pour que les sites soient explorés par Google. Il est possible de soumettre jusqu’à 500 fichiers d’index sitemap pour chaque site dans Search Console.
Comme pour une carte normale, une fois qu’un index sitemap a été soumis, il n’est pas nécessaire de le soumettre à nouveau, sauf si l’URL d’emplacement change.
Voici des articles dans la même thématique qui pourraient vous intéresser :
➡️ La checklist SEO indispensable avant le lancement d’un site !
➡️ Est-ce que le SEO est important pour une entreprise ?
➡️ Pourquoi confier le référencement naturel de son site à une agence SEO ?