Vous avez certainement remarqué que le plugin Yoast SEO a supprimé une option importante qui vous permet d’empêcher l’indexation des pages de pagination et d’archives pour éviter le problème du contenu dupliqué. Yoast a annoncé sur un article que Google reconnait bien ces pages de pagination et ne va pas les indexer; ce qui est tout à fait faux , car on a remarqué des centaines de page indexées.
Dans cet article nous allons vous montrer comment désindexer les sous-pages de pagination et d’archive.
Plugin Yoast SEO et options NoIndex
Yoast est un plugin WordPress très populaire utilisé par plus de 5 millions de sites Web. Je me suis alarmé car après avoir quitté un autre plugin, mon nombre de pages indexées par Google a simplement doublé sans raison évidente jusqu’à ce que j’ai enquêté plus loin.
Vous pouvez vérifier le nombre de pages indexées dans google en recherchant site: domain.com . Donc, comme vous le voyez, nous avons des centaines de sous-pages d’archives indexées dans Google. Ce sont toutes des pages avec des /page/URL.
L’ explication qu’ils donnent sur la page d’assistance est que Google est devenu intelligent au fil des ans dans la reconnaissance des balises previous et next , qui signifient la pagination, et donc, ils comprennent très bien l’architecture du site …
Le fait de ne pas indexer toutes ces pages entraîne une diminution du nombre d’explorations, ce qui entraîne par la suite une diminution du nombre d’explorations pour les articles plus anciens, ce qui n’est pas une bonne idée sur la plupart des sites. »
Comment mettre les sous-pages en Noindex
Mais je ne veux pas que Google indexe des milliers de pages à partir de balises (tags) et de catégories, car cela peut entraîner des doublons de contenu en double.
Voici donc le code que j’ai ajouté au fichier functions.php de mon thème WordPress, pour bloquer toutes les sous-pages de pagination et d’archive d’être indexées.
add_filter("wpseo_robots", function($robots) { if (is_paged()) { return 'noindex,follow'; } else { return $robots; } });
Ce que fait ce code, c’est qu’il affichera les balises meta noindex sur tout le contenu paginé ( is_page ) de google. Il ajoutera une balise meta robots dans la partiedu code HTML comme ceci.
<meta name="robots" content="noindex, follow>
Tous les liens avec /page/ dans l’URL, vont avoir cette meta tag.
Option 2 – Le code suivant ajoutera noindex aux sous-pages des catégories et des balises, tout en épargnant les sous-pages des pages d’index.
add_filter("wpseo_robots", function($robots) { if (is_paged() && is_archive()) { return 'noindex,follow'; } else { return $robots; } });
Très important – Une fois que vous l’avez activé, vous pouvez vérifier le code source HTML de toutes ces pages et voir que le code s’affiche correctement. Au fur et à mesure que Googlebot réexplore vos pages et lit ces balises, Google les supprimera de l’index au cours des prochaines semaines.
Avertissement : faites-le à vos risques , car cela supprimera éventuellement des milliers de pages indexées de l’index Google et pourrait nuire à votre classement dans les moteurs de recherche et au trafic du site. Consultez donc un expert SEO avant d’implémenter ce code.
Laisser un commentaire