• Fonctionnalités
    • Avantages
    • Shopping Ads
  • Références
    • Témoignages
    • Exemples boutiques
    • Presse
  • Tarifs
    • Nos abonnements
    • Migrez vers WiziShop
  • Ressources
    • Nouveautés
    • Partenaires
    • Aides
    • API
    • Glossaire E-commerce
    • Les conseils de Grégory Beyrouti
  • Blog

SEO

Créer sa boutique Générer du CA Ressources et Formations Témoignages Groupe WiziShop SEO
Wizishop - Black Friday
Black Friday Fever ! Votre boutique en ligne à 1€ HT*

*Jusqu'au lundi 29 novembre, boutique en ligne à 1€ HT / mois, pendant 3 mois, sur un plan WiziShop Standard, Pro ou Advanced, avec engagement 12 mois.

Code Promo : BFF

19 août 2021 • SEO

Balise meta robots noindex : Définition et bonnes pratiques SEO pour gérer l'indexation

Balise meta robots noindex : Définition et bonnes pratiques SEO pour gérer l'indexation

Pour afficher des résultats pertinents aux internautes et éviter que les robots des moteurs de recherche n’affichent des pages sans intérêt pour le SEO, il faut gérer l’indexation de votre site de façon intelligente.

Sur vos boutiques en ligne, il peut vous arriver de ne pas vouloir qu'une ou plusieurs de vos pages soient indexées. Si tel est le cas, il est grand temps d'utiliser la balise noindex ! Cette balise SEO ne vous parle pas encore ? Voici un guide complet pour vous la présenter, vous expliquer comment l’insérer sur vos pages et les différents contenus appropriés pour l’utiliser.

Qu’est-ce que la balise noindex ?

C’est une balise qui informe les moteurs de recherche qu'une page ne doit pas être indexée, ni affichée dans les résultats. Celle-ci se trouve la plupart du temps dans le code source de la page, entre la section <head>.

Pour apporter des consignes supplémentaires aux moteurs de recherche lorsqu'ils arrivent sur ces pages, elle peut être complétée par d’autres attributs comme « follow » ou « nofollow ». Je vous présente ces indications supplémentaires plus tard dans l’article.

Comment ajouter une balise noindex dans sa page ?

L'intégration est assez simple. Celle-ci peut-être incluse directement dans le HTML de la page ou dans l'entête HTTP. C’est à vous de définir celle qui est la plus adaptée pour votre site.

Header de la page

Pour l’intégrer, il est nécessaire d'avoir accès au code source de la page en question.

Une fois dans le code de la page :

  • Cherchez la section <head> de votre page.
  • Intégrez la balise suivante : <meta name="robots" content="noindex">.
noindex-code-source

La balise indiquée ci-dessus possède un format standard. Cependant, il est possible d'y inclure des directives encore plus spécifiques.

Cela peut être le cas si vous souhaitez uniquement empêcher Google d'indexer la page de votre site.

Dans ce cas, il suffit de remplacer le terme « robots » par le nom du robot concerné. Par exemple : <meta name="googlebot" content="DIRECTIVE">.

Notez qu'il est également possible d'inclure plusieurs directives les unes à la suite des autres. Il suffit simplement de les séparer par un point-virgule.

En-tête HTTP

Si vous souhaitez empêcher l'indexation d’une page de votre site, sachez qu'il est également possible de le faire via l’en-tête HTTP. Ce sont les informations qui sont directement envoyées par le serveur.

La balise x-robots-tag s'inclut directement dans l'en-tête HTTP et permet de contrôler l'indexation de la page. Elle se présente sous cette forme :

HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)

Particulièrement utile lorsqu’il s’agit de documents PDF, Powerpoint, Word, etc, qui ne contiennent pas de code HTML, cette balise s'ajoute directement dans l’en-tête HTTP de la page.

Les directives Follow et Nofollow

Comme évoqué précédemment, la balise noindex peut être suivie des directives comme follow et nofollow.

La mention nofollow indique aux robots qu'ils ne doivent pas suivre les liens dans la page. Par conséquent, tous les liens présents sur la page ne seront pas suivis par les robots.

Cette élément s'ajoute de cette façon :

<meta name="robots" content="noindex, nofollow">

A contrario, le follow stipule bien aux robots qu'ils peuvent suivre les liens dans la page.

Cependant, son utilisation est assez controversée étant donné que, par défaut, le moteur de recherche suit les liens présents sur la page si vous ne précisez aucune indication. Cette valeur est donc quelque peu inutile.

Autre information qui remet en cause son efficacité, John Mueller a annoncé lui-même qu’une page en noindex depuis un certain moment peut être traitée comme une erreur 404. Ce qui signifie qu’elle sera beaucoup moins crawlée par les robots, et donc que les liens seront beaucoup moins suivis.

Si vous tenez toutefois à l'utiliser, elle s’affiche sous cette forme :

<meta name="robots" content="noindex, follow">

Il existe également d’autres directives que vous pouvez retrouver directement dans la documentation Google.

Sur quels types de pages ajouter une balise noindex pour optimiser votre SEO ?

Lorsqu’ils arrivent sur un site, les robots crawlers des moteurs de recherche visitent la totalité des pages (sauf indications dans le fichier robots.txt).

Si aucune directive d’indexation n’est stipulée, ils vont indexer la totalité du site.

En e-commerce, il est fréquent d’avoir diverses pages sans intérêt pour le SEO. Entre les filtres, le moteur de recherche interne ou encore les URLs de comptes clients, votre boutique peut rapidement se retrouver avec un très grand nombre de pages de faible qualité.

En rendant la totalité de ces pages indexables, les moteurs de recherche vont les prendre en compte dans l’analyse de votre site. Ce qui peut occasionner des problématiques SEO importantes.

Elles peuvent nuire à la note globale de votre site et donc à votre classement dans les résultats des recherches.

Mieux vaut donc indexer moins de pages et se limiter au contenu réellement pertinent. Dans ce cas, la balise noindex est idéale pour éviter l'indexation de certaines sections de votre site Web.

Moteur de recherche interne

Le moteur de recherche interne d'un site désigne la barre de recherche qui est proposée à l'intérieur du site en question.

Elle sert essentiellement à l'internaute, afin que celui-ci puisse accéder plus facilement aux informations ou aux produits qu'il recherche.

Très utile et fidélisant pour vos visiteurs, il est très utilisé sur les sites e-commerce. Il facilite grandement l'achat des produits et aide le visiteur à trouver une solution à sa requête.

En revanche, en matière de référencement naturel, les pages qui lui sont spécifiques ne présentent aucun intérêt particulier. Mieux vaut donc rendre cette partie du site non indexable.

Contenu pauvre ou dupliqué

Vous le savez probablement : Google recherche en permanence de la qualité à fournir aux internautes.

Par conséquent, le moteur de recherche a horreur du contenu dupliqué et des pages de faible qualité.

Si vous possédez un site de vente en ligne, ces pages au contenu pauvre vont être représentées par les filtres de tri, la navigation à facettes, la page panier, etc.

Concernant le contenu dupliqué, l’ajout du noindex peut être judicieux pour éviter les problématiques SEO, mais je vous conseille plutôt d’utiliser la balise canonical dans ces cas de figure.


Vous pouvez découvrir notre article complet sur ce sujet juste ici : canonical et SEO.


Fichiers PDF

Il peut parfois arriver que votre site intègre également des fichiers PDF.

Ces derniers peuvent présenter un faible intérêt en matière de référencement naturel. Qui plus est, il peut aussi s'agir de contenu protégé par des droits d'auteur ou encore de livres blancs destinés uniquement à vos clients ou prospects.

Dans ce cas, il ne faut pas que ces derniers soient indexés. L'utilisation d'une balise se révèle donc pertinente.

Attention toutefois, puisqu'il s'agit de documents sans HTML, vous ne pouvez ajouter la balise noindex dans la section <head>. Il faudra avoir recours à l’ajout d’une directive dans l’en-tête HTTP de la page.

Connexion et compte client

Enfin, comme il est inutile d'indexer les pages du moteur de recherche interne du site, il n'est pas non plus judicieux de faire apparaître les pages liées aux comptes clients (page de connexion, mot de passe oublié, création de compte,...).

Elles permettent aux utilisateurs réguliers de votre site Internet de se connecter et de retrouver toutes leurs informations internes.

En revanche, les autres internautes n'ont aucun intérêt à y accéder directement. Les pages de connexion et de comptes clients peuvent donc posséder une balise noindex.

Les pages en noindex sur les boutiques WiziShop

Afin de vous en dire un peu plus sur la configuration sur le CMS WiziShop, toutes les typologies de pages présentées ci-dessus possèdent automatiquement une balise noindex.

Afin d’optimiser l’indexation de votre site et donc votre SEO, toutes les pages de faible qualité et sans intérêt pour les robots sont non indexables : URLs de tri, navigation à facettes, comptes clients, moteur de recherche interne, etc.

Si vous le souhaitez, vous avez également la possibilité d’ajouter une balise noindex sur les pages libres. Il vous suffit de faire glisser le curseur vers la gauche.

balise-noindex-pages-wizishop

Différence entre balise noindex et fichier robots.txt ?

Souvent confondue, elle n'a pourtant pas la même fonction que le fichier robots.txt.

La balise noindex fournit des directives aux robots lorsqu'ils consultent une page du site. Elle permet de définir si une page doit être indexée ou non. Les robots peuvent donc quand même la consulter et l’explorer.

Le fichier robots.txt, quant à lui, permet d’indiquer aux robots s'ils ont le droit d'accéder à une page. Il permet de définir si une page ne doit pas être explorée. Les robots ne peuvent donc même pas la consulter.


Je vous invite à consulter notre article complet sur le fichier robots.txt.


L’utilisation d'une balise noindex doit être rigoureusement étudiée. Étant donné que celle-ci indique aux robots qu’une page ne doit pas être indexée, une erreur de directive peut occasionner des problématiques SEO, surtout s’il s’agit de pages stratégiques !

En l’utilisant à bon escient, elle reste particulièrement efficace pour informer les moteurs de recherche des pages sans intérêt et éviter l’ajout dans l’index, pouvant nuire à la santé globale de votre site.

Merci de remplir tous les champs et de valider le captcha pour envoyer un commentaire.
Votre commentaire a été enregistré avec succés. Merci !
Chargement

Créons ensemble votre boutique en ligne WiziShop

Quel est votre prénom ?

Vous allez bénéficier de 15 jours de test gratuit

Enchanté ...

Quel est votre nom ?

Retour

Comment souhaitez-vous
nommer votre boutique ?

Retour

..., merci de définir
votre mot de passe

Le mot de passe doit contenir 6 caractères minimum.

Retour

..., dîtes-moi tout.
Quelle est votre couleur préférée ?

Retour

, quels types de produits allez-vous vendre ?

Retour