18 mars 2021 • SEO

Analyse de logs : Présentation et exemples d’utilisation pour améliorer votre SEO

Analyse de logs : Présentation et exemples d’utilisation pour améliorer votre SEO

En tant que propriétaire d’un site qui cherche à améliorer son SEO, vous allez souvent vous intéresser au contenu de vos pages, à votre maillage interne, au respect des balises Hn ou encore à l’acquisition de backlinks.

Mais saviez-vous qu’il existe d'autres leviers qui vous donneront une vision beaucoup plus profonde et aboutie des performances de votre site ?

En ce sens, l'analyse de logs contient des données et informations clés pour améliorer votre référencement naturel.

Qu’est-ce que les logs ?

Les logs sont présents dans un fichier rattaché au serveur de votre site Internet. Ils comptent de nombreuses informations, directement enregistrées par le serveur qui héberge votre site.

Chaque ressource chargée sur une page (css, image, javascript,...) génère une ligne de log dans le fichier.

Les fichiers logs sont donc composés de milliers de lignes qui s'enrichissent chaque jour avec les différents appels générés au serveur (appelés également “hits”). Ces éléments fournissent d'innombrables informations au propriétaire du site !

Chaque ligne de log répertorie toutes sortes d'informations :

  • Heure et date de la requête (timestamp) ;
  • Adresse IP à partir de laquelle une demande a été envoyée à votre serveur ;
  • URL demandée ;
  • Status code : 200, 301, 404, 500... ;
  • User-agent ;
  • Referrer, fournissant la page précédente visitée (hors Googlebot) ;
  • Weight (poids de la page) ;
  • Temps de réponse ;
  • Protocol HTTP ou HTTPs.

Pourquoi analyser les logs en SEO ?

Vous commencez à comprendre que les logs contiennent de nombreuses informations qui peuvent être utilisées dans le cadre d’une stratégie SEO. John Mueller l’a également confirmé !

L’intérêt principal de cette analyse réside dans la possibilité de reconstituer parfaitement le parcours de Googlebot sur votre site.

Et oui, l’IP affichée dans une ligne de log permet de différencier les robots des moteurs de recherche des visiteurs naturels !

L’analyse de logs sur votre site vous permet donc de collecter des informations sur le passage des robots de Google.

Cette information existe d’ailleurs dans votre Search Console, au niveau de l’onglet “Paramètres” > “Statistiques sur l’exploration”.

exploration-search-console

En revanche, celle-ci ne propose pas des données en direct. Les informations remontées ont quelques jours de retard. Avec l’analyse de logs, c’est en temps réel !

L’analyse de logs va donc vous permettre :

  • De monitorer votre site : Vous bénéficiez en direct d’informations liées à l’exploration de votre site (performances, codes HTTP, poids des pages, volume de crawl...)
  • D’améliorer votre site : Vous en tirer des actions SEO concrètes pour faciliter le passage des robots des moteurs de recherche (correction des erreurs 404 et 301, amélioration du temps de chargement des pages, détection de pièges à robots avec les filtres à facettes ou la pagination,...)
  • De croiser des données : Les logs vont vous donner accès à des données très intéressantes sur votre site mais vous pouvez aller encore beaucoup plus loin en croisant ces informations avec d’autres éléments : Crawler SEO, chiffre d’affaires, profondeur des pages, etc.

Comment fonctionne Googlebot ?

Le crawl budget

Google affecte un certain “temps de crawl”, également appelé “crawl budget” aux différents sites.

Celui-ci va varier en fonction de différents signaux comme la popularité du site, la fraîcheur des contenus, le nombre de pages, etc.

C’est cette notion qui va définir le temps que les robots de Google vont passer sur votre site.

L’infrastructure qui repose derrière cette exploration demande des ressources importantes pour le moteur de recherche. Le crawl des pages représente un certain coût.

En optimisant le parcours de Googlebot sur votre site, vous permettez donc au moteur de recherche de faciliter son parcours mais également de faire des économies !

Crawl budget et gros sites ?

Le “crawl budget” est majoritairement associé aux gros sites. Sur un site d’une centaine de pages, cette notion est négligeable.

Mais attention, il peut arriver que votre site ne soit pas le même que celui vu par Googlebot. Les pièges à robots ou “spider trap” sont notamment l’exemple typique d’un problème pouvant impacter le crawl budget.

Par exemple, une mauvaise configuration des filtres à facette, d’une application externe ou encore d’un moteur de recherche interne peut générer des URLs infinies. Et ce sont ces URLs qui vont piéger les robots.

Le risque étant que les robots vont se focaliser sur ces URLs peu qualitatives et mettre de côté vos URLs intéressantes pour le SEO.

Votre site peut donc faire plusieurs milliers voire millions de pages, sans pour autant que vous le sachiez.

C’est d’ailleurs pour cette raison que par défaut, sur les boutiques WiziShop, les pages sensibles (filtres à facettes, filtres de tri, panier, paginations,...) sont gérées efficacement pour éviter ces problématiques.

Les informations SEO à récupérer avec l’analyse de logs

Ce que Google voit

C’est une des premières informations à analyser avec les logs, étroitement liée à ce que je viens d'énoncer juste au-dessus : Est-ce que Google à la même vision du site que moi ?

En tant que propriétaire, vous connaissez votre catalogue, vos meilleurs produits et vos pages “business” qui vous rapportent du chiffre d’affaires.

vision-site-logs

Présentation Seolyzer

En analysant minutieusement le parcours de Google, vous allez rapidement détecter s’il préfère certaines pages de votre site à d'autres. La fréquence des visites des robots met clairement en avant ses préférences.

Donc est-ce que le moteur de recherche est lui aussi focalisé sur ces pages importantes lors des visites ?

Si vous vous apercevez que la majorité du temps, les robots de Google sont concentrés sur des pages intéressantes pour vos clients (page contact, pagination, filtres,...), il y a fort à parier que vous deviez faire des ajustements !

Vous devez tout mettre en place pour faire en sorte que Google ait la même vision que vous de votre site.

L'objectif de cette analyse est de vérifier qu'il y ait une cohérence entre les pages importantes de votre site pour votre référencement et celles qui sont fréquemment visitées par Google.

Les principales raisons pour lesquelles les robots délaissent certaines parties de votre site sont souvent liées à votre maillage interne ou encore à la profondeur des pages.

Les codes HTTP

L'analyse des logs permet d’identifier les URLs de votre site qui répondent bien en code 200 mais surtout, celles qui affichent des codes d'erreur de type 301, 404 ou encore 500.

Les URLs affichant des familles de code 3xx, 4xx ou 5xx peuvent fréquemment nuire à l’exploration de votre site par les robots des moteurs de recherche mais également à l’expérience utilisateurs.

Avec cette analyse, vous pouvez donc facilement détecter ces codes HTTP et mettre en place des corrections lorsque c’est nécessaire.

La vitesse de chargement

Quoi de plus ennuyeux qu'une page Internet qui se charge lentement ?

D'ailleurs, si tel est le cas sur votre boutique en ligne, il est important de corriger ce problème car c’est un des éléments les plus décourageants pour les visiteurs et pour la conversion.

Une page qui ne s'ouvre pas et voilà que tout votre trafic s'envole vers vos principaux concurrents...

D’autant plus que si votre site est très lent, cela ralentit le passage des robots de Google sur votre site. Ils vont donc explorer moins d’URLs.

Par exemple, si chaque page de votre site se charge en 4 secondes et que vous arrivez à baisser cet indicateur à 2 secondes, les robots visiteront 2 fois plus d’URLs !

Les pages orphelines

L’analyse de logs peut également se coupler à d’autres données, comme le crawl d’un outil SEO, pour en ressortir de nombreuses analyses.

C’est par exemple le cas avec les pages orphelines.

Les pages orphelines sont des pages de votre site qui sont en ligne et connues par Google mais qui ne sont pas rattachées à votre site. Aucun lien interne ne pointe vers elles.

Dans ce cas, elles apparaissent dans les données des logs car elles sont visitées par le moteur de recherche, mais ne sont pas détectées lors d’un crawl de votre site.

Il peut même arriver que ces pages génèrent du trafic et sont assez bien positionnées ! Alors imaginez si vous les intégrez à nouveau dans votre maillage interne ?

Plusieurs raisons peuvent expliquer la présence de pages orphelines. Par exemple, il se peut que ce soient d'anciennes pages, autrefois rattachées à votre site, qui ont aujourd'hui perdu leurs liens. Cela peut être le cas pour un produit en rupture de stock que vous ne listez plus dans vos catégories de produits mais qui est toujours en ligne.

Avec des analyses croisées, vous pouvez ressortir de nombreuses informations. C’est à vous d’être imaginatif !

Cette liste est, bien entendu, non exhaustive. Vous pouvez encore découvrir de nombreuses optimisations SEO pour votre site. Le fichier de logs est une véritable mine d’or, mais encore faut-il savoir l’utiliser...

C’est pour cette raison qu’il existe un outil dédié et français qui a pour objectif de rendre l’analyse de logs accessible à tous : Seolyzer. Et devinez quoi ? Nous avons officialisé notre partenariat avec cet outil il y a quelques jours sur notre plateforme e-commerce !


Découvrir l’article complet sur l’outil Seolyzer.


WiziShop est aujourd’hui la seule solution SaaS à rendre possible l’analyse de logs.

Et pour profiter de cette nouveauté, vous bénéficiez d’une réduction de 10% avec le code “wizi” sur votre abonnement mensuel Seolyzer.

Découvrez dès maintenant la puissance de l’analyse de logs sur WiziShop

Merci de remplir tous les champs et de valider le captcha pour envoyer un commentaire.
Votre commentaire a été enregistré avec succés. Merci !
Chargement

Créons ensemble votre boutique en ligne WiziShop

Quel est votre prénom ?

Vous allez bénéficier de 15 jours de test gratuit

Enchanté ...

Quel est votre nom ?

Retour

Comment souhaitez-vous
nommer votre boutique ?

Retour

..., merci de définir
votre mot de passe

Le mot de passe doit contenir 6 caractères minimum.

Retour

..., dîtes-moi tout.
Quelle est votre couleur préférée ?

Retour

, quels types de produits allez-vous vendre ?

Retour