le 26 Jan, 2016 par Nicolas Devaux

Temps de lecture : 10 minutes

Résumé : Avoir un site internet, c'est bien. Avoir un site internet que peuvent trouver les utilisateurs, c'est mieux, voire indispensable !

Plan de l’article

  1. Que veulent les moteurs de recherche
    1. La mission de Google
  2. Les ingrédients d'un bon référencement
    1. Le contenu textuel
    2. La vitesse de chargement des pages
    3. La popularité
  3. Le crawl des robots d'indexation
    1. Ce que voient les robots
    2. Ce que ne voient pas les robots
  4. Fournir du contenu adéquat et à jour

Pour comprendre les bases du référencement naturel1, il est nécessaire d’appréhender à minima le fonctionnement des moteurs de recherche. Nous prendrons comme exemple le moteur Google, qui, s’il n’est pas l’unique moteur existant, est suffisamment représentatif (de fait la part de marché de Google est écrasante par rapport à ses concurrents).

Mais que veulent les moteurs de recherche ?

Vous êtes-vous déjà posé cette question ? Nous savons tous ce que nous attendons d’un moteur de recherche tel que Google, Bing, etc. Mais savez-vous ce que le moteur de recherche attend de vous ? Il est indispensable de connaître la raison d’être de Google pour mieux comprendre comment lui fournir un contenu adéquat (afin d’être bien référencé).


La mission de Google : satisfaire l’utilisateur

Cela peut vous paraître évident, mais la mission première de Google est de satisfaire ses utilisateurs. Non pas par pure philanthropie - les enjeux financiers sont énormes - mais pour être le meilleur moteur de recherche !

Ainsi, si dans un restaurant vous commandez un plat, vous vous attendez à voir apparaître le plat que vous avez commandé, si possible dans des délais raisonnables. Vous attendez également que le plat que vous avez commandé vous soit servi chaud, avec des produits de qualité. Ainsi vous avez toutes les chances d’être satisfait et de revenir commander dans ce restaurant.

C’est à peu près la même chose pour Google. Lorsque vous saisissez une requête, c’est-à-dire une recherche, vous attendez de lui qu’il vous serve un contenu pertinent satisfaisant vos attentes. Dans certains cas, il vous est par ailleurs impératif d’avoir un contenu récent. Si la réponse est donnée rapidement et que le contenu que vous consultez via le résultat de recherche vous plaît, vous êtes plutôt satisfait, et vous avez toutes les chances de préférer Google à Bing ou Duckduckgo…

L’une des priorités de Google est de s’assurer que les sites vers lesquels il oriente ses utilisateurs vont leur apporter une satisfaction, et ce afin que l’utilisateur fasse confiance à Google comme moteur de recherche !

Ainsi, Google doit-il s’assurer que votre site comporte certains ingrédients indispensables - en réalité plus de 200 ingrédients entrent dans la composition du site idéal tel que vu par les algorithmes de Google - à la satisfaction de ses utilisateurs.

Quels sont donc ces ingrédients ? Il est impossible ici de tous les passer en revue. Toutefois, certains sont plus importants que d’autres pour Google. Nous allons voir lesquels.

burger

Les ingrédients d’un bon référencement


Les ingrédients : le contenu textuel

Le contenu textuel de votre site est un indice fort de qualité pour Google car il est plus probable qu’un utilisateur soit satisfait si le contenu de votre site répond avec pertinence à sa requête.

Mais comment Google juge-t-il la qualité d’un contenu ? Les robots d’indexation (voir plus loin), qui sont des automates informatiques qui parcourent en permanence le web, visitent régulièrement votre site à la recherche d’informations.

Ce petit gourmand aux doux noms de Google Panda, Google Pinguin - selon ses versions successives, raffole de certaines substances contenues dans le code de votre site.

En particulier, il absorbe de façon préférentielle des mots clé qu’il va chercher dans des endroits spécifiques de votre site :

  • La balise <title>
  • Les balises <h1> et <h2> qui sont des balises de titre.
  • L’URL de la page.
  • Les mots clé contenus dans la page (contenus dans les balises <p> de paragraphes, qui peuvent être accentués par des balises <strong> etc..).
  • Les balises alt des images

Pour mieux comprendre ce que sont ces balises HTML, voir mon article sur la création d’un site Internet.

C’est pour ces raisons qu’il est important que vous ayez la main sur le code de votre site. Si vous avez réalisé votre site avec un CMS ou un outil de création en ligne, savez-vous où sont vos balises et pouvez-vous les modifier ? Certains CMS ont été réalisés par des développeurs n’ayant aucune connaissance du référencement, soyez prudent dans votre choix !


Les ingrédients : la vitesse de chargement de pages

Une vitesse de chargement des pages trop longue peut ralentir les robots d’indexation et avoir un impact négatif sur votre référencement. C’est particulièrement vrai pour le référencement sur les appareils mobiles2.

Le truc du pro : Pour avoir une idée de la vitesse de chargement des pages de votre site, allez à l’adresse Google Page Speed Insights et entrez votre URL. Les résultats vont peut-être vous surprendre… Toutefois si vous n’obtenez pas d’aussi bons résultats que sur la capture d’écran ci-dessous, pas de panique, monter à 95% devrait suffire.

google speed test


Les ingrédients : la popularité

La popularité de votre site est un gage de sérieux pour Google. Toujours en vertu de sa mission qui consiste à servir à ses utilisateurs un contenu de qualité en rapport avec sa recherche, Google va orienter son classement en fonction de la popularité de votre site, dont les indicateurs sont :

  • Les liens internes entre parties de votre site.
  • Les liens externes en provenance de sites de qualité qui pointent vers votre site.

Les premiers, les liens entre les pages de votre site sont surtout importants pour l’indexation de vos pages. En effet, comme nous le verrons dans le paragraphe suivant, les robots d’indexation parcourent en permanence le Web à la recherche de contenu. Les liens contenus dans vos pages lui permettent de visiter celles-ci fréquemment.

Les seconds, les liens pointant vers votre site, sont les plus importants en termes de classement. Ils doivent impérativement provenir de sites ayant une bonne popularité auprès de Google - méfiez-vous donc des annuaires - pour vous fournir le jus nécessaire.

robots

Le crawl des robots d’indexation

Les robots, encore appelés spiders ou bots, sont des algorithmes informatiques dont la fonction est d’indexer des pages web, c’est-à-dire de les ranger dans une immense bibliothèque de contenus. Pour ce faire, les robots d’indexation naviguent en permanence sur le web (crawl en anglais veut dire ramper, on voit bien la métaphore avec spider et web : l’araignée tisse sa toile !), de lien en lien, et récoltent le contenu des pages pour les mettre dans cette bibliothèque (l’index des pages).

Mais quel contenu est indexé ? Que peuvent voir les robots d’indexation ?


Ce que voient les robots d’indexation

Les robots d’indexation sont, du fait de leur nature informatique, binaires. Ils n’ont - à ce jour - pas la capacité de discerner autre chose que du contenu textuel (bien que Google commence timidement à reconnaître certains contenus d’images). Leur logique binaire leur permet de classer le contenu qu’ils rencontrent dans des collections et d’en extraire des données plus ou moins brutes.

Les robots vont collecter ces données dans :

  • le contenu textuel des balises HTML (HyperText Markup Langage, le langage qui permet d’afficher des pages web), avec en particulier :
    • le contenu de la balise <title> (titre de la page, à ne pas confondre avec ci-dessous)
    • le contenu des balises <h1> et <h2> (balises de titre)
    • les liens ou ancres contenues dans vos pages
    • le contenu des balises alt="" des images
    • le contenu de la balise <meta="description"/> (pas d’impact sur le classement)

Ce que ne voient pas les robots (ou très mal !)

  • les images
  • le texte contenu dans les images
  • les vidéos, l’audio
  • le contenu généré par javascript (ajax, angular.js…)
  • les contenus générés par Flash

On le voit, ce qui importe le plus dans votre site est que vos Mots Clés - qui sont les mots pour lesquels vous voulez voir votre site être bien classé (ranker) - soient contenus dans ces balises. Il est donc vital que vous puissiez avoir la main sur ces balises, ce que ne permettent pas tous les CMS et encore moins la plupart des outils de création gratuits…

Fournir du contenu adéquat et à jour

Delivering relevant, fresh content3

Deux facteurs, la pertinence et la fraîcheur sont analysés par l’algorithme avec :

  • analyse du document et connectivité sémantique :
    • analyse du document : recherche des Mots Clé dans les balises <meta>, <title>, `, et dans le texte de la page (voir plus haut)
    • la connectivité sémantique est la possibilité pour les robots d’associer entre eux des mots du même champ sémantique pour donner des résultats proches de la recherche initiale
  • qualité du contenu et intérêt de la part de l’utilisateur :
    • qualité du contenu: effort éditorial pour avoir un contenu lisible et adéquat avec la cible
    • intérêt : l’utilisateur clique-t-il sur des liens dans le site ou retourne-t-il immédiatement sur Google ensuite ? En d’autres termes, la réponse donnée par Google satisfait-elle l’utilisateur ?

Avec l’outil Google analytics par exemple on peut voir:

  • le taux de rebond (bounce rate) : pourcentage des visiteurs qui ne voient qu’une page du site, ce qui est un indice de contenu non pertinent;
  • le temps passé sur le site : ne tient compte que du temps après chaque page chargée (inutile donc de passer du temps sur la page d’accueil…)
  • nombre de pages vues par visiteur

Conclusion (temporaire…)

Comme nous l’avons vu succinctement, être référencé n’est pas une chose simple. Il faut avant tout s’assurer que toutes ses pages ont été indexées pas le moteur de recherche, mais également maîtriser son code pour fournir les mots clés les plus pertinents possible.

La stratégie SEO n’est toutefois pas une science exacte, mais plutôt un art…

Truc de pro : pour savoir si votre site correspond aux bonnes pratiques recommandées par Google, vous pouvez le tester sur https://varvy.com/.

Glossaire

  • Algorithme :
    • Programme utilisé par les moteurs de recherche pour déterminer le classement des pages en fonction d’une requête utilisateur.
  • Black Hat
    • Utilisateur qui tente de flouer Google avec de mauvaises pratiques.
  • Domain Authority ou DA
    • Popularité accordée par Google à un site donné. Les liens provenant de sites ayant un fort D.A. sont de plus grande valeur.
  • Google AdWords :
    • Campagne publicitaire Google. S’oppose ou complète le référencement naturel.
  • Jus ou juice
    • Influence d’un lien pointant vers le site.
  • Référencement naturel :
    • Classement naturel du site dans les SERPs, hors Google AdWords et géolocalisation.
  • SERP :
    • Search Engine Result Page : On parle de classement dans les SERPs, c’est-à-dire du classement d’un site dans les résultats obtenus après une requête par un internaute.
  • SEO :
    • Search Engine Optimization. C’est l’ensemble des stratégies qui permettent d’optimiser un site pour les moteurs de recherche. Il fait partie du SEM (Search Engine Marketing) avec le SEA (Search Engine Advertising) et le SMO (Social Media Optimization).
  • Taux de rebond :
    • Pourcentage de visiteurs quittant le site peu après y avoir accédé. Un taux de rebond bas est un indicateur de contenu adéquat.
  1. A ne pas confondre avec le référencement payant via les campagnes Google Adwords qui sont des annonces publicitaires dans les résultats de recherche. 

  2. En effet les résultats de recherche diffèrent selon si vous effectuez une recherche à partir d’un ordinateur dit de bureau ou à partir d’un smartphone ou d’une tablette. 

  3. Fournir du contenu adéquat et à jour.