Sommaire
ToggleLa problématique des mots-clés en référencement
Les mots-clés des requêtes et ceux des pages web
En référencement, aussi appelé SEO c’est à dire search engine optimization ou optimisation pour les moteurs de recherche, il est bien connu que les mots-clés représentent un des grands moyens d’acquérir du trafic.
L’idée de base est que, dès lors que les internautes font des recherches sur Google, sur Bing, sur Ecosia, Lilo et tous les autres moteurs, en utilisant des mots précis, les pages qui contiennent ces mots ont de meilleures chances d’apparaitre dans les classement, et donc de déclencher de précieux clics.
Mais qu’en est-il réellement ? Est-ce vrai ou faux ? Et où faut-il placer ces mots-clés, sachant qu’il y a de nombreux emplacements possibles : cela dépend-il surtout de certaines balises HTML, et si oui lesquelles ?
La théorie du TF / IDF
La vieille théorie du TF / IDF, qui repose sur l’interprétation d’informations contenues dans des brevets déposés par Google dans les années 2000 et 2010, prédit que le classement d’une page web dépend en partie de la valeur d’une métrique nommée TF / IDF, qui désigne le ratio entre le nombre de fois qu’un mot ou une expression est utilisé dans un document, et le nombre de mots contenus dans ce document.
L’acronyme TF / IDF signifie en anglais “term frequency-inverse document frequency“, c’est à dire “fréquence du terme – fréquence inverse du document”.
Ainsi, une page web qui contiendrait 10 fois le mot clé “bruit électronique” dans une page de 100 mots, aurait un ratio de 1/100. Ce qui lui permettrait de battre, sur cette métrique, d’autres pages ayant un ratio plus faible.
Dans les années 2000, une telle théorie menait les référenceurs à “optimiser” leurs pages en se livrant à du “bourrage de mots-clés”, pour augmenter la densité. Une technique qui fonctionnait alors et semble avoir largement perdu en popularité, Google ayant appris à reconnaître cette forme de ruse et à en annuler les effets.
Mais alors, si ce n’est pas la fréquence des mots qui compte, quels paramètres sémantiques influencent-ils le classement ?
Ce que montrent les études et tests SEO sur les mots-clés
Etude des mots-clés dans la Google Search Console
Le référenceur Ludovic Bablon s’est livré à une étude des mots-clés attribués par Google à des pages web sur divers sites (étude disponible ici), en utilisant les données de la Google Search Console.
Il a d’abord pu mettre en évidence le fait que Google ne donne pas une grande majorité des requêtes ayant abouti à des clics vers une page web : en moyenne, entre 70 et 90% de ces requêtes sont tout simplement passées sous silence.
Mais, pour les requêtes sur lesquelles Google donne des information, il apparait clairement que dans plus de 80% des cas, elles contiennent des mots présents dans les balises Title et / ou H1, et parfois, mais de manière moins importante, des combinaisons entre ces mots du titre et des mots du texte.
On peut donc en conclure que les mots à optimiser d’abord et avant tout sont ceux du titre principal d’une page web, qui comptent largement plus que leur fréquence d’utilisation dans les textes.
Le rôle des titres H2 à H6
Une autre théorie populaire dans le milieu du référencement, dit que les mots-clés dans les titres prennent une importance particulière.
Or, des tests SEO menés sur cette question ne confirment pas cette théorie, et même, à l’inverse, on a pu montrer que le trafic d’une page dont on transforme tous les titres H2, H3, H4, H5 et H6 en paragraphes, ne change pas substantiellement.
De même, le fait qu’un mot clé soit présent dans un H2 plutôt que dans un H6, ne semble pas du tout influer sur le classement de la page sur ce mot-clé.
Et en complément, on peut affirmer qu’un mot-clé ou une expression qui ne serait présent que dans un titre H2 à H6, mais pas dans le titre H1, n’a quasiment aucune chance de se classer en tête sur une requête contenant uniquement ce mot clé ou cette expression.
L’impact des autres balises HTML
On retrouve les mots-clés à tous les endroits d’une page HTML, entourés par toutes sortes de balises. Quel est l’impact de ces différentes balises ?
Les tests et expériences en référencement – notamment celles menées par Ted Kubaitis et le SEO Fight Club) montrent que certaines ont un impact négligeable voire pas d’impact du tout, tandis que d’autres ont une importance. Listons donc ces dernières :
- l’attribut alt des balises img : la quantité, la taille, la qualité des images, jouent certainement un rôle dans le classement d’une page dans les résultats de recherche. Mais l’élément qui a le plus d’importance est sans aucun doute l’attribut alt des images, car il renseigne les moteurs de recherche sur la signification de cette image. Il est donc utile d’y placer des mots en complément des mots-clés principaux qu’on vise. Je parle bien de mots complémentaires – des variantes, des synonymes, des mots du même champ lexical – car il ne sert à rien de répéter encore et encore les mêmes mots-clés.
- les mots des liens : les moteurs de recherche utilisent les mots des liens, qu’on appelle les “ancres de lien”, pour avoir une idée statistique de ce dont parlent les pages cibles. Dans le cadre de liens internes, cela représente donc une occasion de placer des variantes et autres mots-clés complémentaires.
Sachons raison garder néanmoins : l’optimisation de ces balises n’a qu’un impact léger et ne fera gagner que quelques pourcentages de trafic. La pertinence des contenus et l’autorité du site et des pages restent les piliers d’un bon référencement.
Conclusion
Ces études et tests montrent donc que les mots les plus importants d’une page web sont, de très loin, ceux du titre, et qu’il n’y a pas lieu d’optimiser ni la fréquence de répétition de ces mots, ni leur placement dans des titres subalternes autres que le H1.
Dorénavant, vous savez quoi faire !