L’état des lieux
Les premiers moteurs de recherche avaient un fonctionnement lexical. Aujourd’hui, ils ont un fonctionnement sémantique. On sait par exemple que Google donne plus de valeur à un lien lorsqu’il existe une proximité thématique entre les deux pages liées. Depuis une petite dizaine d’années, nous avons vu apparaître un certain nombre de techniques ayant pour but d’exploiter ce fonctionnement (silos, cocons sémantiques…), pour optimiser le maillage interne d’un site.
Le problème est que ces techniques sont utilisées le plus souvent d’une manière totalement artisanale. On décide que selon sa thématique, tel article doit aller dans tel silo. Si des articles dans deux silos différents ont un point commun, on peut décider de les lier entre eux. Mais ces choix reposent uniquement sur la réflexion et l’intuition, alors qu’il serait beaucoup plus simple, rapide et efficace d’utiliser un algorithme de deep learning pour mesurer la proximité sémantique entre les articles pour les lier d’une manière pertinente. Aujourd’hui, ce type d’automatisation n’est utilisé que par quelques grosses entreprises. Mais elle n’est pas encore disponible pour le plus grand nombre d’entre nous.
Le deep learning pour tous
Il y a quelques années, j’ai expérimenté une librairie pour le text mining qui implémente des algorithmes comme le LSA (Latent Semantic Analysis) et le LDA (Latent Dirichlet Allocation). Depuis ce moment, je me dis qu’il ne serait pas si compliqué de rendre cette technologie disponible pour tous.
Je trouve cette idée très séduisante et pas seulement au niveau SEO. En proposant des contenus similaires à nos visiteurs, on leur apporte une expérience de navigation plus agréable et on réduit le taux de rebond.
Pour autant, cela n’est pas si simple. Les algorithmes de text mining sont trop lourds pour être réalisés directement sur la plupart des hébergements web. Pour pouvoir les utiliser facilement sur n’importe quel site, il est impératif de créer un service distant avec un système d’API et de hooks. C’est pour cela que j’ai créé l’application « Webmill SEO ».
L’ère des référenceurs augmentés
Mon but n’est pas de remplacer les référenceurs par une IA. Mon but est de leur donner des super-pouvoirs, pour leur permettre de travailler plus rapidement et plus efficacement. Un peu comme le ferait un exosquelette en décuplant nos capacités physiques, mais dans le domaine du référencement.
L’analyse sémantique permet de créer automatiquement le maillage parfait pour donner globalement plus de poids à un site web grâce à la qualité de ses liens internes. Mais il faudra toujours le savoir-faire d’un SEO pour sélectionner les requêtes à optimiser et élaborer les arborescences de liens dans le but de pousser les bonnes pages pour les bonnes requêtes. L’idée est qu’au lieu de perdre votre temps à trier des articles, alors qu’une machine est plus compétente que vous pour le faire, vous pourriez vous concentrer sur votre cœur de métier, là où vous apportez vraiment de la valeur.
Structure de l’application
D’un point de vue fonctionnel, l’application Webmill SEO possède deux grandes facettes. D’un côté, elle permet de créer automatiquement un maillage de base, en choisissant, pour chaque page, des articles avec la meilleure proximité thématique. D’un autre, elle permet de créer des arborescences de liens dans le but de pousser des pages pour des requêtes et des sous-requêtes, un peu comme dans un silo. Sauf que globalement, l’application permet de créer une structure beaucoup plus organique. Cette seconde fonctionnalité est semi-automatique. L’application propose des choix pertinents en fonction des requêtes. Mais la personne qui utilise l’application doit choisir comment elle veut lier les pages entre elles.
L’état actuel de l’application
Je travaille sur ce projet depuis début juillet et aujourd’hui, les principales fonctionnalités de l’application sont en place. J’ai développé un manager qui permet de se connecter à l’application. Ce manager permet de gérer les aspects administratifs (factures), d’ajouter des sites, d’importer les articles des sites dans l’application et de créer des arbres de liens.
J’ai également créé un plugin WordPress permettant d’utiliser facilement l’application, sans devoir coder. D’autres intégrations suivront peut-être en fonction de la demande. Mais pour la première version de l’application, j’ai choisi de me concentrer sur WordPress qui fait fonctionner plus de 43 % des sites web existants en 2021.
Lors de l’import d’un site dans l’application, le moteur de text mining créé un index sémantique et une matrice de similarités. Cette matrice est poussée sur le site grâce au plugin WordPress. Le plugin propose un widget qui affiche le voisinage de chaque article. Il propose également des fonctions (fil d’Ariane, pages sœurs/filles) à intégrer dans le thème pour visualiser les arbres de liens créé dans l’application, ainsi qu’un shortcode pour intégrer facilement des liens parents directement dans le contenu.
L’application utilise un système de clé pour permettre une connexion sécurisée avec les sites. Chaque site possède une clé différente, ce qui permet aux agences SEO d’utiliser un seul compte pour tous leurs clients sans que cela ne pose de problèmes de sécurité.
L’application propose également d’autres fonctionnalités. Par exemple, vous pouvez générer un fichier GML pour visualiser la matrice de similarité dans Gephi. L’application vous permet également de faire du spinning sur les ancres lorsque vous le souhaitez.
Même si l’application n’est pas totalement terminée, elle est parfaitement utilisable dans son état actuel. J’ai décidé de lancer une précommande pour vous permettre de l’utiliser dès maintenant. Cela me permettra d’avoir un retour de la communauté SEO et de mieux comprendre vos besoins.