Comprendre l’algorithme Google: comment le moteur de recherche fonctionne ?

Le SEO est l’art de comprendre la manière dont travaillent les moteurs de recherche comme Google, pour faire que son site sorte dans le haut de la première page de réponse à une recherche de mots clés. Ce classement est le fruit d’un classement effectué par le moteur de recherche sur la base de calculs gérés par l’un des secrets les mieux gardés de la planète: l’algorithme Google.

Algorithme Google
Google, le site le plus visité au monde, soigne son algorithme de classement des pages dans les résultats des recherches. L’algorithme Google n’est pas une formule mathématique figée, mais les équipes de Google travaillent continuellement (cliquez ici >> pour voir les changements au fil du temps) sur les analyses des résultats pour le corriger et contrôler le classement des pages. Ces changements expliquent que certaines stratégies de webmasters ont fonctionné à un moment donné, et ne fonctionnent plus quelques mois plus tard.
D’où la préoccupation continuelle de chacun pour essayer de comprendre le fonctionnement et les évolutions de l’algorithme secrète de Google.

Principes de l’algorithme Google

L’algorithme Google repose sur quatre grands éléments:

  • Le PageRank: C’est l’élément le plus connu du classement de l’algorithme Google développé par Larry Page and Sergey Brin, qui ont fondé Google. Le PageRank est un indice correspondant aux nombres de liens sur une page, gage de qualité pour celle-ci. Il est toujours utilisé actuellement, il continue à bénéficier d’évolutions, mais il est largement dépassé, et fait maintenant partie d’un système plus important.
  • Les signaux: L’algorithme Google utilise maintenant 200 critères qu’il appelle « signaux ». Les signaux dépendent à la fois du contenu de la page, et de son évolution, des requêtes et du comportement des visiteurs.
  • Les classificateurs sont utilisés sur les requêtes : leur but est de restituer le contexte de recherche, le cadre dans lequel elle se place. Par exemple, veut-on rechercher un produit pour l’acheter ou se renseigner sur quelque chose?
  • Les modèles : l’algorithme Google fait appel à plusieurs modèles.
    • Les modèles de langues: la capacité à comprendre les phrases, les synonymes, les accents, les fautes d’orthographe, etc.
    • Les modèles de requêtes: il n’y a pas seulement la langue, mais comment elle est utilisée de nos jours.
    • Les modèles de temps: certaines pages répondent mieux quand elles existent depuis 30 minutes, et d’autres quand elles ont subi l’épreuve du temps.
    • Les modèles personnalisés: toutes les personnes ne recherchent pas les mêmes choses, ne le cherchent pas avec les mêmes mots etc.

L’architecture de moteur de calcul

Le moteur de calcul met en oeuvre de nombreux composants:

  • algorithme googleServeur d’URLs : Fournit aux crawlers une liste d’URL à scanner.
  • Serveur de banque : Le crawler envoie les données récoltées au serveur de banque. Celui-ci compresse les pages et les places sous cette forme dans le dépôt. Chaque page stockée a un identifieur.
  • Banque : Contient une copie des pages et des images, permet les comparaisons et la mise en cache.
  • Indexeur: Il indexe les pages pour les fournir aux SERPs (résultats). Il décompresse les documents et les convertit en ensemble de mots appelés « hits ». Il distribue les hits parmi un ensemble de barils. Cela fournit un index partiellement trié. Il crée aussi un liste des URLs dans la page.  Un hit contient les informations suivantes: le mot, sa position dans le document, la taille de police, la capitalisation.
  • Barils: Ce sont des bases de données qui classent les documents par identifiant. Ils sont créés par l’indexeur et utilisés par le trieur.
  • Ancres: Le fichier d’ancres créé par l’indexeur contient les liens internes et le texte associé à chaque lien.
  • Résolveur d’URL : Il reprend le contenu du fichier d’ancres, convertit les URL relatives en adresses absolues et retrouve ou crée les identifiants. Il crée un index de documents et une base de données de liens.
  • Index de documents: Il contient le texte relatif à chaque URL.
  • Liens: La base de donnée de liens associe chacun d’eux à un identifiant (donc aussi à un document sur le Web).
  • Trieur: Il interagit avec les barils. Il reprend les documents classés par identifiant et crée une liste inversée qui est classée par identifiant.
  • Lexicon: Un logiciel appelé DumpLexicon prend la liste fournie par le trieur (classée par wordID), et reprend également le lexicon créé par l’indexeur (la liste des mots-clés dans chaque page), et fabrique un nouveau lexicon à destination du chercheur.
  • Chercheur : Il tourne sur un serveur Web dans un datacenter, il utilise le lexicon fabriqué par DumpLexicon en combinaison avec l’index classé par identifiant, prend en compte le PageRank et fabrique une page de résultats.

L’algorithme Google bénéficie d’une puissance de calcul unique au monde

Le calcul de l’algorithme Google dispose de centaines de milliers d’ordinateurs pour indexer les milliards de pages de tous les sites Web au monde, et est capable de mettre à jour l’index tout entier en quelques jours! Il est important de savoir que les centres de données stockent une copie de toutes les pages du Web pour pouvoir y accéder plus rapidement.

Par ailleurs l’algorithme Google bénéfice d’une recherche d’amélioration constante: Des groupes travaillent à l’amélioration de l’algorithme, d’autres opèrent sur l’évaluation des résultats. L’algorithme Google a bénéficié de plusieurs milliers de modifications, découvrez son histoire dans cet article: cliquez ici>>

LinkedIn
Twitter

Vous aimerez aussi ...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

Téléchargez gratuitement le livre blanc des formations au Social Selling

Le guide complet pour choisir une formation au social selling

Découvrez dans cet ebook les clés pour réduire vos couts de formation tout en les rendant plus efficaces.

La protection des données nous tient à cœur. Vous pouvez vous désinscrire de ce type de communications à tout moment. Pour plus d'informations, consultez notre politique de confidentialité.

Partagez notre blog !

Abonnez-vous

La protection des données nous tient à cœur. Vous pouvez vous désinscrire de ce type de communications à tout moment. Pour plus d'informations, consultez notre politique de confidentialité.

Nos derniers articles

Profils floutés LinkedIn: pourquoi LinkedIn floute des profils?

Booléens LinkedIn : Modification depuis Août 2018

LinkedIn pour faire du social selling ? Quelle blague !

Pourquoi votre SSI LinkedIn vient de baisser de 7 points ?

Le MOOC Social Selling en B2B est disponible en 2020

Logo My Social Selling

Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considérerons que vous acceptez l’utilisation des cookies. Voir notre Politique de confidentialité.