• Technologie des moteurs de recherche et analyse des algorithmes

Une fuite importante de documents de recherche Google révèle les secrets de l'algorithme de classement

  • Felix Rose-Collins
  • 2 min read
Une fuite importante de documents de recherche Google révèle les secrets de l'algorithme de classement

Intro

Une fuite inédite de documents de Google a dévoilé des informations sans précédent sur le fonctionnement interne de l'algorithme de classement du géant de la recherche. Cette révélation met en lumière des facteurs essentiels tels que les clics, les liens, le contenu, les entités et les données de Chrome que Google utilise pour classer le contenu web.

La fuite dévoilée

Le 13 mars, un robot automatisé nommé yoshi-code-bot a publié sur GitHub des milliers de documents internes de Google provenant du Content API Warehouse. Ces documents, partagés avec Rand Fishkin, cofondateur de SparkToro, offrent un rare aperçu des mécanismes de classement de Google.

Principales conclusions de la fuite

  • Informations actuelles : Les documents sont à jour en mars 2024.

  • Caractéristiques du classement : La documentation de l'API détaille 2 596 modules avec 14 014 attributs.

  • Pondération des caractéristiques : Si les documents décrivent les caractéristiques, ils ne précisent pas leur pondération.

  • Les twiddlers : Ces fonctions de reclassement permettent d'ajuster les scores de recherche d'informations.

  • Rétrogradation : Le contenu peut être rétrogradé pour diverses raisons, notamment en raison de liens non concordants, de l'insatisfaction des utilisateurs, d'avis sur des produits, de l'emplacement, de domaines de correspondance exacte et de contenu pour adultes.

  • Historique des modifications : Google conserve une copie de chaque version d'une page qu'il a indexée, mais ne prend en compte que les 20 dernières modifications lors de l'analyse des liens.

L'importance des liens et des clics

  • Les liens sont importants : La diversité et la pertinence des liens restent essentielles, le PageRank restant un facteur important.

  • Les clics réussis sont importants : Google utilise diverses mesures telles que badClicks, goodClicks, lastLongestClicks et unsquashedClicks pour mesurer les clics réussis. Un contenu de qualité et une expérience utilisateur positive sont essentiels pour obtenir un bon classement.

Informations complémentaires

  • Importance de la marque : La construction d'une marque notable et bien reconnue est cruciale pour améliorer le classement dans les moteurs de recherche organiques.

  • Entités : Google stocke des informations sur l'auteur afin d'identifier l'entité à l'origine du contenu.

  • Autorité du site : Ce concept a une incidence sur le classement général d'un site.

  • Données Chrome : Les données du navigateur Chrome influencent le classement des recherches.

  • Listes blanches : Certains domaines liés aux élections et à COVID-19 sont placés sur liste blanche, ce qui garantit qu'ils ne sont pas affectés par des algorithmes spécifiques.

Impact sur le référencement

Cette fuite est en passe de devenir l'un des événements les plus importants de l'histoire du référencement, car elle fournit des informations inestimables sur l'algorithme de classement de Google. Cette révélation est comparable à la fuite de 2023 sur Yandex Search, qui a été un événement majeur cette année-là.

Commentaire d'expert

  • Michael King, PDG d'iPullRank : prévoit d'offrir une analyse approfondie basée sur les documents divulgués.

  • Rand Fishkin, cofondateur de SparkToro : souligne l'importance cruciale de la construction d'une marque et du maintien d'une présence forte en dehors de la recherche Google. Selon Rand Fishkin, un contenu réussi et une marque forte indiquent à Google que vos pages méritent d'être mieux classées.

Pour en savoir plus

  • Secrets de l'algorithme : Ladocumentation technique interne de Google Search a fuité par King sur iPullRank

  • Une source anonyme a partagé avec moi des milliers de documents de l'API de recherche de Google qui ont fait l'objet d'une fuite ; tout le monde dans le domaine du référencement devrait les voir par Fishkin sur SparkToro

Clarification sur la fuite

La question de savoir si ces documents ont fait l'objet d'une "fuite" ou s'ils ont été "découverts" accidentellement au cours d'un examen du code fait l'objet d'un débat. Erfan Azimi, PDG d'EA Eagle Digital, a revendiqué la responsabilité d'avoir partagé les documents avec Fishkin.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Commencez à utiliser Ranktracker... gratuitement !

Découvrez ce qui empêche votre site Web de se classer.

Créer un compte gratuit

Ou connectez-vous en utilisant vos informations d'identification

Different views of Ranktracker app