đŸ”„Google Leaks : Le guide ULTIME des secrets de Google

Une fuite massive d'informations Google révélée.

Le 28 mai 2024, les experts SEO Rand Fishkin et Mike King ont dévoilé plus de 2 500 documents confidentiels de Google sur les données utilisateur, accompagnés de 14 000 attributs techniques.

Cette révélation a débuté lorsqu'Erfan Azimi a partagé des documents de l'API Google avec Rand Fishkin (SparkToro), qui s'est ensuite associé à Michael King (iPullRank).

Les fichiers proviennent d'une mise à jour de la documentation API nommée "yoshi-code-bot/elixer-google-api".

Vous pouvez trouver tous les fichiers que Google utilise ici.

J'ai décortiqué ce document et inscrit ici les choses les plus intéréssantes que j'ai trouvé et ainsi révéler ce leak de secrets du géant de Mountain View.

Ce que vous ne faisiez probablement pas avant, et que vous devez faire

  • Focus sur les entitĂ©s et leur impact sur sites
  • Avoir des auteurs contenus
  • Avoir un site qui focus sur une thĂ©matique (privilĂ©giĂ© par l'algorithme de recherche Google)
  • PossibilitĂ© de crĂ©er des liens thĂ©matiques entre plusieurs thĂ©matiques mais commencer par devenir expert sur une thĂ©matique de base, stratĂ©gie de rĂ©fĂ©rencement efficace pour dĂ©velopper son autoritĂ© de domaine seo
  • Placer le contenu le plus important en dĂ©but d'article pour l'algorithme de recherche Google
  • Selon l'analyse SEO, Google favorise les contenus qui demande des efforts (images, vidĂ©os, complexitĂ©s,..)
  • Optimiser pour Navboost : un contenu qui plait aux internautes, engager un community manager, relayer vos articles, obtenir des backlinks naturels
  • Ne pas oublier de plaire Ă  Google (faire les deux donc)
  • Mettre du gras sur les liens et les mots pour amĂ©liorer le rĂ©fĂ©rencement
  • Pour les backlinks, faire de la relation presse et comprendre le PageRank de semence
  • Tous les facteurs locaux sont Ă  prendre dans cet article mai, nous avons l'habitude d'optimiser tout sauf cela (mĂȘme si nous le savions dĂ©jĂ )

Formule simplifié pour le classement de Google

Pour résumer, Google vous classe avec :

Scores d'interaction utilisateur

  • UgcScore : engagement du contenu gĂ©nĂ©rĂ© par utilisateurs
  • TitleMatchScore : pertinence titre/requĂȘte
  • ChromeInTotal : total interactions Chrome
  • SiteImpressions : impressions totales du site
  • TopicImpressions : impressions pages thĂ©matiques
  • SiteClicks : taux de clics site
  • TopicClicks : taux de clics thĂ©matiques

Scores de qualité du contenu

  • ImageQualityClickSignals : qualitĂ© via clics images
  • VideoScore : qualitĂ©/engagement vidĂ©o
  • ShoppingScore : score contenu shopping
  • PageEmbedding : sĂ©mantique page
  • SiteEmbedding : sĂ©mantique site
  • SiteRadius : Ă©cart sĂ©mantique
  • SiteFocus : thĂšme principal
  • TextConfidence : pertinence/qualitĂ© texte
  • EffortScore : effort crĂ©ation contenu

Scores de liens

  • TrustedAnchors : qualitĂ© backlinks
  • SiteLinkIn : valeur liens entrants
  • PageRank : score autoritĂ© (0-2, ToolBar, NR)

Boost de pertinence

  • TopicEmbedding : pertinence temporelle
  • QnA : qualitĂ© base
  • STS : comprĂ©hension texte/entitĂ©s

Boost de qualité

  • SAS : confiance/autoritĂ© liens
  • EFTS : effort page (texte/mĂ©dia/commentaires)
  • FS : fraĂźcheur contenu

Ajustements spécifiques

  • CDS : score donnĂ©es Chrome
  • SDS : ajustements SERP
  • EQSS : variables expĂ©rimentales

Le fonctionnement de Google au travers du Google Leaks

Crawling :

  • Trawler – SystĂšme de crawling web. GĂšre la file d'attente, les taux de crawl et la frĂ©quence de changement des pages.

Indexation :

  • Alexandria – SystĂšme principal d'indexation.
  • SegIndexer – SystĂšme qui classe les documents par niveaux dans l'index.
  • TeraGoogle – SystĂšme d'indexation secondaire pour les documents stockĂ©s sur disque Ă  long terme.

Rendu :

  • HtmlrenderWebkitHeadless – SystĂšme de rendu pour pages JavaScript. Le nom fait rĂ©fĂ©rence Ă  Webkit plutĂŽt que Chromium. Les docs mentionnent Chromium, suggĂ©rant que Google utilisait WebKit avant de passer Ă  Headless Chrome.

Traitement :

  • LinkExtractor – Extrait les liens des pages.
  • WebMirror – GĂšre la canonicalisation et la duplication.

Classement :

  • Mustang – SystĂšme principal de scoring, classement et diffusion
  • Ascorer – Algorithme principal de classement avant ajustements
  • NavBoost – SystĂšme de reclassement basĂ© sur les logs de clics utilisateurs.
  • FreshnessTwiddler – SystĂšme de reclassement basĂ© sur la fraĂźcheur des documents.
  • WebChooserScorer – DĂ©finit les caractĂ©ristiques utilisĂ©es pour le scoring des extraits.

Diffusion :

  • Google Web Server – Interface avec le frontend Google. Reçoit les donnĂ©es Ă  afficher.
  • SuperRoot – Cerveau de Google Search qui communique avec les serveurs et gĂšre le post-traitement pour le reclassement et la prĂ©sentation.
  • SnippetBrain – SystĂšme de gĂ©nĂ©ration des extraits de rĂ©sultats.
  • Glue – SystĂšme d'unification des rĂ©sultats selon le comportement utilisateur.
  • Cookbook – SystĂšme de gĂ©nĂ©ration de signaux, apparemment créés Ă  l'exĂ©cution.

On-Page Facteurs:

  • titlematchScore: Score de correspondance des titres Ă  l'Ă©chelle du site, indiquant dans quelle mesure les titres correspondent aux requĂȘtes des utilisateurs.
  • fontsize: Taille de la police des liens; utilisĂ©e par Google pour Ă©valuer l'importance du lien.
  • OriginalContentScore: Score reprĂ©sentant l'originalitĂ© du contenu, surtout pour les pages avec peu de contenu.
  • Avg. Term Weight: Renforcement des termes via l'utilisation de texte en gras ou de termes stratĂ©giques.
  • keywordStuffingScore: Score de spam pour le bourrage de mots-clĂ©s.
  • spamWordScore: Score associĂ© aux mots identifiĂ©s comme spam.
  • textConfidence: Confiance dans la pertinence et la qualitĂ© du texte.
  • effortScore: Effort et qualitĂ© dans la crĂ©ation de contenu.
  • Penguin Algorithm: Cible les liens spammy, y compris les liens internes sur-optimisĂ©s.
  • Document Length: Limite sur le nombre de mots et de ponctuations; le contenu important doit ĂȘtre placĂ© en dĂ©but de texte.
  • Content Length: Google traite un nombre limitĂ© de caractĂšres; le contenu important doit ĂȘtre placĂ© tĂŽt sur la page.
  • Page Titles: Doivent ĂȘtre optimisĂ©s et correspondre Ă©troitement aux mots-clĂ©s de la requĂȘte.
  • FreshnessTwiddler: Reclassement basĂ© sur la fraĂźcheur du contenu.

Off-Page Facteurs

  • Fresh Docs: Multiplicateur de fraĂźcheur pour les liens; les liens provenant de pages rĂ©centes sont mieux classĂ©s.
  • homePageInfo: Indique si la page source est une page d'accueil et son niveau de confiance.
  • SiteAuthority: Indique la crĂ©dibilitĂ© ou l'autoritĂ© globale d'un site.
  • sourceType: QualitĂ© de la page source d'un lien, corrĂ©lĂ©e Ă  son niveau d'indexation.
  • CreationDate: Date de premiĂšre dĂ©couverte d'un lien et derniĂšre date connue oĂč ce lien a Ă©tĂ© trouvĂ©.
  • TrustedAnchors: QualitĂ© et fiabilitĂ© des liens entrants.
  • SiteLinkIn: Valeur moyenne des liens entrants.
  • PriorSignal: Informations sur l'historique de l'URL; une mauvaise qualitĂ© antĂ©rieure peut affecter le classement.
  • anchorDiversityScore: DiversitĂ© des textes d'ancrage pour les liens pointant vers un site.
  • trustTarget: Indique si une URL se trouve sur une source fiable; les sites dignes de confiance ont plus de latitude.

PageRank :

  • PageRank: Score PageRank prenant en compte divers facteurs.
  • homepagePagerankNs: PageRank de la page d'accueil du site.
  • PagerankNS: Pagerank-NearestSeeds est un score de pagerank pour le document, calculĂ© Ă  l'aide de la mĂ©thode NearestSeeds. Il s'agit de la valeur de production PageRank que les Ă©quipes devraient utiliser. –> PageRank de 2018 – site de graine, cf mon article sur le PageRank.
  • pagerank: Valeur de classement d'une URL [0-65535]. DÉPRÉCIÉ. Configuration dans NearestSeeds.
  • pagerank2: Score pagerank expĂ©rimental. DÉPRÉCIÉ au profit de MustangBasicInfo.
  • crawlPagerank: Usage interne docjoiner pour transfĂ©rer les scores des canoniques sources vers les canoniques finales. –> faire une canonique permet de transfĂ©rer le PageRank.
  • toolbarPagerank: Score [0-10] . Si non dĂ©fini, utilise EstimatePreDemotion via MustangBasicInfo. –> le fameuxPageRank avec la toolbar.
  • FirstCoveragePagerankNs: Score pagerank initial lors de la premiĂšre indexation.
  • feedPagerank: Score normalisĂ© [0-1] spĂ©cifique aux flux RSS. Distinct du pagerank de la page d'accueil.
  • topPrOnsiteAnchorCount: QualitĂ© des ancres – optimale >51000, standard <47000
  • bookPagerank: Score pagerank spĂ©cifique aux pages de livres.
  • anchorPhraseCount: Le nombre de phrases d'ancrage uniques. LimitĂ© par la constante kMaxAnchorPhraseCountInStats (=5000)

Spam

  • Link Velocity: L'acquisition rapide de nombreux liens peut ĂȘtre signalĂ©e comme du spam.
  • spamRank: Mesure la probabilitĂ© qu'un document renvoie Ă  des spammeurs connus.
  • phraseAnchorSpamCount: Nombre de phrases de spam trouvĂ©es dans les ancres.
  • phraseAnchorSpamDays: Nombre de jours sur lesquels 80% de ces phrases de spam ont Ă©tĂ© dĂ©couvertes.
  • phraseAnchorSpamDemoted: Nombre total d'ancres dĂ©classĂ©es en raison du spam.
  • phraseAnchorSpamEnd: Temps auquel le pic de spam d'ancre a pris fin.
  • phraseAnchorSpamFraq: Fraction de phrases de spam parmi toutes les ancres du document.
  • spamBrainTotalDocSpamScore: Score de spam identifiĂ© par SpamBrain (de 0 Ă  1).
  • trendSpam: Indicateur de manipulation du CTR; nombre de requĂȘtes de spam tendance correspondantes.

Technique:

  • URLHistory: Google conserve les 20 derniers changements d'une URL.
  • mobileFriendlinessScore: Indique si un site est optimisĂ© pour les appareils mobiles.
  • pageLoadTimeScore: Score basĂ© sur le temps de chargement de la page; impacte l'expĂ©rience utilisateur.
  • bylineDate: Date explicitement dĂ©finie sur la page, utilisĂ©e dans les rĂ©sultats de recherche, syntacticDate: Date extraite de l'URL ou du titre du document, semanticDate: Date estimĂ©e Ă  partir du contenu du document –> La cohĂ©rence des dates (bylineDate, syntacticDate, semanticDate) sur la page est importante.
  • Ranking Degradation Factors: Facteurs comme les liens incohĂ©rents, une mauvaise UX, un faible CTR et un contenu de mauvaise qualitĂ© pouvant dĂ©grader les classements.
  • NSR Data (chardVariance, chardScoreVariance, nsrdataFromFallbackPatternKey): Mesures de variance pour les scores NSR appliquĂ©s au site; prĂ©disent la qualitĂ© du site ou de la page.
  • hostAge: Date Ă  laquelle Google a dĂ©couvert pour la premiĂšre fois du contenu sur le domaine.
  • YMYL Scores (ymylHealthScore, ymylNewsScore, encodedChardXlqYmylPrediction): Scores pour le contenu YMYL.

Sémantique:

  • author: Auteur(s) du document stockĂ©s en texte.
  • isAuthor: Indique si une entitĂ© sur la page est Ă©galement l'auteur du document.
  • Authors and Entities: Google considĂšre si les auteurs sont des entitĂ©s reconnues dans le Knowledge Graph.
  • TopicEmbedding: Valeur de la pertinence dans le temps.
  • siteEmbedding: ReprĂ©sentation vectorielle compressĂ©e du site pour l'analyse thĂ©matique.
  • pageEmbedding: ReprĂ©sentation vectorielle compressĂ©e de la page pour l'analyse thĂ©matique.
  • siteFocusScore: Mesure Ă  quel point un site est spĂ©cialisĂ© dans un domaine spĂ©cifique.
  • siteRadius: Mesure l'Ă©cart d'une page par rapport au sujet principal du site.
  • Semantic Text Scores (STS): Score global basĂ© sur la comprĂ©hension du texte, la saillance et les entitĂ©s.
  • Short Content Originality: Accent mis sur l'originalitĂ© du contenu court.
  • AI-Generated Content: Google peut dĂ©tecter et traiter diffĂ©remment le contenu gĂ©nĂ©rĂ© par l'IA.

Facteurs Locaux :

  • clickRadius50Percent: Le rayon (en miles) autour de l'emplacement attribuĂ© auquel le document reçoit 50 % de ses clics.
  • localBusinessCompletenessScore: ComplĂ©tude des informations sur l'entreprise locale.
  • businessReviewCount: Nombre de critiques et avis pour une entreprise locale.
  • NAPConsistencyScore: CohĂ©rence des informations Nom, Adresse et TĂ©lĂ©phone.
  • contentRelevanceScore: Pertinence du contenu pour les recherches locales.
  • localMentionCount: Nombre de mentions locales en ligne.
  • geoDistanceScore: Distance entre l'utilisateur et l'emplacement cible.
  • bestLocaleMatch: Pertinence de la langue et des mĂ©tadonnĂ©es locales.

Engagement des utilisateurs

  • UgcScore: Score liĂ© Ă  l'engagement du contenu gĂ©nĂ©rĂ© par les utilisateurs.
  • clic Ă©crasĂ©, clic court, clic long: Types de clics indiquant le niveau de satisfaction de l'utilisateur.
  • ChromeInTotal: Nombre total de vues via Chrome sur l'ensemble du site.
  • SiteImpressions, TopicImpressions, SiteClicks, TopicClicks: Indicateurs d'engagement et de pertinence.
  • Modulators (Tweeters): Ajustent les classements en fonction de la fraĂźcheur du contenu et des signaux d'engagement des utilisateurs.
  • Navboost: Reclassement basĂ© sur les logs de clics des utilisateurs.
  • Mustang Algorithm: Algorithme de classement principal avec des boosts pour des facteurs comme le CTR et la fraĂźcheur du contenu.
  • dailyClicks – Les clics quotidiens
  • dailyGoodClicks – Les bons clics quotidiens

Algorithmes de déclassement

  • Devaluation of Small Blogs: Les petits blogs peuvent ĂȘtre dĂ©valuĂ©s par rapport aux sites faisant autoritĂ©.
  • exact_match_domain_demotion: DĂ©classement appliquĂ© aux domaines Ă  correspondance exacte (EMD).
  • Anchor Mismatch: Le texte du lien ne correspond pas au site cible; le lien est dĂ©classĂ©.
  • SERP Demotion: DĂ©classement basĂ© sur des facteurs observĂ©s dans les pages de rĂ©sultats, indiquant une insatisfaction de l'utilisateur.
  • Nav Demotion: DĂ©classement pour les pages avec une mauvaise navigation ou des problĂšmes d'expĂ©rience utilisateur.
  • Product Review Demotion: DĂ©classement liĂ© Ă  la qualitĂ© des avis de produits.
  • Location Demotions: Les pages globales peuvent ĂȘtre dĂ©classĂ©es en faveur de rĂ©sultats plus localisĂ©s.
  • Panda Demotion: Quality_Coati.

Le 28 mai 2024, les experts SEO Rand Fishkin et Mike King ont dévoilé plus de 2 500 documents confidentiels de Google sur les données utilisateur, accompagnés de 14 000 attributs techniques.

Cette rĂ©vĂ©lation a dĂ©butĂ© lorsqu’Erfan Azimi a partagĂ© des documents de l’API Google avec Rand Fishkin (SparkToro), qui s’est ensuite associĂ© Ă  Michael King (iPullRank).

Les fichiers proviennent d’une documentation API nommĂ©e “yoshi-code-bot/elixer-google-api”.

Vous pouvez trouver tous les fichiers que Google utilise ici.

J’ai dĂ©cortiquĂ© ce document et inscrit ici les choses les plus intĂ©rĂ©ssantes que j’ai trouvĂ© et ainsi rĂ©vĂ©ler les secrets du gĂ©ant de Mountain View.

Ce que vous ne faisiez probablement pas avant, et que vous devez faire

  • Focus sur les entitĂ©s et leur impact sur sites
  • Avoir des auteurs spĂ©cialisĂ©s en stratĂ©gie de rĂ©fĂ©rencement
  • Avoir un site qui focus sur une thĂ©matique (privilĂ©giĂ© par l'algorithme de recherche Google)
  • PossibilitĂ© de crĂ©er des liens thĂ©matiques entre plusieurs thĂ©matiques mais commencer par devenir expert sur une thĂ©matique de base, stratĂ©gie de rĂ©fĂ©rencement efficace pour dĂ©velopper son autoritĂ© de domaine seo
  • Placer le contenu le plus important en dĂ©but d’article
  • Selon l'analyse SEO, Google favorise les contenus qui demande des efforts (images, vidĂ©os, complexitĂ©s,..)
  • Optimiser pour Navboost : un contenu qui plait aux internautes, engager un community manager, relayer vos articles, …
  • Ne pas oublier de plaire Ă  Google (faire les deux donc)
  • Mettre du gras sur les liens et les mots pour amĂ©liorer le rĂ©fĂ©rencement
  • Pour les backlinks, faire de la relation presse et comprendre le PageRank de semence
  • Tous les facteurs locaux sont Ă  prendre dans cet article, nous avons l’habitude d’optimiser tout sauf cela (mĂȘme si nous le savions dĂ©jĂ )

Formule simplifié pour le classement de Google

Pour résumer, Google vous classe avec :

Scores d’interaction utilisateur

  • UgcScore : engagement du contenu gĂ©nĂ©rĂ© par utilisateurs
  • TitleMatchScore : pertinence titre/requĂȘte
  • ChromeInTotal : total interactions Chrome
  • SiteImpressions : impressions totales du site
  • TopicImpressions : impressions pages thĂ©matiques
  • SiteClicks : taux de clics site
  • TopicClicks : taux de clics thĂ©matiques

Scores de qualité du contenu

  • ImageQualityClickSignals : qualitĂ© via clics images
  • VideoScore : qualitĂ©/engagement vidĂ©o
  • ShoppingScore : score contenu shopping
  • PageEmbedding : sĂ©mantique page
  • SiteEmbedding : sĂ©mantique site
  • SiteRadius : Ă©cart sĂ©mantique
  • SiteFocus : thĂšme principal
  • TextConfidence : pertinence/qualitĂ© texte
  • EffortScore : effort crĂ©ation contenu

Scores de liens

  • TrustedAnchors : qualitĂ© backlinks
  • SiteLinkIn : valeur liens entrants
  • PageRank : score autoritĂ© (0-2, ToolBar, NR)

Boost de pertinence

  • TopicEmbedding : pertinence temporelle
  • QnA : qualitĂ© base
  • STS : comprĂ©hension texte/entitĂ©s

Boost de qualité

  • SAS : confiance/autoritĂ© liens
  • EFTS : effort page (texte/mĂ©dia/commentaires)
  • FS : fraĂźcheur contenu

Ajustements spécifiques

  • CDS : score donnĂ©es Chrome
  • SDS : ajustements SERP
  • EQSS : variables expĂ©rimentales

Le fonctionnement de Google au travers du Google Leaks

Crawling :

  • Trawler – SystĂšme de crawling web. GĂšre la file d’attente, les taux de crawl et la frĂ©quence de changement des pages.

Indexation :

  • Alexandria – SystĂšme principal d’indexation.
  • SegIndexer – SystĂšme qui classe les documents par niveaux dans l’index.
  • TeraGoogle – SystĂšme d’indexation secondaire pour les documents stockĂ©s sur disque Ă  long terme.

Rendu :

  • HtmlrenderWebkitHeadless – SystĂšme de rendu pour pages JavaScript. Le nom fait rĂ©fĂ©rence Ă  Webkit plutĂŽt que Chromium. Les docs mentionnent Chromium, suggĂ©rant que Google utilisait WebKit avant de passer Ă  Headless Chrome.

Traitement :

  • LinkExtractor – Extrait les liens des pages.
  • WebMirror – GĂšre la canonicalisation et la duplication.

Classement :

  • Mustang – SystĂšme principal de scoring, classement et diffusion
  • Ascorer – Algorithme principal de classement avant ajustements
  • NavBoost – SystĂšme de reclassement basĂ© sur les logs de clics utilisateurs.
  • FreshnessTwiddler – SystĂšme de reclassement basĂ© sur la fraĂźcheur des documents.
  • WebChooserScorer – DĂ©finit les caractĂ©ristiques utilisĂ©es pour le scoring des extraits.

Diffusion :

  • Google Web Server – Interface avec le frontend Google. Reçoit les donnĂ©es Ă  afficher.
  • SuperRoot – Cerveau de Google Search qui communique avec les serveurs et gĂšre le post-traitement pour le reclassement et la prĂ©sentation.
  • SnippetBrain – SystĂšme de gĂ©nĂ©ration des extraits de rĂ©sultats.
  • Glue – SystĂšme d’unification des rĂ©sultats selon le comportement utilisateur.
  • Cookbook – SystĂšme de gĂ©nĂ©ration de signaux, apparemment créés Ă  l’exĂ©cution.

 

On-Page Facteurs:

  • titlematchScore: Score de correspondance des titres Ă  l’Ă©chelle du site, indiquant dans quelle mesure les titres correspondent aux requĂȘtes des utilisateurs.
  • fontsize: Taille de la police des liens; utilisĂ©e par Google pour Ă©valuer l’importance du lien.
  • OriginalContentScore: Score reprĂ©sentant l’originalitĂ© du contenu, surtout pour les pages avec peu de contenu.
  • Avg. Term Weight: Renforcement des termes via l’utilisation de texte en gras ou de termes stratĂ©giques.
  • keywordStuffingScore: Score de spam pour le bourrage de mots-clĂ©s.
  • spamWordScore: Score associĂ© aux mots identifiĂ©s comme spam.
  • textConfidence: Confiance dans la pertinence et la qualitĂ© du texte.
  • effortScore: Effort et qualitĂ© dans la crĂ©ation de contenu.
  • Penguin Algorithm: Cible les liens spammy, y compris les liens internes sur-optimisĂ©s.
  • Document Length: Limite sur le nombre de mots et de ponctuations; le contenu important doit ĂȘtre placĂ© en dĂ©but de texte.
  • Content Length: Google traite un nombre limitĂ© de caractĂšres; le contenu important doit ĂȘtre placĂ© tĂŽt sur la page.
  • Page Titles: Doivent ĂȘtre optimisĂ©s et correspondre Ă©troitement aux mots-clĂ©s de la requĂȘte.
  • FreshnessTwiddler: Reclassement basĂ© sur la fraĂźcheur du contenu.

Off-Page Facteurs

  • Fresh Docs: Multiplicateur de fraĂźcheur pour les liens; les liens provenant de pages rĂ©centes sont mieux classĂ©s.
  • homePageInfo: Indique si la page source est une page d’accueil et son niveau de confiance.
  • SiteAuthority: Indique la crĂ©dibilitĂ© ou l’autoritĂ© globale d’un site.
  • sourceType: QualitĂ© de la page source d’un lien, corrĂ©lĂ©e Ă  son niveau d’indexation.
  • CreationDate: Date de premiĂšre dĂ©couverte d’un lien et derniĂšre date connue oĂč ce lien a Ă©tĂ© trouvĂ©.
  • TrustedAnchors: QualitĂ© et fiabilitĂ© des liens entrants.
  • SiteLinkIn: Valeur moyenne des liens entrants.
  • PriorSignal: Informations sur l’historique de l’URL; une mauvaise qualitĂ© antĂ©rieure peut affecter le classement.
  • anchorDiversityScore: DiversitĂ© des textes d’ancrage pour les liens pointant vers un site.
  • trustTarget: Indique si une URL se trouve sur une source fiable; les sites dignes de confiance ont plus de latitude.

PageRank :

  • PageRank: Score PageRank prenant en compte divers facteurs.
  • homepagePagerankNs: PageRank de la page d’accueil du site.
  • PagerankNS: Pagerank-NearestSeeds est un score de pagerank pour le document, calculĂ© Ă  l’aide de la mĂ©thode NearestSeeds. Il s’agit de la valeur de production PageRank que les Ă©quipes devraient utiliser. –> PageRank de 2018 – site de graine, cf mon article sur le PageRank.
  • pagerank: Valeur de classement d’une URL [0-65535]. DÉPRÉCIÉ. Configuration dans NearestSeeds.
  • pagerank2: Score pagerank expĂ©rimental. DÉPRÉCIÉ au profit de MustangBasicInfo.
  • crawlPagerank: Usage interne docjoiner pour transfĂ©rer les scores des canoniques sources vers les canoniques finales. –> faire une canonique permet de transfĂ©rer le PageRank.
  • toolbarPagerank: Score [0-10] . Si non dĂ©fini, utilise EstimatePreDemotion via MustangBasicInfo. –> le fameuxPageRank avec la toolbar.
  • FirstCoveragePagerankNs: Score pagerank initial lors de la premiĂšre indexation.
  • feedPagerank: Score normalisĂ© [0-1] spĂ©cifique aux flux RSS. Distinct du pagerank de la page d’accueil.
  • topPrOnsiteAnchorCount: QualitĂ© des ancres – optimale >51000, standard <47000
  • bookPagerank: Score pagerank spĂ©cifique aux pages de livres.
  • anchorPhraseCount: Le nombre de phrases d’ancrage uniques. LimitĂ© par la constante kMaxAnchorPhraseCountInStats (=5000)

Spam

  • Link Velocity: L’acquisition rapide de nombreux liens peut ĂȘtre signalĂ©e comme du spam.
  • spamRank: Mesure la probabilitĂ© qu’un document renvoie Ă  des spammeurs connus.
  • phraseAnchorSpamCount: Nombre de phrases de spam trouvĂ©es dans les ancres.
  • phraseAnchorSpamDays: Nombre de jours sur lesquels 80% de ces phrases de spam ont Ă©tĂ© dĂ©couvertes.
  • phraseAnchorSpamDemoted: Nombre total d’ancres dĂ©classĂ©es en raison du spam.
  • phraseAnchorSpamEnd: Temps auquel le pic de spam d’ancre a pris fin.
  • phraseAnchorSpamFraq: Fraction de phrases de spam parmi toutes les ancres du document.
  • spamBrainTotalDocSpamScore: Score de spam identifiĂ© par SpamBrain (de 0 Ă  1).
  • trendSpam: Indicateur de manipulation du CTR; nombre de requĂȘtes de spam tendance correspondantes.

Technique:

  • URLHistory: Google conserve les 20 derniers changements d’une URL.
  • mobileFriendlinessScore: Indique si un site est optimisĂ© pour les appareils mobiles.
  • pageLoadTimeScore: Score basĂ© sur le temps de chargement de la page; impacte l’expĂ©rience utilisateur.
  • bylineDate: Date explicitement dĂ©finie sur la page, utilisĂ©e dans les rĂ©sultats de recherche, syntacticDate: Date extraite de l’URL ou du titre du document, semanticDate: Date estimĂ©e Ă  partir du contenu du document –> La cohĂ©rence des dates (bylineDate, syntacticDate, semanticDate) sur la page est importante.
  • Ranking Degradation Factors: Facteurs comme les liens incohĂ©rents, une mauvaise UX, un faible CTR et un contenu de mauvaise qualitĂ© pouvant dĂ©grader les classements.
  • NSR Data (chardVariance, chardScoreVariance, nsrdataFromFallbackPatternKey): Mesures de variance pour les scores NSR appliquĂ©s au site; prĂ©disent la qualitĂ© du site ou de la page.
  • hostAge: Date Ă  laquelle Google a dĂ©couvert pour la premiĂšre fois du contenu sur le domaine.
  • YMYL Scores (ymylHealthScore, ymylNewsScore, encodedChardXlqYmylPrediction): Scores pour le contenu YMYL.

Sémantique:

  • author: Auteur(s) du document stockĂ©s en texte.
  • isAuthor: Indique si une entitĂ© sur la page est Ă©galement l’auteur du document.
  • Authors and Entities: Google considĂšre si les auteurs sont des entitĂ©s reconnues dans le Knowledge Graph.
  • TopicEmbedding: Valeur de la pertinence dans le temps.
  • siteEmbedding: ReprĂ©sentation vectorielle compressĂ©e du site pour l’analyse thĂ©matique.
  • pageEmbedding: ReprĂ©sentation vectorielle compressĂ©e de la page pour l’analyse thĂ©matique.
  • siteFocusScore: Mesure Ă  quel point un site est spĂ©cialisĂ© dans un domaine spĂ©cifique.
  • siteRadius: Mesure l’Ă©cart d’une page par rapport au sujet principal du site.
  • Semantic Text Scores (STS): Score global basĂ© sur la comprĂ©hension du texte, la saillance et les entitĂ©s.
  • Short Content Originality: Accent mis sur l’originalitĂ© du contenu court.
  • AI-Generated Content: Google peut dĂ©tecter et traiter diffĂ©remment le contenu gĂ©nĂ©rĂ© par l’IA.

Facteurs Locaux :

  • clickRadius50Percent: Le rayon (en miles) autour de l’emplacement attribuĂ© auquel le document reçoit 50 % de ses clics.
  • localBusinessCompletenessScore: ComplĂ©tude des informations sur l’entreprise locale.
  • businessReviewCount: Nombre de critiques et avis pour une entreprise locale.
  • NAPConsistencyScore: CohĂ©rence des informations Nom, Adresse et TĂ©lĂ©phone.
  • contentRelevanceScore: Pertinence du contenu pour les recherches locales.
  • localMentionCount: Nombre de mentions locales en ligne.
  • geoDistanceScore: Distance entre l’utilisateur et l’emplacement cible.
  • bestLocaleMatch: Pertinence de la langue et des mĂ©tadonnĂ©es locales.

Engagement des utilisateurs

  • UgcScore: Score liĂ© Ă  l’engagement du contenu gĂ©nĂ©rĂ© par les utilisateurs.
  • clic Ă©crasĂ©, clic court, clic long: Types de clics indiquant le niveau de satisfaction de l’utilisateur.
  • ChromeInTotal: Nombre total de vues via Chrome sur l’ensemble du site.
  • SiteImpressions, TopicImpressions, SiteClicks, TopicClicks: Indicateurs d’engagement et de pertinence.
  • Modulators (Tweeters): Ajustent les classements en fonction de la fraĂźcheur du contenu et des signaux d’engagement des utilisateurs.
  • Navboost: Reclassement basĂ© sur les logs de clics des utilisateurs.
  • Mustang Algorithm: Algorithme de classement principal avec des boosts pour des facteurs comme le CTR et la fraĂźcheur du contenu.
  • dailyClicks – Les clics quotidiens
  • dailyGoodClicks – Les bons clics quotidiens

Algorithmes de déclassement

  • Devaluation of Small Blogs: Les petits blogs peuvent ĂȘtre dĂ©valuĂ©s par rapport aux sites faisant autoritĂ©.
  • exact_match_domain_demotion: DĂ©classement appliquĂ© aux domaines Ă  correspondance exacte (EMD).
  • Anchor Mismatch: Le texte du lien ne correspond pas au site cible; le lien est dĂ©classĂ©.
  • SERP Demotion: DĂ©classement basĂ© sur des facteurs observĂ©s dans les pages de rĂ©sultats, indiquant une insatisfaction de l’utilisateur.
  • Nav Demotion: DĂ©classement pour les pages avec une mauvaise navigation ou des problĂšmes d’expĂ©rience utilisateur.
  • Product Review Demotion: DĂ©classement liĂ© Ă  la qualitĂ© des avis de produits.
  • Location Demotions: Les pages globales peuvent ĂȘtre dĂ©classĂ©es en faveur de rĂ©sultats plus localisĂ©s.
  • Panda Demotion: Quality_Coati.

Auteur

Stan De Jesus Oliveira
Propriétaire et fondateur de createur2site

Stan De Jesus Oliveira est le propriétaire de createur2site, il accompagne les entreprises dans leur création de site web, le Web Design et le référencement naturel SEO.

0 commentaires

Foire Aux Questions

Le contenu principal constitue l'élément central de toute page web. Cette section répond aux questions les plus fréquentes concernant sa définition, sa structure, son optimisation et son importance pour le référencement naturel et l'accessibilité.

Qu'est-ce que le contenu principal d'une page web ?

Le contenu principal reprĂ©sente l'information essentielle d'une page web, celle qui rĂ©pond directement Ă  l'intention de recherche de l'utilisateur. Il s'agit de la partie centrale qui distingue cette page de toutes les autres du site, excluant les Ă©lĂ©ments rĂ©currents comme l'en-tĂȘte, la navigation, le pied de page ou les barres latĂ©rales. Pour les moteurs de recherche comme Google, identifier correctement le contenu principal est crucial pour Ă©valuer la pertinence et la qualitĂ© d'une page.

Comment structurer le contenu principal en HTML ?

La structure HTML du contenu principal doit utiliser la balise sĂ©mantique <main> pour englober le contenu unique de la page. Cette balise doit ĂȘtre unique par page et contenir les Ă©lĂ©ments principaux comme les titres <h1>, paragraphes, images et mĂ©dias pertinents. Il est recommandĂ© d'organiser le contenu de maniĂšre hiĂ©rarchique avec des balises <article>, <section> et des titres structurĂ©s (<h2>, <h3>, etc.) pour faciliter la comprĂ©hension par les moteurs de recherche et les technologies d'assistance. Pour Ă©viter les erreurs courantes, consultez notre guide sur les balises h1-h6 en SEO.

Pourquoi le contenu principal est-il important pour le référencement naturel ?

Le contenu principal est dĂ©terminant pour le rĂ©fĂ©rencement car les algorithmes de Google l'analysent en prioritĂ© pour Ă©valuer la pertinence d'une page vis-Ă -vis d'une requĂȘte. Un contenu principal de qualitĂ©, bien structurĂ© et rĂ©pondant prĂ©cisĂ©ment Ă  l'intention de recherche amĂ©liore considĂ©rablement les chances de positionnement. Les fuites Google ont rĂ©vĂ©lĂ© que les moteurs de recherche accordent plus de poids aux Ă©lĂ©ments situĂ©s dans le contenu principal qu'aux sections secondaires du site. Un audit seo approfondi permet d'identifier les axes d'amĂ©lioration de votre contenu principal.

Quelle est la différence entre contenu principal et contenu secondaire ?

Le contenu principal est unique Ă  chaque page et rĂ©pond directement Ă  l'objectif de celle-ci, tandis que le contenu secondaire inclut les Ă©lĂ©ments rĂ©pĂ©titifs prĂ©sents sur plusieurs pages : navigation, menus, barres latĂ©rales, footer et widgets. Par exemple, sur un article de blog, le contenu principal est l'article lui-mĂȘme, alors que les suggestions d'articles similaires, les commentaires ou la bio de l'auteur constituent du contenu secondaire. Cette distinction est essentielle pour l'optimisation SEO.

Comment optimiser le contenu principal pour l'accessibilité web ?

Pour optimiser l'accessibilité du contenu principal, utilisez la balise <main> avec l'attribut ARIA role="main" si nécessaire. Assurez-vous que la structure de titres est cohérente, les images possÚdent des attributs alt descriptifs, et le contraste des couleurs est suffisant. Ajoutez des liens d'évitement permettant de sauter directement au contenu principal. Ces pratiques améliorent l'expérience des utilisateurs de lecteurs d'écran et renforcent simultanément votre référencement naturel.

Quelles sont les bonnes pratiques pour organiser le contenu principal ?

Organisez le contenu principal en suivant une structure logique et hiérarchique : commencez par un titre H1 clair, divisez le contenu en sections avec des sous-titres pertinents, utilisez des paragraphes courts et aérés. Intégrez des éléments visuels pour illustrer vos propos, ajoutez des listes à puces pour améliorer la lisibilité, et placez les informations les plus importantes en début de contenu. Maintenez un équilibre entre densité informative et fluidité de lecture pour optimiser l'expérience utilisateur et les performances SEO.

Comment améliorer la qualité du contenu principal existant ?

Pour améliorer un contenu principal existant, commencez par analyser sa performance actuelle et identifiez les lacunes sémantiques. Utilisez un outil pour améliorer la richesse lexicale et la pertinence thématique de votre texte. Enrichissez votre contenu avec des informations à jour, des données chiffrées et des exemples concrets. Si vous avez besoin d'accompagnement personnalisé, faire appel à un consultant seo peut vous aider à optimiser efficacement votre stratégie de contenu et maximiser votre visibilité en ligne.