• Actualizări Google Search & SEO Insights

Despachetarea scurgerii masive a documentației de căutare a Google

  • Felix Rose-Collins
  • 8 min read
Despachetarea scurgerii masive a documentației de căutare a Google

Introducere

O scurgere masivă de informații privind documentația internă de clasificare Google Search a provocat un șoc în comunitatea SEO. Scurgerea de informații, care a expus peste 14.000 de caracteristici potențiale de clasificare, oferă o privire fără precedent sub capota sistemului de clasificare a căutărilor atent păzit de Google.

Povestea din spatele scurgerii de informații

Erfan Azimi a împărtășit o scurgere de documente API de la Google cu Rand Fishkin de la SparkToro, care l-a înrolat apoi pe Michael King de la iPullRank pentru a ajuta la diseminarea informațiilor. Fișierele scurse, care provin dintr-un document API Google intitulat "yoshi-code-bot /elixer-google-api", nu au fost rezultatul unui hack sau al unui denunțător, ci mai degrabă al unei eliberări de documente interne.

Prezentare generală a scurgerii

Scurgerea de informații oferă o perspectivă cuprinzătoare asupra factorilor de clasificare Google, dezvăluind informații despre variațiile PageRank, indicatorii de autoritate ai site-ului și multe altele. Iată o defalcare detaliată:

Informații cheie din scurgerea documentelor de căutare Google

PageRank și variațiile sale

  • PageRank_NS: Acum depreciat, acest algoritm este asociat cu înțelegerea documentelor și modifică PageRank-ul tradițional pentru a se concentra pe un subset localizat al rețelei în jurul nodurilor de semințe.

  • Șapte tipuri de PageRank: Google menționează șapte tipuri diferite de PageRank, inclusiv celebrul ToolBarPageRank. Aceste variații indică faptul că Google folosește mai multe metode pentru a evalua importanța paginilor.

Identificarea modelului de afaceri

Algoritmul Google poate identifica diverse modele de afaceri, inclusiv site-uri de știri, site-uri YMYL (Your Money or Your Life), bloguri personale, comerț electronic și site-uri video. Motivul din spatele filtrării specifice pentru blogurile personale rămâne neclar și ridică întrebări cu privire la intențiile mai largi ale Google.

Componentele algoritmului

  • NavBoost: Un mecanism de re-clasare bazat pe comportamentul utilizatorului și pe jurnalele de clicuri, puternic influențat de datele Chrome.

  • NSR (Normalized Site Rank): Se utilizează pentru a calcula rangul site-ului pentru bucăți de site la nivel de gazdă.

  • ChardScores: Scoruri la nivel de site care prezic calitatea site-ului/paginii pe baza conținutului.

Site Authority Metrics

Pentru a evalua autoritatea unui site, Google utilizează un indicator de autoritate la nivelul întregului site și mai multe semnale, inclusiv traficul de la browserele Chrome. Acest lucru sugerează că calitatea și credibilitatea generală a site-ului joacă un rol important în clasificare.

Tehnici de încorporare și autoritate tematică

  • Încorporări de pagini și site-uri: Google utilizează încorporări de pagini, încorporări de site-uri, focalizare și rază a site-ului în funcția sa de scorare pentru a înțelege relevanța și coerența conținutului unui site web din punct de vedere tematic.

  • Frontierele subiectelor și autoritatea subiectelor: Parametrii precum siteFocusScore, siteRadius, siteEmbeddings și pageEmbeddings sunt utilizați pentru a măsura autoritatea tematică, subliniind importanța menținerii unui accent clar pe subiect.

googleapi

Date privind clicurile și implicarea utilizatorilor

  • NavBoost: NavBoost se bazează pe datele de clic și pe comportamentul utilizatorilor pentru a reclasifica rezultatele căutării, subliniind importanța indicatorilor de implicare a utilizatorilor.

  • Faceți clic pe Metrics: Google măsoară diferite tipuri de clicuri, inclusiv clicuri proaste, clicuri bune, ultimele clicuri cele mai lungi și impresii la nivelul întregului site.

Date de calitate NSR

Factorii cheie de notare din documentul de date NSR includ:

  • titlematchScore: Un scor de potrivire a titlurilor la nivelul întregului site, care indică cât de bine corespund titlurile la interogările utilizatorilor.

  • site2vecEmbedding: Un vector la nivel de site similar cu word2vec, care evidențiază importanța integrării complete a site-urilor.

  • pnavClicks: Probabil legate de informațiile de navigare derivate din datele de clic ale utilizatorului.

  • chromeInTotal: Vizualizări Chrome la nivelul întregului site, subliniind importanța semnalelor la nivelul întregului site.

  • chardVariance și chardScoreVariance: Scoruri care prezic calitatea site-ului/paginii pe baza conținutului, consecvența fiind esențială.

NSR Data Insights

Concluzii practice pentru profesioniștii SEO

  1. Investiți într-un site bine conceput: Asigurați-vă că site-ul dvs. are o arhitectură intuitivă pentru a optimiza NavBoost, care se bazează pe comportamentul utilizatorului și pe jurnalele de clicuri pentru a reclasifica rezultatele căutării.

  2. Îndepărtați/blocați paginile irelevante din punct de vedere topic: Eliminați sau blocați paginile care nu sunt relevante din punct de vedere topic. Stabiliți subiectul țintă și asigurați-vă că fiecare pagină are un scor bun în acest domeniu.

  3. Optimizați titlurile și conținutul: Optimizați titlurile în jurul interogărilor și asigurați-vă că paragrafele răspund clar la aceste interogări pentru a îmbunătăți integrarea și relevanța paginii.

  4. Concentrează-te pe clicuri și impresii: Scrieți conținut care atrage mai multe impresii și clicuri, punând accentul pe implicarea utilizatorului.

  5. Actualizați în mod regulat conținutul: Actualizați în mod regulat conținutul cu informații unice, imagini noi și videoclipuri pentru a menține prospețimea și pentru a obține un scor ridicat la calculele de efort.

  6. Mențineți un conținut de înaltă calitate: Consecvența în conținutul de înaltă calitate este crucială. Scorurile Google chard la nivel de site prezic calitatea site-ului/paginii pe baza conținutului.

  7. Creștere a impresiilor de valoare: Creșterea numărului de impresii este un semn pozitiv al performanței site-ului.

  8. Optimizarea pentru saliența entităților: Concentrați-vă pe îmbunătățirea scorurilor de saliență pentru entități și pe identificarea entităților de top, așa cum se menționează în scurgere.

  9. Eliminați paginile cu performanțe slabe: Identificați și eliminați paginile cu parametri de utilizator slabi și fără backlink-uri pentru a menține scorurile ridicate la nivelul întregului site.

panda

Cum să eliminați memoria Google a unei versiuni vechi a unui document

Potrivitscurgerii de informații, Google păstrează o înregistrare a fiecărei versiuni a unei pagini web, menținând o arhivă web internă similară cu Wayback Machine. Cu toate acestea, Google utilizează doar ultimele 20 de versiuni ale unui document. Dacă actualizați o pagină, așteptați o căutare și repetați procesul de 20 de ori, puteți elimina efectiv anumite versiuni ale paginii. Această tactică ar putea fi utilă pentru a îmbunătăți ponderile și scorurile istorice asociate cu versiunile mai vechi.

Sistemul de clasificare a căutărilor Google

Google Search Ranking System

O ipoteză interesantă rezultată în urma scurgerii este impactul ponderii termenului (dimensiunea literală). Scrierea cuvintelor cu litere îngroșate sau ajustarea dimensiunii cuvintelor poate influența scorurile documentelor. În plus, mecanismele de stocare a indexului Google prioritizează diferit conținutul:

  • Unități flash: Pentru conținutul cel mai important și actualizat periodic.

  • Unități de stocare solidă: Pentru conținutul mai puțin important.

  • Hard disk-uri standard: Pentru conținutul actualizat neregulat.

Indexatorul Google: Alexandria

Alexandria

Indexatorul Google se numește Alexandria, după numele celebrei biblioteci. Printre alți indexatori menționați se numără SegIndexer, care plasează documentele pe niveluri, și TeraGoogle, care se ocupă de stocarea în memoria pe termen lung.

Site-uri Seed și autoritate la nivel de site

Scurgerea de informații menționează un factor numit isElectionAuthority, care poate indica site-uri de semințe sau autorități de top. Acesta sugerează că site-urile cu autoritate ridicată, cum ar fi cele cu un PageRank de 9/10, au o influență semnificativă. Cu toate acestea, nsrIsElectionAuthority este considerat depreciat, ceea ce lasă o oarecare ambiguitate în interpretare.

Conținutul scurt poate fi clasat

Contrar credinței comune, conținutul scurt nu înseamnă conținut subțire. Scurgerea de informații confirmă faptul că un conținut scurt poate fi bine clasat, deși cu un sistem de notare diferit.

Legături proaspete vs. Legături existente

Conform multiplicatorului de valoare a legăturilor freshdocs, legăturile din paginile web mai noi sunt mai valoroase decât cele inserate în conținut mai vechi. Acest lucru indică faptul că, deși editările de nișă pot fi eficiente, legăturile proaspete au un impact mai mare.

Descoperiri preferate

Calitatea paginii (PQ)

Google utilizează un LLM pentru a estima "efortul" pentru paginile de articole, ajutând la determinarea dacă o pagină poate fi ușor de reprodus. Instrumentele, imaginile, clipurile video, informațiile unice și profunzimea informațiilor sunt modalități de a obține un scor ridicat la calcularea efortului.

Frontierele subiectului și autoritatea subiectului

Autoritatea tematică, susținută de siteFocusScore, siteRadius, siteEmbeddings și pageEmbeddings, este esențială. Menținerea unui focus topic clar și reducerea la minimum a devierilor de la subiect ajută la îmbunătățirea clasamentului.

Calitatea imaginii

ImageQualityClickSignals măsoară calitatea imaginii pe baza datelor de clic (utilitate, prezentare, atractivitate, atractivitate).

Gazdă NSR

Host NSR este clasamentul site-ului calculat pentru bucăți de site la nivel de gazdă, măsurând calitatea pe segmente. Acest sistem de clasificare ajută Google să evalueze calitatea site-ului în mod cuprinzător.

Teoria unificată a clasamentului

Această secțiune încearcă să consolideze factorii din scurgere într-o formulă matematică, evidențiind diferiți parametri și impactul acestora asupra scorului general al clasamentului ®.

Definiții și indicatori

formula

Punctaje de interacțiune cu utilizatorul (UIS):

formula

  • UgcScore: Angajarea conținutului generat de utilizatori.

  • TitleMatchScore: Relevanța titlurilor în raport cu interogările utilizatorilor.

  • ChromeInTotal: Totalul interacțiunilor urmărite prin Chrome.

  • SiteImpresii: Numărul total de impresii pe site.

  • TopicImpresii: Impresii pe paginile specifice unui subiect.

  • SiteClicks: Rata de clicuri pentru site.

  • TopicClicks: Rata de clicuri pentru paginile cu subiecte specifice.

Scoruri de calitate a conținutului (CQS):

formula

  • ImageQualityClickSignals: Semnale de calitate de la clicurile pe imagine.

  • VideoScore: Calitatea și implicarea conținutului video.

  • ShoppingScore: Punctaj pentru conținutul legat de cumpărături.

  • PageEmbedding: Încorporarea semantică a conținutului paginii.

  • SiteEmbrăcăminte: Încorporarea semantică a conținutului site-ului.

  • SiteRadius: Măsură de abatere în cadrul inserției site-ului.

  • SiteFocus: Metrică ce indică concentrarea pe subiect.

  • TextConfidence: Încrederea în relevanța și calitatea textului.

  • Scor de efort: Efort și calitate în crearea de conținut.

Scoruri de legătură (LS):

Link Scores

  • TrustedAnchors: Calitatea și fiabilitatea legăturilor primite.

  • SiteLinkIn: Valoarea medie a legăturilor primite.

  • PageRank: Diverse scoruri PageRank (0, 1, 2, ToolBar, NR).

Relevance Boost (RB):

Relevance Boost

  • TematicaEmbedding: Relevanța în timp.

  • QnA: Măsură de bază a calității.

  • STS: Scorul agregat bazat pe înțelegerea textului, pe relevanță și pe entități.

Creșterea calității (QB):

Quality Boost

  • SAS: scorul de autoritate al site-ului în ceea ce privește încrederea, fiabilitatea și autoritatea legăturilor.

  • EFTS: Scor de efort care include text, multimedia și comentarii.

  • FS: Punctaj de prospețime bazat pe datele de actualizare și pe data postării originale.

  • CSA: Ajustări specifice conținutului pe baza SERP și a caracteristicilor de pe pagină.

CSA

Ajustări specifice conținutului (CSA):

  • CDS: scorul de date Chrome se concentrează pe impresii și clicuri pe site.

  • SDS: scorul de retrogradare Serp bazat pe măsurarea experienței SERP.

  • EQSS: scorul experimental Q Star pentru variabilele experimentale.

Formula completă

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-

R=((w1⋅UgcScore+w2⋅TitleMatchScore+w3⋅ChromeInTotal+w4⋅SiteImpressions+w5⋅TopicImpressions+w6⋅SiteClicks+w7⋅TopicClicks+w7⋅TopicClicks)+(v1⋅ImageQualityClickSignals+v2⋅VideoScore+v3⋅ShoppingScore+v4⋅PageEmbedding+v5⋅SiteEmbedding+v6⋅SiteRadius+v7⋅SiteFocus+v8⋅TextConfidence+v9⋅EffortScore)+(x1⋅TrustedAnchors+x2⋅SiteLinkIn+x3⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1⋅CDS+y2⋅SDS+y3⋅EQSS)

Prezentare generală a scorului generalizat

1. Implicarea utilizatorilor:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Scoruri multi-media:

  • Calitatea imaginiiClickSignals, VideoScore, ShoppingScore

3. Legături:

  • TrustedAnchors, SiteLinkIn (valoarea medie a legăturilor primite), PageRank (0, 1, 2, ToolBar, NR)

4. Înțelegerea conținutului:

  • PaginaEmbrăcăminte, SiteEmbrăcăminte, SiteRadius, SiteFocus, TextConfidence, EffortScore

Concluzie

Scurgerea de documente oferă informații neprețuite despre mecanismele de clasificare ale Google, demontând mai multe mituri și dezvăluind factori complicați care influențează rezultatele căutărilor. Profesioniștii SEO pot profita de aceste cunoștințe pentru a-și rafina strategiile, concentrându-se pe implicarea utilizatorilor, relevanța topică și calitatea constantă a conținutului. Pe măsură ce comunitatea SEO digeră aceste dezvăluiri, mulți își vor reconsidera probabil abordările în lumina acestor noi informații.

Înțelegând și aplicând aceste informații, practicienii SEO pot naviga mai bine prin complexitatea sistemului de clasificare Google, îmbunătățind în cele din urmă vizibilitatea și performanța site-ului lor în rezultatele căutărilor.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Începeți să utilizați Ranktracker... Gratuit!

Aflați ce împiedică site-ul dvs. să se claseze.

Creați un cont gratuit

Sau Conectați-vă folosind acreditările dvs.

Different views of Ranktracker app