• Aktualizace vyhledávání Google a SEO Insights

Rozbalení rozsáhlého úniku vyhledávací dokumentace společnosti Google

  • Felix Rose-Collins
  • 7 min read
Rozbalení rozsáhlého úniku vyhledávací dokumentace společnosti Google

Úvodní stránka

Masivní únik interní dokumentace k hodnocení vyhledávače Google vyvolal v komunitě SEO šok. Únik, který odhalil více než 14 000 potenciálních funkcí hodnocení, nabízí bezprecedentní pohled pod kapotu přísně střeženého systému hodnocení vyhledávání Google.

Příběh za únikem

Erfan Azimi sdílel únik dokumentu Google API s Randem Fishkinem ze SparkToro, který pak požádal Michaela Kinga z iPullRank, aby pomohl informace rozšířit. Uniklé soubory, pocházející z revize dokumentu Google API s názvem "yoshi-code-bot /elixer-google-api", nebyly výsledkem hackerského útoku ani whistleblowera, ale spíše interního uvolnění dokumentu.

Přehled úniku

Tento únik poskytuje komplexní pohled na faktory hodnocení společnosti Google, odhaluje rozdíly v PageRanku, metriky autority webu a mnoho dalšího. Zde je podrobný rozpis:

Klíčové poznatky z úniku dokumentů z vyhledávání Google

PageRank a jeho varianty

  • PageRank_NS: Tento algoritmus, který je nyní již zastaralý, je spojen s porozuměním dokumentu a modifikuje tradiční PageRank tak, aby se zaměřil na lokalizovanou podmnožinu sítě kolem semenných uzlů.

  • Sedm typů PageRanku: Google uvádí sedm různých typů PageRanku, včetně známého ToolBarPageRanku. Tyto varianty naznačují, že Google používá k hodnocení důležitosti stránek více metod.

Identifikace obchodního modelu

Algoritmus společnosti Google dokáže rozpoznat různé obchodní modely, včetně zpravodajských webů, webů YMYL (Your Money or Your Life), osobních blogů, elektronických obchodů a videí. Důvod specifického filtrování osobních blogů zůstává nejasný a vyvolává otázky ohledně širších záměrů společnosti Google.

Součásti algoritmu

  • NavBoost: Na základě chování uživatelů a záznamů o kliknutí, které jsou silně ovlivněny daty z prohlížeče Chrome, je vytvořen mechanismus pro změnu pořadí.

  • NSR (Normalized Site Rank): Slouží k výpočtu pořadí stránek pro části stránek na úrovni hostitele.

  • ChardScores: Skóre na úrovni webu předpovídající kvalitu webu/stránky na základě obsahu.

Metriky autority webu

K hodnocení autority webu používá společnost Google metriku autority celého webu a několik signálů, včetně návštěvnosti z prohlížečů Chrome. To naznačuje, že celková kvalita a důvěryhodnost webu hrají významnou roli při hodnocení.

Techniky vkládání a tematické autority

  • Vložené stránky a weby: Google ve své hodnotící funkci používá vložené stránky, vložené stránky, zaměření stránek a poloměr stránek, aby pochopil tematickou relevanci a konzistenci obsahu webových stránek.

  • Hranice tématu a autorita tématu: Metriky jako siteFocusScore, siteRadius, siteEmbeddings a pageEmbeddings se používají k měření tematické autority a zdůrazňují důležitost zachování jasného tematického zaměření.

googleapi

Data o kliknutí a zapojení uživatelů

  • NavBoost: NavBoost se při změně pořadí výsledků vyhledávání spoléhá na údaje o kliknutí a chování uživatelů, což podtrhuje význam metrik zapojení uživatelů.

  • Klikněte na položku Metriky: Google měří různé typy kliknutí, včetně špatných kliknutí, dobrých kliknutí, posledních nejdelších kliknutí a zobrazení celého webu.

Kvalitní data NSR

Klíčové faktory hodnocení z datového dokumentu NSR zahrnují:

  • titlematchScore: skóre shody titulů na webu, které udává, jak dobře odpovídají dotazy uživatelů.

  • site2vecEmbedding: Vektor sitewide podobný vektoru word2vec, který zdůrazňuje důležitost komplexního vložení stránek.

  • pnavClicks: Pravděpodobně souvisí s navigačními informacemi odvozenými z údajů o kliknutí uživatele.

  • chromeInTotal: Zobrazení v prohlížeči Chrome v rámci celého webu, které zdůrazňuje důležitost signálů v rámci celého webu.

  • chardVariance a chardScoreVariance: Skóre předpovídající kvalitu webu/stránky na základě obsahu, přičemž klíčová je konzistence.

NSR Data Insights

Praktické poznatky pro odborníky na SEO

  1. Investujte do dobře navrženého webu: Ujistěte se, že má váš web intuitivní architekturu pro optimalizaci pro NavBoost, který se při změně pořadí výsledků vyhledávání spoléhá na chování uživatelů a záznamy o kliknutí.

  2. Odstranění/blokování tematicky irelevantních stránek: Odstranit nebo zablokovat stránky, které nejsou tematicky relevantní. Stanovte si cílové téma a zajistěte, aby každá stránka měla v této oblasti dobré hodnocení.

  3. Optimalizace nadpisů a obsahu: Optimalizujte nadpisy podle dotazů a zajistěte, aby odstavce jasně odpovídaly na tyto dotazy, a zlepšete tak zařazení stránky a její relevanci.

  4. Zaměřte se na kliknutí a zobrazení: Pište obsah, který přiláká více zobrazení a kliknutí a klade důraz na zapojení uživatelů.

  5. Pravidelně aktualizujte obsah: Pravidelně aktualizujte obsah o jedinečné informace, nové obrázky a videa, abyste si udrželi čerstvost a dosáhli vysokého skóre při výpočtu úsilí.

  6. Udržujte vysokou kvalitu obsahu: Důležitá je konzistence vysoce kvalitního obsahu. Skóre chard na úrovni webu Google předpovídá kvalitu webu/stránky na základě obsahu.

  7. Růst hodnoty dojmu: Rostoucí počet impresí je pozitivní známkou výkonnosti webu.

  8. Optimalizujte na zřetelnost entit: Zaměřte se na zlepšení skóre salience entit a identifikaci nejlepších entit, jak je uvedeno v úniku.

  9. Odstranění špatně fungujících stránek: Identifikujte a odstraňte stránky se špatnými uživatelskými metrikami a bez zpětných odkazů, abyste udrželi vysoké skóre celého webu.

panda

Jak odstranit paměť společnosti Google na starou verzi dokumentu

Podle úniku informací si společnost Google uchovává záznamy o každé verzi webové stránky a vede interní webový archiv podobný službě Wayback Machine. Google však používá pouze posledních 20 verzí dokumentu. Pokud stránku aktualizujete, počkáte na procházení a proces 20krát zopakujete, můžete efektivně vytlačit určité verze stránky. Tato taktika by mohla být užitečná pro zlepšení historických vah a skóre spojených se staršími verzemi.

Systém hodnocení vyhledávání Google

Google Search Ranking System

Zajímavou domněnkou z úniku je vliv váhy termínu (doslovné velikosti). Tučné písmo nebo úprava velikosti slov může mít vliv na skóre dokumentu. Kromě toho mechanismy ukládání do indexu Google upřednostňují obsah různě:

  • Flash disky: Pro nejdůležitější a pravidelně aktualizovaný obsah.

  • Pevné disky: Pro méně důležitý obsah.

  • Standardní pevné disky: Pro nepravidelně aktualizovaný obsah.

Indexer společnosti Google: Alexandria

Alexandria

Indexér společnosti Google se jmenuje Alexandria podle slavné knihovny. Mezi další zmíněné indexery patří SegIndexer, který umisťuje dokumenty do vrstev, a TeraGoogle, který se stará o dlouhodobé ukládání do paměti.

Seed Sites a Sitewide Authority

V úniku je zmíněn faktor s názvem isElectionAuthority, který pravděpodobně označuje výchozí stránky nebo tematické autority. Naznačuje, že weby s vysokou autoritou, například s PageRankem 9/10, mají významný vliv. Faktor nsrIsElectionAuthority je však považován za zastaralý, což ponechává určitou nejednoznačnost v interpretaci.

Krátký obsah se může umístit

Navzdory obecnému přesvědčení se krátký obsah nerovná tenkému obsahu. Únik potvrzuje, že krátký obsah se může dobře umístit, i když s jiným systémem bodování.

Čerstvé odkazy vs. stávající odkazy

Podle multiplikátoru hodnoty odkazu freshdocs jsou odkazy z novějších webových stránek cennější než odkazy vložené do staršího obsahu. To naznačuje, že ačkoli úpravy výklenků mohou být účinné, čerstvé odkazy mají větší dopad.

Oblíbené objevy

Kvalita stránky (PQ)

Společnost Google používá metodu LLM k odhadu "náročnosti" stránek článků a pomáhá určit, zda lze stránku snadno replikovat. Nástroje, obrázky, videa, jedinečné informace a hloubka informací jsou způsoby, jak dosáhnout vysokého skóre při výpočtu náročnosti.

Hranice tématu a autorita tématu

Klíčová je tematická autorita, kterou podporují siteFocusScore, siteRadius, siteEmbeddings a pageEmbeddings. Udržování jasného tematického zaměření a minimalizace odchylek od tématu pomáhá zlepšovat hodnocení.

Kvalita obrazu

ImageQualityClickSignals měří kvalitu obrázku na základě údajů o kliknutí (užitečnost, prezentace, atraktivita, zapojení).

Hostitelská NSR

NSR hostitele je pořadí webu vypočtené pro části webu na úrovni hostitele, které měří kvalitu v segmentech. Tento systém členění pomáhá společnosti Google komplexně hodnotit kvalitu stránek.

Jednotná teorie řazení

Tato část se pokouší konsolidovat faktory z úniku do matematického vzorce, přičemž zdůrazňuje různé metriky a jejich dopady na celkové hodnocení ®.

Definice a metriky

formula

Skóre interakce s uživatelem (UIS):

formula

  • UgcScore: Zapojení obsahu generovaného uživateli.

  • TitleMatchScore: Relevance názvů k dotazům uživatelů.

  • ChromeInTotal: Celkový počet interakcí sledovaných prostřednictvím prohlížeče Chrome.

  • SiteImpressions: Celkový počet zobrazení stránek.

  • TémaDojmy: Imprese na stránkách věnovaných danému tématu.

  • SiteClicks: Míra prokliků na stránku.

  • TopicClicks: Míra prokliků na stránky s konkrétním tématem.

Skóre kvality obsahu (CQS):

formula

  • ImageQualityClickSignals: Signály kvality z kliknutí na obrázek.

  • VideoScore: Kvalita a zapojení videoobsahu.

  • ShoppingScore: Skóre pro obsah související s nakupováním.

  • PageEmbedding: Sémantické vkládání obsahu stránky.

  • SiteEmbedding: Sémantické vkládání obsahu webu.

  • SiteRadius: Odchylka v rámci vloženého místa.

  • SiteFocus: Metrika udávající zaměření tématu.

  • TextConfidence: Důvěra v relevanci a kvalitu textu.

  • EffortScore: Vynaložené úsilí a kvalita při tvorbě obsahu.

Skóre odkazů (LS):

Link Scores

  • TrustedAnchors: Kvalita a důvěryhodnost příchozích odkazů.

  • SiteLinkIn: Průměrná hodnota příchozích odkazů.

  • PageRank: Různá skóre PageRanku (0, 1, 2, ToolBar, NR).

Zvýšení relevance (RB):

Relevance Boost

  • TopicEmbedding: Relevance v čase.

  • QnA: Základní měřítko kvality.

  • STS: Souhrnné skóre založené na porozumění textu, významu a entitách.

Zvýšení kvality (QB):

Quality Boost

  • SAS: skóre autority webu týkající se důvěryhodnosti, spolehlivosti a autority odkazů.

  • EFTS: EFTS: skóre úsilí zahrnující text, multimédia a komentáře.

  • FS: Skóre čerstvosti na základě data aktualizace a původního příspěvku.

  • CSA: Úpravy specifické pro obsah na základě SERP a funkcí na stránce.

CSA

Úpravy specifické pro obsah (CSA):

  • CDS: Skóre dat v prohlížeči Chrome zaměřené na zobrazení a kliknutí na webu.

  • SDS: Skóre degradace serveru na základě měření zkušeností se SERP.

  • EQSS: Experimentální skóre Q Star pro experimentální proměnné.

Úplný vzorec

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-.

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Obecný přehled bodování

1. Zapojení uživatelů:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Multimediální skóre:

  • ImageQualityClickSignals, VideoScore, ShoppingScore

3. Odkazy:

  • TrustedAnchors, SiteLinkIn (průměrná hodnota příchozích odkazů), PageRank (0, 1, 2, ToolBar, NR)

4. Porozumění obsahu:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Závěr

Únik dokumentace poskytuje neocenitelné informace o mechanismech řazení Google, vyvrací několik mýtů a odhaluje složité faktory ovlivňující výsledky vyhledávání. Profesionálové v oblasti SEO mohou tyto znalosti využít ke zdokonalení svých strategií a zaměřit se na zapojení uživatelů, tematickou relevanci a konzistentní kvalitu obsahu. Jakmile se komunita SEO s těmito odhaleními seznámí, mnozí pravděpodobně přehodnotí své přístupy ve světle těchto nových informací.

Pochopením a uplatněním těchto poznatků se mohou odborníci na SEO lépe orientovat ve složitém systému hodnocení Google a v konečném důsledku zvýšit viditelnost a výkonnost svých webových stránek ve výsledcích vyhledávání.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Začněte používat Ranktracker... zdarma!

Zjistěte, co brání vašemu webu v umístění.

Vytvoření bezplatného účtu

Nebo se přihlaste pomocí svých přihlašovacích údajů

Different views of Ranktracker app