• Aggiornamenti della ricerca Google e approfondimenti SEO

Come si spiega la massiccia fuga di documentazione di Google sulla ricerca

  • Felix Rose-Collins
  • 8 min read
Come si spiega la massiccia fuga di documentazione di Google sulla ricerca

Introduzione

Una massiccia fuga di notizie sulla documentazione interna relativa al ranking di Google Search ha provocato un'onda d'urto nella comunità dei SEO. La fuga di notizie, che ha rivelato oltre 14.000 potenziali funzioni di ranking, offre uno sguardo senza precedenti sotto il cofano del sistema di ranking di ricerca strettamente custodito da Google.

La storia della fuga di notizie

Erfan Azimi ha condiviso una fuga di documenti delle API di Google con Rand Fishkin di SparkToro, che ha poi arruolato Michael King di iPullRank per contribuire a diffondere le informazioni. I file trapelati, provenienti da un commit di documenti API di Google intitolato "yoshi-code-bot /elixer-google-api", non sono il risultato di un hack o di un whistleblower, ma piuttosto di un rilascio di documenti interni.

Panoramica della perdita

La fuga di notizie fornisce una visione completa dei fattori di ranking di Google, rivelando approfondimenti sulle variazioni di PageRank, sulle metriche di autorità dei siti e molto altro. Ecco una ripartizione dettagliata:

Principali informazioni dalla fuga di documenti di ricerca di Google

Il PageRank e le sue varianti

  • PageRank_NS: ora deprecato, questo algoritmo è associato alla comprensione dei documenti e modifica il PageRank tradizionale per concentrarsi su un sottoinsieme localizzato della rete intorno ai nodi seme.

  • Sette tipi di PageRank: Google cita sette diversi tipi di PageRank, tra cui la famosa ToolBarPageRank. Queste variazioni indicano che Google impiega più metodi per valutare l'importanza delle pagine.

Identificazione del modello di business

L'algoritmo di Google è in grado di identificare diversi modelli di business, tra cui siti di notizie, siti YMYL (Your Money or Your Life), blog personali, e-commerce e siti di video. Il motivo del filtraggio specifico per i blog personali rimane poco chiaro e solleva domande sulle intenzioni più ampie di Google.

Componenti dell'algoritmo

  • NavBoost: Un meccanismo di ri-classificazione basato sul comportamento dell'utente e sui log dei clic, fortemente influenzato dai dati di Chrome.

  • NSR (Normalized Site Rank): Utilizzato per calcolare il rank del sito per i chunk del sito a livello di host.

  • ChardScores: Punteggi a livello di sito che predicono la qualità del sito/pagina in base al contenuto.

Metriche dell'autorità del sito

Per valutare l'autorità di un sito, Google utilizza una metrica di autorità a livello di sito e diversi segnali, tra cui il traffico proveniente dai browser Chrome. Ciò suggerisce che la qualità complessiva del sito e la credibilità giocano un ruolo significativo nel posizionamento.

Tecniche di incorporazione e autorità topica

  • Incorporamenti di pagine e siti: Google utilizza le incorporazioni di pagina, le incorporazioni di sito, l'attenzione al sito e il raggio del sito nella sua funzione di punteggio per comprendere la pertinenza e la coerenza dei contenuti di un sito web.

  • Confini degli argomenti e autorità degli argomenti: Metriche come siteFocusScore, siteRadius, siteEmbeddings e pageEmbeddings sono utilizzate per misurare l'autorità topica, sottolineando l'importanza di mantenere un chiaro focus topico.

googleapi

Dati sui clic e coinvolgimento degli utenti

  • NavBoost: NavBoost si basa sui dati dei clic e sul comportamento degli utenti per riorganizzare i risultati di ricerca, sottolineando l'importanza delle metriche di coinvolgimento degli utenti.

  • Metriche dei clic: Google misura vari tipi di clic, tra cui i clic cattivi, i clic buoni, gli ultimi clic più lunghi e le impressioni a livello di sito.

Approfondimenti sui dati NSR di qualità

I fattori di punteggio chiave del documento di dati NSR includono:

  • titlematchScore: Punteggio di corrispondenza del titolo a livello di sito, che indica la corrispondenza dei titoli con le query degli utenti.

  • site2vecEmbedding: Un vettore a livello di sito simile a word2vec, che evidenzia l'importanza di un'incorporazione completa del sito.

  • pnavClicks: Probabilmente è legato alle informazioni di navigazione derivate dai dati dei clic dell'utente.

  • chromeInTotal: visualizzazioni di Chrome a livello di sito, sottolineando l'importanza dei segnali a livello di sito.

  • chardVariance e chardScoreVariance: Punteggi che predicono la qualità del sito/pagina in base ai contenuti, con la chiave della coerenza.

NSR Data Insights

Spunti pratici per i professionisti SEO

  1. Investite in un sito ben progettato: Assicuratevi che il vostro sito abbia un'architettura intuitiva per ottimizzare NavBoost, che si basa sul comportamento degli utenti e sui registri dei clic per riorganizzare i risultati di ricerca.

  2. Rimuovere/bloccare le pagine topicamente irrilevanti: Rimuovere o bloccare le pagine che non sono rilevanti dal punto di vista topico. Stabilite il vostro argomento di riferimento e assicuratevi che ogni pagina abbia un buon punteggio in quest'area.

  3. Ottimizzare titoli e contenuti: Ottimizzare le intestazioni in base alle query e garantire che i paragrafi rispondano chiaramente a tali query per migliorare l'inserimento nella pagina e la rilevanza.

  4. Concentrarsi su clic e impressioni: Scrivete contenuti che attirino più impressioni e clic, enfatizzando il coinvolgimento degli utenti.

  5. Aggiornare regolarmente i contenuti: Aggiornare regolarmente i contenuti con informazioni uniche, nuove immagini e video per mantenere la freschezza e ottenere un punteggio elevato nel calcolo dello sforzo.

  6. Mantenere contenuti di alta qualità: La coerenza dei contenuti di alta qualità è fondamentale. I punteggi chard di Google a livello di sito prevedono la qualità del sito/pagina in base ai contenuti.

  7. Valore Crescita delle impressioni: La crescita delle impressioni è un segno positivo delle prestazioni del sito.

  8. Ottimizzare la salienza delle entità: Concentrarsi sul miglioramento dei punteggi di salienza delle entità e sull'identificazione delle entità principali, come indicato nella perdita.

  9. Rimuovere le pagine con scarso rendimento: Identificare ed eliminare le pagine con metriche utente scadenti e senza backlink per mantenere alti i punteggi del sito.

panda

Come rimuovere la memoria di Google di una vecchia versione di un documento

Secondo la fuga di notizie, Google registra ogni versione di una pagina web, mantenendo un archivio web interno simile alla Wayback Machine. Tuttavia, Google utilizza solo le ultime 20 versioni di un documento. Se si aggiorna una pagina, si attende un crawl e si ripete il processo per 20 volte, si può effettivamente eliminare alcune versioni della pagina. Questa tattica potrebbe essere utile per migliorare i pesi e i punteggi storici associati alle versioni più vecchie.

Sistema di classificazione della ricerca di Google

Google Search Ranking System

Una congettura interessante che emerge dalla fuga di notizie è l'impatto del peso dei termini (dimensione letterale). Il grassetto delle parole o la regolazione della loro dimensione possono influenzare i punteggi dei documenti. Inoltre, i meccanismi di archiviazione dell'indice di Google danno priorità ai contenuti in modo diverso:

  • Unità flash: Per i contenuti più importanti e regolarmente aggiornati.

  • Unità con memoria a stato solido: Per i contenuti meno importanti.

  • Unità disco standard: Per contenuti aggiornati in modo irregolare.

L'indicizzatore di Google: Alessandria

Alexandria

L'indicizzatore di Google si chiama Alexandria, dal nome della famosa biblioteca. Altri indicizzatori citati sono SegIndexer, che dispone i documenti in livelli, e TeraGoogle, che gestisce l'archiviazione della memoria a lungo termine.

Siti di semina e autorità del sito

La fuga di notizie cita un fattore denominato isElectionAuthority, che forse indica i siti di riferimento o le autorità topiche. Suggerisce che i siti con elevata autorità, come quelli con un PageRank di 9/10, hanno un'influenza significativa. Tuttavia, nsrIsElectionAuthority è considerato deprecato, lasciando una certa ambiguità nell'interpretazione.

I contenuti brevi possono essere classificati

Contrariamente a quanto si pensa, un contenuto breve non equivale a un contenuto scarso. La fuga di notizie conferma che i contenuti brevi possono avere un buon posizionamento, anche se con un sistema di punteggio diverso.

Link freschi vs. link esistenti

Secondo il moltiplicatore del valore dei link di freshdocs, i link provenienti da pagine web più recenti hanno più valore di quelli inseriti in contenuti più vecchi. Ciò indica che, sebbene le modifiche di nicchia possano essere efficaci, i link freschi hanno un impatto maggiore.

Scoperte preferite

Qualità della pagina (PQ)

Google utilizza un LLM per stimare lo "sforzo" delle pagine degli articoli, aiutando a determinare se una pagina può essere facilmente replicata. Strumenti, immagini, video, informazioni uniche e profondità delle informazioni sono modi per ottenere un punteggio elevato nel calcolo dell'impegno.

Confini e autorità degli argomenti

L'autorità topica, supportata da siteFocusScore, siteRadius, siteEmbeddings e pageEmbeddings, è fondamentale. Mantenere un chiaro focus topico e ridurre al minimo le deviazioni dall'argomento aiuta a migliorare le classifiche.

Qualità dell'immagine

ImageQualityClickSignals misura la qualità delle immagini in base ai dati dei clic (utilità, presentazione, attrattiva, coinvolgimento).

Ospite NSR

Host NSR è il rank del sito calcolato per i chunks del sito a livello di host, misurando la qualità in segmenti. Questo sistema di chunking aiuta Google a valutare la qualità del sito in modo completo.

Teoria unificata delle classifiche

Questa sezione cerca di consolidare i fattori della fuga di notizie in una formula matematica, evidenziando le varie metriche e il loro impatto sul punteggio complessivo della classifica ®.

Definizioni e metriche

formula

Punteggi di interazione con l'utente (UIS):

formula

  • UgcScore: Coinvolgimento dei contenuti generati dagli utenti.

  • TitleMatchScore: Pertinenza dei titoli rispetto alle query degli utenti.

  • ChromeInTotal: interazioni totali tracciate tramite Chrome.

  • Impressioni del sito: Impressioni totali del sito.

  • Impressioni sugli argomenti: Impressioni su pagine specifiche di un argomento.

  • SiteClicks: Tasso di clic per il sito.

  • TopicClicks: Tasso di clic per le pagine specifiche di un argomento.

Punteggi di qualità dei contenuti (CQS):

formula

  • ImageQualityClickSignals: Segnali di qualità dai clic sulle immagini.

  • VideoScore: Qualità e coinvolgimento dei contenuti video.

  • ShoppingScore: Punteggio per i contenuti relativi allo shopping.

  • PageEmbedding: Incorporamento semantico del contenuto della pagina.

  • SiteEmbedding: Incorporamento semantico dei contenuti del sito.

  • Raggio del sito: Misura della deviazione all'interno dell'incorporazione del sito.

  • Focus del sito: Metrica che indica il focus dell'argomento.

  • Fiducia nel testo: Fiducia nella rilevanza e nella qualità del testo.

  • EffortScore: Sforzo e qualità nella creazione di contenuti.

Punteggi di collegamento (LS):

Link Scores

  • TrustedAnchors: Qualità e affidabilità dei link in entrata.

  • SiteLinkIn: Valore medio dei link in entrata.

  • PageRank: Vari punteggi di PageRank (0, 1, 2, ToolBar, NR).

Aumento della rilevanza (RB):

Relevance Boost

  • TopicEmbedding: Rilevanza nel tempo.

  • QnA: misura di qualità di base.

  • STS: Punteggio aggregato basato sulla comprensione del testo, sulla salienza e sulle entità.

Aumento della qualità (QB):

Quality Boost

  • SAS: punteggio di autorità del sito relativo a fiducia, affidabilità e autorità dei link.

  • EFTS: Punteggio di sforzo che incorpora testo, multimedia e commenti.

  • FS: Punteggio di freschezza basato sulle date di aggiornamento e di pubblicazione originale.

  • CSA: Adattamenti specifici per i contenuti in base alle caratteristiche della SERP e della pagina.

CSA

Aggiustamenti specifici per i contenuti (CSA):

  • CDS: Punteggio dei dati di Chrome che si concentra sulle impressioni e sui clic sul sito.

  • SDS: punteggio di retrocessione della SERP basato sulla misurazione dell'esperienza della SERP.

  • EQSS: punteggio sperimentale Q Star per le variabili sperimentali.

Formula completa

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-

R=((w1⋅UgcScore+w2⋅TitleMatchScore+w3⋅ChromeInTotal+w4⋅SiteImpressions+w5⋅TopicImpressions+ww6⋅SiteClicks+w7⋅TopicClicks)+(v1⋅ImageQualityClickSignals+v2⋅VideoScore+v3⋅ShoppingScore+v4⋅PageEmbedding+v5⋅SiteEmbedding+v6⋅SiteRadius+v7⋅SiteFocus+v8⋅TextConfidence+v9⋅EffortScore)+(x1⋅TrustedAnchors+x2⋅SiteLinkIn+x3⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1⋅CDS+y2⋅SDS+y3⋅EQSS)

Panoramica del punteggio generalizzato

1. Coinvolgimento degli utenti:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Punteggi multimediali:

  • Qualità dell'immagineSegnali di clic, VideoScore, ShoppingScore

3. Collegamenti:

  • TrustedAnchors, SiteLinkIn (valore medio dei link in entrata), PageRank (0, 1, 2, ToolBar, NR)

4. Comprensione dei contenuti:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Conclusione

La fuga di documenti fornisce preziose informazioni sui meccanismi di ranking di Google, sfatando diversi miti e rivelando intricati fattori che influenzano i risultati di ricerca. I professionisti SEO possono sfruttare queste conoscenze per affinare le loro strategie, concentrandosi sul coinvolgimento degli utenti, sulla pertinenza topica e sulla qualità costante dei contenuti. Mentre la comunità SEO digerisce queste rivelazioni, molti probabilmente riconsidereranno i loro approcci alla luce di queste nuove informazioni.

Comprendendo e applicando queste informazioni, gli operatori SEO possono orientarsi meglio tra le complessità del sistema di ranking di Google, migliorando in ultima analisi la visibilità e le prestazioni del proprio sito web nei risultati di ricerca.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Iniziate a usare Ranktracker... gratuitamente!

Scoprite cosa ostacola il posizionamento del vostro sito web.

Creare un account gratuito

Oppure accedi con le tue credenziali

Different views of Ranktracker app