• Оновлення пошуку Google та інформація про SEO

Розпакування масового витоку пошукової документації Google

  • Felix Rose-Collins
  • 6 min read
Розпакування масового витоку пошукової документації Google

Вступ

Масштабний витік внутрішньої документації Google Search викликав шок у SEO-спільноті. Витік, який розкрив понад 14 000 потенційних функцій ранжування, пропонує безпрецедентний погляд під капот системи пошукового ранжування Google, що ретельно охороняється.

Історія, що стоїть за витоком

Ерфан Азімі поділився витоком документів Google API з Рендом Фішкіним зі SparkToro, який потім залучив Майкла Кінга з iPullRank, щоб той допоміг поширити інформацію. Витік файлів, що походять з коміту документа Google API під назвою "yoshi-code-bot /elixer-google-api", не був результатом злому або викриття, а скоріше внутрішнім випуском документа.

Огляд витоку

Витік надає всебічний огляд факторів ранжування Google, розкриваючи інформацію про варіації PageRank, метрики авторитетності сайту та багато іншого. Ось детальний аналіз:

Ключові висновки з витоку пошукових документів Google

PageRank та його різновиди

  • PageRank_NS: Зараз застарілий, цей алгоритм пов'язаний з розумінням документів і модифікує традиційний PageRank, щоб зосередитися на локальній підмножині мережі навколо посівних вузлів.

  • Сім типів PageRank: Google згадує сім різних типів PageRank, включаючи знаменитий ToolBarPageRank. Ці варіації вказують на те, що Google використовує кілька методів для оцінки важливості сторінок.

Ідентифікація бізнес-моделі

Алгоритм Google може ідентифікувати різні бізнес-моделі, включаючи новинні сайти, сайти YMYL (Your Money or Your Life), особисті блоги, електронну комерцію та відеосайти. Причина фільтрації саме особистих блогів залишається незрозумілою і викликає питання про ширші наміри Google.

Компоненти алгоритму

  • NavBoost: Механізм переранжування, заснований на поведінці користувача та журналах кліків, на який значною мірою впливають дані Chrome.

  • NSR (Normalized Site Rank - нормалізований рейтинг сайту): Використовується для обчислення рейтингу сайту для фрагментів сайту на рівні хоста.

  • ChardScores: Оцінки на рівні сайту, що прогнозують якість сайту/сторінки на основі контенту.

Показники авторитетності сайту

Для оцінки авторитетності сайту Google використовує загальносайтовий показник авторитетності та кілька сигналів, включаючи трафік з браузерів Chrome. Це свідчить про те, що загальна якість сайту та довіра до нього відіграють значну роль у ранжуванні.

Методи впровадження та тематичні авторитети

  • Вбудовування сторінок і сайтів: Google використовує вбудовування сторінок, вбудовування сайтів, фокус сайту та радіус сайту у своїй функції підрахунку балів, щоб зрозуміти тематичну релевантність та узгодженість контенту веб-сайту.

  • Межі тематики та авторитетність тематики: Такі показники, як siteFocusScore, siteRadius, siteEmbeddings і pageEmbeddings, використовуються для вимірювання тематичного авторитету, підкреслюючи важливість підтримки чіткого тематичного фокусу.

googleapi

Натисніть "Дані та залучення користувачів

  • NavBoost: NavBoost покладається на дані про кліки та поведінку користувачів для переранжування результатів пошуку, що підкреслює важливість показників залучення користувачів.

  • Метрика кліків: Google вимірює різні типи кліків, включаючи погані кліки, хороші кліки, останні найдовші кліки та покази на всьому сайті.

Якісна аналітика даних NSR

Ключові фактори оцінювання з документа з даними НСР включають в себе наступні:

  • titlematchScore: Оцінка відповідності заголовків на сайті, яка показує, наскільки заголовки відповідають запитам користувачів.

  • site2vecEmbedding: Загальносайтовий вектор, подібний до word2vec, що підкреслює важливість комплексних вбудовувань на сайті.

  • pnavClicks: Ймовірно, пов'язана з навігаційною інформацією, отриманою на основі даних про кліки користувача.

  • chromeInTotal: перегляд Chrome на всьому сайті, що підкреслює важливість сигналів на всьому сайті.

  • chardVariance та chardScoreVariance: Оцінки, що прогнозують якість сайту/сторінки на основі контенту, причому ключовим є узгодженість.

NSR Data Insights

Практичні поради для SEO-професіоналів

  1. Інвестуйте в добре розроблений сайт: Переконайтеся, що ваш сайт має інтуїтивно зрозумілу архітектуру для оптимізації для NavBoost, який покладається на поведінку користувачів і журнали кліків для переранжування результатів пошуку.

  2. Видалити/заблокувати неактуальні сторінки: Видаліть або заблокуйте сторінки, які не мають відношення до теми. Визначте свою цільову тему і переконайтеся, що кожна сторінка має хороші показники в цій області.

  3. Оптимізуйте заголовки та контент: Оптимізуйте заголовки навколо запитів і переконайтеся, що абзаци чітко відповідають на ці запити, щоб покращити вбудовування та релевантність сторінок.

  4. Зосередьтеся на кліках і показах: Пишіть контент, який привертає більше показів і кліків, підкреслюючи залученість користувачів.

  5. Регулярно оновлюйте контент: Регулярно оновлюйте контент унікальною інформацією, новими зображеннями та відео, щоб підтримувати його свіжість і отримувати високі бали при підрахунку зусиль.

  6. Підтримуйте високу якість контенту: Послідовність у створенні якісного контенту має вирішальне значення. Показники чарду Google на рівні сайту передбачають якість сайту/сторінки на основі контенту.

  7. Зростання показів: Зростання показів є позитивною ознакою ефективності сайту.

  8. Оптимізація за показником релевантності об'єктів: Зосередьтеся на покращенні показників важливості для організацій та ідентифікації головної організації, згаданої у витоку.

  9. Видаляйте сторінки з низькими показниками: Визначте і видаліть сторінки з низькими показниками користувачів і відсутністю зворотних посилань, щоб підтримувати високі показники по всьому сайту.

panda

Як видалити пам'ять Google про стару версію документа

Згідно з витоком, Google зберігає записи про кожну версію веб-сторінки, підтримуючи внутрішній веб-архів, подібний до Wayback Machine. Однак Google використовує лише останні 20 версій документа. Якщо оновити сторінку, дочекатися сканування і повторити процес 20 разів, можна ефективно витіснити певні версії сторінки. Ця тактика може бути корисною для покращення історичної ваги та оцінок, пов'язаних зі старими версіями.

Система ранжирування пошуку Google

Google Search Ranking System

Одне з цікавих припущень витоку - вплив ваги терміна (буквальний розмір). Виділення слів напівжирним шрифтом або зміна розміру слів може вплинути на оцінку документа. Крім того, механізми зберігання індексу Google по-різному розставляють пріоритети контенту:

  • Флешки: Для найважливішого та регулярно оновлюваного контенту.

  • Твердотільні накопичувачі: Для менш важливого контенту.

  • Стандартні жорсткі диски: Для контенту, що оновлюється нерегулярно.

Індексатор Google: Олександрія

Alexandria

Індексатор Google називається Alexandria, на честь відомої бібліотеки. Серед інших згаданих індексаторів - SegIndexer, який розміщує документи за ярусами, і TeraGoogle, який працює з довготривалим зберіганням у пам'яті.

Насіннєві сайти та авторитет на всій території

У витоку згадується фактор під назвою isElectionAuthority, який, можливо, вказує на початкові сайти або тематичні авторитети. Це свідчить про те, що сайти з високим авторитетом, наприклад, з PageRank 9/10, мають значний вплив. Однак nsrIsElectionAuthority вважається застарілим, що залишає певну двозначність в інтерпретації.

Короткий контент може ранжуватися

Всупереч поширеній думці, короткий контент не дорівнює тонкому. Витік підтверджує, що короткий контент може добре ранжуватися, хоча й за іншою системою оцінювання.

Свіжі посилання проти існуючих

Згідно з мультиплікатором цінності посилань freshdocs, посилання з нових веб-сторінок мають більшу цінність, ніж ті, що вставлені в старіший контент. Це свідчить про те, що хоча редагування ніш може бути ефективним, свіжі посилання мають більший вплив.

Улюблені відкриття

Якість сторінки (PQ)

Google використовує LLM для оцінки "зусиль" для сторінок статей, допомагаючи визначити, чи можна легко повторити сторінку. Інструменти, зображення, відео, унікальна інформація та глибина інформації - це способи отримати високі бали при підрахунку зусиль.

Межі теми та повноваження теми

Тематичний авторитет, підтримуваний показниками siteFocusScore, siteRadius, siteEmbeddings і pageEmbeddings, має вирішальне значення. Підтримання чіткої тематичної спрямованості та мінімізація відхилень від теми допомагає покращити ранжування.

Якість зображення

ImageQualityClickSignals вимірює якість зображення на основі даних про кліки (корисність, презентація, привабливість, залучення).

Приймаюча сторона РНР

Host NSR - це рейтинг сайту, який обчислюється для фрагментів сайту на рівні хоста, вимірюючи якість у сегментах. Ця система поділу на частини допомагає Google оцінити якість сайту всебічно.

Єдина теорія ранжування

У цьому розділі зроблено спробу об'єднати фактори витоку в математичну формулу, виділивши різні метрики та їхній вплив на загальний рейтинговий бал ®.

Визначення та метрики

formula

Оцінка взаємодії з користувачем (UIS):

formula

  • UgcScore: Зацікавленість користувацьким контентом.

  • TitleMatchScore: Відповідність заголовків запитам користувачів.

  • ChromeInTotal: загальна кількість взаємодій, відстежених через Chrome.

  • SiteImpressions: Загальна кількість показів сайту.

  • TopicImpressions: Враження на сторінках певної теми.

  • SiteClicks: Кількість кліків на сайт.

  • TopicClicks: Кількість кліків для сторінок певної теми.

Показники якості контенту (CQS):

formula

  • ImageQualityClickSignals: Сигнали якості від кліків на зображеннях.

  • VideoScore: Якість та залученість відеоконтенту.

  • ShoppingScore: Оцінка контенту, пов'язаного з покупками.

  • PageEmbedding: Семантичне вбудовування вмісту сторінки.

  • SiteEmbedding: Семантичне вбудовування контенту сайту.

  • SiteRadius: Міра відхилення в межах вбудовування сайту.

  • SiteFocus: Метрика, що вказує на тематичний фокус.

  • TextConfidence: Впевненість у релевантності та якості тексту.

  • EffortScore: Зусилля та якість у створенні контенту.

Оцінки зв'язків (LS):

Link Scores

  • TrustedAnchors: Якість та надійність вхідних посилань.

  • SiteLinkIn: Середнє значення вхідних посилань.

  • PageRank: Різні значення PageRank (0, 1, 2, ToolBar, NR).

Підвищення релевантності (RB):

Relevance Boost

  • ТемаВбудовування: Актуальність з плином часу.

  • QnA: Базовий показник якості.

  • STS: Сукупна оцінка, що базується на розумінні тексту, виразності та сутностях.

Quality Boost (QB):

Quality Boost

  • SAS: оцінка авторитетності сайту, що стосується довіри, надійності та авторитетності посилань.

  • EFTS: Оцінка зусиль, що включає текст, мультимедіа та коментарі.

  • FS: Оцінка свіжості на основі дати оновлення та початкової дати публікації.

  • CSA: Налаштування контенту на основі результатів пошукової видачі та функцій на сторінці.

CSA

Адаптація до конкретного контенту (CSA):

  • CDS: оцінка даних Chrome, що фокусується на показах і кліках по всьому сайту.

  • SDS: показник пониження у видачі, що базується на вимірюванні досвіду користування пошуковою видачею.

  • EQSS: Експериментальна оцінка Q Star для експериментальних змінних.

Повна формула

R=(∑i=17vi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Узагальнений огляд скорингу

1. Залучення користувачів:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Мультимедійні оцінки:

  • ImageQualityClickSignals, VideoScore, ShoppingScore

3. Посилання:

  • TrustedAnchors, SiteLinkIn (середнє значення вхідних посилань), PageRank (0, 1, 2, ToolBar, NR)

4. Розуміння змісту:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Висновок

Витік документації надає безцінну інформацію про механізми ранжування Google, розвінчуючи кілька міфів і розкриваючи складні фактори, що впливають на результати пошуку. SEO-фахівці можуть використовувати ці знання для вдосконалення своїх стратегій, зосередившись на залученні користувачів, тематичній релевантності та стабільній якості контенту. Поки SEO-спільнота переварює ці відкриття, багато хто, ймовірно, перегляне свої підходи у світлі цієї нової інформації.

Розуміючи і застосовуючи ці знання, SEO-спеціалісти можуть краще орієнтуватися в складнощах системи ранжування Google, що в кінцевому підсумку підвищить видимість і продуктивність їхніх сайтів у результатах пошуку.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Почніть користуватися Ranktracker... Безкоштовно!

Дізнайтеся, що стримує ваш сайт від ранжування.

Створіть безкоштовний обліковий запис

Або Увійдіть, використовуючи свої облікові дані

Different views of Ranktracker app