Въведение
М ащабно изтичане на вътрешна документация за класирането в търсачката на Google предизвика шок в SEO общността. Изтичането на информация, което разкрива над 14 000 потенциални функции за класиране, предлага безпрецедентен поглед под капака на строго охраняваната система за класиране в търсенето на Google.
Историята зад изтичането на информация
Ерфан Азими сподели изтичането на документи от Google API с Ранд Фишкин от SparkToro, който след това привлече Майкъл Кинг от iPullRank, за да помогне за разпространението на информацията. Изтеклите файлове, произхождащи от ангажимент за документи на Google API, озаглавен "yoshi-code-bot /elixer-google-api", не са резултат от хакерска атака или сигнал, а по-скоро от вътрешно освобождаване на документи.
Преглед на теча
Изтичането на информация предоставя цялостен поглед върху факторите за класиране на Google, разкривайки информация за вариациите на PageRank, показателите за авторитета на сайта и много други. Ето и подробна разбивка:
Основни изводи от изтичането на документи за търсене в Google
PageRank и неговите разновидно сти
-
PageRank_NS: Този алгоритъм, който вече е отпаднал, е свързан с разбирането на документи и модифицира традиционния PageRank, като се фокусира върху локализирано подмножество на мрежата около началните възли.
-
Седем вида PageRank: Google споменава седем различни вида PageRank, включително известния ToolBarPageRank. Тези варианти показват, че Google използва множество методи за оценка на важността на страницата.
Идентифициране на бизнес модел
Алгоритъмът на Google може да разпознава различни бизнес модели, включително новинарски сайтове, сайтове YMYL (Your Money or Your Life), лични блогове, сайтове за електронна търговия и видео сайтове. Причината за специфичното филтриране на личните блогове остава неясна и повдига въпроси за по-широките намерения на Google.
Компоненти на алгоритъма
-
NavBoost: Механизъм за пренареждане, базиран на поведението на потребителите и на регистрите на кликванията, силно повлиян от данните за Chrome.
-
NSR (нормализиран ранг на сайта): Използва се за изчисляване на ранга на сайта за части от сайта на ниво хост.
-
ChardScores: Оценки на ниво сайт, предсказващи качеството на сайта/страницата въз основа на съдържанието.
Показатели за авторитета на сайта
За да оцени авторитета на сайта, Google използва метрика за авторитета на целия сайт и няколко сигнала, включително трафик от браузъри Chrome. Това предполага, че цялостното качество на сайта и неговата надеждност играят важна роля при класирането.
Техники за вграждане и тематичен авторитет
-
Вграждане на страници и сайтове: Google използва вграждането на страници, вграждането на сайтове, фокуса на сайта и радиуса на сайта в своята функция за оценяване, за да разбере актуалната значимост и последователност на съдържанието на даден уебсайт.
-
Граници на темите и правомощия на темите: За измерване на тематичния авторитет се използват показатели като siteFocusScore, siteRadius, siteEmbeddings и pageEmbeddings, като се подчертава важността на поддържането на ясен тематичен фокус.
Данни за кликвания и ангажираност на потребителите
-
NavBoost: NavBoost разчита на данни за кликвания и поведение на потребителите, за да пренареди резултатите от търсенето, подчертавайки значението на показателите за ангажираност на потребителите.
-
Щракнете върху Метрики: Google измерва различни видове кликвания, включително лоши кликвания, добри кликвания, последни най-дълги кликвания и импресии в целия сайт.
Прозрения за качеството на данните на NSR
Ключовите фактори за оценка от документа с данни за НСР включват:
-
titlematchScore: Резултат за съвпадение на заглавията в целия сайт, който показва доколко заглавията отговарят на заявките на потребителите.
-
сайт2vecEmbedding: Вектор за целия сайт, подобен на word2vec, който подчертава значението на цялостното вграждане на сайта.
-
pnavClicks: Вероятно свързани с навигационна информация, получена от данните за кликванията на потребителя.
-
chromeInTotal: Изгледи на Chrome в целия сайт, като се подчертава значението на сигналите в целия сайт.
-
chardVariance и chardScoreVariance: Резултати, които предсказват качеството на сайта/страницата въз основа на съдържанието, като ключово значение има последователността.
Практически изводи за SEO специалистите
-
Инвестирайте в добре проектиран сайт: Уверете се, че сайтът ви има интуитивна архитектура, за да го оптимизирате за NavBoost, който разчита на поведението на потребителите и регистрите на кликванията за пренареждане на резултатите от търсенето.
-
Премахване/блокиране на тематично нерелевантни страници: Премахнете или блокирайте страници, които не са актуални. Определете целевата си тема и се уверете, че всяка страница има добри резултати в тази област.
-
Оптимизиране на заглавията и съдържанието: Оптимизирайте заглавията около заявките и гарантирайте, че параграфите ясно отговарят на тези заявки, за да подобрите в граждането в страницата и нейната релевантност.
-
Фокусирайте се върху кликовете и импресиите: Пишете съдържание, което привлича повече впечатления и кликвания, като наблягате на ангажираността на потребителите.
-
Редовно актуализиране на съдържанието: Редовно актуализирайте съдържанието с уникална информация, нови изображения и видеоклипове, за да поддържате свежестта и да постигнете високи резултати при изчисляването на усилията.
-
Поддържане на висококачествено съдържание: Последователността във висококачественото съдържание е от решаващо значение. Оценките на Google на ниво сайт chard предсказват качеството на сайта/страницата въз основа на съдържанието.
-
Растеж на стойността на впечатлението: Нарастващите импресии са положителен знак за ефективността на сайта.
-
Оптимизиране на популярността на субекта: Фокусирайте се върху подобряването на резултатите за популярност на същностите и идентифицирането на най-добрите същности, както е посочено в изтичането на информация.
-
Премахване на лошо работещи страници: Идентифицирайте и премахнете страници с лоши потребителски показатели и без обратни връзки, за да поддържате високи резултати за целия сайт.
Как да премахнете паметта на Google за стара версия на документ
Според изтичането на информация Google записва всяка версия на дадена уебстраница, като поддържа вътрешен уеб архив, подобен на Wayback Machine. Google обаче използва само последните 20 версии на даден документ. Ако актуализирате дадена страница, изчакате обхождането и повторите процеса 20 пъти, можете ефективно да изтласкате определени версии на страницата. Тази тактика може да бъде полезна за подобряване на историческите тегла и оценки, свързани с по-старите версии.
Система за класиране на търсенето в Google
Едно от интересните предположения от изтичането на информация е влиянието на теглото на термина (буквалния размер). Удебеляването на думите или коригирането на размера на думите може да повлияе на оценките на документите. Освен това механизмите за съхранение на индексите на Google дават различен приоритет на съдържанието:
-
Флаш памети: За най-важното и редовно актуализирано съдържание.
-
Твърдотелни дискове: За по-малко важно съдържание.
-
Стандартни твърди дискове: За нередовно актуализирано съдържание.
Индексатор на Google: Александрия
Индексиращият модул на Google е наречен Александрия, по името на известната библиотека. Други споменати индексиращи устройства са SegIndexer, който поставя документите на нива, и TeraGoogle, който се занимава с дългосрочно съхранение в паметта.
Семенни сайтове и авторитет на целия сайт
В изтичането на информация се споменава фактор, наречен isElectionAuthority, който може би посочва сайтове за семена или тематични органи. Той предполага, че сайтовете с висок авторитет, като например тези с PageRank 9/10, имат значително влияние. Въпреки това nsrIsElectionAuthority се счита за обезсилен, което оставя известна неяснота при тълкуването.
Краткото съдържание може да се класира
Противно на общоприетото схващане, краткото съдържание не е равносилно на слабо съдържание. Изтичането на информация потвърждава, че краткото съдържание може да се класира добре, макар и с различна система за оценяване.
Свежи връзки срещу съществуващи връзки
Според коефициента на стойността на връзките в freshdocs връзките от по-нови уебстраници са по-ценни от тези, които са вмъкнати в по-старо съдържание. Това показва, че макар редакциите на ниши да са ефективни, пресните връзки имат по-голямо въздействие.
Любими открития
Качество на страницата (PQ)
Google използва LLM, за да оцени "усилията" за страниците със статии, като по този начин определя дали дадена страница може лесно да бъде възпроизведена. Инструментите, изображенията, видеоклиповете, уникалната информация и дълбочината на информацията са начините да постигнете висок резултат при изчисляването на усилията.
Граници на темите и правомощия на темите
Тематичният авторитет, подкрепен от показателите siteFocusScore, siteRadius, siteEmbeddings и pageEmbeddings, е от решаващо значение. Поддържането на ясен тематичен фокус и свеждането до минимум на отклоненията от темата помага за подобряване на класирането.
Качество на изображението
ImageQualityClickSignals измерва качеството на изображението въз основа на данни за кликване (полезност, представяне, привлекателност, ангажираност).
Домакин NSR
NSR на хоста е ранг на сайта, който се изчислява за части от сайта на ниво хост, като измерва качеството в сегменти. Тази система за разделяне на части помага на Google да оценява качеството на сайта цялостно.
Единна теория на класирането
В този раздел се прави опит да се консолидират факторите от изтичането на информация в математическа формула, като се подчертават различните показатели и тяхното въздействие върху общия резултат от класирането ®.
Определения и показатели
Оценка на взаимодействието с потребителя (UIS):
-
UgcScore: Ангажираност на съдържанието, генерирано от потребителите.
-
TitleMatchScore: релевантност на заглавията към заявките на потребителите.
-
ChromeInTotal: Общо взаимодействия, проследени чрез Chrome.
-
SiteImpressions: Общо импресии на сайта.
-
Впечатления от темата: Впечатления от страници, свързани с конкретна тема.
-
SiteClicks: Процент на кликванията за сайта.
-
TopicClicks: Процентът на кликванията за страници по конкрет на тема.
Оценка на качеството на съдържанието (CQS):
-
ImageQualityClickSignals: Сигнали за качество от кликвания върху изображения.
-
Видеозапис: Качество и ангажираност на видеосъдържанието.
-
ShoppingScore: Оценка за съдържание, свързано с пазаруването.
-
PageEmbedding: Семантично вграждане на съдържанието на страницата.
-
SiteEmbedding: Семантично вграждане на съдържанието на сайта.
-
SiteRadius: Мярка за отклонение в рамките на вграждането на сайта.
-
SiteFocus: Метрика, показваща фокуса на темата.
-
Доверие на текста: Доверие в релевантността и качеството на текста.
-
Оценка на усилията: Усилия и качество при създаването на съдържание.
Оценки на връзките (LS):
-
TrustedAnchors: Качество и надеждност на входящите връзки.
-
SiteLinkIn: Средна стойност на входящите връзки.
-
PageRank: Различни оценки на PageRank (0, 1, 2, ToolBar, NR).
Увеличаване на релевантността (RB):
-
TopicEmbedding: Уместност във времето.
-
QnA: Изходна мярка за качество.
-
STS: Обща оценка, базирана на разбирането на текста, значимостта и същностите.
Повишаване на качеството (QB):
-
SAS: Оценка на авторитета на сайта, свързана с доверието, надеждността и авторитета на връзките.
-
EFTS: Оценка на усилията, включваща текст, мултимедия и коментари.
-
FS: Оценка за свежест въз основа на датите на актуализация и първоначалната публикация.
-
CSA: Специфични за съдържанието корекции въз основа на характеристиките на SERP и на страницата.
Специфични за съдържанието корекции (CSA):
-
CDS: оценка на данните в Chrome, която се фокусира върху импресиите и кликванията в сайта.
-
SDS: оценка за понижаване на рейтинга на сървъра въз основа на измерване на опита в SERP.
-
EQSS: Експериментална оценка Q Star за експерименталните променливи.
Пълна формула
R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-
R=((w1⋅UgcScore+w2⋅TitleMatchScore+w3⋅ChromeInTotal+w4⋅SiteImpressions+w5⋅TopicImpressions+w6⋅SiteClicks+w7⋅TopicClicks)+(v1⋅ImageQualityClickSignals+v2⋅VideoScore+v3⋅ShoppingScore+v4⋅PageEmbedding+v5⋅SiteEmbedding+v6⋅SiteRadius+v7⋅SiteFocus+v8⋅TextConfidence+v9⋅EffortScore)+(x1⋅TrustedAnchors+x2⋅SiteLinkIn+x3⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1⋅CDS+y2⋅SDS+y3⋅EQSS)
Обобщен преглед на точкуването
1. Ангажираност на потребителите:
- UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks
2. Мултимедийни резултати:
- ImageQualityClickSignals, VideoScore, ShoppingScore
3. Връзки:
- TrustedAnchors, SiteLinkIn (средна стойност на входящите връзки), PageRank (0, 1, 2, ToolBar, NR)
4. Разбиране на съдържанието:
- PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore
Заключение
Изтичането на документацията предоставя безценна информация за механизмите за класиране на Google, като развенчава няколко мита и разкрива сложни фактори, влияещи върху резултатите от търсенето. Специалистите по SEO могат да използват тези знания, за да усъвършенстват стратегиите си, като се съсредоточат върху ангажираността на потребителите, актуалната значимост и постоянното качество на съдържанието. Докато SEO общността проучва тези разкрития, мнозина вероятно ще преразгледат своите подходи в светлината на тази нова информация.
Чрез разбирането и прилагането на тези идеи специалистите по SEO могат по-добре да се ориентират в сложността на системата за класиране на Google, като в крайна сметка подобрят видимостта и представянето на своя уебсайт в резултатите от търсенето.