• Technológia

Unikol kód spoločnosti Yandex obsahujúci 1922 faktorov hodnotenia vyhľadávania Ranktracker vysvetľuje všetky faktory hodnotenia

  • Felix Rose-Collins
  • 7 min read
Unikol kód spoločnosti Yandex obsahujúci 1922 faktorov hodnotenia vyhľadávania Ranktracker vysvetľuje všetky faktory hodnotenia

Úvod

Pravdepodobne ste už počuli o spoločnosti Yandex, ktorá je štvrtým najväčším vyhľadávačom na svete podľa podielu na trhu. Včera unikol proprietárny zdrojový kód Yandexu.

Najzaujímavejšia časť pre SEO komunitu je: zoznam všetkých 1922 faktorov hodnotenia používaných vo vyhľadávacom algoritme

Stiahli sme si kód, analyzovali ho a tu ho uvádzame v užitočnej podobe.

Yandex leak

Incident by nemal byť prekvapením, keďže spoločnosť Yandex alebo jej produkty sú často vystavené kybernetickým útokom. V roku 2016 portál Hackread.com exkluzívne informoval o tom, ako predajca na dark webe predával údaje o 6,3 milióna používateľských kont spoločnosti Yandex.

Vseptembri 2021 bol ruský vyhľadávací gigant zasiahnutý jedným z najväčších útokov DDoS, ktorý bol poháňaný 200 000 kompromitovanými zariadeniami internetu vecí.

Zoznámte sa s nástrojom Ranktracker

Platforma "všetko v jednom" pre efektívne SEO

Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO

Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!

Vytvorenie bezplatného konta

Alebo sa pri hláste pomocou svojich poverení

Yandex git sources

Prečo je to veľké?

Yandex je jednou z najväčších IT spoločností v Rusku. V rámci krajiny poskytuje širšiu škálu služieb ako spoločnosť Google. Predstavte si jednu spoločnosť, ktorá nahradí Google, Uber, Amazon, Netflix a Spotify.

Je tento únik skutočný?

Osobne som v spoločnosti Yandex nikdy nepracoval, ale poznám niekoľko ľudí, ktorí tam v rôznych obdobiach pracovali alebo stále pracujú. Overil som si, že aspoň niektoré archívy určite obsahujú moderné zdrojové kódy služieb spoločnosti, ako aj dokumentáciu, ktorá odkazuje na skutočné intranetové adresy URL.

Čo je vo vnútri

Únik zdieľal odkaz na magnet obsahujúci 44,7 GB súborov prepojených so zdrojmi git spoločnosti Yandex. Súbory boli údajne ukradnuté zo spoločnosti Yandex v júli 2022. Predpokladá sa, že okrem toho, že obsahujú antispamové smernice, obsahujú aj zdrojový kód spoločnosti Yandex.

Únik informácií odhalil približne 1 922 faktorov hodnotenia, ktoré vyhľadávač používa vo svojom vyhľadávacom algoritme. Kód unikol vo forme torrentu. Podľa analýzy, ktorú zverejnil používateľ Twitteru Alex Buraks, uniknuté údaje obsahujú množstvo faktorov hodnotenia vrátane relevantnosti textu, PageRanku, veku obsahu, čerstvosti atď.

Okrem toho existuje niekoľko faktorov správania koncového používateľa, faktorov súvisiacich s prepojením a spoľahlivosťou hostiteľa. SEO nájdu niektoré neobvyklé faktory hodnotenia, ako napríklad počet jedinečných návštevníkov, priemerné umiestnenie domény v rámci dotazov a percento organickej návštevnosti.

Vyzerá to tak, že unikol aspoň zdrojový kód všetkých hlavných služieb spoločnosti Yandex:

  • Vyhľadávač a indexovací bot
  • Mapy - ako Mapy Google a Street View
  • Alice - AI asistentka ako Siri / Alexa
  • Taxi - taxislužba podobná Uberu
  • Priame - reklamné služby ako Google Ads / Adwords
  • Mail - poštová služba ako GMail
  • Disk - služba na ukladanie súborov, ako je napríklad Disk Google
  • Trh - Marketplace ako Amazon
  • Cestovanie - ako Booking.com plus lístky na lietadlo, vlak a autobus
  • Yandex360 - Podobne ako pracovné priestory Google pre služby na vlastnej doméne
  • Cloud - Pravdepodobne neunikol celý kód infraštruktúry.
  • Pay - Spracovanie platieb ako Stripe, ale s obmedzeným súborom funkcií
  • Metrika - Podobne ako Google Analytics
  • A aspoň backendová časť väčšiny ostatných služieb spoločnosti je k dispozícii. Najväčší archív s názvom "frontend" ešte len čaká na preskúmanie.

Šestakov ďalej zaznamenal niektoré kľúče API, ktoré boli pravdepodobne použité na testovanie nasadenia.

Podrobnosti o tomto úniku nájdete tu:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex popiera pokus o hackerský útok

Spoločnosť Yandex tvrdí, že o úniku vie a už začala vyšetrovanie s cieľom preveriť, ako sa "fragmenty" zdrojového kódu dostali na verejnosť. Stojí za zmienku, že únik neobsahuje osobné údaje používateľov ani zamestnancov.

Vzhľadom na význam spoločnosti Yandex v ruskej IT infraštruktúre a uniknuté údaje sa však dá predpokladať, že útok bol motivovaný inváziou tejto krajiny na Ukrajinu. Mohli sa na ňom teda podieľať proukrajinskí hackeri.

Zoznámte sa s nástrojom Ranktracker

Platforma "všetko v jednom" pre efektívne SEO

Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO

Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!

Vytvorenie bezplatného konta

Alebo sa pri hláste pomocou svojich poverení

Spoločnosť Yandex vo svojom oficiálnom vyhlásení spresnila, že spoločnosť nebola napadnutá hackermi a do úniku jej zdrojového kódu na verejnosť mohol byť zapojený bývalý zamestnanec. Popredná ruská IT firma uviedla, že uniknutý archív obsahuje fragmenty kódu, ktoré sú súčasťou interného úložiska, ktorého údaje sa líšia od tých, ktoré sa používajú v najnovšej verzii úložiska.

"Spoločnosť Yandex nebola hacknutá. Naša bezpečnostná služba našla fragmenty kódu z interného úložiska vo verejnom priestore, ale obsah sa líši od aktuálnej verzie úložiska používaného v službách Yandexu," uvádza sa vo vyhlásení spoločnosti.

Napriek tomu sú úniky zdrojového kódu nebezpečné, pretože predstavujú pre organizácie vážne bezpečnostné problémy, keďže aktéri hrozieb môžu sledovať duševné vlastníctvo spoločnosti a systémové údaje. Únik zdrojového kódu by útočníkom pomohol vytvoriť cielené bezpečnostné exploity.

Aký je teoreticky rozdiel medzi algoritmami používanými v Googli a v Yandexe?

Sú si dosť podobné:

  • existuje analóg RankBrain- MatrixNet
  • používajú PageRank (takmer rovnaký ako v Google);
  • veľa textových algoritmov je rovnakých.

Yandex vs Google

  • V spoločnosti Yandex je veľa bývalých Google
  • Yanex bol vytvorený ako klon spoločnosti Google;
  • SEO špecialisti v Rusku používajú takmer rovnaké taktiky SEO pre Yandex a Google

Samozrejme, existuje veľa rozdielov, ale prístup a väčšina faktorov hodnotenia sa zdajú byť podobné.

V praxi: pri porovnaní výsledkov vyhľadávania Google a Yandex je ich zhoda ~ 70 %.

Podľa portálu Statcounter sa Yandex svojím podielom na trhu približuje Yahoo a Bingu:

search engine market share worldwide

Súbor s faktormi hodnotenia: https: //dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Štruktúra pre každý faktor:

  1. názov
  2. odkaz na internú wiki (obmedzené)
  3. AntiSeoUpperBound (haha)
  4. popis (je v ruštine, preložil som ho pre vás)
  5. atď.

1. Prvý faktor v zozname - PageRank.

First factor in the list - PageRank

Hlavné poznatky po analýze tohto zoznamu: Vek odkazov je faktorom hodnotenia.

Age of links is a ranking factor.

2. Faktory hodnotenia sú návštevnosť a % organickej návštevnosti.

Nákup PPC ovplyvňuje umiestnenie.

Traffic and % of organic traffic are ranking factors

3. Čísla v adresách URL sú zlé pre hodnotenie

Numbers in URLs is bad for rankings

4. Príliš veľa lomiek v adresách URL škodí hodnoteniu

Too many slashes in URLs is bad for ranking

5. Tvrdá pesimizácia rovná sa PR=0

Hard pessimization equal PR=0

6. Spoľahlivosť hostiteľa je hodnotiacim faktorom

Čím menej chýb 40x/50x máte, tým lepšie pre vašu organickú návštevnosť

Host reliability is a ranking factor

7. Existuje samostatný faktor hodnotenia pre pozdvihnutie Wikipédie

there is a separate ranking factor for uplifting Wikipedia

8. Množstvo faktorov hodnotenia súvisiacich so správaním používateľov - CTR, posledné kliknutie, čas na stránke, bounce rate

Poznámka: Sme si takmer istí, že v Yandexe majú tieto faktory oveľa väčší vplyv ako v Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Vek dokumentu a posledná aktualizácia sú faktormi hodnotenia

Document age and last update both are ranking factors

10. Priemerná pozícia domény vo všetkých dotazoch je faktorom hodnotenia

Average domain position across all queries is a ranking factor

11. Hĺbka prehľadávania je faktor hodnotenia

Udržujte dôležité stránky bližšie k hlavnej stránke:

  • horné stránky: 1 kliknutie z hlavnej stránky
  • dôležité stránky: <3 kliknutia

Crawl depth is a ranking factor

12. Okrem toho: faktor hodnotenia pre osirelé stránky

Môžete to zistiť prostredníctvom nášho nástroja na audit webových stránok

Additionally: ranking factor for orphan pages

13. Spätné odkazy z hlavných stránok sú dôležitejšie ako z interných stránok

Backlinks from main pages are more important than from internal pages

14. Počet vyhľadávacích dotazov na vašu stránku/URL je faktor hodnotenia

Čím viac, tým lepšie

Number of search queries of your site/url is a ranking factor

15. Návštevnosť z Wikipédie je faktorom hodnotenia

Traffic from Wikipedia is a ranking factor

16. Ak by vaša url bola posledná pre reláciu vyhľadávania (používateľ nájde to, čo potrebuje) - ovplyvnilo by to hodnotenie

Existujú na to prísne faktory a tiež predvídateľné faktory.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Faktor hodnotenia záložiek

Čím viac používateľov pridá url do záložiek, tým väčšiu hodnotu má faktor

Bookmarks ranking factor

18. Špeciálne faktory hodnotenia krátkych videí (tiktok, krátke videá, filmy)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Mapy js-api na stránke (napríklad Mapy Google) sú faktorom hodnotenia

V spoločnosti Google (napríklad v oblasti cestovania) funguje aj pridávanie máp s užitočnými informáciami/funkciami.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Kľúčové slová v URL sú faktormi hodnotenia

Ako vidíme z popisu - optimálne by bolo zahrnúť až 3 slová z vyhľadávacieho dotazu.

Keywords in URL are ranking factors

21. Vracajúci sa používatelia sú faktorom hodnotenia

Vytvorte produkty s dobrou retenciou a prospeje to vašej SEO optimalizácii (na jej meranie existuje veľa rankingových faktorov).

Returning users is a ranking factor

22. Percentuálny podiel veľkých písmen v <title> je hodnotiacim faktorom

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Percento priamej návštevnosti je faktorom hodnotenia

Aka. Ak všetka vaša návštevnosť pochádza z organického vyhľadávania - je to podozrivé + zlé pre hodnotenie.

Percentage of direct traffic is a ranking factor

24. Ďalší faktor hodnotenia kvality obsahu - nefunkčné vložené video na stránke

  • Vkladanie videí - dobré pre hodnotenie.
  • Zlomené vložené videá - zlé.

One more ranking factor for content quality - broken embedded video on the page

25. Overené účty na sociálnych sieťach sa radia inak ako ostatné url

Dôležité pre vyhľadávanie značky - v ideálnom prípade by sa pri vyhľadávaní vašej značky mali v prvej desiatke nachádzať len vaše domény + overené sociálne siete

Verified accounts on social networks ranks differently as other urls

26. Ak vaše spätné odkazy obsahujú všetky slová z kľúčových slov - je to dobré pre SEO

Ak je to v jednom odkaze - je to výhodnejšie. Najmä ak je poradie slov rovnaké.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia

![Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia")

28. Hodnota kvality textov na doméne je hodnotiacim faktorom

Stránky s nízkou kvalitou obsahu ovplyvňujú celú doménu.

The quality rank of texts on the domain is a ranking factor

29. Množstvo reklám na stránke je faktor hodnotenia

Amount of advertisements on a page is a ranking factor

30. Existuje náhodnosť ako samostatný faktor hodnotenia

Keď nechápete, prečo sú niektoré stránky na vrchole - môže to byť len náhodné (testovanie faktorov správania).

There is a random as a separate ranking factor

31. JS z Google Analytics je faktor hodnotenia

Predvídateľne. Dobré webové stránky používajú GA / Google Analytics častejšie ako zlé webové stránky.

JS from Google Analytics is a ranking factor

32. Vplyv spätných odkazov z top 100 najlepších webových stránok podľa PageRanku na poradie

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL nemá žiadne číslice

/100-best-credit-cards

/best-credit-cards

URL has no digits

34. Počet lomiek v URL adrese

/finance/articles/2023/investment-advice

/investičné rady

Number of slashes in URL

35. Počet nepísmenových znakov v URL adrese

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. Symbol '?' v adrese URL je hodnotiacim faktorom

/movies?genre=action

/akčné filmy

'?' symbol in the URL is a ranking factor

37. Vyhľadávacia požiadavka = URL vrátane bodiek a medzier (??)

Vyhľadávacia otázka je "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Starý dátum v adrese URL

/2009/12/01/how-to-tie-a-tie

/how-to-tie-a-tie

Old date in the URL

39. Kľúčové slová sú v URL, nie v texte stránky

/video-hry & stránka je o hudbe

/video-hry & stránka je o videohrách

Keywords is in URL, not in the text of the page

40. Pokrytie URL pomocou trigramov z vyhľadávacieho dotazu

/hotels-new-zealand

/nz

/cheap-hotels-in-new-zealand-best-deals

URL coverage with trigrams from the search query

  • Do adresy URL uveďte 1-3 najdôležitejšie slová;
  • Menej lomiek/číslic/nepísmen, ak nie sú súčasťou kľúčového slova

41. počiatočné váhy faktorov hodnotenia Yandex

Konečné váhy vypočítané pomocou AI(matrixnet), ale užitočné sú aj počiatočné hodnoty.

initial weights of Yandex ranking factors

Záver

Tak to by sme mali, to je všetko, čo zatiaľ zdieľame. Práve začíname. Toto vám poskytuje hrubý prehľad o tom, čo sa tam nachádza.

Sme len na začiatku a čaká nás ešte veľa cenných poznatkov.

Mali sme však pravdu v mnohých predpokladoch a interpretáciách zvonku, ako by takýto rozsiahly vyhľadávač fungoval, aspoň čo sa týka odkazov.

Celkovo únik kódu spoločnosti Yandex ponúka fascinujúci pohľad na vnútorné fungovanie moderného vyhľadávača.

Zoznámte sa s nástrojom Ranktracker

Platforma "všetko v jednom" pre efektívne SEO

Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO

Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!

Vytvorenie bezplatného konta

Alebo sa pri hláste pomocou svojich poverení

Hoci nie všetky zistenia sa dajú priamo aplikovať na Google, mnohé predpoklady o všeobecnom fungovaní veľkých internetových vyhľadávačov, ktoré sa objavili v posledných rokoch, sa potvrdili.

Predpokladám, že odvetvie SEO má pred sebou ešte niekoľko zaujímavých mesiacov s novými poznatkami z tohto úniku.

Sledujte túto stránku, pretože v nasledujúcich týždňoch a mesiacoch budeme naďalej pridávať faktory hodnotenia.

Osobitné zásluhy na https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Začnite používať Ranktracker... zadarmo!

Zistite, čo brzdí vaše webové stránky v hodnotení.

Vytvorenie bezplatného konta

Alebo sa pri hláste pomocou svojich poverení

Different views of Ranktracker app