Úvod
Pravdepodobne ste už počuli o spoločnosti Yandex, ktorá je štvrtým najväčším vyhľadávačom na svete podľa podielu na trhu. Včera unikol proprietárny zdrojový kód Yandexu.
Najzaujímavejšia časť pre SEO komunitu je: zoznam všetkých 1922 faktorov hodnotenia používaných vo vyhľadávacom algoritme
Stiahli sme si kód, analyzovali ho a tu ho uvádzame v užitočnej podobe.
Incident by nemal byť prekvapením, keďže spoločnosť Yandex alebo jej produkty sú často vystavené kybernetickým útokom. V roku 2016 portál Hackread.com exkluzívne informoval o tom, ako predajca na dark webe predával údaje o 6,3 milióna používateľských kont spoločnosti Yandex.
Vseptembri 2021 bol ruský vyhľadávací gigant zasiahnutý jedným z najväčších útokov DDoS, ktorý bol poháňaný 200 000 kompromitovanými zariadeniami internetu vecí.
Platforma "všetko v jednom" pre efektívne SEO
Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO
Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!
Vytvorenie bezplatného kontaAlebo sa pri hláste pomocou svojich poverení
Prečo je to veľké?
Yandex je jednou z najväčších IT spoločností v Rusku. V rámci krajiny poskytuje širšiu škálu služieb ako spoločnosť Google. Predstavte si jednu spoločnosť, ktorá nahradí Google, Uber, Amazon, Netflix a Spotify.
Je tento únik skutočný?
Osobne som v spoločnosti Yandex nikdy nepracoval, ale poznám niekoľko ľudí, ktorí tam v rôznych obdobiach pracovali alebo stále pracujú. Overil som si, že aspoň niektoré archívy určite obsahujú moderné zdrojové kódy služieb spoločnosti, ako aj dokumentáciu, ktorá odkazuje na skutočné intranetové adresy URL.
Čo je vo vnútri
Únik zdieľal odkaz na magnet obsahujúci 44,7 GB súborov prepojených so zdrojmi git spoločnosti Yandex. Súbory boli údajne ukradnuté zo spoločnosti Yandex v júli 2022. Predpokladá sa, že okrem toho, že obsahujú antispamové smernice, obsahujú aj zdrojový kód spoločnosti Yandex.
Únik informácií odhalil približne 1 922 faktorov hodnotenia, ktoré vyhľadávač používa vo svojom vyhľadávacom algoritme. Kód unikol vo forme torrentu. Podľa analýzy, ktorú zverejnil používateľ Twitteru Alex Buraks, uniknuté údaje obsahujú množstvo faktorov hodnotenia vrátane relevantnosti textu, PageRanku, veku obsahu, čerstvosti atď.
Pravdepodobne ste už počuli o spoločnosti Yandex, ktorá je štvrtým najväčším vyhľadávačom na svete podľa podielu na trhu. Včera unikol proprietárny zdrojový kód Yandexu.
- Alex Buraks (@alex_buraks) 27. januára 2023
Najzaujímavejšia časť pre SEO komunitu je: zoznam všetkých 1922 faktorov hodnotenia používaných vo vyhľadávacom algoritme
[🧵THREAD] pic.twitter.com/6x82AAmbON
Okrem toho existuje niekoľko faktorov správania koncového používateľa, faktorov súvisiacich s prepojením a spoľahlivosťou hostiteľa. SEO nájdu niektoré neobvyklé faktory hodnotenia, ako napríklad počet jedinečných návštevníkov, priemerné umiestnenie domény v rámci dotazov a percento organickej návštevnosti.
Vyzerá to tak, že unikol aspoň zdrojový kód všetkých hlavných služieb spoločnosti Yandex:
- Vyhľadávač a indexovací bot
- Mapy - ako Mapy Google a Street View
- Alice - AI asistentka ako Siri / Alexa
- Taxi - taxislužba podobná Uberu
- Priame - reklamné služby ako Google Ads / Adwords
- Mail - poštová služba ako GMail
- Disk - služba na ukladanie súborov, ako je napríklad Disk Google
- Trh - Marketplace ako Amazon
- Cestovanie - ako Booking.com plus lístky na lietadlo, vlak a autobus
- Yandex360 - Podobne ako pracovné priestory Google pre služby na vlastnej doméne
- Cloud - Pravdepodobne neunikol celý kód infraštruktúry.
- Pay - Spracovanie platieb ako Stripe, ale s obmedzeným súborom funkcií
- Metrika - Podobne ako Google Analytics
- A aspoň backendová časť väčšiny ostatných služieb spoločnosti je k dispozícii. Najväčší archív s názvom "frontend" ešte len čaká na preskúmanie.
Šestakov ďalej zaznamenal niektoré kľúče API, ktoré boli pravdepodobne použité na testovanie nasadenia.
Podrobnosti o tomto úniku nájdete tu:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex popiera pokus o hackerský útok
Spoločnosť Yandex tvrdí, že o úniku vie a už začala vyšetrovanie s cieľom preveriť, ako sa "fragmenty" zdrojového kódu dostali na verejnosť. Stojí za zmienku, že únik neobsahuje osobné údaje používateľov ani zamestnancov.
Vzhľadom na význam spoločnosti Yandex v ruskej IT infraštruktúre a uniknuté údaje sa však dá predpokladať, že útok bol motivovaný inváziou tejto krajiny na Ukrajinu. Mohli sa na ňom teda podieľať proukrajinskí hackeri.
Platforma "všetko v jednom" pre efektívne SEO
Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO
Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!
Vytvorenie bezplatného kontaAlebo sa pri hláste pomocou svojich poverení
Spoločnosť Yandex vo svojom oficiálnom vyhlásení spresnila, že spoločnosť nebola napadnutá hackermi a do úniku jej zdrojového kódu na verejnosť mohol byť zapojený bývalý zamestnanec. Popredná ruská IT firma uviedla, že uniknutý archív obsahuje fragmenty kódu, ktoré sú súčasťou interného úložiska, ktorého údaje sa líšia od tých, ktoré sa používajú v najnovšej verzii úložiska.
"Spoločnosť Yandex nebola hacknutá. Naša bezpečnostná služba našla fragmenty kódu z interného úložiska vo verejnom priestore, ale obsah sa líši od aktuálnej verzie úložiska používaného v službách Yandexu," uvádza sa vo vyhlásení spoločnosti.
Napriek tomu sú úniky zdrojového kódu nebezpečné, pretože predstavujú pre organizácie vážne bezpečnostné problémy, keďže aktéri hrozieb môžu sledovať duševné vlastníctvo spoločnosti a systémové údaje. Únik zdrojového kódu by útočníkom pomohol vytvoriť cielené bezpečnostné exploity.
Aký je teoreticky rozdiel medzi algoritmami používanými v Googli a v Yandexe?
Sú si dosť podobné:
- existuje analóg RankBrain- MatrixNet
- používajú PageRank (takmer rovnaký ako v Google);
- veľa textových algoritmov je rovnakých.
- V spoločnosti Yandex je veľa bývalých Google
- Yanex bol vytvorený ako klon spoločnosti Google;
- SEO špecialisti v Rusku používajú takmer rovnaké taktiky SEO pre Yandex a Google
Samozrejme, existuje veľa rozdielov, ale prístup a väčšina faktorov hodnotenia sa zdajú byť podobné.
V praxi: pri porovnaní výsledkov vyhľadávania Google a Yandex je ich zhoda ~ 70 %.
Podľa portálu Statcounter sa Yandex svojím podielom na trhu približuje Yahoo a Bingu:
Súbor s faktormi hodnotenia: https: //dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Štruktúra pre každý faktor:
- názov
- odkaz na internú wiki (obmedzené)
- AntiSeoUpperBound (haha)
- popis (je v ruštine, preložil som ho pre vás)
- atď.
1. Prvý faktor v zozname - PageRank.
Hlavné poznatky po analýze tohto zoznamu: Vek odkazov je faktorom hodnotenia.
2. Faktory hodnotenia sú návštevnosť a % organickej návštevnosti.
Nákup PPC ovplyvňuje umiestnenie.
3. Čísla v adresách URL sú zlé pre hodnotenie
4. Príliš veľa lomiek v adresách URL škodí hodnoteniu
5. Tvrdá pesimizácia rovn á sa PR=0
6. Spoľahlivosť hostiteľa je hodnotiacim faktorom
Čím menej chýb 40x/50x máte, tým lepšie pre vašu organickú návštevnosť
7. Existuje samostatný faktor hodnotenia pre pozdvihnutie Wikipédie
8. Množstvo faktorov hodnotenia súvisiacich so správaním používateľov - CTR, posledné kliknutie, čas na stránke, bounce rate
Poznámka: Sme si takmer istí, že v Yandexe majú tieto faktory oveľa väčší vplyv ako v Google.
9. Vek dokumentu a posledná aktualizácia sú faktormi hodnotenia
10. Priemerná pozícia domény vo všetkých dotazoch je faktorom hodnotenia
11. Hĺbka prehľadávania je faktor hodnotenia
Udržujte dôležité stránky bližšie k hlavnej stránke:
- horné stránky: 1 kliknutie z hlavnej stránky
- dôležité stránky: <3 kliknutia
12. Okrem toho: faktor hodnotenia pre osirelé stránky
Môžete to zistiť prostredníctvom nášho nástroja na audit webových stránok
13. Spätné odkazy z hlavných stránok sú dôležitejšie ako z interných stránok
14. Počet vyhľadávacích dotazov na vašu stránku/URL je faktor hodnotenia
Čím viac, tým lepšie
15. Návštevnosť z Wikipédie je faktorom hodnotenia
16. Ak by vaša url bola posledná pre reláciu vyhľadávania (používateľ nájde to, čo potrebuje) - ovplyvnilo by to hodnotenie
Existujú na to prísne faktory a tiež predvídateľné faktory.
17. Faktor hodnotenia záložiek
Čím viac používateľov pridá url do záložiek, tým väčšiu hodnotu má faktor
18. Špeciálne faktory hodnotenia krátkych videí (tiktok, krátke videá, filmy)
19. Mapy js-api na stránke (napríklad Mapy Google) sú faktorom hodnotenia
V spoločnosti Google (napríklad v oblasti cestovania) funguje aj pridávanie máp s užitočnými informáciami/funkciami.
20. Kľúčové slová v URL sú faktormi hodnotenia
Ako vidíme z popisu - optimálne by bolo zahrnúť až 3 slová z vyhľadávacieho dotazu.
21. Vracajúci sa používatelia sú faktorom hodnotenia
Vytvorte produkty s dobrou retenciou a prospeje to vašej SEO optimalizácii (na jej meranie existuje veľa rankingových faktorov).
22. Percentuálny podiel veľkých písmen v <title> je hodnotiacim faktorom
23. Percento priamej návštevnosti je faktorom hodnotenia
Aka. Ak všetka vaša návštevnosť pochádza z organického vyhľadávania - je to podozrivé + zlé pre hodnotenie.
24. Ďalší faktor hodnotenia kvality obsahu - nefunkčné vložené video na stránke
- Vkladanie videí - dobré pre hodnotenie.
- Zlomené vložené videá - zlé.
25. Overené účty na sociálnych sieťach sa radia inak ako ostatné url
Dôležité pre vyhľadávanie značky - v ideálnom prípade by sa pri vyhľadávaní vašej značky mali v prvej desiatke nachádzať len vaše domény + overené sociálne siete
26. Ak vaše spätné odkazy obsahujú všetky slová z kľúčových slov - je to dobré pre SEO
Ak je to v jednom odkaze - je to výhodnejšie. Najmä ak je poradie slov rovnaké.
27. Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia
![Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Pomer "dobrých" a "zlých" spätných odkazov je faktor hodnotenia")
28. Hodnota kvality textov na doméne je hodnotiacim faktorom
Stránky s nízkou kvalitou obsahu ovplyvňujú celú doménu.
29. Množstvo reklám na stránke je faktor hodnotenia
30. Existuje náhodnosť ako samostatný faktor hodnotenia
Keď nechápete, prečo sú niektoré stránky na vrchole - môže to byť len náhodné (testovanie faktorov správania).
31. JS z Google Analytics je faktor hodnotenia
Predvídateľne. Dobré webové stránky používajú GA / Google Analytics častejšie ako zlé webové stránky.
32. Vplyv spätných odkazov z top 100 najlepších webových stránok podľa PageRanku na poradie
33. URL nemá žiadne číslice
❌ /100-best-credit-cards
✅ /best-credit-cards
34. Počet lomiek v URL adrese
❌ /finance/articles/2023/investment-advice
✅ /investičné rady
35. Počet nepísmenových znakov v URL adrese
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. Symbol '?' v adrese URL je hodnotiacim faktorom
❌ /movies?genre=action
✅ /akčné filmy
37. Vyhľadávacia požiadavka = URL vrátane bodiek a medzier (??)
Vyhľadávacia otázka je "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Starý dátum v adrese URL
❌ /2009/12/01/how-to-tie-a-tie
✅ /how-to-tie-a-tie
39. Kľúčové slová sú v URL, nie v texte stránky
❌ /video-hry & stránka je o hudbe
✅ /video-hry & stránka je o videohrách
40. Pokrytie URL pomocou trigramov z vyhľadávacieho dotazu
✅ /hotels-new-zealand
❌ /nz
❌ /cheap-hotels-in-new-zealand-best-deals
- Do adresy URL uveďte 1-3 najdôležitejšie slová;
- Menej lomiek/číslic/nepísmen, ak nie sú súčasťou kľúčového slova
41. počiatočné váhy faktorov hodnotenia Yandex
Konečné váhy vypočítané pomocou AI(matrixnet), ale užitočné sú aj počiatočné hodnoty.
Záver
Tak to by sme mali, to je všetko, čo zatiaľ zdieľame. Práve začíname. Toto vám poskytuje hrubý prehľad o tom, čo sa tam nachádza.
Sme len na začiatku a čaká nás ešte veľa cenných poznatkov.
Mali sme však pravdu v mnohých predpokladoch a interpretáciách zvonku, ako by takýto rozsiahly vyhľadávač fungoval, aspoň čo sa týka odkazov.
Celkovo únik kódu spoločnosti Yandex ponúka fascinujúci pohľad na vnútorné fungovanie moderného vyhľadávača.
Platforma "všetko v jednom" pre efektívne SEO
Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO
Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!
Vytvorenie bezplatného kontaAlebo sa pri hláste pomocou svojich poverení
Hoci nie všetky zistenia sa dajú priamo aplikovať na Google, mnohé predpoklady o všeobecnom fungovaní veľkých internetových vyhľadávačov, ktoré sa objavili v posledných rokoch, sa potvrdili.
Predpokladám, že odvetvie SEO má pred sebou ešte niekoľko zaujímavých mesiacov s novými poznatkami z tohto úniku.
Sledujte túto stránku, pretože v nasledujúcich týždňoch a mesiacoch budeme naďalej pridávať faktory hodnotenia.
Osobitné zásluhy na https://twitter.com/alex_buraks