• Tehnoloogia

Yandex lekitas koodi, mis sisaldab 1922 otsingu reitingufaktorit Ranktracker selgitab kõiki reitingufaktoreid

  • Felix Rose-Collins
  • 6 min read
Yandex lekitas koodi, mis sisaldab 1922 otsingu reitingufaktorit Ranktracker selgitab kõiki reitingufaktoreid

Intro

Ilmselt olete kuulnud Yandexist, mis on maailma suuruselt 4. otsingumootor turuosa järgi. Eile lekkis välja Yandexi enda lähtekood.

Kõige huvitavam osa SEO-kogukonna jaoks on: loetelu kõigist 1922 otsingualgoritmis kasutatavast pingerea tegurist.

Oleme koodi alla laadinud, analüüsinud ja siin on see kasulikult esitatud.

Yandex leak

Intsident ei tohiks tulla üllatusena, sest Yandex või selle tooted on sageli küberrünnakute all. 2016. aastal teatas Hackread.com eksklusiivselt, kuidas üks pimedas veebis tegutsev müüja müüs 6,3 miljoni Yandexi kasutajakonto andmeid.

2021. aasta septembris tabas Venemaa otsingumootori hiiglast üks suurimaid DDoS-rünnakuid, mille aluseks oli 200 000 kompromiteeritud asjade interneti seadet.

Meet Ranktracker

Kõik-ühes platvorm tõhusaks SEO-ks

Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.

Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!

Loo tasuta konto

Või logi sisse oma volituste abil

Yandex git sources

Miks on see suur?

Yandex on üks suurimaid IT-ettevõtteid Venemaal. Riigisiseselt pakub ta laiemat teenuste valikut kui Google. Kujutage ette ühte ettevõtet, mis asendab Google'i, Uberi, Amazoni, Netflixi ja Spotify'i.

Kas see leke on tõeline?

Mina isiklikult ei ole kunagi Yandexis töötanud, kuid ma tean mitmeid inimesi, kes on seal erinevatel aegadel töötanud või töötavad seal siiani. Ma kontrollisin, et vähemalt mõned arhiivid sisaldavad kindlasti ettevõtte teenuste kaasaegset lähtekoodi ning dokumentatsiooni, mis viitab tõelistele intraneti URL-dele.

Mis on sees

Lekitaja jagas magnetlinki, mis sisaldab 44,7 GB faile, mis on seotud Yandex git allikatega. Väidetavalt varastati failid Yandexist juulis 2022. Lisaks sellele, et koodirepositooriumid sisaldavad spämmivastaseid suuniseid, on neis arvatavasti ka Yandexi lähtekood.

Lekk paljastas umbes 1922 järjestusfaktorit, mida otsingumootor kasutab oma otsingualgoritmis. Kood lekkis torrentina. Twitteri kasutaja Alex Buraksi poolt avaldatud analüüsi kohaselt sisaldavad lekkinud andmed arvukaid järjestusfaktoreid, sealhulgas teksti asjakohasust, PageRanki, sisu vanust, värskust jne.

Lisaks sellele on olemas mitmed lõppkasutaja käitumise tegurid, linkidega seotud tegurid ja vastuvõtja usaldusväärsus. SEO-d leiavad mõned ebatavalised pingerea tegurid, nagu unikaalsete külastajate arv, keskmine domeeni pingerida päringute lõikes ja orgaanilise liikluse protsent.

Tundub, et vähemalt kõigi Yandexi peamiste teenuste lähtekood on lekkinud:

  • Otsingumootor ja indekseerimisrobot
  • Kaardid - nagu Google Maps ja Street View
  • Alice - AI assistent nagu Siri / Alexa
  • Takso - Uberi sarnane taksoteenus
  • Otse - reklaami teenus nagu Google Ads / Adwords
  • Mail - postiteenus nagu GMail
  • Disk - failide salvestamise teenus nagu Google drive
  • Turg - turuplats nagu Amazon
  • Reisimine - nagu Booking.com pluss lennu-, rongi- ja bussipiletid
  • Yandex360 - nagu Google'i tööruumid oma domeeni teenuste jaoks
  • Pilv - Tõenäoliselt ei lekkinud kogu infrastruktuuri kood.
  • Pay - Maksetöötlus nagu Stripe, kuid piiratud funktsioonidega
  • Metrika - nagu Google Analytics
  • Ja vähemalt enamiku teiste ettevõtete teenuste backend osa on olemas. Suurim arhiiv nimega "frontend" on veel uurimata.

Shestakov märkis veel mõned API võtmed, mida tõenäoliselt on kasutatud testimiseks kasutuselevõtu.

Üksikasjad selle lekke kohta: leiate siit:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex eitab häkkimiskatset

Yandex väidab, et ta on lekkest teadlik ja on juba algatanud uurimise, et kontrollida, kuidas lähtekoodi "fragmendid" avalikkusele avaldati. Väärib märkimist, et leke ei sisalda kasutajate või töötajate isikuandmeid.

Arvestades aga Yandexi tähtsust Venemaa IT-infrastruktuuris ja lekkinud andmeid, võib oletada, et rünnaku ajendiks oli riigi sissetung Ukrainasse. Seega võivad sellega olla seotud Ukraina-meelsed häkkerid.

Meet Ranktracker

Kõik-ühes platvorm tõhusaks SEO-ks

Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.

Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!

Loo tasuta konto

Või logi sisse oma volituste abil

Oma ametlikus avalduses selgitas Yandex, et ettevõtet ei ole häkitud ja et endine töötaja võib olla seotud selle lähtekoodi avalikkusele lekkimisega. Venemaa juhtiv IT-firma märkis, et lekkinud arhiiv sisaldab koodifragmente, mis on osa sisemisest repositooriumist, mille andmed erinevad sellest, mida kasutatakse repositooriumi viimases versioonis.

"Yandexi ei häkkinud. Meie turvateenistus leidis koodifragmente avalikust sisemisest repositooriumist, kuid nende sisu erineb Yandexi teenustes kasutatava repositooriumi praegusest versioonist," seisis ettevõtte avalduses.

Sellegipoolest on lähtekoodi lekked ohtlikud, sest need tekitavad organisatsioonidele tõsiseid julgeolekuprobleeme, kuna ohuallikad võivad jälgida ettevõtte intellektuaalomandit ja süsteemiandmeid. Lähtekoodi lekkimine aitaks ründajatel luua sihipäraseid turvanäiteid.

Milline on teoreetiliselt erinevus Google'i ja Yandexi algoritmide vahel?

Nad on üsna sarnased:

Yandex vs Google

  • Yandexis on palju endiseid googlejaid.
  • Yanex ehitati Google'i kloonina;
  • SEO spetsialistid Venemaal kasutavad peaaegu sama valge mütsiga SEO taktikat Yandexi ja Google'i jaoks.

Loomulikult on palju erinevusi, kuid lähenemisviis ja enamik pingerea tegureid näivad olevat sarnased.

Praktikas: võrreldes Google'i ja Yandexi otsingutulemusi on nad ~70% vastavuses.

Statcounteri andmetel on Yandex turuosa poolest Yahoo ja Bingi lähedal:

search engine market share worldwide

Faili koos reitingufaktoritega: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Iga teguri struktuur:

  1. nimi
  2. link sisemisele wikile (piiratud)
  3. AntiSeoUpperBound (haha)
  4. kirjeldus (see on vene keeles, ma tõlkisin selle teile)
  5. jne

1. Esimene tegur nimekirjas - PageRank.

First factor in the list - PageRank

Peamised järeldused pärast selle nimekirja analüüsimist: Linkide vanus on pingerea tegur.

Age of links is a ranking factor.

2. Liiklus ja orgaanilise liikluse % on edetabeli tegurid.

PPC ostmine mõjutab edetabelit.

Traffic and % of organic traffic are ranking factors

3. Numbrid URL-ides on pingerea jaoks halvad

Numbers in URLs is bad for rankings

4. Liiga palju kaldkriipsu URL-ides on halvasti mõjunud edetabelisse paigutamisele

Too many slashes in URLs is bad for ranking

5. Kõva pessimatsioon võrdne PR=0

Hard pessimization equal PR=0

6. Vastuvõtja usaldusväärsus on pingerea tegur

Mida vähem 40x/50x vigu teil on, seda parem on teie orgaanilise liikluse jaoks.

Host reliability is a ranking factor

7. Vikipeedia tõstmise jaoks on eraldi pingerea tegur.

there is a separate ranking factor for uplifting Wikipedia

8. Palju kasutajate käitumisega seotud pingerea tegureid - CTR, viimane klõps, veebilehel viibimise aeg, tagasilöögimäära.

Märkus: Oleme peaaegu kindlad, et Yandexis mõjutavad need tegurid palju rohkem kui Google'is.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumendi vanus ja viimane uuendus on mõlemad pingerea tegurid.

Document age and last update both are ranking factors

10. Keskmine domeeni positsioon kõigi päringute lõikes on pingerea tegur.

Average domain position across all queries is a ranking factor

11. Crawli sügavus on pingerea tegur

Hoidke oma tähtsad leheküljed põhilehele lähemal:

  • ülemised leheküljed: 1 klõps pealehelt
  • olulised leheküljed: <3 klõpsu

Crawl depth is a ranking factor

12. Lisaks: orbude lehekülgede järjestusfaktor

Selle leiate meie veebisaidi auditi tööriista abil

Additionally: ranking factor for orphan pages

13. Tagasilinkid põhilehtedelt on olulisemad kui siselehtedelt.

Backlinks from main pages are more important than from internal pages

14. Teie saidi/url otsingupäringute arv on pingerea tegur.

Mida rohkem, seda parem

Number of search queries of your site/url is a ranking factor

15. Vikipeedia liiklus on edetabeli tegur

Traffic from Wikipedia is a ranking factor

16. Kui teie url oleks viimane otsingusessiooni jaoks (kasutaja leiab selle, mida ta vajab) - see mõjutaks edetabelit.

Selleks on ranged tegurid ja ka prognoositavad tegurid.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Järjestusfaktor järjehoidjad

Mida rohkem kasutajaid lisab url-i järjehoidjatesse, seda suurem on selle faktoriväärtus.

Bookmarks ranking factor

18. Lühikeste videote (tiktok, lühivideod, rullid) erilised pingeread.

Special ranking factors for short videos (tiktok, shorts, reels)

19. Kaardid js-api lehel (näiteks Google Maps) on edetabeli tegur.

Google'is (näiteks reisimise valdkonnas) töötab ka kasuliku info/funktsionaalsusega kaartide lisamine.

Maps js-api on page (for example Google Maps) is a ranking factor

20. URL-i märksõnad on pingerea tegurid

Nagu näeme kirjeldusest - optimaalne sisaldaks kuni 3 sõna otsingupäringust.

Keywords in URL are ranking factors

21. Kasutajate tagasipöördumine on pingerea tegur

Ehitage hea säilivusega tooteid ja sellest oleks kasu teie SEO-le (selle mõõtmiseks on palju pingerea tegureid).

Returning users is a ranking factor

22. Suurtähtede osakaal <title>-s on pingerea tegur.

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Otseliikluse protsentuaalne osakaal on edetabeli tegur.

Aka. Kui kogu teie liiklus tuli orgaanilisest otsingust - see on kahtlane + halb edetabelite jaoks.

Percentage of direct traffic is a ranking factor

24. Veel üks sisukvaliteedi pingerea tegur - katkine varjatud video lehel

  • Embed videod - hea pingerea jaoks.
  • Rikutud embed videod - halb.

One more ranking factor for content quality - broken embedded video on the page

25. Verifitseeritud kontod sotsiaalvõrgustikes reastatakse erinevalt kui muud urlid

Oluline brändi otsingute jaoks - ideaalis peaks teie brändi otsingul olema ainult teie domeenid + kontrollitud sotsiaalvõrgustikud top 10-s.

Verified accounts on social networks ranks differently as other urls

26. Kui teie tagasilinkide ankurdused sisaldavad kõiki märksõnu - see on hea SEO jaoks.

Kui see on ühes lingis - see on kasulikum. Eriti kui sõnade järjekord on sama.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Suhtarv "head" vs "halvad" tagasilinkid on pingerea teguriks

![Ratio "head" vs "halvad" tagasilinkid on pingerea tegur](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Ratio "head" vs "halvad" tagasilinkid on pingerea tegur")

28. Domeeni tekstide kvaliteedirida on pingerea teguriks.

Madala kvaliteediga leheküljed mõjutavad kogu domeeni.

The quality rank of texts on the domain is a ranking factor

29. Reklaami hulk lehel on pingerea tegur.

Amount of advertisements on a page is a ranking factor

30. Eraldi pingerea tegurina on juhuslikkus.

Kui te ei saa aru, miks mõned leheküljed on üleval - see võib olla lihtsalt juhuslik (testida käitumistegureid).

There is a random as a separate ranking factor

31. Google Analyticsi JS on pingerea tegur

Ennustatavalt. Head veebisaidid kasutavad GA / Google Analytics 'i sagedamini kui halvad veebisaidid.

JS from Google Analytics is a ranking factor

32. Tagasilinkid 100 parimatelt veebilehtedelt PageRanki järgi mõjutavad edetabelit

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL ei sisalda numbreid

/100-parimat-krediitkaarti

/best-credit-cards

URL has no digits

34. Kaldkriipsude arv URL-is

/finance/articles/2023/investment-advices

/investeerimisnõuanded

Number of slashes in URL

35. Mittetähtede arv URL-is

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. '?' sümbol URL-is on pingerea tegur.

/movies?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Otsingupäring = URL, kaasa arvatud punktid ja tühikud (??)

Otsingupäring on "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Vana kuupäev URL-is

/2009/12/01/how-to-tie-a-tie

/how-to-tie-a-tie

Old date in the URL

39. Märksõnad on URL-is, mitte lehekülje tekstis.

/video-mängud & lehekülg räägib muusikast

/video-mängud & lehekülg räägib videomängudest

Keywords is in URL, not in the text of the page

40. URL-i katvus koos otsingupäringu trigrammidega

/hotels-new-zealand

/nz

/cheap-hotels-in-new-zealand-best-deals

URL coverage with trigrams from the search query

  • Sisestage URL-ile 1-3 kõige olulisemat sõna;
  • Vähem kaldkriipsu/numbreid/mittekriipsu, kui see ei ole osa teie märksõnast.

41. Yandexi reitingufaktorite esialgsed kaalud

Lõplikud kaalud arvutab AI(matrixnet), kuid ka algväärtused on kasulikud.

initial weights of Yandex ranking factors

Kokkuvõte

Noh, see on kõik, mida me praegu jagame. Me alles alustame. See annab teile ligikaudse ülevaate sellest, mis seal sees on.

Me alles kriimustame siin pinda ja ees ootab veel palju väärtuslikke teadmisi.

Kuid meil oli üsna õigus paljudes oletustes ja tõlgendustes väljastpoolt, kuidas selline ulatuslik otsingumootor töötaks, vähemalt mis puudutab linke.

Kokkuvõttes pakub Yandexi koodileke põnevat sissevaadet kaasaegse otsingumootori sisemusse.

Meet Ranktracker

Kõik-ühes platvorm tõhusaks SEO-ks

Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.

Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!

Loo tasuta konto

Või logi sisse oma volituste abil

Kuigi kõiki tulemusi ei saa otseselt kohaldada Google'ile, leiavad kinnitust paljud viimastel aastatel tehtud oletused suurte internetiotsingumootorite üldise toimimise kohta.

Eeldan, et SEO-tööstusel on selle lekke uute teadmistega veel paar huvitavat kuud ees.

Jälgige seda lehekülge, sest me jätkame järgnevate nädalate ja kuude jooksul pingerea tegurite lisamist.

Eriline krediit https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Alusta Ranktracker'i kasutamist... Tasuta!

Uuri välja, mis takistab sinu veebisaidi edetabelisse paigutamist.

Loo tasuta konto

Või logi sisse oma volituste abil

Different views of Ranktracker app