• Teknologia

Yandex vuoti koodin, joka sisältää 1,922 haku ranking-tekijät Ranktracker selittää kaikki ranking-tekijät

  • Felix Rose-Collins
  • 6 min read
Yandex vuoti koodin, joka sisältää 1,922 haku ranking-tekijät Ranktracker selittää kaikki ranking-tekijät

Intro

Olet varmaan kuullut Yandexista, joka on markkinaosuudeltaan maailman neljänneksi suurin hakukone. Eilen Yandexin oma lähdekoodi vuoti julkisuuteen.

SEO-yhteisön kannalta mielenkiintoisin osa on: luettelo kaikista 1922 hakualgoritmissa käytetystä ranking-tekijästä.

Olemme ladanneet koodin, analysoineet sen ja esittäneet sen tässä hyödyllisellä tavalla.

Yandex leak

Välikohtauksen ei pitäisi tulla yllätyksenä, sillä Yandex tai sen tuotteet ovat usein kyberhyökkäysten kohteena. Vuonna 2016 Hackread.com uutisoi yksinoikeudella siitä, kuinka pimeän verkon myyjä myi 6,3 miljoonaa Yandexin käyttäjätilitietoa.

Syyskuussa 2021 venäläinen hakukonejätti joutui yhden suurimmista DDoS-hyökkäyksistä kohteeksi, jonka voimanlähteenä oli 200 000 vaarannettua IoT-laitetta.

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Yandex git sources

Miksi tämä on suuri?

Yandex on yksi Venäjän suurimmista IT-yrityksistä. Se tarjoaa maassa laajemman palveluvalikoiman kuin Google. Kuvittele yksi yritys, joka korvaa Googlen, Uberin, Amazonin, Netflixin ja Spotifyn.

Onko tämä vuoto todellinen?

Itse en ole koskaan työskennellyt Yandexilla, mutta tunnen useita ihmisiä, jotka ovat työskennelleet siellä eri aikoina tai työskentelevät siellä edelleen. Olen varmistanut, että ainakin osa arkistoista sisältää varmasti nykyaikaista lähdekoodia yrityksen palveluille sekä dokumentaatiota, joka osoittaa todellisiin intranet-osoitteisiin.

Mitä sisällä on

Vuotaja on jakanut magneettilinkin, joka sisältää 44,7 gigatavua tiedostoja, jotka on linkitetty Yandexin git-lähteisiin. Tiedostojen väitetään varastetun Yandexilta heinäkuussa 2022. Sen lisäksi, että koodivarastot sisältävät roskapostin torjuntaohjeita, niissä uskotaan olevan Yandexin lähdekoodia.

Vuoto paljasti noin 1 922 ranking-tekijää, joita hakukone käyttää hakualgoritmissaan. Koodi vuoti torrenttina. Twitter-käyttäjä Alex Buraksin julkaiseman analyysin mukaan vuotaneet tiedot sisältävät lukuisia ranking-tekijöitä, kuten tekstin relevanssi, PageRank, sisällön ikä, tuoreus jne.

Lisäksi on olemassa useita tekijöitä, jotka liittyvät loppukäyttäjän käyttäytymiseen, linkkiin ja isännän luotettavuuteen. SEO:t löytävät joitakin epätavallisia sijoitustekijöitä, kuten yksilöllisten kävijöiden määrän, verkkotunnuksen keskimääräisen sijoituksen kyselyiden välillä ja orgaanisen liikenteen prosenttiosuuden.

Näyttää siltä, että ainakin Yandexin kaikkien tärkeimpien palveluiden lähdekoodi on vuotanut:

  • Hakukone ja indeksointisbotti
  • Kartat - Kuten Google Maps ja Street View
  • Alice - tekoälyavustaja, kuten Siri / Alexa
  • Taksi - Uberin kaltainen taksipalvelu
  • Suora - Mainospalvelu kuten Google Ads / Adwords
  • Mail - Sähköpostipalvelu kuten GMail
  • Levy - Tiedostojen tallennuspalvelu, kuten Google drive
  • Market - Markkinapaikka kuten Amazon
  • Matkailu - Kuten Booking.com sekä lento-, juna- ja bussiliput.
  • Yandex360 - Kuten Googlen työtilat oman verkkotunnuksen palveluille.
  • Pilvi - Luultavasti kaikki infrastruktuurikoodi ei vuotanut.
  • Pay - Maksujen käsittely kuten Stripe, mutta rajoitetuilla ominaisuuksilla.
  • Metrika - Kuten Google Analytics
  • Ja ainakin useimpien muiden yritysten palveluiden backend-osa on olemassa. Suurin arkisto nimeltä "frontend" on vielä tutkimatta.

Shestakov huomasi lisäksi joitakin API-avaimia, joita on todennäköisesti käytetty käyttöönoton testaamiseen.

Yksityiskohtaiset tiedot tästä vuodosta löytyvät täältä:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex kiistää hakkerointiyrityksen

Yandex väittää olevansa tietoinen vuodosta ja on jo aloittanut tutkimuksen tarkistaakseen, miten lähdekoodin "pätkät" pääsivät julkisuuteen. On syytä huomata, että vuoto ei sisällä käyttäjien tai työntekijöiden henkilötietoja.

Kun otetaan huomioon Yandexin merkitys Venäjän IT-infrastruktuurissa ja vuotaneet tiedot, voidaan kuitenkin olettaa, että hyökkäyksen taustalla oli maan hyökkäys Ukrainaan. Mukana voisivat siis olla Ukrainan-mieliset hakkerit.

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Virallisessa lausunnossaan Yandex selvensi, että yritystä ei hakkeroitu ja että entinen työntekijä saattoi olla osallisena sen lähdekoodin vuotamisessa julkisuuteen. Venäjän johtava tietotekniikkayritys totesi, että vuotanut arkisto sisältää koodinpätkiä, jotka ovat osa sisäistä arkistoa, jonka tiedot eroavat siitä, mitä käytetään arkiston uusimmassa versiossa.

"Yandexia ei hakkeroitu. Tietoturvapalvelumme löysi koodinpätkiä julkisesta sisäisestä arkistosta, mutta sisältö eroaa Yandexin palveluissa käytetyn arkiston nykyisestä versiosta", yhtiön lausunnossa sanotaan.

Lähdekoodivuodot ovat kuitenkin vaarallisia, sillä ne aiheuttavat organisaatioille vakavia turvallisuusongelmia, koska uhkaajat voivat tarkkailla yrityksen henkistä omaisuutta ja järjestelmätietoja. Lähdekoodin vuotaminen auttaisi hyökkääjiä luomaan kohdennettuja tietoturvahyökkäyksiä.

Mitä eroa on teoriassa Googlen ja Yandexin algoritmeilla?

Ne ovat melko samanlaisia:

Yandex vs Google

  • Yandexissa on paljon entisiä googlaajia.
  • Yanex rakennettiin Googlen klooniksi;
  • SEO-asiantuntijat Venäjällä käyttävät lähes samoja valkoisen hatun SEO-taktiikoita Yandexille ja Googlelle.

Eroja on toki paljon, mutta lähestymistapa ja suurin osa ranking-tekijöistä näyttävät olevan samanlaisia.

Käytännössä: vertaamalla Google- ja Yandex-hakutuloksia ne vastaavat toisiaan ~70%.

Statcounterin mukaan Yandex on markkinaosuudeltaan lähellä Yahoota ja Bingiä:

search engine market share worldwide

Ranking-tekijöitä sisältävä tiedosto: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Kunkin tekijän rakenne:

  1. nimi
  2. linkki sisäiseen wikiin (rajoitettu)
  3. AntiSeoUpperBound (haha)
  4. kuvaus (se on venäjäksi, käänsin sen sinulle)
  5. jne

1. Ensimmäinen tekijä luettelossa - PageRank.

First factor in the list - PageRank

Tärkeimmät oivallukset tämän luettelon analysoinnin jälkeen: Linkkien ikä on ranking-tekijä.

Age of links is a ranking factor.

2. Liikennemäärä ja orgaanisen liikenteen osuus ovat sijoitustekijöitä.

PPC:n ostaminen vaikuttaa sijoituksiin.

Traffic and % of organic traffic are ranking factors

3. URL-osoitteissa olevat numerot ovat huono asia sijoitusten kannalta.

Numbers in URLs is bad for rankings

4. Liian monta vinoviivaa URL-osoitteissa on huono asia sijoituksen kannalta.

Too many slashes in URLs is bad for ranking

5. Kova pessimointi yhtä suuri kuin PR=0

Hard pessimization equal PR=0

6. Isännän luotettavuus on luokittelutekijä

Mitä vähemmän 40x/50x-virheitä sinulla on, sitä parempi orgaaniselle liikenteellesi.

Host reliability is a ranking factor

7. Wikipedian nostamiselle on erillinen ranking-tekijä.

there is a separate ranking factor for uplifting Wikipedia

8. Paljon käyttäjien käyttäytymiseen liittyviä ranking-tekijöitä - CTR, viimeinen klikkaus, sivustollaoloaika, hyppyprosentti.

Huomautus: Olemme lähes varmoja, että Yandexissa nämä tekijät vaikuttavat paljon enemmän kuin Googlessa.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Asiakirjan ikä ja viimeinen päivitys ovat molemmat ranking-tekijöitä.

Document age and last update both are ranking factors

10. Verkkotunnuksen keskimääräinen sijainti kaikissa kyselyissä on sijoitustekijä.

Average domain position across all queries is a ranking factor

11. Ryöminnän syvyys on ranking-tekijä

Pidä tärkeät sivut lähempänä pääsivua:

  • yläsivut: 1 klikkaus pääsivulta
  • tärkeät sivut: <3 klikkausta

Crawl depth is a ranking factor

12. Lisäksi: orpojen sivujen ranking-tekijä

Löydät tämän verkkosivuston tarkastustyökalun avulla

Additionally: ranking factor for orphan pages

13. Pääsivuilta tulevat takalinkit ovat tärkeämpiä kuin sisäisiltä sivuilta tulevat.

Backlinks from main pages are more important than from internal pages

14. Sivustosi/url-sivuston hakukyselyjen määrä on sijoitustekijä.

Mitä enemmän sitä parempi

Number of search queries of your site/url is a ranking factor

15. Wikipediasta tuleva liikenne on sijoitustekijä

Traffic from Wikipedia is a ranking factor

16. Jos url olisi viimeinen hakuistunnon aikana (käyttäjä löytää tarvitsemansa) - se vaikuttaisi sijoituksiin.

Tähän on olemassa tiukkoja tekijöitä ja myös ennustettavia tekijöitä.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Kirjanmerkit ranking-tekijä

Mitä useampi käyttäjä lisää url-osoitteen kirjanmerkkeihin, sitä suurempi tekijäarvo sillä on.

Bookmarks ranking factor

18. Lyhyiden videoiden (tikrot, lyhytvideot, filmit) erityiset ranking-tekijät.

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api sivulla (esimerkiksi Google Maps) on ranking-tekijä.

Googlessa (esimerkiksi matkailualalla) karttojen lisääminen hyödyllisellä tiedolla/toiminnallisuudella toimii myös.

Maps js-api on page (for example Google Maps) is a ranking factor

20. URL-osoitteen avainsanat ovat ranking-tekijöitä

Kuten kuvauksesta näkyy - optimaalinen sisältää enintään 3 sanaa hakukyselystä.

Keywords in URL are ranking factors

21. Palautuvat käyttäjät ovat sijoitustekijä

Rakenna tuotteita, joilla on hyvä retentio, ja se hyödyttää hakukoneoptimointiasi (sen mittaamiseen on paljon ranking-tekijöitä).

Returning users is a ranking factor

22. Suurten kirjainten osuus <title>:ssä on ranking-tekijä.

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Suoran liikenteen prosenttiosuus on sijoitustekijä.

Aka. Jos kaikki liikenne tuli orgaanisesta hausta - se on epäilyttävää + huono sijoituksia.

Percentage of direct traffic is a ranking factor

24. Vielä yksi sisällön laatuun vaikuttava tekijä - rikkinäinen upotettu video sivulla.

  • Upota videoita - hyvä sijoitusten kannalta.
  • Rikkinäiset upotusvideot - huono.

One more ranking factor for content quality - broken embedded video on the page

25. Verifioidut tilit sosiaalisissa verkostoissa sijoittuvat eri tavalla kuin muut urlit.

Tärkeää tuotemerkkihauissa - ihanteellisessa tapauksessa tuotemerkkiäsi etsiessä top 10:ssä pitäisi olla vain verkkotunnuksesi + vahvistetut sosiaaliset verkostot.

Verified accounts on social networks ranks differently as other urls

26. Jos linkkisi ankkurit sisältävät kaikki avainsanojen sanat - se on hyvä SEO:n kannalta.

Jos se on yhdessä linkissä - siitä on enemmän hyötyä. Varsinkin jos sanojen järjestys on sama.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Suhde "hyvät" vs. "huonot" backlinkit on sijoitustekijä.

![Suhde "hyvät" vs. "huonot" backlinkit on ranking-tekijä](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Suhde "hyvät" vs. "huonot" backlinkit on ranking-tekijä"))

28. Verkkotunnuksen tekstien laatuluokitus on sijoitustekijä.

Sivut, joiden sisältö on heikkolaatuista, vaikuttavat koko verkkotunnukseen.

The quality rank of texts on the domain is a ranking factor

29. Sivulla olevien mainosten määrä on ranking-tekijä.

Amount of advertisements on a page is a ranking factor

30. Satunnaisuus on erillinen sijoitustekijä.

Kun et ymmärrä, miksi jotkut sivut ovat kärjessä - se voi olla vain satunnaista (käyttäytymistekijöiden testaamiseksi).

There is a random as a separate ranking factor

31. Google Analyticsin JS on sijoitustekijä

Ennustettavasti. Hyvät verkkosivustot käyttävät GA:ta / Google Analyticsia useammin kuin huonot verkkosivustot.

JS from Google Analytics is a ranking factor

32. PageRank-arvoltaan 100 parhaan verkkosivuston takalinkit vaikuttavat rankingiin.

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL-osoitteessa ei ole numeroita

/100-parasta-luottokorttia

/best-credit-cards

URL has no digits

34. Viivojen määrä URL-osoitteessa

/finance/articles/2023/investment-advices

/sijoitusneuvoja

Number of slashes in URL

35. Muiden kuin kirjainten määrä URL-osoitteessa

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. '?'-symboli URL-osoitteessa on ranking-tekijä.

/movies?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Hakukysely = URL-osoite, mukaan lukien pisteet ja välilyönnit (??).

Hakukysely on "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Vanha päivämäärä URL-osoitteessa

/2009/12/01/how-to-tie-a-tie-a-tie

/how-to-tie-a-tie-a-tie

Old date in the URL

39. Avainsanat ovat URL-osoitteessa, eivät sivun tekstissä.

/videopelit & sivu kertoo musiikista

/videopelit & sivu kertoo videopeleistä

Keywords is in URL, not in the text of the page

40. URL-osoitteen kattavuus hakukyselyn trigrammien avulla

/hotels-new-zealand

/nz

/halvat-hotellit-uusimaassa-uusimaa-parhaimmat-tarjoukset

URL coverage with trigrams from the search query

  • Sisällytä URL-osoitteeseen 1-3 tärkeintä sanaa;
  • Vähemmän vinoviivoja/numeroita/ei-kirjaimia, jos ne eivät ole osa avainsanaa.

41. Yandexin ranking-tekijöiden alkuperäiset painotukset

Lopulliset painot lasketaan AI:n(matrixnet) avulla, mutta myös alkuarvot ovat hyödyllisiä.

initial weights of Yandex ranking factors

Päätelmä

No siinäpä se, tässä on kaikki, mitä jaamme toistaiseksi. Olemme vasta aloittamassa. Tämä antaa teille karkean yleiskuvan siitä, mitä siellä on.

Olemme vasta raapaisemassa pintaa, ja edessä on vielä paljon arvokkaita oivalluksia.

Olimme kuitenkin aivan oikeassa monissa oletuksissa ja tulkinnoissa, jotka ulkopuolelta esitettiin siitä, miten näin laaja hakukone toimisi, ainakin linkkien osalta.

Kaiken kaikkiaan Yandexin koodivuoto tarjoaa kiehtovan näkymän modernin hakukoneen sisäiseen toimintaan.

Tapaa Ranktracker

All-in-One-alusta tehokkaaseen hakukoneoptimointiin

Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.

Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Vaikka kaikkia havaintoja ei voida suoraan soveltaa Googleen, monet viime vuosina esitetyt oletukset suurten Internet-hakukoneiden yleisestä toiminnasta ovat saaneet vahvistusta.

Oletan, että SEO-alalla on vielä muutama mielenkiintoinen kuukausi edessä, kun vuodosta saadaan uusia tietoja.

Pidä silmällä tätä sivua, sillä lisäämme ranking-tekijöitä tulevien viikkojen ja kuukausien aikana.

Erityishyvityksiä https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Aloita Ranktrackerin käyttö... ilmaiseksi!

Selvitä, mikä estää verkkosivustoasi sijoittumasta.

Luo ilmainen tili

Tai Kirjaudu sisään omilla tunnuksillasi

Different views of Ranktracker app