Intro
Olet varmaan kuullut Yandexista, joka on markkinaosuudeltaan maailman neljänneksi suurin hakukone. Eilen Yandexin oma lähdekoodi vuoti julkisuuteen.
SEO-yhteisön kannalta mielenkiintoisin osa on: luettelo kaikista 1922 hakualgoritmissa käytetystä ranking-tekijästä.
Olemme ladanneet koodin, analysoineet sen ja esittäneet sen tässä hyödyllisellä tavalla.
Välikohtauksen ei pitäisi tulla yllätyksenä, sillä Yandex tai sen tuotteet ovat usein kyberhyökkäysten kohteena. Vuonna 2016 Hackread.com uutisoi yksinoikeudella siitä, kuinka pimeän verkon myyjä myi 6,3 miljoonaa Yandexin käyttäjätilitietoa.
Syyskuussa 2021 venäläinen hakukonejätti joutui yhden suurimmista DDoS-hyökkäyksistä kohteeksi, jonka voimanlähteenä oli 200 000 vaarannettua IoT-laitetta.
All-in-One-alusta tehokkaaseen hakukoneoptimointiin
Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.
Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!
Luo ilmainen tiliTai Kirjaudu sisään omilla tunnuksillasi
Miksi tämä on suuri?
Yandex on yksi Venäjän suurimmista IT-yrityksistä. Se tarjoaa maassa laajemman palveluvalikoiman kuin Google. Kuvittele yksi yritys, joka korvaa Googlen, Uberin, Amazonin, Netflixin ja Spotifyn.
Onko tämä vuoto todellinen?
Itse en ole koskaan työskennellyt Yandexilla, mutta tunnen useita ihmisiä, jotka ovat työskennelleet siellä eri aikoina tai työskentelevät siellä edelleen. Olen varmistanut, että ainakin osa arkistoista sisältää varmasti nykyaikaista lähdekoodia yrityksen palveluille sekä dokumentaatiota, joka osoittaa todellisiin intranet-osoitteisiin.
Mitä sisällä on
Vuotaja on jakanut magneettilinkin, joka sisältää 44,7 gigatavua tiedostoja, jotka on linkitetty Yandexin git-lähteisiin. Tiedostojen väitetään varastetun Yandexilta heinäkuussa 2022. Sen lisäksi, että koodivarastot sisältävät roskapostin torjuntaohjeita, niissä uskotaan olevan Yandexin lähdekoodia.
Vuoto paljasti noin 1 922 ranking-tekijää, joita hakukone käyttää hakualgoritmissaan. Koodi vuoti torrenttina. Twitter-käyttäjä Alex Buraksin julkaiseman analyysin mukaan vuotaneet tiedot sisältävät lukuisia ranking-tekijöitä, kuten tekstin relevanssi, PageRank, sisällön ikä, tuoreus jne.
Olet varmaan kuullut Yandexista, joka on markkinaosuudeltaan maailman neljänneksi suurin hakukone. Eilen Yandexin oma lähdekoodi vuoti julkisuuteen.
- Alex Buraks (@alex_buraks) January 27, 2023
SEO-yhteisön kannalta mielenkiintoisin osa on: luettelo kaikista 1922:sta hakualgoritmissa käytetystä ranking-tekijästä.
[🧵THREAD] pic.twitter.com/6x82AAmbON
Lisäksi on olemassa useita tekijöitä, jotka liittyvät loppukäyttäjän käyttäytymiseen, linkkiin ja isännän luotettavuuteen. SEO:t löytävät joitakin epätavallisia sijoitustekijöitä, kuten yksilöllisten kävijöiden määrän, verkkotunnuksen keskimääräisen sijoituksen kyselyiden välillä ja orgaanisen liikenteen prosenttiosuuden.
Näyttää siltä, että ainakin Yandexin kaikkien tärkeimpien palveluiden lähdekoodi on vuotanut:
- Hakukone ja indeksointisbotti
- Kartat - Kuten Google Maps ja Street View
- Alice - tekoälyavustaja, kuten Siri / Alexa
- Taksi - Uberin kaltainen taksipalvelu
- Suora - Mainospalvelu kuten Google Ads / Adwords
- Mail - Sähköpostipalvelu kuten GMail
- Levy - Tiedostojen tallennuspalvelu, kuten Google drive
- Market - Markkinapaikka kuten Amazon
- Matkailu - Kuten Booking.com sekä lento-, juna- ja bussiliput.
- Yandex360 - Kuten Googlen työtilat oman verkkotunnuksen palveluille.
- Pilvi - Luultavasti kaikki infrastruktuurikoodi ei vuotanut.
- Pay - Maksujen käsittely kuten Stripe, mutta rajoitetuilla ominaisuuksilla.
- Metrika - Kuten Google Analytics
- Ja ainakin useimpien muiden yritysten palveluiden backend-osa on olemassa. Suurin arkisto nimeltä "frontend" on vielä tutkimatta.
Shestakov huomasi lisäksi joitakin API-avaimia, joita on todennäköisesti käytetty käyttöönoton testaamiseen.
Yksityiskohtaiset tiedot tästä vuodosta löytyvät täältä:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex kiistää hakkerointiyrityksen
Yandex väittää olevansa tietoinen vuodosta ja on jo aloittanut tutkimuksen tarkistaakseen, miten lähdekoodin "pätkät" pääsivät julkisuuteen. On syytä huomata, että vuoto ei sisällä käyttäjien tai työntekijöiden henkilötietoja.
Kun otetaan huomioon Yandexin merkitys Venäjän IT-infrastruktuurissa ja vuotaneet tiedot, voidaan kuitenkin olettaa, että hyökkäyksen taustalla oli maan hyökkäys Ukrainaan. Mukana voisivat siis olla Ukrainan-mieliset hakkerit.
All-in-One-alusta tehokkaaseen hakukoneoptimointiin
Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.
Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!
Luo ilmainen tiliTai Kirjaudu sisään omilla tunnuksillasi
Virallisessa lausunnossaan Yandex selvensi, että yritystä ei hakkeroitu ja että entinen työntekijä saattoi olla osallisena sen lähdekoodin vuotamisessa julkisuuteen. Venäjän johtava tietotekniikkayritys totesi, että vuotanut arkisto sisältää koodinpätkiä, jotka ovat osa sisäistä arkistoa, jonka tiedot eroavat siitä, mitä käytetään arkiston uusimmassa versiossa.
"Yandexia ei hakkeroitu. Tietoturvapalvelumme löysi koodinpätkiä julkisesta sisäisestä arkistosta, mutta sisältö eroaa Yandexin palveluissa käytetyn arkiston nykyisestä versiosta", yhtiön lausunnossa sanotaan.
Lähdekoodivuodot ovat kuitenkin vaarallisia, sillä ne aiheuttavat organisaatioille vakavia turvallisuusongelmia, koska uhkaajat voivat tarkkailla yrityksen henkistä omaisuutta ja järjestelmätietoja. Lähdekoodin vuotaminen auttaisi hyökkääjiä luomaan kohdennettuja tietoturvahyökkäyksiä.
Mitä eroa on teoriassa Googlen ja Yandexin algoritmeilla?
Ne ovat melko samanlaisia:
- on olemassa RankBrain-analogi- MatrixNet.
- he käyttävät PageRankia (lähes sama kuin Googlessa);
- monet tekstialgoritmit ovat samoja.
- Yandexissa on paljon entisiä googlaajia.
- Yanex rakennettiin Googlen klooniksi;
- SEO-asiantuntijat Venäjällä käyttävät lähes samoja valkoisen hatun SEO-taktiikoita Yandexille ja Googlelle.
Eroja on toki paljon, mutta lähestymistapa ja suurin osa ranking-tekijöistä näyttävät olevan samanlaisia.
Käytännössä: vertaamalla Google- ja Yandex-hakutuloksia ne vastaavat toisiaan ~70%.
Statcounterin mukaan Yandex on markkinaosuudeltaan lähellä Yahoota ja Bingiä:
Ranking-tekijöitä sisältävä tiedosto: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Kunkin tekijän rakenne:
- nimi
- linkki sisäiseen wikiin (rajoitettu)
- AntiSeoUpperBound (haha)
- kuvaus (se on venäjäksi, käänsin sen sinulle)
- jne
1. Ensimmäinen tekijä luettelossa - PageRank.
Tärkeimmät oivallukset tämän luettelon analysoinnin jälkeen: Linkkien ikä on ranking-tekijä.
2. Liikennemäärä ja orgaanisen liikenteen osuus ovat sijoitustekijöitä.
PPC:n ostaminen vaikuttaa sijoituksiin.
3. URL-osoitteissa olevat numerot ovat huono asia sijoitusten kannalta.
4. Liian monta vinoviivaa URL-osoitteissa on huono asia sijoituksen kannalta.
5. Kova pessimointi yhtä suuri kuin PR=0
6. Isännän luotettavuus on luokittelutekijä
Mitä vähemmän 40x/50x-virheitä sinulla on, sitä parempi orgaaniselle liikenteellesi.
7. Wikipedian nostamiselle on erillinen ranking-tekijä.
8. Paljon käyttäjien käyttäytymiseen liittyviä ranking-tekijöitä - CTR, viimeinen klikkaus, sivustollaoloaika, hyppyprosentti.
Huomautus: Olemme lähes varmoja, että Yandexissa nämä tekijät vaikuttavat paljon enemmän kuin Googlessa.
9. Asiakirjan ikä ja viimeinen päivitys ovat molemmat ranking-tekijöitä.
10. Verkkotunnuksen keskimääräinen sijainti kaikissa kyselyissä on sijoitustekijä.
11. Ryöminnän syvyys on ranking-tekijä
Pidä tärkeät sivut lähempänä pääsivua:
- yläsivut: 1 klikkaus pääsivulta
- tärkeät sivut: <3 klikkausta
12. Lisäksi: orpojen sivujen ranking-tekijä
Löydät tämän verkkosivuston tarkastustyökalun avulla
13. Pääsivuilta tulevat takalinkit ovat tärkeämpiä kuin sisäisiltä sivuilta tulevat.
14. Sivustosi/url-sivuston hakukyselyjen määrä on sijoitustekijä.
Mitä enemmän sitä parempi
15. Wikipediasta tuleva liikenne on sijoitustekijä
16. Jos url olisi viimeinen hakuistunnon aikana (käyttäjä löytää tarvitsemansa) - se vaikuttaisi sijoituksiin.
Tähän on olemassa tiukkoja tekijöitä ja myös ennustettavia tekijöitä.
17. Kirjanmerkit ranking-tekijä
Mitä useampi käyttäjä lisää url-osoitteen kirjanmerkkeihin, sitä suurempi tekijäarvo sillä on.
18. Lyhyiden videoiden (tikrot, lyhytvideot, filmit) erityiset ranking-tekijät.
19. Maps js-api sivulla (esimerkiksi Google Maps) on ranking-tekijä.
Googlessa (esimerkiksi matkailualalla) karttojen lisääminen hyödyllisellä tiedolla/toiminnallisuudella toimii myös.
20. URL-osoitteen avainsanat ovat ranking-tekijöitä
Kuten kuvauksesta näkyy - optimaalinen sisältää enintään 3 sanaa hakukyselystä.
21. Palautuvat käyttäjät ovat sijoitustekijä
Rakenna tuotteita, joilla on hyvä retentio, ja se hyödyttää hakukoneoptimointiasi (sen mittaamiseen on paljon ranking-tekijöitä).
22. Suurten kirjainten osuus <title>:ssä on ranking-tekijä.
23. Suoran liikenteen prosenttiosuus on sijoitustekijä.
Aka. Jos kaikki liikenne tuli orgaanisesta hausta - se on epäilyttävää + huono sijoituksia.
24. Vielä yksi sisällön laatuun vaikuttava tekijä - rikkinäinen upotettu video sivulla.
- Upota videoita - hyvä sijoitusten kannalta.
- Rikkinäiset upotusvideot - huono.
25. Verifioidut tilit sosiaalisissa verkostoissa sijoittuvat eri tavalla kuin muut urlit.
Tärkeää tuotemerkkihauissa - ihanteellisessa tapauksessa tuotemerkkiäsi etsiessä top 10:ssä pitäisi olla vain verkkotunnuksesi + vahvistetut sosiaaliset verkostot.
26. Jos linkkisi ankkurit sisältävät kaikki avainsanojen sanat - se on hyvä SEO:n kannalta.
Jos se on yhdessä linkissä - siitä on enemmän hyötyä. Varsinkin jos sanojen järjestys on sama.
27. Suhde "hyvät" vs. "huonot" backlinkit on sijoitustekijä.
![Suhde "hyvät" vs. "huonot" backlinkit on ranking-tekijä](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Suhde "hyvät" vs. "huonot" backlinkit on ranking-tekijä"))
28. Verkkotunnuksen tekstien laatuluokitus on sijoitustekijä.
Sivut, joiden sisältö on heikkolaatuista, vaikuttavat koko verkkotunnukseen.
29. Sivulla olevien mainosten määrä on ranking-tekijä.
30. Satunnaisuus on erillinen sijoitustekijä.
Kun et ymmärrä, miksi jotkut sivut ovat kärjessä - se voi olla vain satunnaista (käyttäytymistekijöiden testaamiseksi).
31. Google Analyticsin JS on sijoitustekijä
Ennustettavasti. Hyvät verkkosivustot käyttävät GA:ta / Google Analyticsia useammin kuin huonot verkkosivustot.
32. PageRank-arvoltaan 100 parhaan verkkosivuston takalinkit vaikuttavat rankingiin.
33. URL-osoitteessa ei ole numeroita
❌ /100-parasta-luottokorttia
✅ /best-credit-cards
34. Viivojen määrä URL-osoitteessa
❌ /finance/articles/2023/investment-advices
✅ /sijoitusneuvoja
35. Muiden kuin kirjainten määrä URL-osoitteessa
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. '?'-symboli URL-osoitteessa on ranking-tekijä.
❌ /movies?genre=action
✅ /action-movies
37. Hakukysely = URL-osoite, mukaan lukien pisteet ja välilyönnit (??).
Hakukysely on "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Vanha päivämäärä URL-osoitteessa
❌ /2009/12/01/how-to-tie-a-tie-a-tie
✅ /how-to-tie-a-tie-a-tie
39. Avainsanat ovat URL-osoitteessa, eivät sivun tekstissä.
❌ /videopelit & sivu kertoo musiikista
✅ /videopelit & sivu kertoo videopeleistä
40. URL-osoitteen kattavuus hakukyselyn trigrammien avulla
✅ /hotels-new-zealand
❌ /nz
❌ /halvat-hotellit-uusimaassa-uusimaa-parhaimmat-tarjoukset
- Sisällytä URL-osoitteeseen 1-3 tärkeintä sanaa;
- Vähemmän vinoviivoja/numeroita/ei-kirjaimia, jos ne eivät ole osa avainsanaa.
41. Yandexin ranking-tekijöiden alkuperäiset painotukset
Lopulliset painot lasketaan AI:n(matrixnet) avulla, mutta myös alkuarvot ovat hyödyllisiä.
Päätelmä
No siinäpä se, tässä on kaikki, mitä jaamme toistaiseksi. Olemme vasta aloittamassa. Tämä antaa teille karkean yleiskuvan siitä, mitä siellä on.
Olemme vasta raapaisemassa pintaa, ja edessä on vielä paljon arvokkaita oivalluksia.
Olimme kuitenkin aivan oikeassa monissa oletuksissa ja tulkinnoissa, jotka ulkopuolelta esitettiin siitä, miten näin laaja hakukone toimisi, ainakin linkkien osalta.
Kaiken kaikkiaan Yandexin koodivuoto tarjoaa kiehtovan näkymän modernin hakukoneen sisäiseen toimintaan.
All-in-One-alusta tehokkaaseen hakukoneoptimointiin
Jokaisen menestyvän yrityksen takana on vahva SEO-kampanja. Mutta kun tarjolla on lukemattomia optimointityökaluja ja -tekniikoita, voi olla vaikea tietää, mistä aloittaa. No, älä pelkää enää, sillä minulla on juuri oikea apu. Esittelen Ranktracker all-in-one -alustan tehokasta SEO:ta varten.
Olemme vihdoin avanneet Ranktrackerin rekisteröinnin täysin ilmaiseksi!
Luo ilmainen tiliTai Kirjaudu sisään omilla tunnuksillasi
Vaikka kaikkia havaintoja ei voida suoraan soveltaa Googleen, monet viime vuosina esitetyt oletukset suurten Internet-hakukoneiden yleisestä toiminnasta ovat saaneet vahvistusta.
Oletan, että SEO-alalla on vielä muutama mielenkiintoinen kuukausi edessä, kun vuodosta saadaan uusia tietoja.
Pidä silmällä tätä sivua, sillä lisäämme ranking-tekijöitä tulevien viikkojen ja kuukausien aikana.
Erityishyvityksiä https://twitter.com/alex_buraks