Intro
Ilmselt olete kuulnud Yandexist, mis on maailma suuruselt 4. otsingumootor turuosa järgi. Eile lekkis välja Yandexi enda lähtekood.
Kõige huvitavam osa SEO-kogukonna jaoks on: loetelu kõigist 1922 otsingualgoritmis kasutatavast pingerea tegurist.
Oleme koodi alla laadinud, analüüsinud ja siin on see kasulikult esitatud.
Intsident ei tohiks tulla üllatusena, sest Yandex või selle tooted on sageli küberrünnakute all. 2016. aastal teatas Hackread.com eksklusiivselt, kuidas üks pimedas veebis tegutsev müüja müüs 6,3 miljoni Yandexi kasutajakonto andmeid.
2021. aasta septembris tabas Venemaa otsingumootori hiiglast üks suurimaid DDoS-rünnakuid, mille aluseks oli 200 000 kompromiteeritud asjade interneti seadet.
Kõik-ühes platvorm tõhusaks SEO-ks
Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.
Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!
Loo tasuta kontoVõi logi sisse oma volituste abil
Miks on see suur?
Yandex on üks suurimaid IT-ettevõtteid Venemaal. Riigisiseselt pakub ta laiemat teenuste valikut kui Google. Kujutage ette ühte ettevõtet, mis asendab Google'i, Uberi, Amazoni, Netflixi ja Spotify'i.
Kas see leke on tõeline?
Mina isiklikult ei ole kunagi Yandexis töötanud, kuid ma tean mitmeid inimesi, kes on seal erinevatel aegadel töötanud või töötavad seal siiani. Ma kontrollisin, et vähemalt mõned arhiivid sisaldavad kindlasti ettevõtte teenuste kaasaegset lähtekoodi ning dokumentatsiooni, mis viitab tõelistele intraneti URL-dele.
Mis on sees
Lekitaja jagas magnetlinki, mis sisaldab 44,7 GB faile, mis on seotud Yandex git allikatega. Väidetavalt varastati failid Yandexist juulis 2022. Lisaks sellele, et koodirepositooriumid sisaldavad spämmivastaseid suuniseid, on neis arvatavasti ka Yandexi lähtekood.
Lekk paljastas umbes 1922 järjestusfaktorit, mida otsingumootor kasutab oma otsingualgoritmis. Kood lekkis torrentina. Twitteri kasutaja Alex Buraksi poolt avaldatud analüüsi kohaselt sisaldavad lekkinud andmed arvukaid järjestusfaktoreid, sealhulgas teksti asjakohasust, PageRanki, sisu vanust, värskust jne.
Ilmselt olete kuulnud Yandexist, mis on maailma suuruselt 4. otsingumootor turuosa järgi. Eile lekkis välja Yandexi enda lähtekood.
- Alex Buraks (@alex_buraks) January 27, 2023
SEO-kogukonna jaoks kõige huvitavam osa on: loetelu kõigist 1922 otsingualgoritmis kasutatavast järjestusfaktorist.
[🧵THREAD] pic.twitter.com/6x82AAmbON
Lisaks sellele on olemas mitmed lõppkasutaja käitumise tegurid, linkidega seotud tegurid ja vastuvõtja usaldusväärsus. SEO-d leiavad mõned ebatavalised pingerea tegurid, nagu unikaalsete külastajate arv, keskmine domeeni pingerida päringute lõikes ja orgaanilise liikluse protsent.
Tundub, et vähemalt kõigi Yandexi peamiste teenuste lähtekood on lekkinud:
- Otsingumootor ja indekseerimisrobot
- Kaardid - nagu Google Maps ja Street View
- Alice - AI assistent nagu Siri / Alexa
- Takso - Uberi sarnane taksoteenus
- Otse - reklaami teenus nagu Google Ads / Adwords
- Mail - postiteenus nagu GMail
- Disk - failide salvestamise teenus nagu Google drive
- Turg - turuplats nagu Amazon
- Reisimine - nagu Booking.com pluss lennu-, rongi- ja bussipiletid
- Yandex360 - nagu Google'i tööruumid oma domeeni teenuste jaoks
- Pilv - Tõenäoliselt ei lekkinud kogu infrastruktuuri kood.
- Pay - Maksetöötlus nagu Stripe, kuid piiratud funktsioonidega
- Metrika - nagu Google Analytics
- Ja vähemalt enamiku teiste ettevõtete teenuste backend osa on olemas. Suurim arhiiv nimega "frontend" on veel uurimata.
Shestakov märkis veel mõned API võtmed, mida tõenäoliselt on kasutatud testimiseks kasutuselevõtu.
Üksikasjad selle lekke kohta: leiate siit:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex eitab häkkimiskatset
Yandex väidab, et ta on lekkest teadlik ja on juba algatanud uurimise, et kontrollida, kuidas lähtekoodi "fragmendid" avalikkusele avaldati. Väärib märkimist, et leke ei sisalda kasutajate või töötajate isikuandmeid.
Arvestades aga Yandexi tähtsust Venemaa IT-infrastruktuuris ja lekkinud andmeid, võib oletada, et rünnaku ajendiks oli riigi sissetung Ukrainasse. Seega võivad sellega olla seotud Ukraina-meelsed häkkerid.
Kõik-ühes platvorm tõhusaks SEO-ks
Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.
Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!
Loo tasuta kontoVõi logi sisse oma volituste abil
Oma ametlikus avalduses selgitas Yandex, et ettevõtet ei ole häkitud ja et endine töötaja võib olla seotud selle lähtekoodi avalikkusele lekkimisega. Venemaa juhtiv IT-firma märkis, et lekkinud arhiiv sisaldab koodifragmente, mis on osa sisemisest repositooriumist, mille andmed erinevad sellest, mida kasutatakse repositooriumi viimases versioonis.
"Yandexi ei häkkinud. Meie turvateenistus leidis koodifragmente avalikust sisemisest repositooriumist, kuid nende sisu erineb Yandexi teenustes kasutatava repositooriumi praegusest versioonist," seisis ettevõtte avalduses.
Sellegipoolest on lähtekoodi lekked ohtlikud, sest need tekitavad organisatsioonidele tõsiseid julgeolekuprobleeme, kuna ohuallikad võivad jälgida ettevõtte intellektuaalomandit ja süsteemiandmeid. Lähtekoodi lekkimine aitaks ründajatel luua sihipäraseid turvanäiteid.
Milline on teoreetiliselt erinevus Google'i ja Yandexi algoritmide vahel?
Nad on üsna sarnased:
- on olemas RankBrainanaloog - MatrixNet
- nad kasutavad PageRanki (peaaegu sama nagu Google'is);
- paljud teksti algoritmid on samad.
- Yandexis on palju endiseid googlejaid.
- Yanex ehitati Google'i kloonina;
- SEO spetsialistid Venemaal kasutavad peaaegu sama valge mütsiga SEO taktikat Yandexi ja Google'i jaoks.
Loomulikult on palju erinevusi, kuid lähenemisviis ja enamik pingerea tegureid näivad olevat sarnased.
Praktikas: võrreldes Google'i ja Yandexi otsingutulemusi on nad ~70% vastavuses.
Statcounteri andmetel on Yandex turuosa poolest Yahoo ja Bingi lähedal:
Faili koos reitingufaktoritega: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Iga teguri struktuur:
- nimi
- link sisemisele wikile (piiratud)
- AntiSeoUpperBound (haha)
- kirjeldus (see on vene keeles, ma tõlkisin selle teile)
- jne
1. Esimene tegur nimekirjas - PageRank.
Peamised järeldused pärast selle nimekirja analüüsimist: Linkide vanus on pingerea tegur.
2. Liiklus ja orgaanilise liikluse % on edetabeli tegurid.
PPC ostmine mõjutab edetabelit.
3. Numbrid URL-ides on pingerea jaoks halvad
4. Liiga palju kaldkriipsu URL-ides on halvasti mõjunud edetabelisse paigutamisele
5. Kõva pessimatsioon võrdne PR=0
6. Vastuvõtja usaldusväärsus on pingerea tegur
Mida vähem 40x/50x vigu teil on, seda parem on teie orgaanilise liikluse jaoks.
7. Vikipeedia tõstmise jaoks on eraldi pingerea tegur.
8. Palju kasutajate käitumisega seotud pingerea tegureid - CTR, viimane klõps, veebilehel viibimise aeg, tagasilöögimäära.
Märkus: Oleme peaaegu kindlad, et Yandexis mõjutavad need tegurid palju rohkem kui Google'is.
9. Dokumendi vanus ja viimane uuendus on mõlemad pingerea tegurid.
10. Keskmine domeeni positsioon kõigi päringute lõikes on pingerea tegur.
11. Crawli sügavus on pingerea tegur
Hoidke oma tähtsad leheküljed põhilehele lähemal:
- ülemised leheküljed: 1 klõps pealehelt
- olulised leheküljed: <3 klõpsu
12. Lisaks: orbude lehekülgede järjestusfaktor
Selle leiate meie veebisaidi auditi tööriista abil
13. Tagasilinkid põhilehtedelt on olulisemad kui siselehtedelt.
14. Teie saidi/url otsingupäringute arv on pingerea tegur.
Mida rohkem, seda parem
15. Vikipeedia liiklus on edetabeli tegur
16. Kui teie url oleks viimane otsingusessiooni jaoks (kasutaja leiab selle, mida ta vajab) - see mõjutaks edetabelit.
Selleks on ranged tegurid ja ka prognoositavad tegurid.
17. Järjestusfaktor järjehoidjad
Mida rohkem kasutajaid lisab url-i järjehoidjatesse, seda suurem on selle faktoriväärtus.
18. Lühikeste videote (tiktok, lühivideod, rullid) erilised pingeread.
19. Kaardid js-api lehel (näiteks Google Maps) on edetabeli tegur.
Google'is (näiteks reisimise valdkonnas) töötab ka kasuliku info/funktsionaalsusega kaartide lisamine.
20. URL-i märksõnad on pingerea tegurid
Nagu näeme kirjeldusest - optimaalne sisaldaks kuni 3 sõna otsingupäringust.
21. Kasutajate tagasipöördumine on pingerea tegur
Ehitage hea säilivusega tooteid ja sellest oleks kasu teie SEO-le (selle mõõtmiseks on palju pingerea tegureid).
22. Suurtähtede osakaal <title>-s on pingerea tegur.
23. Otseliikluse protsentuaalne osakaal on edetabeli tegur.
Aka. Kui kogu teie liiklus tuli orgaanilisest otsingust - see on kahtlane + halb edetabelite jaoks.
24. Veel üks sisukvaliteedi pingerea tegur - katkine varjatud video lehel
- Embed videod - hea pingerea jaoks.
- Rikutud embed videod - halb.
25. Verifitseeritud kontod sotsiaalvõrgustikes reastatakse erinevalt kui muud urlid
Oluline brändi otsingute jaoks - ideaalis peaks teie brändi otsingul olema ainult teie domeenid + kontrollitud sotsiaalvõrgustikud top 10-s.
26. Kui teie tagasilinkide ankurdused sisaldavad kõiki märksõnu - see on hea SEO jaoks.
Kui see on ühes lingis - see on kasulikum. Eriti kui sõnade järjekord on sama.
27. Suhtarv "head" vs "halvad" tagasilinkid on pingerea teguriks
![Ratio "head" vs "halvad" tagasilinkid on pingerea tegur](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Ratio "head" vs "halvad" tagasilinkid on pingerea tegur")
28. Domeeni tekstide kvaliteedirida on pingerea teguriks.
Madala kvaliteediga leheküljed mõjutavad kogu domeeni.
29. Reklaami hulk lehel on pingerea tegur.
30. Eraldi pingerea tegurina on juhuslikkus.
Kui te ei saa aru, miks mõned leheküljed on üleval - see võib olla lihtsalt juhuslik (testida käitumistegureid).
31. Google Analyticsi JS on pingerea tegur
Ennustatavalt. Head veebisaidid kasutavad GA / Google Analytics 'i sagedamini kui halvad veebisaidid.
32. Tagasilinkid 100 parimatelt veebilehtedelt PageRanki järgi mõjutavad edetabelit
33. URL ei sisalda numbreid
❌ /100-parimat-krediitkaarti
✅ /best-credit-cards
34. Kaldkriipsude arv URL-is
❌ /finance/articles/2023/investment-advices
✅ /investeerimisnõuanded
35. Mittetähtede arv URL-is
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. '?' sümbol URL-is on pingerea tegur.
❌ /movies?genre=action
✅ /action-movies
37. Otsingupäring = URL, kaasa arvatud punktid ja tühikud (??)
Otsingupäring on "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Vana kuupäev URL-is
❌ /2009/12/01/how-to-tie-a-tie
✅ /how-to-tie-a-tie
39. Märksõnad on URL-is, mitte lehekülje tekstis.
❌ /video-mängud & lehekülg räägib muusikast
✅ /video-mängud & lehekülg räägib videomängudest
40. URL-i katvus koos otsingupäringu trigrammidega
✅ /hotels-new-zealand
❌ /nz
❌ /cheap-hotels-in-new-zealand-best-deals
- Sisestage URL-ile 1-3 kõige olulisemat sõna;
- Vähem kaldkriipsu/numbreid/mittekriipsu, kui see ei ole osa teie märksõnast.
41. Yandexi reitingufaktorite esialgsed kaalud
Lõplikud kaalud arvutab AI(matrixnet), kuid ka algväärtused on kasulikud.
Kokkuvõte
Noh, see on kõik, mida me praegu jagame. Me alles alustame. See annab teile ligikaudse ülevaate sellest, mis seal sees on.
Me alles kriimustame siin pinda ja ees ootab veel palju väärtuslikke teadmisi.
Kuid meil oli üsna õigus paljudes oletustes ja tõlgendustes väljastpoolt, kuidas selline ulatuslik otsingumootor töötaks, vähemalt mis puudutab linke.
Kokkuvõttes pakub Yandexi koodileke põnevat sissevaadet kaasaegse otsingumootori sisemusse.
Kõik-ühes platvorm tõhusaks SEO-ks
Iga eduka ettevõtte taga on tugev SEO-kampaania. Kuid kuna on olemas lugematu hulk optimeerimisvahendeid ja -tehnikaid, mille hulgast valida, võib olla raske teada, kust alustada. Noh, ärge kartke enam, sest mul on just see, mis aitab. Tutvustan Ranktracker'i kõik-ühes platvormi tõhusaks SEO-ks.
Oleme lõpuks avanud registreerimise Ranktracker täiesti tasuta!
Loo tasuta kontoVõi logi sisse oma volituste abil
Kuigi kõiki tulemusi ei saa otseselt kohaldada Google'ile, leiavad kinnitust paljud viimastel aastatel tehtud oletused suurte internetiotsingumootorite üldise toimimise kohta.
Eeldan, et SEO-tööstusel on selle lekke uute teadmistega veel paar huvitavat kuud ees.
Jälgige seda lehekülge, sest me jätkame järgnevate nädalate ja kuude jooksul pingerea tegurite lisamist.
Eriline krediit https://twitter.com/alex_buraks