Introduksjon
Du har sikkert hørt om Yandex, det er den fjerde største søkemotoren etter markedsandel på verdensbasis. I går ble proprietær kildekode til Yandex lekket.
Den mest interessante delen for SEO-fellesskapet er: listen over alle 1922 rangeringsfaktorer som brukes i søkealgoritmen
Vi har lastet ned koden, analysert den og her presenteres den på en nyttig måte.
Hendelsen bør ikke komme som en overraskelse, siden Yandex eller dets produkter ofte er under cyberangrep. I 2016 rapporterte Hackread.com eksklusivt om hvordan en leverandør på det mørke nettet solgte 6,3 millioner Yandex-brukerkontodata.
I september 2021 ble den russiske søkemotorgiganten rammet av et av de største DDoS-angrepene drevet av 200 000 kompromitterte IoT-enheter.
Alt-i-ett-plattformen for effektiv søkemotoroptimalisering
Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.
Vi har endelig åpnet registreringen til Ranktracker helt gratis!
Opprett en gratis kontoEller logg inn med påloggingsinformasjonen din
Hvorfor er dette stort?
Yandex er et av de største IT-selskapene i Russland. I landet tilbyr det et bredere spekter av tjenester enn Google. Tenk deg ett selskap som erstatter Google, Uber, Amazon, Netflix og Spotify.
Er denne lekkasjen ekte?
Personlig har jeg aldri jobbet i Yandex, men jeg kjenner flere personer som har jobbet der på forskjellige tidspunkter eller fortsatt jobber der. Jeg bekreftet at i det minste noen av arkivene helt sikkert inneholder moderne kildekode for selskapets tjenester samt dokumentasjon som peker til ekte intranett-URL-er.
Hva er inni?
Lekkasjen har delt en magnetlenke som inneholder 44,7 GB med filer knyttet til Yandex git-kilder. Filene skal ha blitt stjålet fra Yandex i juli 2022. Bortsett fra å inneholde anti-spam-retningslinjer, antas kodelagrene å inneholde Yandex' kildekode.
Lekkasjen avslørte rundt 1 922 rangeringsfaktorer som søkemotoren bruker i sin søkealgoritme. Koden ble lekket som en torrent. Ifølge analysen som ble lagt ut av Twitter-brukeren Alex Buraks, inkluderer de lekkede dataene en rekke rangeringsfaktorer, inkludert tekstrelevans, PageRank, innholdets alder, ferskhet osv.
Du har sikkert hørt om Yandex, det er den fjerde største søkemotoren etter markedsandel på verdensbasis. I går ble den proprietære kildekoden til Yandex lekket.
- Alex Buraks (@alex_buraks) 27. januar 2023
Den mest interessante delen for SEO-fellesskapet er: listen over alle 1922 rangeringsfaktorer som brukes i søkealgoritmen
[🧵THREAD] pic.twitter.com/6x82AAmbON
I tillegg finnes det flere sluttbrukeratferdsfaktorer, lenkerelaterte faktorer og vertspålitelighet. SEO-er finner noen uvanlige rangeringsfaktorer, for eksempel antall unike besøkende, gjennomsnittlig domenerangering på tvers av søk og prosent av organisk trafikk.
Det ser ut til at i det minste kildekoden for alle de viktigste tjenestene til Yandex har blitt lekket:
- Søkemotor og indekseringsrobot
- Kart - som Google Maps og Street View
- Alice - AI-assistent som Siri / Alexa
- Taxi - Uber-lignende drosjetjeneste
- Direkte - annonsetjeneste som Google Ads / Adwords
- Mail - E-posttjeneste som GMail
- Disk - fillagringstjeneste som Google-stasjon
- Marked - Markedsplass som Amazon
- Reise - Som en Booking.com pluss fly-, tog- og bussbilletter
- Yandex360 - Som Google Workspaces for tjenester på ditt eget domene
- Cloud - Sannsynligvis ble ikke all infrastrukturkode lekket.
- Betal - Betalingsbehandling som Stripe, men med et begrenset sett med funksjoner.
- Metrika - Som Google Analytics
- Og i det minste er backend-delen av de fleste andre selskapstjenester der. Det største arkivet kalt "frontend" er ennå ikke utforsket.
Shestakov bemerket videre noen API-nøkler, som mest sannsynlig har blitt brukt til å teste distribusjon.
Detaljer om denne lekkasjen finner du her:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex benekter forsøk på hacking
Yandex hevder at de er klar over lekkasjen og allerede har satt i gang en etterforskning for å sjekke hvordan "fragmenter" av kildekoden ble eksponert for offentligheten. Det er verdt å merke seg at lekkasjen ikke omfatter personopplysninger om brukere eller ansatte.
Tatt i betraktning Yandex' betydning i Russlands IT-infrastruktur og lekkede data, kan det imidlertid antas at angrepet var motivert av landets invasjon av Ukraina. Så pro-ukrainske hackere kan være involvert.
Alt-i-ett-plattformen for effektiv søkemotoroptimalisering
Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.
Vi har endelig åpnet registreringen til Ranktracker helt gratis!
Opprett en gratis kontoEller logg inn med påloggingsinformasjonen din
I sin offisielle uttalelse presiserte Yandex at selskapet ikke ble hacket, og at en tidligere ansatt kunne være involvert i å lekke kildekoden i det offentlige området. Russlands ledende IT-firma bemerket at det lekkede arkivet inneholder kodefragmenter som er en del av et internt arkiv, hvis data er forskjellig fra det som brukes i den nyeste versjonen av arkivet.
"Yandex ble ikke hacket. Vår sikkerhetstjeneste fant kodefragmenter fra et internt depot i det offentlige domenet, men innholdet skiller seg fra den nåværende versjonen av depotet som brukes i Yandex-tjenester", heter det i selskapets uttalelse.
Ikke desto mindre er lekkasjer av kildekode farlige fordi de kan utgjøre alvorlige sikkerhetsproblemer for organisasjoner, siden trusselaktører kan observere virksomhetens immaterielle rettigheter og systemdata. Lekkasje av kildekode vil hjelpe angripere med å lage målrettede sikkerhetsutnyttelser.
Teoretisk sett, hva er forskjellen mellom algoritmer som brukes i Google og i Yandex?
De er ganske like:
- det finnes en RankBrain-analog- MatrixNet
- de bruker PageRank (nesten det samme som i Google);
- mange tekstalgoritmer er de samme.
- Det er mange eks-googlere i Yandex
- Yanex ble bygget som en Google-klone;
- SEO-spesialister i Russland bruker nesten samme hvite hatt SEO-taktikk for Yandex og for Google
Selvfølgelig er det mange forskjeller, men tilnærmingen og de fleste rangeringsfaktorene ser ut til å være like.
I praksis: Hvis man sammenligner søkeresultatene fra Google og Yandex, er det ca. 70 % samsvar.
Ifølge Statcounter ligger Yandex nær Yahoo og Bing etter markedsandel:
Filen med rangeringsfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Struktur for hver faktor:
- navn
- lenke til intern wiki (begrenset)
- AntiSeoUpperBound (haha)
- beskrivelse (det er på russisk, jeg oversatte det for deg)
- osv.
1. Første faktor i listen - PageRank.
De viktigste innsiktene etter å ha analysert denne listen: Koblingenes alder er en rangeringsfaktor.
2. Trafikk og % av organisk trafikk er rangeringsfaktorer.
Kjøp av PPC påvirker rangeringen.
3. Tall i nettadresser er dårlig for rangeringen
4. For mange skråstreker i nettadresser er ikke bra for rangeringen.
5. Hard pessimisering lik PR=0
6. Vertspålitelighet er en rangeringsfaktor
Jo færre 40x/50x feil du har, jo bedre er det for den organiske trafikken din.
7. Det er en egen rangeringsfaktor for å løfte Wikipedia.
8. Mange rangeringsfaktorer knyttet til brukeratferd - CTR, siste klikk, tid på nettstedet, fluktfrekvens.
Merk: Vi er nesten sikre på at i Yandex påvirker disse faktorene mye mer enn i Google.
9. Dokumentets alder og siste oppdatering er begge rangeringsfaktorer.
10. Gjennomsnittlig domeneposisjon på tvers av alle søk er en rangeringsfaktor.
11. Krypedybde er en rangeringsfaktor
Hold viktige sider nærmere hovedsiden:
- toppsider: 1 klikk fra hovedsiden
- viktige sider: <3 klikk
12. I tillegg: rangeringsfaktor for foreldreløse sider
Du finner dette via revisjonsverktøyet på nettstedet vårt
13. Tilbakekoblinger fra hovedsider er viktigere enn fra interne sider.
14. Antall søk på nettstedet/url-en din er en rangeringsfaktor.
Jo flere, jo bedre
15. Trafikk fra Wikipedia er en rangeringsfaktor
16. Hvis nettadressen din er den siste for søkeøkten (brukeren vil finne det han trenger) - vil det påvirke rangeringen.
Det finnes strenge faktorer for dette og også forutsigbare faktorer.
17. Bokmerker rangeringsfaktor
Jo flere brukere som legger til en nettadresse i bokmerker, jo større faktorverdi har den.
18. Spesielle rangeringsfaktorer for korte videoer (tiktok, shorts, reels)
19. Maps js-api på siden (for eksempel Google Maps) er en rangeringsfaktor.
I Google (for eksempel i reisenisjen) fungerer det også å legge til kart med nyttig informasjon/funksjonalitet.
20. Nøkkelord i URL er rangeringsfaktorer
Som vi kan se fra beskrivelsen - det optimale ville inkludere opptil 3 ord fra søket.
21. Tilbakevendende brukere er en rangeringsfaktor
Bygg produkter med god oppbevaring, og det vil være til fordel for SEO (det er mange rangeringsfaktorer for å måle det).
22. Prosentandel av STORE BOKSTAVER i <tittel> er en rangeringsfaktor.
23. Prosentandel av direkte trafikk er en rangeringsfaktor
Aka. Hvis all trafikken din kom fra organisk søk - det er mistenkelig + dårlig for rangeringen.
24. Ytterligere en rangeringsfaktor for innholdskvalitet - ødelagt innebygd video på siden
- Legg inn videoer - bra for rangeringer.
- Ødelagte innebygde videoer - dårlig.
25. Verifiserte kontoer på sosiale nettverk rangeres annerledes enn andre nettadresser.
Viktig for merkevaresøk - ideelt sett bør det bare være dine domener + verifiserte sosiale nettverk blant de 10 beste.
26. Hvis tilbakekoblingsankrene dine inneholder alle ordene fra søkeordene - er det bra for SEO
Hvis det er i en lenke - det er mer fordelaktig. Spesielt hvis rekkefølgen på ordene er den samme.
27. Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor
Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor](/images/i84.png "Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor")
28. Kvalitetsrangeringen av tekster på domenet er en rangeringsfaktor.
Sider med innhold av lav kvalitet påvirker hele domenet.
29. Mengden annonser på en side er en rangeringsfaktor
30. Det er tilfeldighet som en egen rangeringsfaktor.
Når du ikke forstår hvorfor noen av sidene ligger øverst - det kan være tilfeldig (for å teste atferdsfaktorer).
31. JS fra Google Analytics er en rangeringsfaktor
Forutsigbart. Gode nettsteder bruker GA / Google analytics oftere enn dårlige nettsteder.
32. Tilbakekoblinger fra de 100 beste nettstedene etter PageRank påvirker rangeringene
33. URL har ingen sifre
❌ /100-beste-kredittkort
✅ /best-kredittkort
34. Antall skråstreker i URL
❌ /finance/articles/2023/investment-advices (
på engelsk)
✅ /investeringsrådgivning
35. Antall ikke-bokstaver i URL
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. '?'-symbolet i nettadressen er en rangeringsfaktor.
❌ /movies?genre=action
✅ /action-filmer
37. Søkeord = URL, inkludert punkter og mellomrom (??).
Søkeordet er "Franklin D. Roosevelt":
❌ /roosevelt
✅ ✅ /Franklin_D._Roosevelt
38. Gammel dato i nettadressen
❌ /2009/12/01/hvordan-binde-et-slips
✅ /how-to-tie-a-tie
39. Nøkkelord er i URL, ikke i teksten på siden.
❌ /videospill og siden handler om musikk
✅ /videospill & siden handler om videospill
40. URL-dekning med trigrammer fra søkesøket
✅ /hotels-new-zealand
❌ /nz
❌ / cheap-hotels-in-new-zealand-best-deals
- Ta med de 1-3 viktigste ordene i nettadressen;
- Færre skråstreker/siffer/ikke-bokstaver, hvis det ikke er en del av søkeordet.
41. innledende vekter for Yandex-rangering av faktorer
Sluttvekter beregnet av AI(matrixnet), men startverdier er også nyttige.
Konklusjon
Der har vi det, dette er alt vi deler foreløpig. Vi har så vidt begynt. Dette gir deg en grov oversikt over hva som er der inne.
Vi har bare skrapt i overflaten her, og det ligger mye mer verdifull innsikt foran oss.
Men vi hadde helt rett i mange antagelser og tolkninger fra utsiden av hvordan en så omfattende søkemotor ville fungere, i det minste når det gjelder lenker.
Alt i alt gir Yandex-kodelekkasjen et fascinerende innblikk i hvordan en moderne søkemotor fungerer.
Alt-i-ett-plattformen for effektiv søkemotoroptimalisering
Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.
Vi har endelig åpnet registreringen til Ranktracker helt gratis!
Opprett en gratis kontoEller logg inn med påloggingsinformasjonen din
Selv om ikke alle funnene kan overføres direkte til Google, bekreftes mange antakelser som er gjort de siste årene om hvordan store søkemotorer på Internett generelt fungerer.
Jeg antar at SEO-bransjen fortsatt har noen interessante måneder foran seg med ny innsikt fra denne lekkasjen.
Følg med på denne siden ettersom vi vil fortsette å legge til rangeringsfaktorer i løpet av de kommende ukene og månedene.
Spesielle kreditter til https://twitter.com/alex_buraks