Εισαγωγή
Πιθανότατα έχετε ακούσει για τη Yandex, είναι η 4η μεγαλύτερη μηχανή αναζήτησης με βάση το μερίδιο αγοράς παγκοσμίως. Χθες διέρρευσε ο ιδιόκτητος πηγαίος κώδικας του Yandex.
Το πιο ενδιαφέρον μέρος για την κοινότητα του SEO είναι: ο κατάλογος όλων των 1922 παραγόντων κατάταξης που χρησιμοποιούνται στον αλγόριθμο αναζήτησης.
Κατεβάσαμε τον κώδικα, τον αναλύσαμε και εδώ παρουσιάζεται με χρήσιμο τρόπο.
Το περιστατικό δεν θα πρέπει να αποτελεί έκπληξη, δεδομένου ότι η Yandex ή τα προϊόντα της δέχονται συχνά κυβερνοεπιθέσεις. Το 2016, το Hackread.com ανέφερε αποκλειστικά πώς ένας πωλητής του σκοτεινού ιστού πωλούσε 6,3 εκατομμύρια δεδομένα λογαριασμών χρηστών Yandex.
Τον Σεπτέμβριο του 2021, ο ρωσικός γίγαντας των μηχανών αναζήτησης δέχτηκε μία από τις μεγαλύτερες επιθέσεις DDoS που τροφοδοτήθηκε από 200.000 παραβιασμένες συσκευές IoT.
Η All-in-One πλατφόρμα για αποτελεσματικό SEO
Πίσω από κάθε επιτυχημένη επιχείρηση βρίσκεται μια ισχυρή εκστρατεία SEO. Αλλά με αμέτρητα εργαλεία και τεχνικές βελτιστοποίησης εκεί έξω για να διαλέξετε, μπορεί να είναι δύσκολο να ξέρετε από πού να ξεκινήσετε. Λοιπόν, μη φοβάστε άλλο, γιατί έχω ακριβώς αυτό που θα σας βοηθήσει. Παρουσιάζοντας την πλατφόρμα Ranktracker all-in-one για αποτελεσματικό SEO
Έχουμε επιτέλους ανοίξει την εγγραφή στο Ranktracker εντελώς δωρεάν!
Δημιουργήστε έναν δωρεάν λογαριασμόΉ Συνδεθείτε χρησιμοποιώντας τα διαπιστευτήριά σας
Γιατί είναι τόσο μεγάλο;
Η Yandex είναι μία από τις μεγαλύτερες εταιρείες πληροφορικής στη Ρωσία. Εντός της χώρας παρέχει ένα ευρύτερο φάσμα υπηρεσιών από τη Google. Φανταστείτε μια εταιρεία που αντικαθιστά τις Google, Uber, Amazon, Netflix και Spotify.
Είναι πραγματική αυτή η διαρροή;
Προσωπικά δεν εργάστηκα ποτέ στη Yandex, αλλά γνωρίζω αρκετούς ανθρώπους που εργάστηκαν εκεί σε διάφορες εποχές ή εργάζονται ακόμη εκεί. Έχω επαληθεύσει ότι τουλάχιστον ορισμένα από τα αρχεία περιέχουν σίγουρα σύγχρονο πηγαίο κώδικα για τις υπηρεσίες της εταιρείας, καθώς και τεκμηρίωση που παραπέμπει σε πραγματικές διευθύνσεις URL στο εσωτερικό δίκτυο.
Τι υπάρχει μέσα
Ο διαρρέοντας μοιράστηκε έναν σύνδεσμο μαγνήτη που περιέχει 44,7 GB αρχείων που συνδέονται με τις πηγές του Yandex git. Τα αρχεία φέρεται να εκλάπησαν από την Yandex τον Ιούλιο του 2022. Εκτός από το ότι περιέχουν οδηγίες κατά του spam, τα αποθετήρια κώδικα πιστεύεται ότι έχουν τον πηγαίο κώδικα της Yandex.
Η διαρροή αποκάλυψε περίπου 1.922 παράγοντες κατάταξης που χρησιμοποιε ί η μηχανή αναζήτησης στον αλγόριθμο αναζήτησης. Ο κώδικας διέρρευσε ως torrent. Σύμφωνα με την ανάλυση που δημοσίευσε ο χρήστης του Twitter Alex Buraks, τα δεδομένα που διέρρευσαν περιλαμβάνουν πολυάριθμους παράγοντες κατάταξης, όπως συνάφεια κειμένου, PageRank, ηλικία περιεχομένου, φρεσκάδα κ.λπ.
Πιθανότατα έχετε ακούσει για τη Yandex, είναι η 4η μεγαλύτερη μηχανή αναζήτησης με βάση το μερίδιο αγοράς παγκοσμίως. Χθες διέρρευσε ο ιδιόκτητος πηγαίος κώδικας του Yandex.
- Alex Buraks (@alex_buraks) January 27, 2023
Το πιο ενδιαφέρον μέρος για την κοινότητα SEO είναι: η λίστα με όλους τους 1922 παράγοντες κατάταξης που χρησιμοποιούνται στον αλγόριθμο αναζήτησης.
[🧵THREAD] pic.twitter.com/6x82AAmbON
Επιπλέον, υπάρχουν διάφοροι παράγοντες συμπεριφοράς του τελικού χρήστη, παράγοντες που σχετίζονται με τη σύνδεση και την αξιοπιστία του κεντρικού υπολογιστή. Οι SEOs βρίσκουν ορισμένους ασυνήθιστους παράγοντες κατάταξης, όπως ο αριθμός των μοναδ ικών επισκεπτών, η μέση κατάταξη του τομέα σε όλες τις αναζητήσεις και το ποσοστό της οργανικής επισκεψιμότητας.
Φαίνεται ότι τουλάχιστον ο πηγαίος κώδικας για όλες τις σημαντικές υπηρεσίες της Yandex έχει διαρρεύσει:
- Μηχανή αναζήτησης και Indexing Bot
- Χάρτες - Όπως οι Χάρτες Google και το Street View
- Alice - Βοηθός AI όπως η Siri / Alexa
- Ταξί - Υπηρεσία ταξί τύπου Uber
- Άμεση - Υπηρεσία διαφημίσεων όπως το Google Ads / Adwords
- Mail - Υπηρεσία αλληλογραφίας όπως το GMail
- Δίσκος - Υπηρεσία αποθήκευσης αρχείων όπως το Google drive
- Αγορά - Αγορά όπως το Amazon
- Ταξίδια - Όπως η Booking.com καθώς και εισιτήρια για αεροπλάνο, τρένο και λεωφορείο
- Yandex360 - Όπως το Google Workspaces για υπηρεσίες στον δικό σας τομέα
- Cloud - Πιθανώς δεν διέρρευσε όλος ο κώδικας υποδομής.
- Pay - Επεξεργασία πληρωμών όπως το Stripe, αλλά με περιορισμένες δυνατότητες
- Metrika - Όπως το Google Analytics
- Και τουλάχιστον το backend μέρος της πλειοψηφίας των άλλων υπηρεσιών της εταιρείας είναι εκεί. Το μεγαλύτερο αρχείο που ονομάζεται "frontend" δεν έχει ακόμη εξερευνηθεί.
Ο Shestakov σημείωσε επίσης κάποια κλειδιά API, τα οποία πιθανότατα χρησιμοποιήθηκαν γι α τη δοκιμή της ανάπτυξης.
Λεπτομέρειες σχετικά με αυτή τη διαρροή: μπορείτε να βρείτε εδώ:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Η Yandex αρνείται την απόπειρα πειρατείας
Η Yandex ισχυρίζεται ότι γνωρίζει για τη διαρροή και έχει ήδη ξεκινήσει έρευνα για να ελέγξει πώς εκτέθηκαν στο κοινό "κομμάτια" του πηγαίου κώδικα. Αξίζει να σημειωθεί ότι η διαρροή δεν περιλαμβάνει προσωπικά δεδομένα χρηστών ή εργαζομένων.
Ωστόσο, λαμβάνοντας υπόψη τη σημασία της Yandex στην υποδομή πληροφορικής της Ρωσίας και τα δεδομένα που διέρρευσαν, θα μπορούσε να υποτεθεί ότι η επίθεση είχε ως κίνητρο την εισβολή της χώρας στην Ουκρανία. Έτσι, θα μπορούσαν να εμπλέκονται χάκερ που τάσσονται υπέρ της Ουκρανίας.
Η All-in-One πλατφόρμα για αποτελεσματικό SEO
Πίσω από κάθε επιτυχημένη επιχείρηση βρίσκεται μια ισχυρή εκστρατεία SEO. Αλλά με αμέτρητα εργαλεία και τεχνικές βελτιστοποίησης εκεί έξω για να διαλέξετε, μπορεί να είναι δύσκολο να ξέρετε από πού να ξεκινήσετε. Λοιπόν, μη φοβάστε άλλο, γιατί έχω ακριβώς αυτό που θα σας βοηθήσει. Παρουσιάζοντας την πλατφόρμα Ranktracker all-in-one για αποτελεσματικό SEO
Έχουμε επιτέλους ανοίξει την εγγραφή στο Ranktracker εντελώς δωρεάν!
Δημιουργήστε έναν δωρεάν λογαριασμόΉ Συνδεθείτε χρησιμοποιώντας τα διαπιστευτήριά σας
Στην επίσημη ανακοίνωσή της, η Yandex διευκρίνισε ότι η εταιρεία δεν υπέστη hacking και ότι ένας πρώην υπάλληλος θα μπορούσε να εμπλέκεται στη διαρροή του πηγαίου της κώδικα στο δημόσιο τομέα. Η κορυφαία εταιρεία πληροφορικής της Ρωσίας σημείωσε ότι το αρχείο που διέρρευσε περιλαμβάνει τμήματα κώδικα που αποτελούν μέρος ενός εσωτερικού αποθετηρίου, τα δεδομένα του οποίου είναι διαφορετικά από αυτά που χρησιμοποιούνται στην τελευταία έκδοση του αποθετηρίου.
"Η Yandex δεν παραβιάστηκε. Η υπηρεσία ασφαλείας μας βρήκε τμήματα κώδικα από ένα εσωτερικό αποθετήριο στο δημόσιο τομέα, αλλά το περιεχόμενο διαφέρει από την τρέχουσα έκδοση του αποθετηρίου που χρησιμοποιείται στις υπηρεσίες της Yandex", αναφέρεται στην ανακοίνωση της εταιρείας.
Παρ' όλα αυτά, οι διαρροές πηγαίου κώδικα είναι επικίνδυνες, καθώς θέτουν σοβαρά ζητήματα ασφάλειας στους οργανισμούς, καθώς οι απειλητικοί παράγοντες μπορούν να παρατηρήσουν την πνευματική ιδιοκτησία και τα δεδομένα του συστήματος της εταιρείας. Η διαρροή πηγαίου κώδικα θα βοηθούσε τους επιτιθέμενους να δημιουργήσουν στοχευμένα exploits ασφαλείας.
Θεωρητικά, ποια είναι η διαφορά μεταξύ των αλγορίθμων που χρησιμοποιούνται στη Google και στο Yandex;
Μοιάζουν αρκετά:
- υπάρχει ανάλογο του RankBrain- MatrixNet
- χρησιμοποιούν το PageRank (σχεδόν το ίδιο με το Google),
- πολλοί αλγόριθμοι κειμένου είναι ίδιοι.
- Υπάρχουν πολλοί πρώην γκουγκλέρ στη Yandex
- Το Yanex κατασκευάστηκε ως κλώνος της Google,
- Οι ειδικοί SEO στη Ρωσία χρησιμοποιούν σχεδόν τις ίδιες τακτικές white hat SEO για το Yandex και για το Google.
Φυσικά υπάρχουν πολλές διαφορές, αλλά η προσέγγιση και η πλειοψηφία των παραγόντων κατάταξης φαίνεται να είναι παρόμοιες.
Στην πράξη: συγκρίνοντας τα αποτελέσματα αναζήτησης της Google με τα αποτελέσματα αναζήτησης της Yandex, η αντιστοιχία τους είναι ~70%.
Σύμφωνα με το Statcounter το Yandex είναι κοντά στο Yahoo και το Bing σε μερίδιο αγοράς:
Το αρχείο με τους παράγοντες κατάταξης: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Δομή για κάθε παράγοντα:
- όνομα
- σύνδεσμος σε εσωτερικό wiki (περιορισμένο)
- AntiSeoUpperBound (χαχα)
- περιγραφή (είναι στα ρωσικά, το μετέφρασα για εσάς)
- κ.λπ.
1. Πρώτος παράγοντας στη λίστα - PageRank.
Κύριες ιδέες μετά την ανάλυση αυτού του καταλόγου: Η ηλικία των συνδέσμων είναι παράγοντας κατάταξης.
2. Η επισκεψιμότητα και το % της οργανικής επισκεψιμότητας είναι παράγοντες κατάταξης.
Η αγορά PPC επηρεάζει την κατάταξη.
3. Οι αριθμοί στις διευθύνσεις URL είναι κακοί για την κατάταξη
4. Πάρα πολλές κάθετες γραμμές στις διευθύνσεις URL είναι κακές για την κατάταξη
5. Σκληρή προσομοίωση ίση με PR=0
6. Η αξιοπιστία του κεντρικού υπολογιστή είναι παράγοντας κατάταξης
Όσο λιγότερα σφάλματα 40x/50x έχετε, τόσο το καλύτερο για την οργανική σας κυκλοφορία
7. Υπάρχει ξεχωριστός παράγοντας κατάταξης για την ανύψωση της Wikipedia
8. Πολλοί παράγοντες κατάταξης που συνδέονται με τη συμπεριφορά των χρηστών - CTR, τελευταίο κλικ, χρόνος παραμονής στον ιστότοπο, ποσοστό αναπήδησης.
Σημείωση: Είμαστε σχεδόν βέβαιοι ότι στο Yandex αυτοί οι παράγοντες επηρεάζουν πολύ περισσότερο από ό,τι στο Google.
9. Η ηλικία του εγγράφου και η τελευταία ενημέρωση είναι παράγοντες κατάταξης
10. Η μέση θέση του τομέα σε όλα τα ερωτήματα είναι παράγοντας κατάταξης
11. Το βάθος ανίχνευσης είναι παράγοντας κατάταξης
Κρατήστε τις σημαντικές σας σελίδες πιο κοντά στην κεντρική σελίδα:
- κορυφαίες σελίδες: 1 κλικ από την κεντρική σελίδα
- σημαντικές σελίδες: <3 κλικ
12. Επιπλέον: παράγοντας κατάταξης για ορφανές σελίδες
Μπορείτε να το βρείτε μέσω του εργαλείου ελέγχου του ιστότοπού μας
13. Οι backlinks από τις κύριες σελίδες είναι πιο σημαντικοί από ό,τι από τις εσωτερικές σελίδες
14. Ο αριθμός των ερωτημάτων αναζήτησης του ιστότοπου/url σας είναι παράγοντας κατάταξης
Όσο περισσότερα τόσο το καλύτερο
15. Η επισκεψιμότητα από τη Wikipedia είναι παράγοντας κατάταξης
16. Εάν το url σας θα είναι το τελευταίο για τη συνεδρία αναζήτησης (ο χρήστης θα βρει αυτό που χρειάζεται) - θα επηρεάσει την κατάταξη
Υπάρχουν αυστηροί παράγοντες γι' αυτό, αλλά και προβλέψιμοι παράγοντες.
17. Παράγοντας κατάταξης σελιδοδεικτών
Όσο περισσότεροι χρήστες προσθέτουν στους σελιδοδείκτες ένα url, τόσο μεγαλύτερη αξία έχει ο παράγοντας
18. Ειδικοί παράγοντες κατάταξης για βίντεο μικρού μήκους (tiktok, shorts, reels)
19. Maps js-api στη σελίδα (για παράδειγμα Google Maps) είναι παράγοντας κατάταξης
Στο Google (για παράδειγμα στην ταξιδιωτική θέση) η προσθήκη χαρτών με χρήσιμες πληροφορίες/λειτουργικότητα λειτουργεί επίσης.
20. Οι λέξεις-κλειδιά στη διεύθυνση URL είναι παράγοντες κατάταξης
Όπως μπορούμε να δούμε από την περιγραφή - το βέλτιστο θα περιλαμβάνει έως και 3 λέξεις από το ερώτημα αναζήτησης.
21. Οι χρήστες που επιστρέφουν είναι παράγοντας κατάταξης
Κατασκευάστε προϊόντα με καλή διατήρηση και αυτό θα ωφελήσει το SEO σας (υπάρχουν πολλοί παράγοντες κατάταξης για τη μέτρησή του).
22. Το ποσοστό των ΚΕΦΑΛΑΙΩΝ ΓΡΑΜΜΑΤΩΝ στο <title> είναι παράγοντας κατάταξης
23. Το ποσοστό της άμεσης κυκλοφορίας είναι παράγοντας κατάταξης
Aka. Αν όλη η επισκεψιμότητά σας προέρχεται από Οργανική Αναζήτηση - είναι ύποπτο + κακό για την κατάταξη.
24. Ένας ακόμη παράγοντας κατάταξης για την ποιότητα του περιεχομένου - σπασμένο ενσωματωμένο βίντεο στη σελίδα
- Ενσωματώστε βίντεο - καλό για την κατάταξη.
- Σπασμένα βίντεο ενσωμάτωσης - κακό.
25. Οι επαληθευμένοι λογαριασμοί σε κοινωνικά δίκτυα κατατάσσονται διαφορετικά από άλλα urls
Σημαντικό για τις αναζητήσεις μάρκας - ιδανικά, αναζητώντας τη μάρκα σας, θα πρέπει να υπάρχουν μόνο οι τομείς σας + τα επαληθευμένα κοινωνικά δίκτυα στην κορυφή 10.
26. Αν οι άγκυρες των backlinks σας περιέχουν όλες τις λέξεις-κλειδιά - είναι καλό για το SEO
Αν είναι σε έναν σύνδεσμο - είναι πιο ωφέλιμο. Ειδικά αν η σειρά των λέξεων είναι η ίδια.
27. Η αναλογία "καλών" vs "κακών" backlinks είναι παράγοντας κατάταξης
![Η αναλογία "καλών" vs "κακών" backlinks είναι παράγοντας κατάταξης](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Η αναλογία "καλών" vs "κακών" backlinks είναι παράγοντας κατάταξης")
28. Η ποιοτική κατάταξη των κειμένων στον τομέα αποτελεί παράγοντα κατάταξης
Οι σελίδες με περιεχόμενο χαμηλής ποιότητας επηρεάζουν ολόκληρο τον τομέα.
29. Το ποσό των διαφημίσεων σε μια σελίδα είναι παράγοντας κατάταξης
30. Υπάρχει τυχαιότητα ως ξεχωριστός παράγοντας κατάταξης
Όταν δεν καταλαβαίνετε γιατί κάποιες από τις σελίδες βρίσκονται στην κορυφή - μπορεί να είναι απλώς τυχαίο (για να ελέγξετε παράγοντες συμπεριφοράς).
31. Το JS από το Google Analytics είναι παράγοντας κατάταξης
Προβλέψιμα. Οι καλοί ιστότοποι χρησιμοποιούν το GA / Google analytics συχνότερα από τους κακούς ιστότοπους.
32. Backlinks από τους 100 καλύτερους ιστότοπους με βάση το PageRank επηρεάζουν την κατάταξη
33. Η διεύθυνση URL δεν έχει ψηφία
❌ /100-καλύτερες-πιστωτικές-κάρτες
✅ /best-credit-cards
34. Αριθμός κάθετων γραμμών στη διεύθυνση URL
❌ /finance/articles/2023/investment-advices
✅ /επενδυτικές συμβουλές
35. Αριθμός μη γραμμάτων στη διεύθυνση URL
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. Το σύμβολο '?' στη διεύθυνση URL είναι παράγοντας κατάταξης
❌ /movies?genre=action
✅ / action-movies
37. Ερώτημα αναζήτησης = URL, συμπεριλαμβανομένων των τελειών και των κενών (??)
Το ερώτημα αναζήτησης είναι "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Παλιά ημερομηνία στη διεύθυνση URL
❌ /2009/12/01/how-to-tie-a-tie
✅ /how-to-tie-a-tie
39. Οι λέξεις-κλειδιά είναι στη διεύθυνση URL, όχι στο κείμενο της σελίδας
❌ /video-games & η σελίδα αφορά τη μουσική
✅ /video-games & η σελίδα αφορά τα βιντεοπαιχνίδια
40. Κάλυψη URL με τριγράμματα από το ερώτημα αναζήτησης
✅ /hotels-new-zealand
❌ /nz
❌ /cheap-hotels-in-new-zealand-best-deals
- Συμπεριλάβετε 1-3 πιο σημαντικές λέξεις στη διεύθυνση URL,
- Λιγότερες πλάγιες γραμμές/ψηφία/μη γράμματα, εάν δεν αποτελούν μέρος της λέξης-κλειδί σας
41. Αρχικά βάρη των παραγόντων κατάταξης Yandex
Τα τελικά βάρη υ πολογίζονται από το AI(matrixnet), αλλά οι αρχικές τιμές είναι επίσης χρήσιμες.
Συμπέρασμα
Λοιπόν, αυτά έχουμε, αυτά είναι όλα όσα μοιραζόμαστε προς το παρόν. Μόλις αρχίσαμε. Αυτό σας παρέχει μια γενική εικόνα για το τι υπάρχει εκεί μέσα.
Μόλις τώρα ξύνουμε την επιφάνεια εδώ, με πολλές ακόμα πολύτιμες πληροφορίες μπροστά μας.
Αλλά είχαμε δίκιο σε πολλές υποθέσεις και ερμηνείες από το εξωτερικό για το πώς θα λειτουργούσε μια τόσο εκτεταμένη μηχανή αναζήτησης, τουλάχιστον όσον αφορά τους συνδέσμους.
Συνολικά, η διαρροή κώδικα της Yandex προσφέρει μια συναρπαστική εικόνα των εσωτερικών λειτουργιών μιας σύγχρονης μηχανής αναζήτησης.
Η All-in-One πλατφόρμα για αποτελεσματικό SEO
Πίσω από κάθε επιτυχημένη επιχείρηση βρίσκεται μια ισχυρή εκστρατεία SEO. Αλλά με αμέτρητα εργαλεία και τεχνικές βελτιστοποίησης εκεί έξω για να διαλέξετε, μπορεί να είναι δύσκολο να ξέρετε από πού να ξεκινήσετε. Λοιπόν, μη φοβάστε άλλο, γιατί έχω ακριβώς αυτό που θα σας βοηθήσει. Παρουσιάζοντας την πλατφόρμα Ranktracker all-in-one για αποτελεσματικό SEO
Έχουμε επιτέλους ανοίξει την εγγραφή στο Ranktracker εντελώς δωρεάν!
Δημιουργήστε έναν δωρεάν λογαριασμόΉ Συνδεθείτε χρησιμοποιώντας τα διαπιστευτήριά σας
Αν και δεν μπορούν να εφαρμοστούν άμεσα όλα τα ευρήματα στην Google, επιβεβαιώνονται πολλές υποθέσεις που έχουν γίνει τα τελευταία χρόνια σχετικά με τη γενική λειτουργία των μεγάλων μηχανών αναζήτησης στο Διαδίκτυο.
Υποθέτω ότι ο κλάδος του SEO έχει ακόμα μερικούς ενδιαφέροντες μήνες μπροστά του με νέες πληροφορίες από αυτή τη διαρροή.
Παρακολουθήστε αυτή τη σελίδα καθώς θα συνεχίσουμε να προσθέτουμε παράγοντες κατάταξης τις επόμενες εβδομάδες και μήνες.
Ειδικές πιστώσεις στο https://twitter.com/alex_buraks