Εισαγωγή
Κατά την πρόσφατη περίοδο των διακοπών, εμφανίστηκαν αναρτήσεις στα μέσα κοινωνικής δικτύωσης σχετικά με μια υποτιθέμενη διαρροή δεδομένων που σχετίζονται με τους αλγόριθμους κατάταξης της Google. Οι αρχικές συζητήσεις γύρω από αυτές τις διαρροές επικεντρώθηκαν στην "επιβεβαίωση" των μακροχρόνιων πεποιθήσεων από προσωπικότητες όπως ο Rand Fishkin, αλλά δεν υπήρχε πλαίσιο σχετικά με την πραγματική φύση των δεδομένων.
Το πλαίσιο έχει σημασία: Document AI Warehouse
Τα δεδομένα που διέρρευσαν φαίνεται να σχετίζονται με το Document AI Warehouse της Google, μια δημόσια πλατφόρμα Google Cloud που χρησιμοποιείται για την ανάλυση, οργάνωση, αναζήτηση και αποθήκευση δεδομένων. Αυτή η δημόσια τεκμηρίωση φέρει τον τίτλο "Document AI Warehouse overview". Δημοσιεύσεις σε πλατφόρμες όπως το Facebook υποδηλώνουν ότι τα δεδομένα που διέρρευσαν είναι μια "εσωτερική έκδοση" αυτής της δημόσια διαθέσιμης τεκμηρίωσης, υποδεικνύοντας ότι μπορεί να μην είναι αποκλειστικά για τις λειτουργίες της Google Search.
Διαρροή δεδομένων εσωτερικής αναζήτησης;
Η αρχική δημοσίευση στο SparkToro δεν ισχυριζόταν ότι τα δεδομένα προέρχονταν από το Google Search, αλλά ανέφερε ότι η πηγή που παρείχε τα δεδομένα στον Rand Fishkin έκανε αυτόν τον ισχυρισμό. Ο Fishkin, γνωστός για τη σχολαστική του προσέγγιση, σημείωσε ότι ο ισχυρισμός σχετικά με τα δεδομένα που προέρχονται από το Google Search προήλθε από το άτομο που του έστειλε email και όχι από επαληθευμένες πηγές.
Ο Fishkin ανέφερε το email:
"Έλαβα ένα μήνυμα ηλεκτρονικού ταχυδρομείου από ένα άτομο που ισχυρίζεται ότι έχει πρόσβαση σε μια μαζική διαρροή τεκμηρίωσης API από το τμήμα Search της Google".
Παρά ταύτα, οι πρώην χρήστες της Google που ερωτήθηκαν από τον Fishkin μπόρεσαν μόνο να επιβεβαιώσουν ότι τα δεδομένα έμοιαζαν με εσωτερικές πληροφορίες της Google, αλλά δεν επιβεβαίωσαν ρητά ότι προέρχονταν από το Google Search.
Γνωριμίες από πρώην χρήστες του Googlers
Οι πρώην Googlers σχολίασαν:
-
"Δεν είχα πρόσβαση σε αυτόν τον κωδικό όταν δούλευα εκεί. Αλλά αυτό σίγουρα φαίνεται νόμιμο."
-
"Έχει όλα τα χαρακτηριστικά ενός εσωτερικού API της Google".
-
"Είναι ένα API βασισμένο στη Java. Και κάποιος ξόδεψε πολύ χρόνο για να τηρήσει τα εσωτερικά πρότυπ α της Google για την τεκμηρίωση και την ονομασία".
-
"Χρειάζομαι περισσότερο χρόνο για να είμαι σίγουρος, αλλά αυτό ταιριάζει με την εσωτερική τεκμηρίωση που γνωρίζω".
-
"Τίποτα που είδα σε μια σύντομη ανασκόπηση δεν υποδηλώνει ότι αυτό είναι οτιδήποτε άλλο εκτός από νόμιμο."
Οι δηλώσεις αυτές υπογραμμίζουν ότι, ενώ τα δεδομένα φαίνονται γνήσια, δεν υπάρχει καμία οριστική απόδειξη ότι προέρχονται από την Αναζήτηση Google.
Διατηρώντας ανοιχτό μυαλό
Είναι ζωτικής σημασίας να παραμείνουμε ανοιχτόμυαλοι όσον αφορά αυτά τα δεδομένα, καθώς πολλά από αυτά παραμένουν ανεπιβεβαίωτα. Η βιαστική εξαγωγή συμπερασμάτων ή η χρήση των δεδομένων για την επιβεβαίωση προϋπαρχουσών πεποιθήσεων μπορεί να οδηγήσει σε προκατάληψη επιβεβαίωσης, όπου κάποιος ερμηνεύει τις πληροφορίες με τρόπο που ενισχύει τις υπάρχουσες απόψεις του.
Ορισμός της μεροληψίας επιβεβαίωσης:
"Η προκατάληψη επιβεβαίωσης είναι η τάση να αναζητά, να ερμηνεύει, να ευνοεί και να ανακαλεί κανείς πληροφορίες με τρόπο που επιβεβαιώνει ή υποστηρίζει τις προηγούμενες πεποιθήσεις ή αξίες του".
Βασικές ερωτήσεις σχετικά με τη διαρροή δεδομένων της Google
-
Πλαίσιο των πληροφοριών που διέρρευσαν: Σχετίζονται τα δεδομένα με την αναζήτηση Google ή με άλλους σκοπούς;
-
Σκοπός των δεδομένων: Χρησιμοποιήθηκαν για πραγματικά αποτελέσματα αναζήτησης ή για εσωτερική διαχείριση ή χειραγώγηση δεδομένων;
-
Επιβεβαίωση από πρώην χρήστες του Google: Οι πρώην Google δεν επιβεβαίωσαν ότι τα δεδομένα αφορούν συγκεκριμένα την Αναζήτηση Google, παρά μόνο ότι φαίνεται να προέρχονται από την Google.
-
Ανοιχτόμυαλη ανάλυση: Αποφύγετε τη χρήση των δεδομένων για να επιβεβαιώσετε τις μακροχρόνιες πεποιθήσεις σας για να αποφύγετε τη μεροληψία επιβεβαίωσης.
-
Σχέση με την αποθήκη εγγράφων AI: Τα στοιχεία υποδηλώνουν ότι τα δεδομένα μπορεί να σχετίζονται με ένα εξωτερικό API για τη δημιουργία μιας αποθήκης εγγράφων και όχι με την αναζήτηση Google.
Γνώμες εμπειρογνωμόνων σχετικά με τα δεδομένα που "διέρρευσαν"
Ο εμπειρογνώμονας SEO Ryan Jones μοιράστηκε:
-
Αβεβαιότητα εάν τα δεδομένα προορίζονται για παραγωγή ή δοκιμές.
-
Έλλειψη σαφήνειας αν πρόκειται για αναζήτηση στο διαδίκτυο ή για άλλες κάθετες εφαρμογές όπως το Google Home ή οι ειδήσεις.
-
Εικασία ότι ορισμένα πεδία ισχύουν μόνο για σύνολα δεδομένων εκπαίδευσης και όχι για όλες τις τοποθεσίες.
Ο DavidGQuaid έγραψε στο Twitter:
Η All-in-One πλατφόρμα για αποτελεσματικό SEO
Πίσω από κάθε επιτυχημένη επιχείρηση βρίσκεται μια ισχυρή εκστρατεία SEO. Αλλά με αμέτρητα εργαλεία και τεχνικές βελτιστοποίησης εκεί έξω για να διαλέξετε, μπορεί να είναι δύσκολο να ξέρετε από πού να ξεκινήσετε. Λοιπόν, μη φοβάστε άλλο, γιατί έχω ακριβώς αυτό που θα σας βοηθήσει. Παρουσιάζοντας την πλατφόρμα Ranktracker all-in-one για αποτελεσματικό SEO
Έχουμε επιτέλους ανοίξει την εγγραφή στο Ranktracker εντελώς δωρεάν!
Δημιουργήστε έναν δωρεάν λογαριασμόΉ Συνδεθείτε χρησιμοποιώντας τα διαπιστευτήριά σας
"Δεν ξέρουμε αν πρόκειται για την αναζήτηση Google ή για την ανάκτηση εγγράφων στο Google cloud. Τα APIs φαίνονται pick & choose - δεν περιμένω έτσι να εκτελεστεί ο αλγόριθμος - τι γίνεται αν ένας μηχανικός θέλει να παραλείψει όλους αυτούς τους ελέγχους ποιότητας - αυτό μοιάζει σαν να θέλω να φτιάξω μια εφαρμογή αποθήκης περιεχομένου για την επιχειρησιακή μου βάση γνώσης."
Συμπέρασμα
Προς το παρόν, δεν υπάρχουν συγκεκριμένες αποδείξεις ότι τα δεδομένα που "διέρρευσαν" προέρχονται από το Google Search. Το πλαίσιο και ο σκοπός των δεδομένων παραμένουν ασαφή, με ενδείξεις που δείχνουν ότι πρόκειται για ένα API εξωτερικής όψης για τη διαχείριση εγγράφων και όχι για ένα βασικό συστατικό του αλγορίθμου αναζήτησης της Google. Είναι σημαντικό να προσεγγίσετε αυτές τις πληροφορίες με προσοχή και να αποφύγετε την εξαγωγή οριστικών συμπερασμάτων χωρίς περαιτέρω επαλήθευση.