Ένας θησαυρός εγγράφων που φαίνεται να περιγράφουν τον τρόπο με τον οποίο η Google κατατάσσει τα αποτελέσματα αναζήτησης εμφανίστηκε στο διαδίκτυο, πιθανότατα ως αποτέλεσμα τυχαίας δημοσίευσης από ένα εσωτερικό bot.
Η τεκμηρίωση που διέρρευσε περιγράφει μια παλιά έκδοση του Content Warehouse API της Google και παρέχει μια ματιά στις εσωτερικές λειτουργίες της Αναζήτησης Google.
Το υλικό φαίνεται να ήταν άθελά τους σε ένα δημόσιο αποθετήριο που ανήκει στην Google στο GitHub γύρω στις 13 Μαρτίου από τα αυτοματοποιημένα εργαλεία του ίδιου του γίγαντα του Ιστού. Αυτός ο αυτοματισμός ενσωμάτωσε μια άδεια ανοιχτού κώδικα Apache 2.0 στο commit, όπως είναι τυπικό για τη δημόσια τεκμηρίωση της Google. ΕΝΑ δέσμευση παρακολούθησης στις 7 Μαΐου προσπάθησε να αναιρέσει τη διαρροή.
Το υλικό ωστόσο εντοπίστηκε από Ερφάν ΑζίμιΔιευθύνων Σύμβουλος της βελτιστοποίησης μηχανών αναζήτησης (SEO) biz EA Digital Eagle και στη συνέχεια αποκαλύφθηκαν την Κυριακή από τους συναδέλφους του SEO, Rand Fishkin, CEO της SparkToro και Michael King, Διευθύνοντα Σύμβουλο της iPullRank.
Αυτά τα έγγραφα δεν περιέχουν κώδικα ή κάτι παρόμοιο και, αντίθετα, περιγράφουν τον τρόπο χρήσης του Content Warehouse API της Google που πιθανότατα προορίζεται μόνο για εσωτερική χρήση. η τεκμηρίωση που διέρρευσε περιλαμβάνει πολυάριθμες αναφορές σε εσωτερικά συστήματα και έργα. Ενώ υπάρχει α με παρόμοια ονομασία Το Google Cloud API που είναι ήδη δημόσιο, αυτό που κατέληξε στο GitHub ξεπερνά πολύ αυτό, φαίνεται.
Τα αρχεία είναι αξιοσημείωτα για όσα αποκαλύπτουν σχετικά με τα πράγματα που η Google θεωρεί σημαντικά κατά την κατάταξη ιστοσελίδων ως προς τη συνάφεια, ένα θέμα διαρκούς ενδιαφέροντος για οποιονδήποτε ασχολείται με την επιχείρηση SEO ή/και οποιονδήποτε χειρίζεται έναν ιστότοπο και ελπίζει ότι η Google θα τον βοηθήσει να κερδίσει επισκεψιμότητα.
Μεταξύ των 2.500 και πλέον σελίδων τεκμηρίωσης, που συγκεντρώθηκαν για εύκολη ανάγνωση εδώ, υπάρχουν λεπτομέρειες για περισσότερα από 14.000 χαρακτηριστικά προσβάσιμα ή συσχετισμένα με το API, αν και ελάχιστες πληροφορίες σχετικά με το εάν χρησιμοποιούνται όλα αυτά τα σήματα και τη σημασία τους. Επομένως, είναι δύσκολο να διακρίνει κανείς το βάρος που εφαρμόζει η Google στα χαρακτηριστικά στον αλγόριθμο κατάταξης των αποτελεσμάτων αναζήτησης.
Ωστόσο, οι σύμβουλοι SEO πιστεύουν ότι τα έγγραφα περιέχουν αξιοσημείωτες λεπτομέρειες επειδή διαφέρουν από τις δημόσιες δηλώσεις εκπροσώπων της Google.
“Πολλά από [Azimi’s] αξιώσεις [in an email describing the leak] έρχονται σε άμεση αντίθεση με δημόσιες δηλώσεις που έγιναν από υπαλλήλους της Google όλα αυτά τα χρόνια, ιδίως η επανειλημμένη άρνηση της εταιρείας ότι χρησιμοποιούνται σήματα χρήστη με επίκεντρο κλικ, η άρνηση ότι οι υποτομείς εξετάζονται χωριστά στις ταξινομήσεις, οι αρνήσεις ενός sandbox για νεότερους ιστότοπους, οι αρνήσεις ότι συλλέγεται η ηλικία ενός τομέα ή θεωρούνται, και περισσότερα», εξήγησε ο Fishkin του SparkToro στο α κανω ΑΝΑΦΟΡΑ.
Το iPullRank’s King, στο δικό του Θέση στα έγγραφα, επισήμανε μια δήλωση που έκανε ο συνήγορος της αναζήτησης της Google, John Mueller, ο οποίος είπε ένα βίντεο ότι “δεν έχουμε τίποτα σαν βαθμολογία αρχής ιστότοπου” – ένα μέτρο για το εάν η Google θεωρεί έναν ιστότοπο έγκυρο και επομένως αξίζει υψηλότερες βαθμολογίες για τα αποτελέσματα αναζήτησης.
Ωστόσο, ο King σημειώνει ότι τα έγγραφα αποκαλύπτουν ότι ως μέρος των Συμπιεσμένων Σημάτων Ποιότητας που αποθηκεύει η Google για έγγραφα, μπορεί να υπολογιστεί μια βαθμολογία “siteAuthority”.
Αρκετές άλλες αποκαλύψεις αναφέρονται στις δύο αναρτήσεις.
Το ένα είναι η σημασία των κλικ – και των διαφορετικών τύπων κλικ (καλά, κακά, μεγάλα κ.λπ.) – είναι για τον καθορισμό της κατάταξης μιας ιστοσελίδας. Google κατά τη διάρκεια του ΗΠΑ εναντίον Google αντιμονοπωλιακή δοκιμή αναγνώρισε [PDF] ότι θεωρεί τις μετρήσεις κλικ ως παράγοντα κατάταξης στην αναζήτηση ιστού.
Ένα άλλο είναι ότι η Google χρησιμοποιεί ιστότοπους που προβάλλονται στο Chrome ως σήμα ποιότητας, όπως φαίνεται στο API ως παράμετρος ChromeInTotal. “Μία από τις ενότητες που σχετίζονται με τις βαθμολογίες ποιότητας σελίδας διαθέτει μια μέτρηση προβολών από το Chrome σε επίπεδο ιστότοπου”, σύμφωνα με τον King.
Επιπλέον, τα έγγραφα υποδεικνύουν ότι η Google λαμβάνει υπόψη άλλους παράγοντες όπως η φρεσκάδα του περιεχομένου, η συγγραφή, το κατά πόσο μια σελίδα σχετίζεται με την κεντρική εστίαση ενός ιστότοπου, η ευθυγράμμιση μεταξύ τίτλου και περιεχομένου σελίδας και “το μέσο σταθμισμένο μέγεθος γραμματοσειράς ενός όρου στο σώμα του εγγράφου.”
Η Google δεν απάντησε σε αίτημα για σχολιασμό. ®