• Google Search Updates & SEO Insights

Google desvela la filtración masiva de documentación sobre búsquedas

  • Felix Rose-Collins
  • 8 min read
Google desvela la filtración masiva de documentación sobre búsquedas

Introducción

Una filtración masiva de documentación interna sobre las clasificaciones de búsqueda de Google ha conmocionado a la comunidad SEO. La filtración, que deja al descubierto más de 14.000 posibles funciones de clasificación, ofrece una visión sin precedentes del sistema de clasificación de búsquedas de Google.

La historia detrás de la filtración

Erfan Azimi compartió la filtración de un documento de la API de Google con Rand Fishkin, de SparkToro, quien a su vez pidió ayuda a Michael King, de iPullRank, para difundir la información. Los archivos filtrados, procedentes de un commit de documentos de la API de Google titulado "yoshi-code-bot /elixer-google-api", no eran el resultado de un pirateo o de un informante, sino de la publicación de un documento interno.

Visión general de la fuga

La filtración ofrece una visión completa de los factores de clasificación de Google, revelando información sobre las variaciones del PageRank, las métricas de autoridad del sitio y mucho más. He aquí un desglose detallado:

Claves de la filtración de documentos de búsqueda de Google

PageRank y sus variaciones

  • PageRank_NS: ahora obsoleto, este algoritmo está asociado a la comprensión de documentos y modifica el PageRank tradicional para centrarse en un subconjunto localizado de la red alrededor de los nodos semilla.

  • Siete tipos de PageRank: Google menciona siete tipos diferentes de PageRank, incluido el famoso ToolBarPageRank. Estas variaciones indican que Google emplea múltiples métodos para evaluar la importancia de las páginas.

Identificación del modelo de negocio

El algoritmo de Google puede identificar varios modelos de negocio, incluidos sitios de noticias, sitios YMYL (Your Money or Your Life), blogs personales, comercio electrónico y sitios de vídeo. El motivo de filtrar específicamente los blogs personales sigue sin estar claro y plantea dudas sobre las intenciones más generales de Google.

Componentes del algoritmo

  • NavBoost: Un mecanismo de cambio de clasificación basado en el comportamiento del usuario y los registros de clics, muy influido por los datos de Chrome.

  • NSR (Clasificación normalizada de sitios): Se utiliza para calcular el rango de sitios para los trozos de sitios a nivel de host.

  • ChardScores: Puntuaciones a nivel de sitio que predicen la calidad del sitio/página en función del contenido.

Métricas de autoridad del sitio

Google utiliza una métrica de autoridad de todo el sitio y varias señales, incluido el tráfico de los navegadores Chrome, para evaluar la autoridad del sitio. Esto sugiere que la calidad general del sitio y la credibilidad desempeñan un papel importante en la clasificación.

Técnicas de incrustación y autoridad temática

  • Incorporación de páginas y sitios: Google emplea incrustaciones de página, incrustaciones de sitio, enfoque de sitio y radio de sitio en su función de puntuación para comprender la relevancia temática y la coherencia del contenido de un sitio web.

  • Límites temáticos y autoridad temática: Métricas como siteFocusScore, siteRadius, siteEmbeddings y pageEmbeddings se utilizan para medir la autoridad temática, enfatizando la importancia de mantener un enfoque temático claro.

googleapi

Datos de clics y compromiso de los usuarios

  • NavBoost: NavBoost se basa en datos de clics y en el comportamiento de los usuarios para reordenar los resultados de búsqueda, lo que subraya la importancia de las métricas de participación de los usuarios.

  • Métricas de clics: Google mide varios tipos de clics, incluidos los clics malos, los clics buenos, los últimos clics más largos y las impresiones en todo el sitio.

Datos NSR de calidad

Los factores clave de puntuación del documento de datos NSR incluyen:

  • titlematchScore: Una puntuación de coincidencia de títulos de todo el sitio que indica lo bien que coinciden los títulos con las consultas de los usuarios.

  • site2vecEmbedding: Un vector de todo el sitio similar a word2vec, que destaca la importancia de las incrustaciones completas del sitio.

  • pnavClicks: Probablemente relacionado con la información de navegación derivada de los datos de clics del usuario.

  • chromeInTotal: Vistas de Chrome en todo el sitio, destacando la importancia de las señales en todo el sitio.

  • chardVariance y chardScoreVariance: Puntuaciones que predicen la calidad del sitio/página en función del contenido, siendo clave la coherencia.

NSR Data Insights

Consejos prácticos para profesionales del SEO

  1. Invierta en un sitio bien diseñado: Asegúrese de que su sitio tenga una arquitectura intuitiva para optimizarlo para NavBoost, que se basa en el comportamiento del usuario y en los registros de clics para volver a clasificar los resultados de búsqueda.

  2. Eliminar/bloquear páginas irrelevantes: Elimine o bloquee las páginas que no sean relevantes desde el punto de vista temático. Establezca su tema objetivo y asegúrese de que cada página obtiene una buena puntuación en esta área.

  3. Optimice los títulos y el contenido: Optimice los encabezados en torno a las consultas y asegúrese de que los párrafos responden claramente a esas consultas para mejorar la incrustación y la relevancia de la página.

  4. Concéntrese en los clics y las impresiones: Escriba contenidos que atraigan más impresiones y clics, haciendo hincapié en la participación del usuario.

  5. Actualice regularmente los contenidos: Actualice regularmente el contenido con información única, nuevas imágenes y vídeos para mantener la frescura y obtener una puntuación alta en los cálculos de esfuerzo.

  6. Mantener contenidos de alta calidad: La consistencia en el contenido de alta calidad es crucial. Las puntuaciones chard de Google a nivel de sitio predicen la calidad del sitio/página en función del contenido.

  7. Valorar el crecimiento de las impresiones: El crecimiento de las impresiones es un signo positivo del rendimiento del sitio.

  8. Optimización de la relevancia de las entidades: Concéntrese en mejorar las puntuaciones de saliencia de las entidades y la identificación de entidades principales, como se menciona en la filtración.

  9. Elimine las páginas de bajo rendimiento: Identifique y elimine las páginas con métricas de usuario pobres y sin backlinks para mantener puntuaciones altas en todo el sitio.

panda

Cómo eliminar de la memoria de Google una versión antigua de un documento

Según la filtración, Google guarda un registro de cada versión de una página web, manteniendo un archivo web interno similar a Wayback Machine. Sin embargo, Google sólo utiliza las 20 últimas versiones de un documento. Si actualizas una página, esperas a que la rastreen y repites el proceso 20 veces, puedes expulsar determinadas versiones de la página. Esta táctica podría ser útil para mejorar los pesos históricos y las puntuaciones asociadas a las versiones más antiguas.

Sistema de clasificación de búsquedas de Google

Google Search Ranking System

Una conjetura interesante de la filtración es el impacto del peso de los términos (tamaño literal). Poner palabras en negrita o ajustar su tamaño puede influir en la puntuación de los documentos. Además, los mecanismos de almacenamiento del índice de Google priorizan el contenido de forma diferente:

  • Memorias USB: Para los contenidos más importantes y actualizados periódicamente.

  • Unidades de estado sólido: Para contenidos menos importantes.

  • Discos duros estándar: Para contenidos actualizados de forma irregular.

Indexador de Google: Alexandria

Alexandria

El indexador de Google se llama Alexandria, en honor a la famosa biblioteca. Otros indexadores mencionados son SegIndexer, que coloca los documentos en niveles, y TeraGoogle, que se encarga del almacenamiento en memoria a largo plazo.

Sitios semilla y autoridad del sitio

La filtración menciona un factor llamado isElectionAuthority, que posiblemente indica sitios semilla o autoridades temáticas. Sugiere que los sitios con gran autoridad, como los que tienen un PageRank de 9/10, tienen una influencia significativa. Sin embargo, nsrIsElectionAuthority se considera obsoleto, lo que deja cierta ambigüedad en la interpretación.

El contenido breve puede posicionar

Contrariamente a lo que se suele creer, un contenido breve no equivale a un contenido pobre. La filtración confirma que los contenidos breves pueden posicionarse bien, aunque con un sistema de puntuación diferente.

Enlaces frescos frente a enlaces existentes

Según el multiplicador de valor de enlaces de freshdocs, los enlaces procedentes de páginas web más recientes son más valiosos que los insertados en contenidos más antiguos. Esto indica que, aunque las ediciones de nicho pueden ser eficaces, los enlaces frescos tienen un mayor impacto.

Descubrimientos favoritos

Calidad de página (PQ)

Google utiliza un LLM para calcular el "esfuerzo" de las páginas de los artículos, lo que ayuda a determinar si una página puede reproducirse fácilmente. Herramientas, imágenes, vídeos, información única y profundidad de la información son formas de puntuar alto en los cálculos de esfuerzo.

Fronteras temáticas y autoridad temática

La autoridad temática, respaldada por siteFocusScore, siteRadius, siteEmbeddings y pageEmbeddings, es crucial. Mantener un enfoque temático claro y minimizar la desviación del tema ayuda a mejorar la clasificación.

Calidad de imagen

ImageQualityClickSignals mide la calidad de la imagen basándose en los datos de los clics (utilidad, presentación, atractivo, participación).

Anfitrión NSR

El NSR de host es la clasificación del sitio calculada para trozos de sitio a nivel de host, que mide la calidad en segmentos. Este sistema de segmentación ayuda a Google a evaluar la calidad del sitio de forma exhaustiva.

Teoría unificada de la clasificación

Esta sección intenta consolidar los factores de la filtración en una fórmula matemática, destacando varias métricas y sus impactos en la puntuación global de la clasificación ®.

Definiciones y métricas

formula

Puntuación de la interacción con el usuario (UIS):

formula

  • UgcScore: Compromiso con los contenidos generados por los usuarios.

  • TitleMatchScore: Relevancia de los títulos para las consultas de los usuarios.

  • ChromeInTotal: Total de interacciones rastreadas a través de Chrome.

  • SiteImpressions: Total de impresiones del sitio.

  • TopicImpressions: Impresiones en páginas específicas de un tema.

  • SiteClicks: Porcentaje de clics del sitio.

  • Clics por tema: Porcentaje de clics en páginas temáticas.

Puntuación de la calidad de los contenidos (CQS):

formula

  • ImageQualityClickSignals: Señales de calidad de los clics en las imágenes.

  • VideoScore: Calidad y compromiso de los contenidos de vídeo.

  • Puntuación de compras: Puntuación para contenidos relacionados con las compras.

  • PageEmbedding: Incrustación semántica del contenido de la página.

  • SiteEmbedding: Incrustación semántica del contenido del sitio.

  • SiteRadius: Medida de desviación dentro de la incrustación del sitio.

  • Enfoque del sitio: Métrica que indica el enfoque del tema.

  • TextoConfianza: Confianza en la relevancia y calidad del texto.

  • EffortScore: Esfuerzo y calidad en la creación de contenidos.

Puntuación de enlaces (LS):

Link Scores

  • TrustedAnchors: Calidad y fiabilidad de los enlaces entrantes.

  • SiteLinkIn: Valor medio de los enlaces entrantes.

  • PageRank: Varias puntuaciones de PageRank (0, 1, 2, ToolBar, NR).

Refuerzo de la relevancia (RB):

Relevance Boost

  • TopicEmbedding: Pertinencia en el tiempo.

  • QnA: Medida de calidad de referencia.

  • STS: Puntuación agregada basada en la comprensión del texto, la prominencia y las entidades.

Aumento de la calidad (QB):

Quality Boost

  • SAS: Puntuación de autoridad del sitio relacionada con la confianza, fiabilidad y autoridad de enlaces.

  • EFTS: Puntuación del esfuerzo que incorpora texto, multimedia y comentarios.

  • FS: Puntuación de frescura basada en las fechas de actualización y publicación original.

  • CSA: Ajustes específicos de contenido basados en SERP y características on-page.

CSA

Ajustes por contenido (CSA):

  • CDS: Puntuación de datos de Chrome centrada en impresiones y clics en todo el sitio.

  • SDS: Puntuación de descenso de categoría basada en la medición de la experiencia en las SERP.

  • EQSS: Puntuación Q Star experimental de las variables experimentales.

Fórmula completa

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-.

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Visión general de la puntuación generalizada

1. Compromiso del usuario:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Partituras multimedia:

  • ImageQualityClickSignals, VideoScore, ShoppingScore

3. Enlaces:

  • TrustedAnchors, SiteLinkIn (valor medio de los enlaces entrantes), PageRank (0, 1, 2, ToolBar, NR)

4. Comprensión de contenidos:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Conclusión

La filtración de documentación proporciona información muy valiosa sobre los mecanismos de clasificación de Google, desmontando varios mitos y revelando intrincados factores que influyen en los resultados de búsqueda. Los profesionales del SEO pueden aprovechar estos conocimientos para perfeccionar sus estrategias, centrándose en la participación del usuario, la relevancia temática y la calidad constante del contenido. A medida que la comunidad SEO asimile estas revelaciones, es probable que muchos reconsideren sus enfoques a la luz de esta nueva información.

Al comprender y aplicar estos conocimientos, los profesionales de SEO pueden navegar mejor por las complejidades del sistema de clasificación de Google y, en última instancia, mejorar la visibilidad y el rendimiento de su sitio web en los resultados de búsqueda.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Empieza a usar Ranktracker... ¡Gratis!

Averigüe qué está impidiendo que su sitio web se clasifique.

Crear una cuenta gratuita

O inicia sesión con tus credenciales

Different views of Ranktracker app