Como profesionales del marketing digital, no hay nada más interesante que conocer los detalles secretos del algoritmo de Google. El 27 de mayo, la noticia de la filtración del algoritmo de Google dejó atónito al mundo entero, ¡y es cierta! Explorar los más de 2.500 documentos y más de 14.000 señales y factores filtrados es emocionante. Sin embargo, también requiere mucho tiempo.
Por eso, he dedicado muchas horas a analizar esta información y contrastarla con los hallazgos de algunos de los expertos internacionales más destacados en SEO. Al compartir todo lo que he averiguado, espero ahorrarte este laborioso trabajo.
¿Pero qué valor tienen los secretos que ya no son tales?
El hecho de que se hayan desvelado más de 8.000 factores específicamente relativos al algoritmo de resultados de búsqueda de Google, de los 14.000 factores totales filtrados, lo cambia todo.
Los detalles que revelaré aquí no son la fórmula secreta de Google, ya que no incluyen el peso de cada factor. Sin embargo, te darán una gran ventaja competitiva: muchos detalles, muchas ideas nuevas e información para elaborar una nueva estrategia de SEO que logre unos resultados de visibilidad y ventas que antes no hubiese podido lograr, ni queriendo pagar… Esta es tu oportunidad de acceder a conocimientos de SEO que antes solo tenían unos pocos, como las grandes OTAs y cadenas hoteleras, y usarlos para adelantarte a tus competidores. Pero recuerda, que ahora ellos también pueden mejorar sus estrategias, ¡así que no te quedes atrás!
¿Qué secretos sobre el algoritmo de Google se han revelado?
El 29 de mayo Rand Fishkin y Mike King compartieron la noticia de que se habían filtrado el Content API Warehouse y los factores que alimentan los cálculos del ranking de los resultados de búsqueda de Google. Ocurrió el 13 de marzo, por un bot automatizado llamado yoshi-code-bot que publicó miles de documentos en la web de GitHub. Durante mi análisis encontré enlaces a perfiles de Google Plus que dejaron de funcionar en abril de 2024, lo que sugiere que la información filtrada fue actualizada por última vez en marzo de 2024. El análisis de estos documentos ha revelado los componentes más importantes del algoritmo de Google, incluyendo los específicos para hoteles y el sector de viajes.
Mi objetivo es darte pistas para tu nueva estrategia de SEO, compartiendo los aspectos que creo tendrán mayor impacto en tu sitio web. Esta no es una lista exhaustiva de los secretos de Google, ni mucho menos. ¡Y créeme, para cubrir los más de 8.000 factores necesitaríamos un artículo más largo que la Biblia! 🙂
Cuáles son los factores más importantes del algoritmo de Google para el sector de viajes
A continuación, te revelaré los 7 factores que considero más importantes, de forma clara y sencilla:
1. NavBoost
NavBoost es un algoritmo de Google que mejora la relevancia de los resultados de búsqueda. Se enfoca especialmente en consultas de navegación, es decir, cuando los usuarios buscan un sitio o páginas web específicas. El algoritmo de Google utiliza señales como los clics e impresiones de los usuarios para determinar la relevancia de los resultados. Incluso recuerda los clics de consultas de hasta 13 meses atrás.
NavBoost también personaliza los resultados según la ubicación del usuario y el tipo de búsqueda, utilizando el machine learning para ajustar la clasificación y hacerla más relevante.
La existencia de Glue y Navboost fue confirmada recientemente por Pandu Nayak, vicepresidente de búsquedas de Google. Sin embargo, las primeras filtraciones sobre este algoritmo datan de 2019.
Glue: NavBoost es parte de Glue, un sistema de Google que analiza diferentes interacciones en los resultados de búsqueda, como el scroll y el hover. Esto permite entender mejor la experiencia del usuario, más allá de los simples clics.
Características principales de NavBoost:
- Interacciones del usuario: Analiza los clics y otras interacciones de los usuarios con los resultados de búsqueda.
- Métricas basadas en clics: Incluyen clicks, goodClicks, BadClicks, UnsquashedClicks, UnsquashedLastLongestClicks, UnicornClicks.
- Métricas basadas en impresiones: Incluyen Impressions, UnsquashedImpressions, AbsoluteImpressions.
La información indica que el volumen de clics y el comportamiento del usuario (como el tiempo en el sitio y los rebotes) son críticos para determinar el ranking final. Las métricas basadas en clics evalúan la interacción y satisfacción del usuario, mientras que las métricas basadas en impresiones miden la visibilidad y el interés en los resultados.
La medición de estas métricas ayuda a Google a comprender y refinar la satisfacción y experiencia del usuario, la relevancia del contenido y la efectividad general de los resultados de búsqueda.
Una ejemplificación de cómo funciona Navboost sería decir que los clics actúan como un «me gusta», o un voto a favor, si el usuario permanece en el sitio el tiempo suficiente, y como un «no me gusta», o un voto en contra, si el usuario regresa rápidamente a los resultados de búsqueda utilizando el botón de retroceso o cerrando la ventana/pestaña. Estos rebotes indican obviamente insatisfacción.
Consejo: Optimizar los títulos de tus páginas puede aumentar los clics dentro de los resultados de búsqueda, pero recuerda que asegurar una buena experiencia del usuario dentro de tu sitio es crucial. Si no es buena, Google lo notará y te penalizará.
Factores que influyen en los cálculos de Navboost
Comportamiento del Usuario en Chrome
¿Cómo obtiene Google toda esta información? Los documentos filtrados revelan que Google rastrea el comportamiento de los usuarios de Chrome, incluyendo clics y navegación, lo que le da una visión detallada de la experiencia en cada sitio web.
Consejo: Prioriza una excelente experiencia de usuario en tu sitio, especialmente en Chrome (y Android), para evitar penalizaciones.
Evolución de los clics
La clave no es sólo cuántos clics recibe tu página, sino que también importa la evolución de su tráfico a lo largo del tiempo. Según Mike King, para mantener un buen ranking, tu web debe atraer visitas de diversas consultas, obtener enlaces de varias fuentes y mantener un volumen constante de clics.
Es decir, un contenido relevante (“evergreen”) y de calidad atraerá más búsquedas y tráfico cualificado, manteniendo un buen posicionamiento a lo largo del tiempo. Si tu página no recibe clics o estos disminuyen, hará pensar a Google que ya no es un buen resultado y esto hará probable que baje en el ranking.
Relevancia Local y Datos Estructurados
NavBoost también considera la ubicación del usuario para adaptar los resultados de búsqueda.
En el sector de viajes, la ubicación es clave. Google usa datos estructurados para entender la relevancia de los servicios de viaje en búsquedas locales. Optimizar el perfil de tu negocio en Google Business Profile también es esencial.
Consejo: Implementa datos estructurados y mantén tu perfil de Google Business Profile actualizado.
Autoridad del Sitio (Site Authority)
A pesar de las declaraciones hechas, durante años, Google calcula la autoridad de un sitio (siteAuthority), y ésta influye notablemente en el ranking. Además, las marcas conocidas y fiables también tienden a obtener más clics en los resultados de búsqueda.
Consejo: Consigue enlaces de calidad, crea contenido relevante e invierte en mejorar tu marca para aumentar la autoridad de tu sitio.
Contenido Fresco y Relevante
Google prioriza el contenido fresco y relevante. Actualizar tu sitio web regularmente puede mejorar tu ranking y atraer más clics. Según observa Neil Patel, experto internacional de SEO, «los grandes sitios con mejores resultados, la gran cosa que tienen en común es que dedican más tiempo a actualizar contenidos que a crear contenidos nuevos”.
Consejo: Prioriza mantener tu contenido actualizado y relevante, antes de crear nuevos.
Optimización para Dispositivos Móviles
Las búsquedas móviles son cada vez más importantes, por lo que Google prioriza los sitios optimizados para estos dispositivos. ¡Cuidado! Google no indexará los sitios que no funcionen en dispositivos móviles a partir del 5 de julio.
Consejo: Asegúrate de que tu sitio web sea responsive y funcione perfectamente en dispositivos móviles.
2. PageQuality (PQ)
Además de NavBoost, Google ha introducido una métrica clave para evaluar la calidad del contenido: PageQuality (PQ).
Características principales de PageQuality (PQ):
- PageQuality (PQ) es una métrica de Google que evalúa la calidad general de las páginas web. Considera factores como la calidad del contenido, la experiencia del usuario, la fiabilidad y la relevancia.
- Recompensa el contenido que no solo atrae al público, sino que también responde a sus preguntas de manera útil y satisfactoria.
Factores Considerados en PageQuality (PQ):
- Uso de Multimedia: La inclusión de videos, imágenes y otros medios enriquecedores para mejorar la experiencia del usuario.
- Originalidad y Presentación: Valora la originalidad de la información y cómo se presenta.
- Esfuerzo del Creador: Google utiliza modelos de lenguaje avanzado (LLM) para estimar el «esfuerzo» invertido por el creador en el contenido.
Esta métrica cambia la forma en que Google clasifica el contenido. PQ va más allá de la densidad de palabras clave y los enlaces entrantes, evaluando también el esfuerzo y la calidad del trabajo invertido en la creación del contenido.
Cómo puntúa el contenido el PQ
- El PQ de Google determina si una página puede reproducirse fácilmente, como en el caso de las páginas generadas con código (tipo vuelos desde Madrid, vuelos desde Roma… que comparten las mismas plantillas). Si el “esfuerzo” es bajo y el valor del contenido también lo es, la puntuación de la página será baja y su posicionamiento será rebajado.
- PQ determina si una página es fácil de reproducir, como las generadas con plantillas (ej: «vuelos desde Roma», «vuelos desde Madrid”…). Si el esfuerzo y el valor del contenido son bajos, la puntuación y el posicionamiento de la página serán bajos.
- Las puntuaciones altas de PQ se dan a aquellas páginas que se supone generarán una buena experiencia para el usuario, por ejemplo, con contenido que muestra profundidad, estudio y utilidad. Esto debería impulsar a los creadores de contenidos a generar recursos llenos de información útil y rehuir de delegar a ChatGPT de hacerlo por ellos. De hecho, es un factor que a la luz del fallido intento de lanzar la nueva experiencia de búsqueda de Google, introduciendo la nueva funcionalidad de “AI Overviews”, tendrá probablemente cada vez más peso.
- Las páginas con contenido profundo, útil y bien investigado obtienen puntuaciones altas de PQ, ya que ofrecen una buena experiencia al usuario. Esto incentiva a los creadores a producir contenido de calidad en lugar de depender de herramientas como ChatGPT. PQ será aún más importante con la nueva experiencia de búsqueda de Google «AI Overviews», aunque de momento su lanzamiento haya sido un fracaso.
PQ es crucial para evaluar la calidad y relevancia de las páginas web, y se basa en varias señales y factores:
- pqData, onsiteProminence y hostNsr: Elementos que contribuyen directamente a la métrica PQ.
- NSR, chardEncoded, site2vecEmbedding y clutterScores: Conceptos relacionados que ayudan a evaluar la calidad global del sitio y de la página.
3. Quality Travel Good Sites Model
Google también tiene un módulo específico para evaluar la calidad de los sitios web de viajes: «V1.Model.QualityTravelGoodSites».
Puntos clave de este módulo:
- Evaluación de la calidad: El modelo define la calidad del sitio basándose en características específicas del sector de viajes.
- Impacto en el ranking: Altera el ranking de resultados de búsqueda para el sector de viajes y actúa como una «lista blanca».
Esto demuestra que las técnicas genéricas de SEO no siempre son efectivas en el sector turístico.
Como ya habrás intuido, la clasificación de los resultados de búsqueda de Google considera varios elementos. En los inicios de Google, el PageRank (basado en la cantidad de enlaces entrantes) era clave en su algoritmo. Sin embargo, tras la filtración, sabemos que ha sido sustituido por el «pageRank_NS» (NS quiere decir Nearest Seed).
Además Google usa hasta siete tipos diferentes de PageRank:
Tipo de PageRank | Descripción |
ToolbarPageRank | El PageRank que se mostraba en la barra de herramientas de Google (ya no está disponible). |
RealtimePageRank | PageRank calculado en tiempo real, teniendo en cuenta los cambios recientes en los enlaces. |
PersonalizedPageRank | PageRank adaptado a los intereses e historial de búsqueda del usuario. |
TopicSensitivePageRank | PageRank que tiene en cuenta la temática de la página y la consulta de búsqueda. |
GeoSpecificPageRank | PageRank que considera la ubicación geográfica del usuario y del sitio web. |
SocialPageHighQuality | PageRank que evalúa la calidad y autoridad de una página en función de su presencia y actividad en redes sociales. |
DomainAuthorityPageRank | PageRank que tiene en cuenta la autoridad general del dominio al que pertenece la página. |
El concepto de «Nearest Seed» (Semilla más Cercana) se basa en una patente de Google de 2015, “Producing a ranking for pages using distances in a web-link graph”. Para entender a qué se refiere, hay que considerar que Google identifica sitios web de alta calidad y confianza, como Wikipedia o sitios gubernamentales, llamados «sitios semilla«. La cercanía de tu sitio a estos sitios semilla, medida por la cantidad de enlaces que los separan, influye en tu posición en los resultados de búsqueda. En resumen, cuantos menos enlaces haya entre tu sitio y los sitios semilla de tu temática, mejor será tu posicionamiento.
En resumen, los sitios semilla son sitios web de referencia en diversos temas. Obtener enlaces de ellos o de sitios cercanos a ellos es muy valioso para tu posicionamiento, ya que Google confía más en los sitios que están a menor «distancia» de estas fuentes de autoridad.
Por ejemplo, si tu hotel en Barcelona recibe un enlace desde una web de viajes reconocida como TripAdvisor, este enlace tendrá más valor que uno desde un sitio web de deportes. Y si ese enlace proviene de una página de alta calidad dentro de TripAdvisor, su valor será aún mayor.
5. Topic borders y topic authority
Google va más allá de los enlaces. Gracias a modelos de Procesamiento del Lenguaje Natural (PLN) como BERT, también considera las menciones de tu web en otros sitios. Aunque no está claro si tienen el mismo valor que los enlaces, la documentación filtrada comprueba que las menciones son muy importantes para Google.
En este sentido parece que también el cálculo del Nearest Seed haya evolucionado.
Evolución del Nearest Seed
El concepto Nearest Seed, también conocido como «semilla más cercana», representa un cambio de paradigma en la forma en que Google (y potencialmente otros motores de búsqueda) evalúan la relevancia de los enlaces y las páginas web. En lugar de considerar cada enlace como un «voto positivo» que aumenta la autoridad de una página, Google ahora agrupa las páginas web en función de su temática y establece «semillas» o referentes para cada grupo.
Estos referentes son las páginas web consideradas las más autorizadas y relevantes dentro de su nicho. Por ejemplo el New York Times para las noticias en EEUU o Tripadvisor como directorio de hoteles. Una vez identificados los referentes, Google evalúa la «distancia» temática (proximidad) y la relevancia de otras entidades (páginas web) dentro del mismo grupo temático. La proximidad se refiere a qué tan cerca está una entidad de los referentes en términos de contenido, enlaces y otros factores.
Ejemplo práctico: Si un usuario busca «hotel en el centro de Madrid», Google identificará las «semillas» para este tema (por ejemplo, páginas de hoteles reconocidos en el centro de Madrid). Luego, evaluará qué tan cerca están otros hoteles en términos de ubicación, servicios, reseñas, precio y contenido relacionado con «centro de Madrid». Los hoteles más «cercanos” a las semillas y más relevantes para la consulta tendrán una mayor probabilidad de posicionarse bien en los resultados de búsqueda.
Google también tiene en cuenta la intención de búsqueda del usuario al determinar la relevancia de una página. Por ejemplo, si el usuario busca «hotel barato en el centro de Madrid», los hoteles más económicos podrían tener una mayor relevancia, incluso si no están tan cerca de las «semillas» en términos de otros factores.
En fin, he simplificado mucho pero creo que se entiende mejor así.
Nota: Recuerda optimizar la información que Google logra de tu hotel en las OTAs, además de las propias reseñas en Google Business Profile, y así diciendo.
Factores Clave: SiteFocusScore y SiteRadius
SiteFocusScore:
- Definición: Indica qué tan enfocado está un sitio en un tema específico.
- Impacto: Los sitios con un enfoque claro en un tema son considerados más relevantes para ese tema.
SiteRadius:
- Definición: Mide qué tanto se alejan los contenidos del tema principal del sitio.
- Impacto: Los sitios con contenido más enfocado en su tema principal son considerados más relevantes y obtienen un mejor ranking.
6. Embeddings
Los embeddings son representaciones numéricas que transforman datos complejos, como texto o sitios web, en un formato que los modelos de aprendizaje automático pueden entender fácilmente (vectores). Son fundamentales en el Procesamiento del Lenguaje Natural (PLN) y la Inteligencia Artificial (IA) generativa.
Google genera mucha información para entender la relevancia de los contenidos en la web, como páginas, valoraciones, etc. Esta información debe ser recuperada rápidamente para responder a los usuarios en milisegundos. Para lograrlo, Google utiliza técnicas de machine learning, como los embeddings, que le permiten evaluar la calidad de las páginas y sitios web.
La documentación filtrada menciona «site2vecEmbedding» y «site2vecEmbeddingEncoded», que son formatos de almacenamiento de site2vec, una herramienta que captura y describe la temática de los sitios web en formato numérico.
Además de determinar la relevancia del sitio/página para cada tema, siteEmbedding y pageEmbedding se utilizan para calcular el ranking:
- siteEmbedding: Representación numérica de las características de un sitio web.
- pageEmbedding: Representación numérica de las características de una página web.
De esta forma es posible analizar la relación entre las páginas y el sitio web en términos de temas y contexto. Cada contenido se evalúa según su coherencia con el tema principal del sitio, lo que afecta la reputación y relevancia de la página. Con esta información Google podrá medir la relación entre una página y el tema principal del sitio: a mayor distancia, menor puntuación de relevancia.
Es un poco como decir que si un usuario está buscando un hotel en Madrid, los hoteles del centro tendrán más “proximidad” y más “relevancia” si desde las palabras claves de su búsqueda se infiere que busca un hotel (en lugar de un hostal) y que quiere una situación cercana a las principales atracciones de la ciudad (cerca de Sol en lugar que en Pozuelo…). He simplificado mucho pero creo que se entiende mejor así.
La integración de modelos de PLN como BERT o PaLM, el uso de técnicas como el RAG, junto con la evolución de Nearest Seed, demuestra cómo Google utiliza técnicas avanzadas para evaluar la relevancia y autoridad de las páginas web, mucho más allá de los enlaces tradicionales. Factores como las menciones, el enfoque temático (siteFocusScore) y la coherencia del contenido (siteRadius) son cruciales, y en el sector turístico, más.
7. ChardScore y NSR
Tras evaluar la calidad y relevancia de una página, Google también analiza su fiabilidad y confianza a través de ChardScore. Este análisis es clave para determinar una métrica global de clasificación: el NSR.
ChardScore:
- Definición: Mide la calidad y fiabilidad del contenido,detectando contenido engañoso, traducido o que afecte aspectos importantes de la vida (YMYL).
Chard Encoded Scores (Puntuaciones codificadas Chard):
- Definición: Predicen la calidad del contenido y ayudan a Google a entender la coherencia y variabilidad de la calidad en todo el sitio web.
Estas mediciones se usan para evaluar la calidad general del sitio y limitar la visibilidad de sitios con contenido de baja calidad, engañoso o dañino.
NSR (significado más probable: Normalized Site Rank o Navigational Site Rank):
- Definición: Métrica clave que evalúa la calidad y relevancia de los sitios web, considerando la calidad del contenido, la interacción del usuario, la estructura y el enfoque temático.
Host NSR
- Definición: Valor NSR agregado para todo el sitio web, que refleja su fiabilidad y confianza general.
NSR combina y evalúa varias señales, como la calidad del contenido, la interacción del usuario, la estructura del sitio y el enfoque temático, para refinar la clasificación de los resultados de búsqueda. ChardScore es una de estas señales. Esto ayuda a Google a garantizar resultados relevantes, de alta calidad, útiles y fáciles de navegar.
Por otra parte, Host NSR ofrece una visión global de la fiabilidad y confianza de todo el sitio web, no solo de una parte (como un subdominio).
Y con toda esta información (Navboost, pageRank_NS, PageQuality…) Google tiene lo que necesita para seleccionar y comparar los resultados para cada consulta y elegir los mejores! 🙂
Conclusión
¡Gracias por dedicar tu atención y tiempo para leer este artículo!
Recuerda que Google no ha confirmado todos los detalles y advierte sobre conclusiones apresuradas. Así que analiza la información cuidadosamente.
Dicho esto, la información aquí presentada nos da una idea clara de cómo Google evalúa la relevancia de nuestras webs con respecto a las búsquedas más importantes para nuestros negocios. Ahora tenemos las bases para entender cómo mejorar nuestros sitios y ofrecer una experiencia positiva a los usuarios, lo que se traduce en más ventas y tráfico gratuito, mejor posicionamiento y menos gastos en publicidad y comisiones a OTAs.
¡Así que no dejes que esta oportunidad se te escape! Ponte manos a la obra y comienza a optimizar tu sitio web para conquistar los primeros puestos en Google y dejar atrás a tu competencia. ¿Te ha parecido interesante este post? Si es así, por favor, comparte este artículo y hazme saber qué aspectos te gustaría que se profundizaran o explicaran con tus comentarios.