Como especialistas en SEO, sabemos mucho sobre Google. Las actualizaciones del algoritmo generalmente se basan en patentes publicadas. El objetivo fundamental de las actualizaciones es eliminar las prácticas de SEO sospechosas.
Por prácticas sospechosas, nos referimos a cualquier práctica que intente explotar las debilidades del algoritmo de Google para obtener una mejor clasificación en los motores de búsqueda. Google penaliza a los sitios web que lo hacen, ya que el contenido proporcionado a los usuarios en sus páginas de resultados de búsqueda suele ser de mala calidad, lo que significa que los resultados del motor de búsqueda también se ven afectados.
Todos aquellos que han estado jugando al juego del SEO durante varios años conocen bien las principales tácticas de Black Hat que Google penaliza (veremos algunos ejemplos concretos más adelante en el artículo).
🚀 Lectura rápida: 3 patentes de Google que debes conocer para evitar una penalización SEO
- Patente del 8 de octubre de 2013 sobre "content spinning": reescritura automática de páginas idénticas para evitar contenido duplicado.
- Patente del 13 de diciembre de 2011 sobre "keyword stuffing": saturación de palabras clave para posicionar un sitio en una sola palabra.
- Patente del 5 de marzo de 2013 sobre "cloaking": ocultación de contenido para engañar al algoritmo.
❓ ¿Por qué es importante cómo Google identifica las tácticas de Black Hat?
Porque no quieres cometer accidentalmente errores de SEO que resulten en que Google te penalice. Pensarán que estás tratando de aprovechar el sistema.
De hecho, simplemente has cometido algunos errores costosos de SEO porque no lo sabías. Para comprender mejor cómo el algoritmo de Google identifica las malas prácticas de SEO (y así comprender mejor cómo evitar cometer errores de SEO), debes revisar las patentes de Google relacionadas con algunas de las tácticas de Black Hat más comunes.
💫 Content spinning
La patente en cuestión: "Identifying gibberish content in resources" (patente del 8 de octubre de 2013)[1]
Un sitio web reescribirá la misma publicación cientos de veces con el objetivo de aumentar su número de enlaces y tráfico, evitando que se considere contenido duplicado. Algunos sitios incluso logran generar ingresos a través de este tipo de contenido, mediante enlaces publicitarios.
Sin embargo, dado que la reescritura de contenido es una tarea bastante tediosa, muchos sitios recurren a software de redacción automática capaz de reemplazar automáticamente nombres y verbos. Esto generalmente resulta en la creación de contenido de muy mala calidad o, en otras palabras, galimatías.
La patente explica cómo Google detecta este tipo de contenido mediante la identificación de frases incomprensibles o incorrectas contenidas en una página web. El sistema que utiliza Google se basa en diferentes factores para asignar a la página una puntuación contextual: se trata del "gibberish score", literalmente la puntuación de galimatías.
Google utiliza un modelo de lenguaje que es capaz de reconocer cuándo una secuencia de palabras es artificial. De hecho, identifica y analiza los diferentes n-gramas en una página y los compara con otros grupos de n-gramas en otros sitios web. Un n-grama es una secuencia contigua de elementos (en este caso, palabras).
A partir de ahí, Google genera una puntuación del modelo de lenguaje y una puntuación de "query stuffing". Se trata de la frecuencia de repetición de ciertos términos en el contenido. Estas puntuaciones se combinan para calcular el gibberish score. Este último se analiza para determinar si la posición del contenido en la página de resultados debe modificarse.
🔑 Keyword Stuffing (saturación de palabras clave)
La patente en cuestión: "Detecting spam documents in a phrase based information retrieval system" (13 de diciembre de 2011)[2]
En cierto momento, muchas páginas contenían poca o ninguna información útil, ya que encadenaban palabras clave sin preocuparse por el significado de las frases. La actualización de su algoritmo permitió a Google poner fin a esta estrategia.
La patente
La forma en que Google indexa las páginas basándose en frases completas es extremadamente compleja. Abordar esta patente (que, por cierto, no es la única sobre este tema) es un primer paso para comprender el impacto de las palabras clave en la indexación.
El sistema de Google que permite la comprensión de las frases puede desglosarse en tres etapas:
- El sistema recopila las expresiones utilizadas, así como las estadísticas relacionadas con su frecuencia y co-ocurrencia.
- Luego los clasifica como buenos o malos en función de las estadísticas de frecuencia que ha recopilado.
- Finalmente, utilizando la medida predictiva que el sistema ha establecido a partir de las estadísticas relacionadas con la co-ocurrencia de palabras, refina el contenido de la lista de expresiones consideradas buenas.
La tecnología utilizada por Google para realizar estas etapas puede causar dolores de cabeza. Por eso, vamos al grano.
¿Cómo permite este sistema a Google identificar casos de keyword stuffing?
Además de poder determinar cuántas palabras clave se utilizan en un documento dado (obviamente, un documento con una densidad de palabras clave del 50% es un caso de keyword stuffing), Google también puede medir la cantidad de expresiones relacionadas con una palabra clave (estas son las palabras clave LSI).
Un documento normal generalmente tiene entre 8 y 20 frases relacionadas, según Google, en comparación con 100 o incluso hasta 1.000, para un documento que utiliza métodos de spam.
Al comparar las estadísticas de los documentos que utilizan las mismas consultas clave y expresiones relacionadas, Google puede determinar si un documento emplea un mayor número de palabras clave y expresiones relacionadas que el promedio.
🕵️♂️ Cloaking
La patente en cuestión: "Systems and methods for detecting hidden text and hidden links" (5 de marzo de 2013)[3]
Esto permite que un sitio web sea referenciado como algo que no es. Imagina un disfraz que permite a un sitio deslizarse entre los resultados de búsqueda. Solo será descubierto si un usuario hace clic en él y nota una diferencia.
Hay varias formas diferentes de ocultar un sitio web. Puedes:
- colocar texto detrás de una imagen o un video;
- establecer el tamaño de tu fuente a 0;
- ocultar enlaces insertándolos en un solo carácter (un guion entre dos palabras, por ejemplo);
- usar CSS para posicionar tu texto fuera de la pantalla...
Estas tácticas de ocultación permiten aumentar artificialmente el posicionamiento de una página. Así, es posible colocar una lista de palabras clave no relacionadas con el tema de la publicación en la parte inferior de la página en blanco sobre fondo blanco.
En su patente, Google explica que su sistema puede descubrir este tipo de engaños inspeccionando el Document Object Model (DOM).
El DOM de una página permite a Google recopilar información sobre los diferentes elementos de la página. Estos incluyen: el tamaño del texto, el color del texto, el color de fondo, la posición del texto, el orden de las capas y la visibilidad del texto.
👀 Ejemplos de sanciones SEO relacionadas con las patentes de Google
Los errores descritos anteriormente, ya sean intencionales o accidentales, te exponen a sanciones severas.
Google no tiene en cuenta ni el tamaño ni la notoriedad del sitio web y penaliza a todos los usuarios que violan las reglas. ¡Incluso se han penalizado a sí mismos!
Aquí hay algunos ejemplos de sanciones administradas a sitios web de renombre.
Rap Genius
El sitio estadounidense que enumera las letras de canciones de rap pidió a los blogueros que insertaran enlaces que apuntaran a su sitio. A cambio, prometieron tuitear las publicaciones de los blogueros.
Esto constituye una granja de enlaces y Google rápidamente penalizó el sitio web. El sitio fue eliminado de la primera página de resultados, en todas las expresiones clave, ¡incluso en su propio nombre! La sanción duró diez días.
BMW
BMW comete un gran error al decidir utilizar el cloaking para mejorar su posicionamiento. Esto sucedió en 2006 y, incluso en ese momento, Google logró detectar la infracción. Las marcas reconocidas como BMW no están exentas de sanciones. Su sitio web fue desindexado durante tres días. Para una marca de este tamaño, esta es una penalización enorme que dañó la imagen de la empresa.
JCPenney
Las compras de enlaces por parte de la empresa JC Penney fueron descubiertas por un periodista del New York Times. Este último notó que cada una de las páginas estaba extremadamente bien posicionada. La mayoría de sus contenidos fueron eliminados de la primera página. Esta sanción duró 90 días. Su tráfico cayó más del 90%. JC Penney rápidamente despidió a la empresa encargada de su SEO y limpió su sitio web.
Google Japón
No es una broma. Google se sancionó a sí mismo. Resultó que Google Japón estaba comprando enlaces para promocionar el widget de Google. ¿Su sanción? Su PageRank fue degradado de PR9 a PR5 durante un período de 11 meses.
Este tipo de estrategias de SEO puede resultar en sanciones, como la degradación del PageRank, la eliminación de la primera página e incluso la desindexación total del sitio web, dependiendo de la gravedad de la falta.
Al repasar estas patentes, ahora tienes información crucial para evitar una penalización de Google. Por supuesto, algunos especialistas en SEO son expertos en leer entre líneas de las patentes y otras recomendaciones de Google. Así, sus prácticas de Black Hat siguen funcionando en la actualidad. ¿Pero hasta cuándo?
Los riesgos en caso de actualización del algoritmo o revisión manual de los datos son, en mi opinión, demasiado importantes para seguir actuando de esta manera. Además, con la llegada de la búsqueda por voz y el auge de las consultas de cola larga, el keyword stuffing y el cloaking definitivamente ya no valen la pena.
Por supuesto, para que tu estrategia SEO sea rentable, requiere tiempo, dedicación e inversión (en tiempo y dinero). ¡Y especialmente si tu campo es muy competitivo! Sin embargo, hoy en día existen técnicas de White Hat y respetuosas con el usuario que te permiten hacerte un lugar en la SERP:
- respeta las recomendaciones de Google (especialmente los criterios EAT),
- contrata a redactores web capacitados en SEO,
- recibe asesoramiento de consultores de posicionamiento que no te prometan montañas y maravillas en pocas semanas.
🙏 Fuentes utilizadas para redactar este artículo
Need to go further?
If you need to delve deeper into the topic, the editorial team recommends the following 5 contents: