Cloaking: Una práctica SEO cuestionable

El Cloaking es una de esas triquiñuelas semi-legales que se utilizan para intentar posicionar mejor en la web. Digo «semi-legal«, porque realmente no es una buena práctica para posicionarse en Google. Es todo lo contrario.

Sí hablamos de buenas y malas prácticas de posicionamiento en Google, podemos entender qué hay una alineación clara para ellas. Con base en ello podemos matizar una escala de luz y oscuridad; siendo la luz como el buen camino, y la oscuridad como el mal camino.

El resultado de ese matiz es dos tipos de prácticas netamente definidas. Las prácticas White hat, cómo las buenas; y las Black hat, cómo las malas; pero también, hay muchos sub matices en medio de ambas, estas son conocidas cómo Grey hat.

— ¿Y dónde entra el Cloaking?. Bueno, el Cloaking es una práctica Sasha Grey hat.

Hoy veremos eso. No, no veremos nada sobre Sasha Grey hat, solo veremos acerca del Cloaking, y por qué no es buena idea implementarlo.


¿Qué es el Cloaking en SEO?

Cloaking es un término en inglés que significa encubrir. Entonces, debido a esta premisa, la técnica del Cloaking se trata de encubrir algo. — Pero, ¿qué se busca encubrir?. Bueno, se intenta encubrir el contenido, mostrándole una cosa al Googlebot, y otra diferente al usuario.

Es justamente por este motivo qué no podría ser considerado como White hat, pues, no es muy ético anunciar una cosa y ofrecer otra. Lo mismo pasa con los productos y servicio. — ¿Te gusta cuando te ofrecen un producto milagroso, pero resulta ser otra basura más?. ¿Quién te conoce Wish.com?.

Pero bueno, no es lo mismo engañar a la gente «cómo lo hacen en AliExpress», que engañar a Google. Pues, Google es un gorila de 300 kg.

— ¿Un gorila de 300 kg?, ¿qué tiene que ver?. Bueno, es una analogía simple, pues el gorila de 300 kg es quien manda, y hace lo que quiere. ¿Por qué?, porque básicamente, es un gorila de 300 kg.


¿Cómo funciona el cloaking?

El Cloaking utiliza varias técnicas de encubrimiento, siendo una de ellas, relacionada con el servidor. Pues, desde la configuración del mismo se puede hacer que se muestre un contenido específico dependiendo del explorador usado.

Es así que, sí se detecta un bot, específicamente el de Google, se mostrará un determinado contenido de valor. En cambio, sí se detecta que es un usuario, se mostrará otro. Esto lo vemos mucho en sitios que promueven las apuestas, criptomonedas, y demás mecanismos por los cuales se puede estafar a usuarios.

Otra técnica diferente es la de ejecutar un pequeño script de JavaScript para generar redireccionamientos conforme a la misma premisa. Es decir, sí se detecta que es un usuario ocurre algo, más sí de un bot se trata, se muestra otro contenido.

Pero, al ejecutar este código, también se puede permitir que el contenido cambie según la IP. O también, se genera una meta-refresh a los 0 segundos, generando un cambio de destino URL.

Puntualmente, este último tipo de Cloaking se puede detectar de manera simple. Para ello, hay que navegar desde un navegador con el JavaScript desactivado, o incluso desde Web Developer, pero sin aceptar las Cookies.


El detalle del Cloaking

Para ir al detalle, debemos recordar que el objetivo del Cloaking es el de encubrir el contenido. Pues, generalmente los sitios que lo hacen, generalmente buscan sacar un rédito económico de usuarios que caen en las diferentes trampas.

A la hora de ver las técnicas de Cloaking, puntualmente dos grandes variables:

1. Agent name delivery

En este tipo de técnica, el acceso a un sitio web se da por medio de un «user agent«; el cual puede ser una persona o un bot. Pues, debido a estos usuarios, el servidor puede mostrar un determinado contenido, dependiendo del user agent.

Sí de una persona se trata, el contenido mostrado será afin a este. En cambio, sí el user agent es el bot, se mostrará otro contenido diferente.

Todo este proceso de mostrar un contenido dependiendo del usuario se conoce como Cloaking. Entonces, este tipo de Cloaking se conoce cómo: «Cloaking de tipo Agent Name Delivery«.

2. User IP delivery

En esta técnica, lo qué se hace es mostrar el contenido dependiendo de la IP del visitante. Pues, sí la consulta se realiza desde un lugar donde las leyes son cuestionables, podemos mostrar cierto contenido qué no se podría desde otro lugar.

Sí querés activar esta técnica, tenés que ir al archivo «.htcaccess«, y ahí mismo elegir que mostrar a tal o cual IP. Para ello tenés un módulo llamado «mod_rewrite«, donde podemos hacer estas modificaciones.

Para chequearlo, hay un plugin en WordPress conocido cómo «User agent switcher«, qué con el cual podemos ver la página cómo si fuéramos el Googlebot. Esto te ayuda mucho a comparar las dos versiones, tanto para usuarios, cómo para bots.


¿Cómo es el proceso de rastreo?

El proceso de rastro lo realizan las arañas de Google. Estas van saltando de enlace a enlace, rastreando e indexando las distintas URLs sí estas le dan permiso para hacerlo. Pues, cuando estas arañas rastreadoras llegan a una URL, estas leen todo el código, y buscan una fragmento que las habilite a indexar dicha página.

Es importante conocer este proceso. Pues, entender al Googlebot en sus dos versiones «deepbot y freshbot» nos ayudarán a entender el funcionamiento del cloaking.

Porque el deepbot se encarga de seguir los enlaces de un contenido, que resulta en la visita del sitio; y el freshboot, se encarga de buscar el contenido nuevo de la web.

El entender el manejo de ambos, nos permite ver cómo se intenta engañar al Googlebot con esta mala práctica conocida como Cloaking.


Pero, ¿de dónde sale Cloaking?

Lo cierto es qué para entender por qué alguien quiere hacer Cloaking, hay que entender primero, de donde sale esta práctica.

Es que originalmente, el Cloaking tenía un sentido de justicia por mano propia. Pues, se utilizaba en sitios difíciles de posicionar, cómo páginas web pesadas con videos, imágenes, animaciones, etc. Y lo que se pretendía era justamente, compensar esa desventaja competitiva que tenían dichos sitios.

Entonces, se le mostraba primero a los rastreadores un contenido con mucho texto y pocas imágenes. Para luego mostrarle las imágenes y el resto del contenido al usuario.

Es cierto que las tecnologías de esa época eran diferentes a las que hay a día de hoy, y la práctica no era mal vista. Pero, con la evolución del HTML, y la búsqueda de imágenes en Google, esta práctica perdió su sentido. Y conforme a esto fue mutando en otros tipos de Cloaking, hasta que dejó de ser relevante.


¿Qué tipos de Cloaking existen?

Hay muchos tipos de Cloaking o de prácticas que son muy similares. Lo importante es que, estas técnicas tienen como objetivo molestar al Googlebot y los demás rastreadores. Veamos algunos ejemplos:

1. Cloaking de Texto

El Cloaking de texto, o texto invisible, utiliza un tipo de Cloaking, en la que se pretende adicionar muchas más Keywords de manera oculta. A esta práctica también se le dice Keyword Stuffing, y busca ocultar esta información con el mismo color que el empleado en el fondo.

Es decir, escriben un texto en negro, sobre un fondo negro. De esta manera, el usuario no alcanza a ver el texto que efectivamente se encuentra en dicha URL.

Esto, además, va en contra de las normas de la WCAG que hablan sobre el alto contraste.

2. Páginas web con Flash

Bueno, como ya te habrás dado cuenta, no hay más Flash en la páginas web desde hace mucho tiempo. Este tipo de contenido ya quedó obsoleto hace mucho tiempo, pues, tenía muchos problemas de seguridad, entre otros problemas.

Pero, uno de los puntos principales, es que tampoco puede ser interpretado por los motores de búsqueda. Entonces, no ayudan al SEO de tu sitio.

En el Cloaking de Flash, se pretende mostrar un contenido específico sin flash a los motores de búsqueda, y otro con flash al usuario. Se daba mucho en las páginas web que tenían muchos virus jueguitos en macromedia flash.

3. Cloaking en e-mails

En el Cloaking de e-mails, lo que se pretende es, no mostrar quien es el remitente ni en el nombre, ni en la dirección. Pues, se utiliza un correo de tipo anónimo, ya que se pretende jugar un papel de «usuario desconocido«.

Para lograr esto se utilizan, justamente, cuentas de correo completamente anónimas o random. Una que es muy conocida es Yopmail!, la cual es una copia barata del Yahoo! de los 2000.

Mucha gente la utiliza para molestar otras personas, aunque también lo hacen para tener una cuenta demo en diferentes plataformas. ¡Sí se habrán cansado desde Netflix o PlayStation Network de recibir estas notificaciones!. Pues, esta metodología te permite tener «cuentas gratuitas«, sí creas nuevas suscripciones todos los meses.

4. Páginas web con mucho HTML

En esta situación se pretende encubrir mucha parte del código HTML o del texto. Pues, para un buen posicionamiento se recomienda un ratio alto de HTML/text.

Sí hay poco texto, se intenta ocultar de alguna manera, mucho texto repetido, con el fin de mejorar el ratio. De esta manera, se atacan más palabras clave, y hay mayores probabilidades de que te encuentren.

5. Cloaking de imágenes

Con las imágenes pasa lo mismo que con el ejemplo anterior. Para compensar que las imagenes no posicionaban «hace años», se utilizaban keywords para posicionar un sitio.

Pero con la evolución de las tecnologías, el encubrimiento de las imágenes quedó obsoleto.

6. Cloaking de geolocalización

En el Cloaking de geolocalización, se pretende mostrar diferentes páginas según desde donde estén localizados los usuarios. Muy posiblemente, esta es la táctica más moderna, que muchas páginas webs utilizan.

Sí bien mostrar un contenido para tal o cual localización está bien, hacerlo de manera maliciosa no lo es tanto. Por eso muchas veces vemos qué un determinado contenido no está disponible para nuestra ubicación.

No porque estas empresas hagan Cloaking, si no, justamente, por lo contrario, porque cumplen con las directivas de privacidad.

7. Malas prácticas de CSS y de JavaScript

Estas malas prácticas de CSS y JavaScript consisten en un Keyword Stuffing en el código. Pues, Google no es capaz de interpretar «o al menos, no lo era» estos formatos de código.

Entonces, con estas prácticas, se introducían muchas palabras clave con el fin de tener más visibilidad. Otra cosa que se hacía es, programar un horario para mostrar un contenido, y luego, en otro horario, mostrar otro contenido.

8. Cloaking de redirecciones

Este Cloaking de redirecciones es el ejemplo típico de encubrimiento. Pues, acá, lo que se hace es redireccionar al usuario conforma a la identidad de este. Sí el visitante se trata de un usuario se lo envía hacia un lugar «o no»; y sí se trata de un bot, se lo deriva a otra URL «o no».

A día de hoy, esta práctica se utiliza mucho en sitios que se catalogan cómo spam.

Hay un plugin en WordPress con el que podemos medir las redirecciones, «redirect path«.

9. SPA

El SPA o Simple Page Application, es una técnica moderna de Cloaking, desarrollada en JavaScript, que dificulta el renderizado del sitio. En este renderizado, se pretende encubrir algo en nuestro sitio web, para que dicho contenido no aparezca hasta un determinado momento.

No debe confundirse esto con el Lazy Loading, pues, el SPA es una mala práctica, penalizada por Google. En cambio, el Lazy Loading es una práctica aceptada por Google, y la beneficia.

Para analizar esto, podemos utilizar el propio plugin de Lighthouse, con el cual podemos observar todo el proceso de renderizado. Además de ver el renderizado, podremos obtener oportunidades de mejora con Lighthouse, sin duda es una app que necesitás tener si o sí.


El Cloaking en la actualidad

A día de hoy el Cloaking «en todas sus variables» no es una práctica muy utilizada, pues, Google la penaliza. Sí bien, hace un par de años era más fácil engañar a los buscadores, a día de hoy parece una práctica imposible.

Quizás solo los SEO completamente Black Hateros podrían engañar de manera efectiva a los algoritmos de búsqueda. Más temprano qué tarde, dicha práctica será descubierta y penalizada. De igual manera que lo que sucedió con el Cloaking.


¿Puedo hacer Cloaking?

— ¡Vos podés hacer lo que quieras!. Pero te voy a decir, que el Cloaking es una técnica Grey Hat «tirando a Black», es decir, no aprobada por Google.

Google, siempre insiste en qué el SEO debe ser natural y pensado en la experiencia del usuario, más no en el algoritmo. Entonces, sí, intentamos engañar a los robots, quizás podremos hacerlo por un tiempo, pero Google siempre gana. Ergo, es un riesgo que no vale la pena correr.

Además, los motores de búsquedas y los algoritmos van aplicando nuevas tecnologías, volviéndose más eficientes.

Las nuevas versiones de los buscadores ya están detectando las inconsistencias en el código «incluido el JavaScript». Entonces, ya como que no vale la pena poner esfuerzos en ello, es mejor crear contenido original, y aportar valor.


¿Estoy haciendo Cloaking?

Quizás te preguntes sí tu página web está haciendo Cloaking. Pues, Hay dos maneras muy simple de analizarlo, la primera es una comprobación manual, y la segunda es por medio de alguna aplicación.

Comprobación manual

Sí tenemos alguna sospecha de qué nuestra página web está haciendo Cloaking, debemos hacer una comprobación manual:

Para ello debemos ver el código de nuestro sitio desde el navegador, que es lo que ven tanto las personas como el bot.

Luego, hay que ir a Google Search Console y ver que es lo que está interpretando el Googlebot.

Para eso tenemos qué ir a:

  1. Cobertura
  2. Excluidas
  3. Seleccionamos alguna de las opciones, en este caso, yo utilizo las que no están indexadas.

Luego seleccionamos una URL de las no indexadas. En este caso utilicé una URL qué dice «top-of-mind-cocacola«. Luego, quiero ver que me dice el Robots.

En este caso, entro al archivo robots.txt de la propia URL, donde me dice en los sitemaps que aparece la URL; el User Agent, qué es lo que tenemos que ver; y el Disallow y Allow, que no nos importan ahora.

Justamente, en el tercer renglón vemos el User-agent, donde vemos que no hay nada extraño. Ni Agent Name Delivery, ni IP Delivery. En el caso de que haya algo fuera de lo común, nos daremos cuenta sí estamos haciendo Cloaking.

En el caso de que hay un código que no tengas ni idea qué es, deberías utilizar el Visual Studio u otro programa de esos. O directamente una herramienta online como diffchecker. Tenés que ejecutar el código desde estos programas y verás qué es lo que ve un bot.

Pero, lo más fácil es volver a poner un asterisco como figura en el ejemplo.

Comprobación automática

Pero, muchas personas no quieren complicársela tanto, entonces optan por una herramienta automatizada. En este caso, vamos a usar una herramienta vieja, llamada Cloaking Checker By Webtoolhub ↗. Es muy fácil de usar, para ello debemos:

  1. Acceder a la herramienta.
  2. Introducir la URL que queremos analizar.
  3. Ver el resultado.

La propia herramienta nos dirá sí todo está bien, o sí no lo está. En el caso de estar haciendo cloaking, podremos ver las dos versiones, tanto lo que ven las personas como los buscadores.


Conclusión:

Bueno, vimos está práctica cuestionable de SEO. Pero siempre está bueno conocer todo lo que nos respecta en el mundo digital, pues, el conocimiento no ocupa lugar.

También nos sirve para entender cómo está evolucionando el mundo del posicionamiento web, y las directrices de Google. Pues, lo que siempre es constante para el buscador es brindar una buena experiencia de usuario «UX».

Para finalizar, te dejo un banner con un regalo de 25 dólares para tu próximo sitio de WordPress. Así podes, o no, aplicar lo que vimos hoy. Yo no te lo recomiendo, pero, ¡podés intentar!.

Consigue 25 dólares para tu próximo sitio WordPress

2 comentarios en “Cloaking: Una práctica SEO cuestionable”

  1. Pingback: Robots.txt y su importancia para Google • Tupac Bruch

  2. Pingback: 💔⚡ Keyword Stuffing: ¡No abuses de las palabras clave! • Tupac Bruch

Deja un comentario Cancelar respuesta

Metodología Agile: qué es y cómo aplicarla a tu proyecto de alto rendimiento en tu flujo de trabajo

Cuando hablamos de cambios y procesos tecnológicos relacionados con la transformación digital, tendremos una gran cantidad de nuevos conceptos dentro de la nube de ideas de temas relacionados. Sin embargo, sí hablamos propiamente de la gestión de proyectos, un concepto se destaca por sobre el resto, estoy hablando, de la metodología Agile. Entonces, hablando netamente

Read More »

Mindset: Aprende sobre el poder de la mentalidad positiva o growth mindset «progresivo» y a detectar tu propio mindset con ejemplos

Este es un tema muy propio del desarrollo personal, pues, tener una mentalidad correcta, es crucial para tu crecimiento. Entonces, toca hablar del Mindset, y de los marcos mentales relacionados con el mismo. El Mindset es un término que ha ganado mucha popularidad en los últimos años. Este concepto es simple y la verdad, no

Read More »

Liderazgo: Aprende qué es este concepto con definiciones y ejemplos, los tipos de líderes, algunas frases

Bueno, se viene un post cortito y serio sobre Liderazgo y desarrollo personal. El liderazgo es una cualidad importante que tienen todas las personas, independientemente de su área de interés; pues, el liderazgo se encuentra a muchos niveles y tiene muchos matices. En este post, intentaré definir el liderazgo, y mencionar los tipos de liderazgo

Read More »

Diseño web: Aprende qué es y como un diseño profesional puede ayudarte a posicionar tu sitio web con este post tutorial

Bueno, el diseño web es un área enfocada en el desarrollo de interfaces digitales, como el diseño de sitios y aplicaciones para web «Progressive Web App». Para ello, los diseñadores web crean sitios utilizando lenguajes de programación como HTML, CSS, JavaScript, e incluso otros tantos más. Pero, siempre, el motivo del diseño debe estar orientado

Read More »

Diseño: Cuando el diseño es tu pasión nada puede malir sal

— La idea de este post ocurrió mientras estaba escuchando la siguiente canción que seguramente comparta por aquí debajo. Mientras lo hacía, no paraba de pensar en el meme que dice: «el diseño gráfico es mi pasión«. Bueno, siendo justos, tampoco soy un gran maestro del diseño, pues, todo lo que engloba al diseño requiere

Read More »
error: Content is protected !!