Sitemap: Aprende que es, cómo funciona y a generar el mapa de un sitio para indexar rapidamente tu web

Según Google Maps, ir desde El Cairo hasta Jerusalén se tarda 6 días. Entonces, uno se pregunta, ¿por qué Moisés tardó 40 años?, quizás porque iba caminando, tal vez porque no existió, o simplemente porque no tenía un mapa. Da igual cuál de las opciones es la correcta, pues, lo cierto es que un mapa acelera las cosas. Lo mismo ocurre con la indexación de nuestro sitio web, pues, un sitemap.xml facilita el proceso.

Un sitemap es un anglicismo que significa mapa del sitio. Se llama así, porque es un archivo que contiene todas y cada una de las URLs de un determinado sitio web. Sirve básicamente para que los motores de búsqueda indexen tu sitio.

Eso sí, debes hacer los robots puedan rastrear los sitios, y que los indexe. Por este motivo, el Sitemap también es útil para el SEO, y el posicionamiento web.

Palabras clave, link building, escaneabilidad, tiempo de carga, diseño responsivo. Todos estos son factores de ranking muy importantes para conquistar la tan soñada cima en la página de resultados. Pero nada podría ocurrir fluidamente sin un sitemap.

¿Querés saber cómo? Bueno, hoy veremos esto así que continuá leyendo el post hasta el final.


¿Qué es un sitemap?

Probablemente, ya hiciste organigramas jerárquicos en el colegio, ¿no es así?. Bueno, porque un sitemap es más o menos eso, pero con juegos de azar y mujerzuelas direccionamientos de URLs.

Como el propio nombre lo dice, es un mapa de tu sitio web. Contiene la información que indica el camino correcto que debe ser recorrido por un rastreador.

El rastreador o crawler es un robot que rastrea enlaces por todo el internet localizando páginas web relevantes para cada búsqueda. En este caso, Google tiene el Googlebot, Bing tiene el Bingbot, etc.

Pensá en la situación de Moisés que mencioné en la introducción. Sí tan solo hubiera tenido un mapa, las cosas hubieran sido diferentes, ¿no?.

Esa es la función del sitemap, ayudar en el trabajo del robot de Google. Esto hará con que los procesos de indexación se vuelvan más rápidos y eficientes. Tanto el tiempo de rastreo como el de carga de la página se volverán más ágiles.

Pues, el sitio se almacenará en la memoria caché del propio Google sí así lo deseamos.

Un sitemap contiene las URL principales de un sitio web, o sea, aquellas que serán leídas en orden prioritaria. También están contenidas las informaciones referentes a la jerarquía, arquitectura de enlaces y actualizaciones.

Pueden ser páginas de conversión, blog posts o pestañas. En síntesis, es necesario privilegiar aquellas que consideras realmente importantes para tu negocio.


¿Cuándo tenemos que usar un sitemap?

La utilización de un sitemap es recomendada para cualquier sitio web, pues facilita acelera los procesos de indexación. Cómo Google es, básicamente, el principal motor de búsqueda, debemos cargar obligatoriamente nuestro sitemap en Google Search Console.

Pero en especial, tener un sitemap es prácticamente un obligado en los siguientes casos:

1. Sitios con contenido dinámico

Para los sitios con contenido que se actualiza a diario, el hecho de tener un sitemap es esencial. Algunos ejemplos son portales de noticias, blogs corporativos, y tiendas virtuales que tienen stock muy dinámico.

2. Sitios con dificultad para un buen posicionamiento

Algunas sitios web tienen problemas para posicionar bien. Es complicado determinar de manera general los problemas de posicionamiento, para ello debemos analizar las diversas URLs.

Pero, por lo general, este problema puede darse por diversos factores, como contenido en los lenguajes Ajax, Flash, o directamente sitios creados en Wix.

3. Sitios nuevos

Sitios web que fueron creados hace poco, aún no tienen una alta autoridad de dominio. Por eso, Google puede demorar más tiempo para rastrear las páginas internas. En este caso un sitemap puede acelerar este proceso.

4. Sitios con pocos enlaces entrantes

Cuando no existen muchos enlaces de entrada para un sitio web, el crawler puede considerarlo irrelevante. Por lo tanto, para disminuir los problemas de indexación se facilita con un mapa, por esto se recomienda usar un sitemap.


¿Cuáles son los formatos de un sitemap?

Bueno, ya conocemos que son los sitemaps y cuando debemos usarlos, ahora resta ver cuáles son los diferentes formatos de sitemaps. Existen varios formatos, pues, los estándares van cambiando, y se van adaptando a los nuevos tiempos. Por eso existen diferentes modelos, veamos cuáles son estos:

1. XLM

El formato más utilizado en la web es el XLM. Consiste en una lista de URL formateadas en un lenguaje codificado, dirigido especialmente para la optimización de SEO. Puede ser creado manualmente o con la ayuda de herramientas específicas. También agrega imágenes y videos.

2. TXT

El formato TXT es más sencillo, pero tiene problemas con ciertas informaciones importantes, como la fecha de modificación de la URL y la organización jerárquica. Básicamente, es un texto que puede ser compuesto en un simple editor, como Word o el Bloc de Notas.

3. Atom-RSS

Atom-RSS es muy utilizado en blogs, en especial en los viejos cómo Blogspot, los cuales deberían migrar a otra plataforma. En él, la propia sección de noticias funciona como un sitemap, pero lleva en consideración la fecha de publicación como factor de prioridad. Funcionan de manera semejante a un agregador de contenidos en el cual el usuario puede inscribirse.

Pero esta tecnología quedó un poco obsoleta con la llegada de los XLM. Aun así aún se sigue utilizando para indexar y posicionar sitios en Blogger.


¿Qué tipos de sitemap hay?

Como internet es una atmosfera que ofrece amplias oportunidades, existen diversos tipos de negocios. Por eso, muchas veces los sitios web necesitarán diferentes tipos de sitemaps, dejando el mapa aún más específico.

Descubre, a seguir, cuáles son algunas características de cada tipo de sitemap:

1. Imágenes

Muchos sitios web se enfocan en el aspecto visual. Es el caso de bancos de imágenes, portafolios de fotógrafos e ilustradores e incluso algunos e-commerce.

Un sitemap de imágenes tiene la misma función, pero las URL citadas serán dirigidas para las fotos. Este recurso es muy importante para negocios que quieren aparecer en la cima de Google Imágenes.

2. Videos

Los videos están en alta en la atmósfera digital. Gracias a eso, es muy importante posicionarlos bien en los mecanismos de búsquedas.

Muchas veces Googlebot acaba siendo negligente con este formato de contenido, entonces hacer un sitemap es una buena idea. En él deben estar contenidas informaciones como descripción, tiempo de duración y la thumbnail «miniatura».

3. Noticias

Otro tipo de sitemap es el de noticias. Si inviertes en este tipo de media, con seguridad necesitarás un sitemap de este tipo, pues lleva en consideración la sección de noticias del blog.

Además del sitemap, será necesario seguir algunos pasos y solicitar la inclusión del artículo mediante la central de editores de Google Noticias.

4. Google Sites

Un sitio creado a través de Google Sites tendrá un sitemap creado automáticamente. Sin embargo, es necesario enviarlo a Google Search Console para tener informaciones sobre los informes.

5. Sitemap de sitemaps

Este tipo de mapa se utiliza cuando tenemos demasiados mapas en el sitio. Por eso, por ejemplo, en lugar de indexar 20 sitemaps, podremos indexar uno que contenga al resto.

Más adelante en el propio post hablaremos de esto.


Subir el sitemap a Google Search Console

Después de crear un sitemap, tenemos que subirlo de alguna manera a los motores de búsqueda. Cada motor tiene su propia manera de indexar contenido, que generalmente lo hacen los rastreadores, pero este proceso es lento.

Por eso, debemos optar por informar directamente al buscador sobre lo que queremos indexar. Pero, cómo Google es el buscador más relevante, debemos hacérselo saber primero. Para ello existen dos formas:

Añadir el sitemap desde Google Search Console

La mejor manera es hacerlo desde Google Search Console. Para esto tenemos que acceder a la pestaña del índice, y luego hacer clic en sitemap. Allí mismo tendremos la opción de escribir la URL de nuestro mapa, y lo mandamos con el botón Enviar.

Indexación dirigida desde el Robots.txt

La otra opción es hacerlo desde el archivo Robots.txt. Con este podrás dirigir el comportamiento de los crawlers, e indicarles donde puede encontrar el sitemap para indexarlo de una manera rápida y efectiva. Esto podría realizarse así:

robots.txt para http://www.ejemplo.es
User-agent: *
Disallow: /temp/
Sitemap: http://www.ejemplo.es/sitemap.xml


Buenas prácticas con el sitemap

Para mejorar el desempeño de tu sitio web, algunas prácticas relacionadas con el sitemap son recomendadas. A seguir descubre algunas de ellas:

  • Crea varios sitemaps para las diferentes categorías del sitio.
  • Aunque el límite sea de 50 mil URL, intenta mantener ese número debajo de 10 mil.
  • Utiliza URL canónicas, por ejemplo, www.tupacbruch.com.
  • Evita cambios en el protocolo de transferencia recomendado https en lugar de HTTP.
  • Visita con regularidad Google Search Console para identificar posibles errores.
  • Usa certificados SSL cómo medida de seguridad.

¿Cuáles son los beneficios?

En el SEO, una de las principales técnicas es el link building. O sea, referencias en otras páginas que redireccionan al usuario para tu sitio web.

Cuando una página no recibe muchos enlaces de entrada, puede pasar desapercibida por el bot. Por lo tanto, es necesario indicarla a Google que, de esta forma, tendrá mayor facilidad en reconocerla y posicionarla en los resultados de búsqueda.

Además, el uso de fechas indica la actualización de contenidos. Así, serán releídos por el crawler. Esta técnica de reestructuración y extensión de contenido es muy utilizada para intentar mejorar el ranking de las páginas.

Google también le da prioridad a los administradores de sitios que ayudan al bot en la lectura. Siendo esta una práctica recomendada y recompensada por el motor de búsqueda.


¿Cómo crear un sitemap?

Primero. Tenés que saber qué contenido querés indexar, es decir, si quieres que Google muestre en los resultados de búsqueda categorías, etiquetas, y atributos.

Los sitemaps pueden ser creados manualmente, pero algunos formatos exigen cierta profundidad de estudio, como las marcaciones XML.

Existen varias formas de generar un Sitemap. Realmente es un proceso simple, pero, hay que hacerlo correctamente porque de lo contrario podemos complicar mucho nuestra web desde un punto de vista SEO.

Otra opción es el software GSiteCrawler, un simulador de crawlers que analiza el sitio web y crea automáticamente el sitemap.

Por último, hay herramientas online, como XLM-Sitemaps (gratuito para sitios con hasta 500 páginas) y la extensión para navegadores Sitemap Generator.

Dependiendo de nuestras necesidades, podremos utilizar diferentes herramientas para la creación y actualización automática de nuestro sitemap.xml.

Creando un sitemap en WordPress

La mejor opción en la actualidad es utilizar el sitemap.xml que genera el plugin de Yoast SEO. Esta herramienta nos generará las URLs.xml de los diferentes tipos de contenido que queremos que se indexe.

Para ello tienes que ir al apartado «General» del plugin y en «Características» bajas hasta donde dice «Mapas del sitio XML». Verás que hay un interrogante al lado de esa frase. Haz clic en él y te aparecerá un enlace que dice «Ver mapa del sitio XML».

Plugin de Yoast

El plugin Yoast tiene muchas opciones y funciones como la de no indexar categorías, etiquetas, plantillas, o archivos, sin tener la necesidad un robots.txt. Pero lo mejor, es que te crea el sitemap automáticamente.

PrestaShop:

Un módulo de PrestaShop que te solucionará todos los problema relacionados con el sitemap.xml y sus actualizaciones automáticas es el Google Sitemap. Tal y como ocurre con WordPress, no olvides configurarlo o llenarás tu archivo sitemap de contenidos indeseados

Joomla:

Como ocurre con WordPress y PrestaShop, en Joomla también existen gran cantidad de componentes o plugins para la generación y actualización automática del sitemap.

Uno sencillo y que funciona a la perfección el Sitemap Generator. La única pega de este plugin es que, si tu web cuenta con más de 500 URLs, tendrás que utilizar la versión de pago.

Shopify y otros CMS

Da igual la plataforma CMS que utilices, la creación de sitemaps es prácticamente la misma en todos. Pues, tenés la opción de usar una aplicación comprada desde la tienda del CMS, o directamente crearlo de manera manual, como en webs a medida.

Para webs de programación hechas a medida o proyectos muy grandes, lo mejor es que programes la generación de tu propio sitemap automático. Si se trata de proyectos pequeños, puedes hacerlos a mano o utilizar herramientas online como https://www.xml-sitemaps.com/


Crear un sitemap para proyectos personalizados

El sitemap.xml es un archivo que se sube al FTP junto con el resto de contenidos de nuestra web. Este sirve para listar todas las URLs indexables de nuestro sitio, con el objetivo de que los buscadores puedan encontrarlas de manera sencilla.

Es decir, un listado de URLs de nuestra web para los buscadores.

Su uso permite que las arañas puedan encontrar de una manera rápida y sencilla todas las páginas que queremos indexar. Para esto no es necesario tener que estar navegando a través de nuestros enlaces internos.

Sin embargo, su uso no garantiza una indexación completa de todas las URLs. Pues, los buscadores determinarán, como hacen siempre, de qué contenidos deben valerse.

¿Cómo configuro un sitemap.xml en mi web?

Dependiendo del CMS o la programación de tu web, podrás utilizar diferentes herramientas para la creación del sitemap.xml. Independientemente de ello, debes saber que los sitemap se rigen mediante unos protocolos marcados por sitemaps.org.

Según estas directrices, un sitemap puede configurarse de la siguiente manera:

La primera línea de código marca la codificación del archivo y es obligatoria. Luego resta que la etiqueta <urlset> marque el listado de URLs, pues, debe tener una apertura y un cierra obligatorios.

Dentro del <urlset>, encontraremos tantas etiquetas <url> como páginas queramos mostrar en nuestro archivo sitemap.xml.

¿Qué hay en las etiquetas <url>?

Por último, dentro de cada etiqueta <url> encontramos cuatro etiquetas de información diferentes:

<loc> Sirve para introducir una URL única. Es una etiqueta de uso obligatorio.

<lastmod> Indica la fecha de la última modificación textual o de programación en dicha URL. Su uso no es obligatorio.

<changefreq> Esta etiqueta indica la frecuencia en la que se realizan modificaciones textuales o de código en esa URL. Su uso no es obligatorio.

<priority> Indica en un rango de 0 a 1 la importancia atribuida a una URL en concreto respecto a la web en su conjunto. Su uso no es obligatorio.

El uso correcto de las etiquetas

En muchos casos, en los sitemap.xml que faltan todas o algunas de las etiquetas <lastmod>, <changefreq> o <priority>. No pasa nada si faltan, ya que su uso no es obligatorio, y no aportan mucho.

Por mucho que indiquemos la importancia, la última modificación o la frecuencia de cambio que nosotros condiremos oportunos, Google hace esto por cuenta propia. Así que, a veces podría ser un proceso un tanto redundante.


Algunas especificaciones intrínsecas del sitemap

También hay que tener en cuenta un par de aspectos técnicos más sobre el archivo sitemap.xml:

  • Su peso: No puede ser mayor a 50 MB.
  • Cantidad de URLs: No puede haber más de 50k urls.

Si tu proyecto que supera esos datos, tendrás que pensar en crear más de un archivo sitemap.xml.

De hecho, hacerlo es muy recomendable para proyectos grandes, ya que si creas diferentes dependiendo del tipo de contenido. Pues, así podrás tenerlos mucho más organizados de cara a cualquier cambio o modificación en el futuro.

Porque, tampoco lo olvides de tenerlo actualizado en cuanto a las categorías.


Sitemap de sitemaps

Cuando optas por dividir tus contenidos en diferentes sitemaps, debes saber también que existe la posibilidad de hacer un «sitemap de sitemaps». O lo que es lo mismo, un listado de todos los sitemaps en un nuevo sitemap.

La configuración de los sitemaps individuales debe realizarse igual que como hemos comentado anteriormente. Sin embargo, el listado de sitemaps se configuraría de la siguiente manera:

Como podemos observar, las principales diferencias son:

<sitemapindex> Sustituye a la etiqueta urlset. Indica que se trata de un listado de sitemaps, en lugar de un listado de URLs.

<sitemap> Sustituye a la etiqueta URL. Indica que se trata de un sitemap y no de una URL.

<loc> Se mantiene igual que el sitemap individual y su uso es obligatorio.

<lastmod> Sirve para indicar la última modificación de dicho sitemap, pero su uso no es obligatorio.


Conclusión:

Bueno, llegamos al final del post sobre los sitemaps. No seas cómo Moisés, y activá el sitemap para no perderte en el desierto digital de la no indexación web.

Para finalizar, te dejo un enlace con un descuento para tu próximo sitio en WordPress. Tan solo tenés que seguir el enlace y comenzar a utilizar el sitemap en tu próxima página web.

¡Me despido por hoy!, ¡hasta la próxima!.

Consigue 25 dólares para tu próximo sitio WordPress

Tf*idf: La frecuencia de términos vs Frecuencia inversa del documento es una práctica funcional a tu SEO dentro del marketing de contenidos

Puede que te parezca extraño el título del artículo de hoy, pero, posiblemente el Tf*idf sea una métrica que seguro utilizaste sin saberlo. En especial sí tu sitio web o blog aplica marketing de contenidos para posicionarse conforme a los motores de búsqueda. Si una de las patas centrales de tu negocio o actividad profesional

Read More »

Metodología Agile: qué es y cómo aplicarla a tu proyecto de alto rendimiento en tu flujo de trabajo

Cuando hablamos de cambios y procesos tecnológicos relacionados con la transformación digital, tendremos una gran cantidad de nuevos conceptos dentro de la nube de ideas de temas relacionados. Sin embargo, sí hablamos propiamente de la gestión de proyectos, un concepto se destaca por sobre el resto, estoy hablando, de la metodología Agile. Entonces, hablando netamente

Read More »

Mindset: Aprende sobre el poder de la mentalidad positiva o growth mindset «progresivo» y a detectar tu propio mindset con ejemplos

Este es un tema muy propio del desarrollo personal, pues, tener una mentalidad correcta, es crucial para tu crecimiento. Entonces, toca hablar del Mindset, y de los marcos mentales relacionados con el mismo. El Mindset es un término que ha ganado mucha popularidad en los últimos años. Este concepto es simple y la verdad, no

Read More »

Liderazgo: Aprende qué es este concepto con definiciones y ejemplos, los tipos de líderes, algunas frases

Bueno, se viene un post cortito y serio sobre Liderazgo y desarrollo personal. El liderazgo es una cualidad importante que tienen todas las personas, independientemente de su área de interés; pues, el liderazgo se encuentra a muchos niveles y tiene muchos matices. En este post, intentaré definir el liderazgo, y mencionar los tipos de liderazgo

Read More »

Diseño web: Aprende qué es y como un diseño profesional puede ayudarte a posicionar tu sitio web con este post tutorial

Bueno, el diseño web es un área enfocada en el desarrollo de interfaces digitales, como el diseño de sitios y aplicaciones para web «Progressive Web App». Para ello, los diseñadores web crean sitios utilizando lenguajes de programación como HTML, CSS, JavaScript, e incluso otros tantos más. Pero, siempre, el motivo del diseño debe estar orientado

Read More »

Diseño: Cuando el diseño es tu pasión nada puede malir sal

— La idea de este post ocurrió mientras estaba escuchando la siguiente canción que seguramente comparta por aquí debajo. Mientras lo hacía, no paraba de pensar en el meme que dice: «el diseño gráfico es mi pasión«. Bueno, siendo justos, tampoco soy un gran maestro del diseño, pues, todo lo que engloba al diseño requiere

Read More »
error: Content is protected !!