¿Qué es un sitemap.xml y cómo usarlo correctamente?

Un sitemap es un anglicismo que significa «Mapa del sitio», es decir, un archivo (o una url) que contiene todas y cada una de las páginas de una web. Y sirve basicamente para que los motores de búsqueda indexen tu sitio. Eso si, debes hacer que uno de los robots lo «crawlee».

Como dijo Pikotaro en PPAP: «I have a XML, I have a Sitemap»

Crear un sitemap.xml

Existen varias formas de generar un Sitemap. Realmente es un proceso simple, eso si, hay que hacerlo de la manera correcta porque de lo contrario podemos complicar mucho nuestra web desde un punto de vista SEO.

Dependiendo de nuestras necesidades, podremos utilizar diferentes herramientas para la creación y actualización automática de nuestro sitemap.xml.

Lo primero de todo. Tienes que saber qué contenido quieres que Google indexe, es decir, si quieres que Google muestre en los resultados de búsqueda categorías, etiquetas, y atributos.

¿Que es más útil?

Lo más útil siempre es evitar que se nos generen URL’s automáticas, sí es que vamos a atacar unas palabras claves específicas. Automáticamente se generan URL al estilo «tupacbruch.com/2021/04/08/etcétera». Si nosotros queremos atacar la keyword «etcétera» , lo que tenemos que hacer es hacer una URL específica que sea: «tupacbruch.com/etcétera».

Una vez que hemos decidido esto, vamos a ver cómo generar un .xml.

Xml en WordPress

La mejor opción en la actualidad es utilizar el sitemap.xml que genera el plugin de Yoast SEO. Esta herramienta nos generará las urls .xml de los diferentes tipos de contenido que queremos que se indexe.

Para ello tienes que ir al apartado «General» del plugin y en «Características» bajas hasta donde dice «Mapas del sitio XML». Verás que hay un interrogante al lado de esa frase. Haz clic en él y te aparecerá un enlace que dice «Ver mapa del sitio XML».

Imagen de muestra de los sitemaps en Yoast SEO

He configurado el plugin Yoast para que no indexe ni categorías, ni etiquetas, ni plantillas, ni archivos que van metiendo diferentes plugins que se instalan (bueno bueno bueno, algunas cosas si). Desde el mismo Yoast, le podes decir qué quieres que se te indexe y qué no.

A continuación vamos a Google Search Console y en el apartado «Sitemaps» colocaríamos esas urls y mandaríamos esos sitemaps a Google para que los localicen y los utilicen como archivo de apoyo a la indexación de los contenidos de tu web.

Una recomendación más en cuanto a WordPress es la de no utilizar el plugin XML-Sitemap. De un tiempo a esta parte está dando muchos errores a la hora de que Google, a través de Search Console, pueda leer los sitemaps que genera.

Errores y Advertencias

Cuando subas tus sitemaps a Search Console, puede que te encuentres con avisos de advertencia o de error como en este caso:

Ejemplo de errores.

Las advertencias indican por lo general que en el listado de urls estamos enviando algunas que, bien por robots.txt o por meta robots, estamos pidiendo su no indexación. No pasa nada porque existan estas advertencias, pero sería recomendable eliminar del sitemap esas urls.

En cuanto a los errores, generalmente se producen por fallos en la configuración o la formulación del archivo. Revísalo porque, en caso contrario, tu archivo sitemap no servirá de nada.

Prestashop:

Un módulo de Prestashop (No relacionado con Sebastián Presta) que te solucionará todos los problema relacionados con el sitemap.xml y sus actualizaciones automáticas es el Google Sitemap. Tal y como ocurre con WordPress, no olvides configurarlo o llenarás tu archivo sitemap de contenidos indeseados

Prestashop ejemplo.

Joomla:

Como ocurre con WordPress y Prestashop, en Joomla también existen gran cantidad de componentes o plugins para la generación y actualización automática del sitemap. Uno sencillo y que funciona a la perfección el Sitemap Generator. La única pega de este plugin es que, si tu web cuenta con más de 500 urls, tendrás que utilizar la versión de pago.

Para webs de programación hechas a medida o proyectos muy grandes, lo mejor es que programes la generación de tu propio sitemap automático. Si se trata de proyectos pequeños, puedes hacerlos a mano o utilizar herramientas online como https://www.xml-sitemaps.com/

Generar archivos sitemap para otros proyectos

El sitemap.xml es un archivo que se sube al FTP junto con el resto de contenidos de nuestra web y que sirve para listar todas las urls indexables de nuestro site, con el objetivo de que los buscadores puedan encontrarlas de manera sencilla. Es decir, un listado de urls de nuestra web para los buscadores.

Su uso permite que las arañas puedan encontrar de una manera rápida y sencilla todas las páginas que queremos indexar, sin necesidad de tener que estar navegando a través de nuestros enlaces internos.

Sin embargo, su uso no garantiza una indexación completa de todas las urls, ya que los buscadores determinarán, como hacen siempre, de qué contenidos deben valerse.

¿Cómo configuro un sitemap.xml en mi web?

Dependiendo del CMS o la programación de tu web, podrás utilizar diferentes herramientas para la creación del sitemap.xml. Independientemente de ello, debes saber que los sitemap se rigen mediante unos protocolos marcados por sitemaps.org.

Según estas directrices, un sitemap puede configurarse de la siguiente manera:

Configuración estándar de Schema.org

La primera línea de código marca la codificación del archivo y es obligatoria, mientras que la etiqueta urlset marca el listato de urls y debe tener una apertura y un cierra obligatorios.

Dentro del <urlset>, encontraremos tantas etiquetas <url> como páginas queramos mostrar en nuestro archivo sitemap.xml.

¿Qué hay en las etiquetas <url>?

Por último, dentro de cada etiqueta <url> encontramos cuantro etiquetas de información diferentes:

<loc> Sirve para introducir una url única. Es una etiqueta de uso obligatorio.

<lastmod> Indica la fecha de la última modificación textual o de programación en dicha url. Su uso no es obligatorio.

<changefreq> Esta etiqueta indica la frecuencia en la que se realizan modificaciones textuales o de código en esa url. Su uso no es obligatorio.

<priority> Indica en un rago de 0 a 1 la importancia que el webmaster atribuye a esa url en concreto respecto a la web en su conjunto. Su uso no es obligatorio.

El uso correcto de las etiquetas

En muchos casos, en los sitemap.xml que faltan todas o algunas de las etiquetas lastmod, changefreq o priority. No pasa nada si faltan, ya que su uso no es obligatorio, y no aportan mucho.

Pero si debemos tener en cuenta que, por mucho que indiquemos en nuestro sitemap la importancia, la última modificación o la frecuencia de cambio que nosotros condiremos oportunos, Google y el resto de buscadores ya obtienen esa información a través de sus bots.

Algunas especificaciones técnicas más

También hay que tener en cuenta un par de aspectos técnicos más sobre el archivo sitemap.xml:

  • Su peso: No puede ser mayor a 50 MB.
  • Cantidad de URLs: No pueden haber más de 50k urls.

Si tu proyecto que supera esos datos, tendrás que pensar en crear más de un archivo sitemap.xml. De hecho, hacerlo es muy recomendable para proyectos grandes, ya que si creas diferentes dependiendo del tipo de contenido, podrás tenerlos mucho más controlados de cara a cualquier cambio o modificación en el futuro.

Porque, tampoco lo olvides. Si el sitemap es un listado de todas las urls indexables de tu web, deberás tenerlo siempre al día y actualizado ante subidas o bajadas de urls en tu site.

Sitemap de sitemaps

Cuando optas por dividir tus contenidos en diferentes sitemaps, debes saber también que existe la posibilidad de hacer un «sitemap de sitemaps». O lo que es lo mismo, un listado de todos los sitemaps de tu site.

La configuración de los sitemaps individuales debe realizarse igual que como hemos comentado anteriormente, mientras que el listado de sitemaps se configuraría de la siguiente manera:

Sitemap de sitemaps | Info de Sitemap.org

Como podemos observar, las principales diferencias son:

<sitemapindex> Sustituye a la etiqueta urlset. Indica que se trata de un listado de sitemaps, en lugar de un listado de urls.

<sitemap> Sustituye a la etiqueta url. Indica que se trata de un sitemap y no de una url.

<loc> Se mantiene igual que el sitemap individual y su uso es obligatorio.

<lastmod> Sirve para indicar la última modificación de dicho sitemap, pero su uso no es obligatorio.

50 elementos a comprobar en un checklist seo

Conclusión:

Si tenes un sitio web es practicamente indispensable que tengas un sitemap subido a los principales motores de búsqueda como por ejemplo a Google Search Console o Bing!, porque sino la indexación de tu sitio a los moteres será muy lento, se hará, pero el 12 de junio… ¿El 12 de junio?… Si, porque es el día del arquero.

error: Content is protected !!