A la hora de iniciar una estrategia con una agencia SEO, es fundamental tener una estructura interna optimizada para favorecer el posicionamiento en buscadores. Los motores de búsqueda envían periódicamente un bot que se encarga de leer tu sitemap y utilizarlo para rastrear tu web. El mapa del sitio es clave en este punto, ya que actúa como un mapa de contenidos de tu sitio web que va guiando al robot, mostrándole cómo están organizadas las páginas y la importancia que tienen entre sí. Después de realizar el rastreo el bot determina que hay en la página y cuál es la intención de la misma. ¡Si quieres saberlo todo sobre los sitemaps sigue leyendo!
¿Qué es un Sitemap?
Un sitemap es un archivo en formato XML que lista las URL’s de un sitio web. Su principal función es informar a los motores de búsqueda sobre las páginas que están disponibles para su rastreo e indexación. Al proporcionar este archivo a herramientas como Google Search Console, se facilita que los motores de búsqueda comprendan la estructura del sitio, identifiquen todas sus páginas y determinen cuáles son más relevantes.
Además de listarlas, se encarga de obtener información de cada una de las páginas como cuándo fue la última actualización, con qué frecuencia cambia y cuál es su relevancia en relación con las demás páginas del sitio web. Esta información ayuda a los motores de búsqueda a rastrear el sitio de manera más eficiente, garantizando que se indexen las páginas más recientes o relevantes.
Por tanto, cumple una doble función. Sirve para establecer prioridades de rastreo por parte de los motores de búsqueda y además nos ayuda a estructurar la web y facilitar la navegación de los usuarios que la visitan.
Diferencias entre el Sitemap HTML y el Sitemap XML
El sitemap HTML está principalmente diseñado para usuarios humanos. Su objetivo es presentar de forma estructurada el contenido de un sitio web para mejorar la experiencia de navegación de los usuarios. Mientras que el sitemap XML se crea específicamente para los motores de búsqueda. Su misión es guiar a los robots de Google a través del sitio web, asegurándose de que todas las páginas se indexen correctamente.
A continuación te mostramos una tabla comparativa:
Diferencias | Sitemap HTML | Sitemap XML |
---|---|---|
Objetivo | Ayuda a los usuarios a navegar en el sitio | Informa a los motores de búsqueda sobre las páginas disponibles para su rastreo |
Estructura | Estructura de árbol con categorías y subcategorías | Lista de URL’s |
Destinatario principal | Usuarios humanos | Motores de búsqueda |
Ubicación | Presente en páginas “mapa del sitio” para mejorar la navegación | Enviados a Google Search Console para mejorar la indexación |
Inclusión de metadatos | Raramente. Se centra en la navegación | Suele incluir datos como “changefreq”, “lastmod” y “priority” |
Actualización | Se actualiza según los cambios de diseño o estructura del sitio web | Frecuente para reflejar nuevas páginas o cambios en el sitio web |
Extensión y tamaño | Variable dependiendo del sitio web, sus categorías y subcategorías | Limitado a 50MB sin comprimir o 50.000 URL’s |
Importancia del Sitemap para los usuarios
Este sistema de organización del contenido está diseñado principalmente para ayudar a los motores de búsqueda a rastrear las páginas web y en consecuencia facilitar su indexación, sin embargo, su optimización también tiene repercusión sobre los usuarios que navegan por la página web.
Los sitios web no son elementos estáticos, sino que se mantienen en constante evolución. La escritura de entradas de blog o la introducción de nuevos productos y/o servicios para ofrecer a tus clientes, van a necesitar la ayuda de un mapa del sitio que ayude a mantener actualizado el contenido.
A medida que se añaden páginas al sitio web, disponer de uno facilitará que los robots de Google puedan encontrarlas y categorizarlas para posteriormente mostrar rápidamente ese contenido específico a los usuarios. Por este motivo se recomienda especialmente su creación para webs con una gran cantidad de páginas, sin embargo, también es recomendable su uso en webs con un número de páginas más pequeño o webs de reciente creación.
¿Cómo repercute en el SEO?
La creación de un sitemap forma parte del SEO técnico y de la estrategia de SEO On-Page, ya que permite la optimización del contenido del sitio web de forma que sea más sencillo su rastreo e indexación. La claridad y sencillez de la estructura es determinante si buscamos un rastreo rápido de la web. En este sentido, podemos indicar cuáles son las páginas por las que queremos que pasen directamente los robots de Google sin perder tiempo rastreando otras páginas que no aportan valor. Si le facilitamos la tarea a los motores de búsqueda, la página rastreada será recompensada con una mayor visibilidad en los buscadores, afectando positivamente al SEO.
Beneficios en el SEO
Tener un sitemap optimizado es altamente recomendable ya que, además de facilitar el trabajo a los motores de búsqueda, tiene efectos positivos sobre el SEO:
- Mejoras en la indexación: Proporcionarlo de forma clara y actualizada, garantiza que los motores de búsqueda estén al tanto de todas las páginas de tu sitio web, incluidas las nuevas o aquellas que podrían ser difíciles de encontrar mediante rastreo convencional.
- Priorización de contenido: Puedes indicar a los motores de búsqueda que páginas son más importantes o relevantes, utilizando el atributo «priority». Esto puede influir en cómo los motores de búsqueda rastrean e indexan tu contenido.
- Actualizaciones rápidas: Al incluir metadatos como la fecha de la última modificación, los motores de búsqueda pueden saber rápidamente qué páginas se han actualizado recientemente, lo que acelera el rastreo.
- Rastreo más eficiente: Tenerlo optimizado, reduce el rastreo innecesario de páginas que no han cambiado, lo que puede ahorrar recursos del servidor.
- Facilidad de acceso para los bots: Si un sitio tiene una estructura de navegación compleja o basada en scripts, puede asegurar que los motores de búsqueda accedan a todas las páginas.
Al mejorar la indexación y el rastreo, el sitio web tiene una más probabilidad de aparecer en los resultados de búsqueda para consultas relevantes, o dicho de otro modo, mejora su posicionamiento orgánico en buscadores (SEO).
¿Cómo crear un Sitemap?
Más allá del método utilizado para crearlo, lo primero que se debe comprobar es la estructura del sitio web. Cuanto más sencilla sea su estructura, más fácil será el posicionamiento y lectura por parte de los buscadores. A continuación te mostramos las diferentes formas que tienes de crear uno:
Manualmente
Crear un mapa del sitio manualmente es un proceso que requiere atención y conocimientos mínimos trabajando con HTML. Este método es más adecuado para sitios web pequeños con una cantidad limitada de páginas.
Para hacerlo debes crear una lista de todas las páginas del sitio web, organizándolas jerárquicamente. Considera categorías, subcategorías y páginas individuales. A continuación debes crear un archivo de texto con extensión .xml y rellenarlo con código relevante. Antes de subirlo, valida el código usando una herramienta de validación para asegurarte de que no haya errores.
Automáticamente
Crearlo automáticamente es una opción recomendable si estás utilizando un sistema de gestión de contenido como WordPress. Lo primero que tienes que hacer es elegir un plugin, instalarlo y activarlo en WordPress. A continuación, sigue las instrucciones del plugin para configurarlo. Estos plugins generan automáticamente un sitemap basándose en el contenido existente en el sitio web y lo mantienen siempre actualizado.
Si el plugin lo permite puedes excluir ciertas páginas o ajustar la frecuencia de rastreo. Aunque el proceso es automático, es recomendable revisar la información generada por el plugin para asegurarse de que todo está en orden.
Envíalo a Google Search Console
Una vez que lo hayas creado, es crucial enviarlo a Google Search Console para asegurarte de que Google lo rastree e indexe. Antes de hacerlo debes verificar la página web en Google Search Console. Esto se puede hacer a través de varios métodos, como cargar un archivo HTML específico o configurar una etiqueta meta en tu página de inicio. Una vez verificado, en Google Search Console ve a la sección «Sitemaps» e introduce su URL y haz clic en «Enviar». Recuerda que debes evitar incluir URL’s redirigidas cuando lo envíes.
¿Cómo monitorizar el rendimiento de tu Sitemap?
Monitorizar el rendimiento de un mapa del sitio es crucial para asegurarte de que está cumpliendo su función y que los motores de búsqueda pueden acceder, rastrear e indexar correctamente tu sitio web. En la actualidad existe un gran abanico de herramientas que nos permiten comprobar el estado del sitemap, algunas de las más relevantes son:
- Google Search Console: Permite comprobar si ha sido aceptado por parte de Google sin errores. Muestra las URL’s que Google no ha podido rastrear, junto con las razones del fallo y el total de páginas que están indexadas por Google.
- Plugins: Si usas CMS como WordPress, existen plugins que no solo te ayudan a generarlos, sino que también te proporcionan herramientas para monitorizar y diagnosticar problemas.
- Screaming Frog o Semrush: Permiten rastrear tu sitio como lo haría un motor de búsqueda, ayudándote a identificar errores, redirecciones, enlaces rotos y otros problemas que podrían afectar el rendimiento del mapa del sitio.
- Google Analytics: Monitoriza el tráfico que llega a un sitio web. Permite detectar posibles disminuciones significativas o falta de tráfico en páginas que deberían estar bien representadas en el sitemap.
- Pingdom: Es capaz de escanear internamente el sitio web para analizar todos los elementos y detectar posibles anomalías que hagan que se vuelva inaccesible.
- Revisión manual: Aunque es la forma más lenta de revisar un mapa del sitio, sobre todo si se trata de sitios web grandes, revisarlo manualmente puede ayudarte a identificar problemas como enlaces rotos, páginas obsoletas o estructuras confusas.
¿Qué aspecto tiene un Sitemap?
Visualmente, el mapa de contenidos de una página web tiene una apariencia muy reconocible. Aunque todos presentan similitudes, también existen diferencias notables entre ellos.
Sitemap HTML
La organización generalmente sigue una estructura jerárquica, y puede parecerse a una lista de contenidos que encontrarías en un libro. Estas categorizaciones permiten una navegación más intuitiva y una mejor comprensión del alcance del contenido del sitio web. A continuación te mostramos un ejemplo de la estructura que suele tener un mapa del sitio de este tipo.
Las categorías hacen referencia a las principales áreas temáticas bajo las cuales se agrupa el contenido del sitio web. Reflejan las principales ofertas, servicios o tipos de información presentes en la web. Su propósito es segmentar el contenido de manera lógica y estructurada facilitando la navegación de los usuarios y permitiéndoles encontrar fácilmente lo que buscan.
Las subcategorías son divisiones específicas dentro de una categoría que desglosan el contenido en segmentos más manejables y específicos. Permiten una navegación más detallada ayudando a los usuarios a dirigirse de una forma más directa al contenido que buscan.
Sitemap XML de URL’s
En un sitemap de URL’s la primera línea de código es común a todos y nos indica la codificación a usar, en este caso UTF-8. A continuación estableceremos el tipo de sitemap a través de la etiqueta <urlset> que hace referencia al protocolo y formato mediante xmlns. En este caso listaremos las diferentes URL’s mediante la etiqueta <url> que se encarga de declarar y separar cada una de las URL’s de nuestro sitio web que queremos indexar en los buscadores.
El contenedor <url> tiene las siguientes propiedades:
- <loc>: Se trata de una propiedad obligatoria que indica la dirección URL que queremos indexar. No debe exceder los 2.048 caracteres y debe empezar con http o https.
- <lastmod>: Esta propiedad no es obligatoria y hace referencia a la fecha en que se modificó por última vez la URL que queremos indexar. Su formato debe ser aaaa-mm-dd y puede incluir la hora y franja horaria.
Debemos conocer la existencia de las siguientes propiedades que forman parte del contenedor <url> , aunque actualmente Google ignora estos valores:
- <changefreq>: Con esta propiedad opcional aportamos a los motores de búsqueda información más precisa sobre cúal es la frecuencia de actualización de la URL. Los valores admitidos son “always”, “hourly”, “daily”, “weekly”, “monthly”, “yearly” y “never”.
- <priority>: Esta propiedad indica el grado de importancia que tiene una URL dentro del sitio web. Los valores admitidos van desde 0.0 hasta 1.0 y le ayudan a los motores de búsqueda a decidir qué páginas rastrear primero, siendo 0.5 el valor por defecto. Aplicar un valor de 1.0 a todas las páginas carece de sentido ya que no todas las páginas del sitio web tienen el mismo peso y esta práctica tampoco nos va a ayudar a posicionarlas mejor.
Propiedad | Utilidad principal |
---|---|
<loc> | Identificar la ubicación de la URL |
<lastmod> | Informar sobre la fecha de última modificación |
<changefreq> | Estimar frecuencia de cambios en la página |
<priority> | Indicar relevancia de la página en el sitio |
Sitemap XML de imágenes
Es habitual encontrar imágenes y URL’s mezcladas en un mismo sitemap, esto no es necesariamente perjudicial, sin embargo, a la hora de crear un índice del sitio o dar las directrices para su creación es posible separar el sitemap de URL’s y el de imágenes.
En el ejemplo anterior se muestra un sitemap normal con una extensión de sitemap de imágenes que incluye dos elementos <url>. A su vez cada uno de ellos contiene las propiedades <loc>, <image:image> e <image:loc>:
- <image:image>: Esta propiedad incluye toda la información relativa a una única imágen. En una misma etiqueta <url> podemos llegar a encontrar hasta 1.000 etiquetas de este tipo.
- <image:loc>: Indica la URL de la imagen que queremos mapear y se ubica dentro de la etiqueta <image:image>.
Propiedad | Utilidad principal |
---|---|
<image:image> | Definir un bloque específico para una imagen dentro del sitemap XML |
<image:loc> | Identificar la ubicación exacta de la imagen en el sitio web |
Índice de Sitemap
Un sitemap index, es útil cuando tienes múltiples mapas del sitio para una página web, lo cual es común en sitios web grandes. Sirve como una especie de tabla de contenidos que señala a los motores de búsqueda hacia tus sitemaps individuales. El siguiente ejemplo se ha simplificado y hace referencia a un índice que apunta a dos sitemaps individuales.
La primera línea indica el tipo de codificación, normalmente UTF-8. Además existen una serie de etiquetas de uso obligatorio necesarias para que Google pueda hacer uso de ellos:
- <sitemapindex>: Se trata de la etiqueta superior del árbol XML. Indica que nos encontramos ante un índice y actúa como contenedor del resto de etiquetas. Permite agrupar múltiples sitemaps en un archivo principal.
- <sitemap>: Hace posible el listado de los diferentes sitemap. Contiene a su vez las etiquetas <loc> y <lastmod>, de las cuales podemos hacer la misma interpretación que en el caso anterior.
Propiedad | Utilidad principal |
---|---|
<sitemapindex> | Definir el inicio de un índice de sitemaps |
<sitemap> | Especificar un sitemap individual dentro del índice |
Todas las etiquetas utilizadas deben cerrarse en órden, de forma que comenzamos cerrando las últimas hasta llegar a las primeras. Una vez finalizado el listado, cerramos la primera etiqueta que abrimos mediante </sitemapindex>.
Errores comunes al crear un Sitemap
Mantener un archivo de este tipo libre de errores puede ayudarnos a mejorar la experiencia del usuario y el posicionamiento SEO. Algunos de los errores más frecuentes que podemos encontrar son:
- URL’s erróneas: Incluir URL’s que llevan a páginas 404 o que no existen así como páginas con códigos de respuesta 301 de redirección permanente o 302 de redirección temporal tampoco es recomendable. Lo óptimo únicamente es la inclusión de URL’s que envían códigos de respuesta 200, los cuales implican que la petición realizada por el robot se ha recibido correctamente y puede ser atendida por el servidor.
- Páginas no indexables: Incluir URL’s de páginas que tienen la etiqueta noindex. Si le dices a los motores de búsqueda que no indexen una página, no tiene sentido incluirla en el sitemap.
- Tamaño demasiado grande: Su tamaño no debe exceder los 50,000 URL’s ni ser mayor de 50 MB sin comprimir. Si tu sitio web tiene más URL’s, deberás dividirlo en varios archivos y usar un índice de sitemap.
- Falta de actualización: No actualizarlo cuando se agregan, modifican o eliminan páginas.
- Falta de coherencia con el archivo robots.txt: Bloquear URL’s en el archivo robots.txt pero incluirlas en el sitemap.
- No incluir metadatos: Aunque no es obligatorio, es recomendable añadir metadatos como <lastmod>, <changefreq< y <priority> para proporcionar más información a los motores de búsqueda.
- Usar URL’s no canónicas: Incluir URL’s que no son la versión canónica de una página.
- Incluir páginas irrelevantes: Agregar páginas que no aportan valor, como términos y condiciones, políticas de privacidad, etc.
- No enviarlo a los motores de búsqueda: Una vez creado, es importante enviarlo a herramientas como Google Search Console para asegurarse de que sea rastreado.
- Formato incorrecto: Errores en la estructura del XML o en la declaración de namespaces pueden invalidar el mapa del sitio.
- No comprobar errores después de enviarlo: Una vez que lo envíes, es importante revisar regularmente si hay errores reportados y corregirlos.
- No protegerlo: Si contiene información que no deseas que sea pública, como URL’s de áreas privadas, es un error no protegerlo adecuadamente.
Conclusiones
Como hemos visto, la optimización para los motores de búsqueda es una herramienta indispensable que garantiza la visibilidad y el acceso al contenido de un sitio web. Dentro de esta estrategia SEO, los sitemaps desempeñan un papel crucial, es por ello que además de tener uno, debemos garantizar su calidad y coherencia. Si necesitas ayuda con tu sitemap, ya sea con su creación u optimización, contáctanos y nuestro equipo de SEO que conoce todos los requerimientos para lograr un sitemap efectivo se pondrá a trabajar para ayudarte a mejorar el posicionamiento orgánico de tu web. No lo dudes más y ponte en contacto con Okisam.