Como crear un Sitemaps.xml para que Google indexe tus páginas

Utiliza el archivo sitemaps.xml para indexar todas las url de tu web. El archivo sitemap.xml se ha creado para que los motores de búsqueda tipo google, bing, yahoo, etc., puedan rastrear todos los links que hay en una página web.

sitemaps google

Otros artículos que te pueden interesar:

Usos del archivo sitemaps para indexar toda tu web

1. Que es el archivo sitemap.xml

El archivo sitemap.xml es el archivo donde indicamos todas las url de nuestra web para notificar a los motores de búsqueda. Los motores de búsqueda sabrán de su existencia y procederán a rastrearlas e indexarlas para que aparezcan en sus buscadores.

2. Es obligatorio usar sitemap.xml?

No es necesario. Con esto quiero decir que google te restreará la web de todos modos. Solo si existe algún problema interno, es cuando deberíamos usar el archivo sitemap.xml.

De hecho, muchos usuarios creen que google posicionará mejor su web una vez generado el archivo sitemap.xml, cuando no tiene nada que ver con el posicionamiento ni con el SEO de tu web.

3. Que pasa si no tenemos el archivo sitemap.xml?

El problema que puede haber es que tu web tenga algún tipo de error y no se puedan rastrear todos los links desde la home. Por ejemplo, si tu web tiene enlaces internos, desde la página principal (home) deberías poder llegar a todos ellos y en todas sus combinaciones. Si no, habrás de usar el archivo sitemap.xml.

Por ejemplo, supongamos que tenemos el dominio siguiente, www.dominio.es/venta-de-muebles/barcelona/ y a la vez tenemos un javascript con todas las provincias de España. Google en principio no puede leer todos los javascript, por lo que los enlaces con todas las provincias es muy posible que no las lea. Combinaciones tipo www.dominio.es/venta-de-muebles/madrid/ www.dominio.es/venta-de-muebles/valencia/ etc., es muy posible que google no las lea y es ahí donde tendrás que hacer el archivo sitemap.xml indicando todos los enlaces que necesitas que google te rastree.

Otro punto a favor del archivo sitemap.xml es que le puedes indicar prioridades y tiempos de rastreo. Google en principio es lo bastante inteligente como para saber cuando ha de rastrear tu web y que enlaces son mas prioritarios que otros. Pero puede que tengas una web muy compleja, o que hayas cometido algunos errores SEO que marcan prioridades. Puede que tu web necesite ser rastreada cada hora porque las noticias que ofreces son muy relevantes. En este caso, hacer el archivo sitemap.xml puede ser de gran ayuda.

4. Cuando debemos generar un archivo sitemap.xml

Si en google colocamos una página nuestra después del texto “site:”, debería encontrar nuestro enlace. En caso contrario, o modificamos la programación de nuestra web o bien generamos el archivo sitemap.xml

site:www.dominio.com/pagina/

5. Como hacer un archivo sitemap.xml

El archivo sitemap.xml viene definido por un protocolo. Dicho protocolo se encuentra en la web http://www.sitemaps.org/es/protocol.html. Aquí podrás encontrar toda la información en cuanta al sitemap.xml que debes generar. Dentro de dicho archivo, deberemos indicarle la siguiente información:

  • URL del enlace
  • Fecha de actualización
  • Frecuencia de actualización
  • Prioridad relativa del enlace

Las URL que ponemos, han de ser todas del mismo dominio, no permitiéndose así los subdominio. Tampoco se puede poner http si hemos incluido url con https.

6. Etiquetas del archivo sitemap.xml

Dentro del protocolo de sitemap, existen como todo lenguaje, una serie de etiquetas que debemos usar para generar el archivo sitemap.xml. Estas etiquetas son las siguiente:

<urlset> y </urlset> son usadas para el inicio y fin del archivo

<url> y </url> son usadas para abrir y cerrar la ubicación de todos los aspectos de un único enlace

<loc> y </loc> son usadas para poner la url del enlace

<lastmod> y </lastmod> son usadas para poner la última actualización del enlace

<changefreq> y </changefreq> son usadas para indica la frecuencia de actualización del enlace. Las opciones existentes son “always” (siempre que te rastreen la web), hourly (cada 1 hora), daily (1 vez al dia), weekly (1 vez a la semana), montly (1 vez al mes), yearly (1 vez al año) y never (rastrear únicamente 1 vez).

<priority> y </priority> son usadas para indicar la prioridad relativa del enlace. Los valores asignados van de 0.0 a 1.0. Si el motor de búsqueda te va a rastrear ese día 100 enlaces, tendrá prioridad a aquellos que tengan el número mas elevado.

7. Ejemplo de sitemap.xml

<urlset>
  <url>
  <loc>http://www.dominio.es/</loc>
  <lastmod>20014-01-01</lastmod>
  <changefreq>weekly</changefreq>
  <priority>1.0</priority>
  </url>
<url>
  <loc>http://wwwdominio.com/bizcochos/</loc>
  <lastmod>2015-02-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
  </url>
  </urlset>

8. Comprimir archivo sitemap.xml.gz

El archivo sitemap.xml puede comprimirse en sitemaps.xml.gz para poder generar menor carga a tu servidor. Has de pensar, que dependiendo del tipo de web que tengas, tal vez te sea necesario comprimirlo. En la típica web estática donde hay poco movimiento de enlaces, de manera que se generen pocos enlaces cada día, no creo necesario que se tenga que comprimir. Pero si tu web son de aquellas que cada dia se generan archivos nuevos y las url se ven modificadas cada dia a parte de que diariamente se añades mas url. En estos casos, es mejor que lo comprimas, porque llegará un día en que vas a tener tantos enlaces, que el archivo sitemap.xml te va a ocupar demasiado.

Has de tener en cuenta que un archivo sitemap.xml no puede ocupar mas de 10MB y no pueden ponerse mas de 50.000 url. Cuando hayas superado alguna de estas dos prioridades, habrás de generar otro archivo. Dentro de un archivo sitemap.xml, puede generar varios archivos sitemaps. De manera que puedas separarlos por categorías.

9. Donde colocar el archivo sitemap.xml

Cuando hayamos generado el archivo sitemap.xml, tanto si es comprimido o no, lo dejaremos en la primera carpeta de tu servidor, aunque lo podemos dejar en cualquier otra carpeta.

10. Como indicar la ubicación del sitemap.xml a los motores de búsqueda

Luego, le habremos de indicar a los motores de búsqueda la ubicación de dicho archivo. Por ejemplo, para webmaster de google, habremos de ir al apartado “Rastreo” y aquí encontraremos el apartado “Sitemaps”. Si está en cero, habremos de añadir la url donde se encuentra ubicado nuestro sitemap. Webmaster tiene una opción que es “probar sitemaps”, donde nos indicará si lo ha encontrado o bien existe algún error. Esto mismo pasa con los webmaster de bing y de yahoo.

Otra manera de indicar la ubicación del archivo sitemap a los búscadores es indicarlo en el archivo robots.txt. Este archivo no solo sirve para indicarle a los buscadores que no rastrear, sino también donde encontrar los archivos sitemap. Habremos de poner una linea por cada sitemap que tengamos.

Sitemap: http://www.dominio.es/sitemap.xml

Una tercera opción es haciendo “ping” del archivo sitemap.xml. Para ello, le indicamos a cada uno de los motores de búsqueda la ubicación de nuestros archivos sitemaps. Hay páginas webs que indicándole una sola vez la ubicación de tu sitemap, ya lo distribuyen a todos los motores de búsqueda. La web Pingsitemap se encargará de su distribución, aquí podemos dejar el enlace de la ubicación.

11. Usar plugins de wordpress generar el sitemap.xml

Si lo que tenemos es un gestor de contenidos tipo wordpress, aquí la cosa puede cambiar. Existen muchos pluguins que se encargan de automatizarlo todo. De manera que cada vez que generas una entrada o una página nueva en tu dominio, dicho plugin generará un sitemaps nuevo con la nueva url.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *