El posicionamiento en buscadores de los sitios que diseñamos
y realizamos tiene una enorme importancia en un entorno muy competitivo
como la web de hoy. Frecuentemente, la posición del sitio en la lista
de resultados determina el exito o el fracaso de nuestro trabajo,
aún con diseños creativos y profesionales.
La condición básica y fundamental del posicionamiento es la certeza
de que todas las páginas del sitio se encuentran indexadas correctamente,
y esto no es siempre fácil de lograr.
Aquí es donde los Sitemaps
pueden sernos de gran ayuda.
¿Qué es y para qué sirve un sitemap?
En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.
Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.
Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse.
Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.
Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información
adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización
y qué tan importante es respecto al resto de las páginas del mismo sitio.
La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps,
que describimos a continuación:
Contenidos obligatorios del sitemap
El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8.
Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos
caracteres especiales, tal como se acostumbra en HTML.
Por ejemplo, las comillas dobles (") deben ser reemplazadas por
" y los
signos menor (<) y mayor (>) por
< y > respectivamente.
El archivo XML debe:
Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
</url>
</urlset>
Contenidos opcionales del sitemap
Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil
para que el proceso de indexación se realice más inteligentemente.
Los nodos opcionales, aunque importantes, son:
<lastmod>Fecha</lastmod>
Se refiere a la fecha de la última modificación de la página que figura en <loc>
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.
<changefrec>Frec</changefrec>
Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con
qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente.
Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran.
Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente),
yearly (anualmente) o never (nunca, típicamente para páginas archivadas).
<priority>Valor</priority>
Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio.
Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo.
Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5
Volviendo al ejemplo anterior y agregando los atributos opcionales:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefrec>monthly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>
El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de
que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.
Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que
se encuentren en ejemplo.com/
Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.
A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica
para aceptarlo.
Para el caso de Yahoo de Argentina, puede sugerirse un sitio y enviar el sitemap desde aquí
(requiere registro previo).
El caso de Google es sutilmente distinto, ya que la construcción del sitemap sigue un protocolo propio, muy similar pero
más sencillo. Cuenta además con una interfaz muy completa de seguimiento.
Todo en este enlace (requiere registro previo).
Fernando Campaña (Noviembre de 2006)
Diseño
y Posicionamiento
Palabras Clave: diseño web, posicionamiento en buscadores, sitemaps, XML, crawlers
Copyright Rakidwam Diseño Web 2006 - Se permite la reproducción total o parcial del presente artículo manteniendo el enlace del autor.