Olá leitores da Agência Mestre,

No artigo de hoje falaremos sobre um arquivo muito importante para os websites da internet, o Sitemap.XML.

Introdução

Os Sitemaps XML – geralmente chamados de Sitemaps, com S maiúsculo – são uma forma de fornecer ao buscador informações sobre o seu site. Resumidamente, um Sitemap é uma lista das URLs do seu site. Criar e enviar um Sitemap ajuda a garantir que o buscador tenha conhecimento de todas as páginas do seu site, incluindo URLs que não seriam normalmente encontrados através do processo normal de rastreamento do buscador. Isso ajuda o crawler a indexar e atualizar o seu site em um menor espaço de tempo.

Os Sitemaps são especialmente úteis se:

  • O seu site tiver conteúdo dinâmico.
  • O seu site tiver páginas que não podem ser facilmente encontradas pelo buscadorbot durante o processo de rastreamento – por exemplo, páginas com conteúdo em AJAX ou Flash.
  • O seu site for novo e houver poucos links para ele. Como o crawler rastreia a web seguindo os links de uma página para a outra, se seu site não estiver bem lincado, vai ser difícil detectá-lo.
  • O seu site possuir um grande arquivo com páginas de conteúdo que não estão bem lincadas umas às outras ou que simplesmente não estejam lincadas.

O que um Sitemap pode conter?

Para os Sitemaps de qualquer formato, considere o seguinte:

  • Um Sitemap pode conter uma lista de URLs ou uma lista de sitemaps.
  • Se seu Sitemap contiver uma lista de outros sitemaps, você poderá salvá-la como um arquivo de índice de sitemap e usar o formato XML fornecido com esse tipo de arquivo. Um arquivo de índice de sitemap não pode listar mais de 1.000 sitemaps.
  • Um arquivo de Sitemap não pode conter mais de 50.000 URLs na sua lista e ser maior que 10 MB quando não compactado. Se o seu sitemap for maior que isso, divida-o em vários sitemaps menores. Esses limites ajudam a garantir que seu servidor não seja sobrecarregado ao enviar arquivos muito extensos para o buscador.
  • Especifique todos os URLs usando a mesma sintaxe. Por exemplo, se você especificar o local de seu site como http://www.exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://exemplo.com/. E se o local especificado for http://exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://www.exemplo.com/.
  • Não inclua IDs de sessão na sua lista de URLs.
  • O URL do Sitemap deve ser codificado para capacidade de leitura pelo servidor no qual está localizado. Além disso, ele pode conter somente caracteres ASCII. Ele não pode conter caracteres ASCII maiúsculos nem determinados códigos de controle ou caracteres especiais, como * e {}. Se o URL do seu sitemap tiver esses caracteres, ocorrerá um erro quando você tentar adicioná-lo.

Entendendo o Arquivo

O que temos que entender do Sitemap.XML é que ele é um indicador de URLs para os mecanismos de busca. Cada URL aí citada será utilizada para encontrar informação sobre uma página (URL).

Atributo loc

O item indica qual a URL que você deseja listar.

Atributo lastmod

Em seguida temos o informa a data da última atualização da página, ou seja, você deve manter constamente atualizado o arquivo do sitemap.xml com esta informação; caso não consiga, não utilize este atributo.

Atributo changefreq

O item seguinte, o é utilizado pelos menicanismos de busca como uma dica de quando você altera o conteúdo; a minha sugestão é que você não se importe com este item, pois os mecanismos de busca decidem qual a melhor “época” para re-visitar a sua página.

Atributo priority

O indica para os mecanismos de busca qual prioridade daquela URL dentro da sua arquitetura. Do mesmo modo que o este valor é apenas uma dica e eu não me importaria em não fornecer este dado no arquivo do sitemap.xml.