Sitemap.XML – O Guia Completo

Por Fábio Ricotta


Olá leitores da Agência Mestre,

No artigo de hoje falaremos sobre um arquivo muito importante para os websites da internet, o Sitemap.XML.

Introdução

Os Sitemaps XML – geralmente chamados de Sitemaps, com S maiúsculo – são uma forma de fornecer ao buscador informações sobre o seu site. Resumidamente, um Sitemap é uma lista das URLs do seu site. Criar e enviar um Sitemap ajuda a garantir que o buscador tenha conhecimento de todas as páginas do seu site, incluindo URLs que não seriam normalmente encontrados através do processo normal de rastreamento do buscador. Isso ajuda o crawler a indexar e atualizar o seu site em um menor espaço de tempo.

Os Sitemaps são especialmente úteis se:

  • O seu site tiver conteúdo dinâmico.
  • O seu site tiver páginas que não podem ser facilmente encontradas pelo buscadorbot durante o processo de rastreamento – por exemplo, páginas com conteúdo em AJAX ou Flash.
  • O seu site for novo e houver poucos links para ele. Como o crawler rastreia a web seguindo os links de uma página para a outra, se seu site não estiver bem lincado, vai ser difícil detectá-lo.
  • O seu site possuir um grande arquivo com páginas de conteúdo que não estão bem lincadas umas às outras ou que simplesmente não estejam lincadas.

O que um Sitemap pode conter?

Para os Sitemaps de qualquer formato, considere o seguinte:

  • Um Sitemap pode conter uma lista de URLs ou uma lista de sitemaps.
  • Se seu Sitemap contiver uma lista de outros sitemaps, você poderá salvá-la como um arquivo de índice de sitemap e usar o formato XML fornecido com esse tipo de arquivo. Um arquivo de índice de sitemap não pode listar mais de 1.000 sitemaps.
  • Um arquivo de Sitemap não pode conter mais de 50.000 URLs na sua lista e ser maior que 10 MB quando não compactado. Se o seu sitemap for maior que isso, divida-o em vários sitemaps menores. Esses limites ajudam a garantir que seu servidor não seja sobrecarregado ao enviar arquivos muito extensos para o buscador.
  • Especifique todos os URLs usando a mesma sintaxe. Por exemplo, se você especificar o local de seu site como http://www.exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://exemplo.com/. E se o local especificado for http://exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://www.exemplo.com/.
  • Não inclua IDs de sessão na sua lista de URLs.
  • O URL do Sitemap deve ser codificado para capacidade de leitura pelo servidor no qual está localizado. Além disso, ele pode conter somente caracteres ASCII. Ele não pode conter caracteres ASCII maiúsculos nem determinados códigos de controle ou caracteres especiais, como * e {}. Se o URL do seu sitemap tiver esses caracteres, ocorrerá um erro quando você tentar adicioná-lo.

Entendendo o Arquivo

O que temos que entender do Sitemap.XML é que ele é um indicador de URLs para os mecanismos de busca. Cada URL aí citada será utilizada para encontrar informação sobre uma página (URL).

Atributo loc

O item indica qual a URL que você deseja listar.

Atributo lastmod

Em seguida temos o informa a data da última atualização da página, ou seja, você deve manter constamente atualizado o arquivo do sitemap.xml com esta informação; caso não consiga, não utilize este atributo.

Atributo changefreq

O item seguinte, o é utilizado pelos menicanismos de busca como uma dica de quando você altera o conteúdo; a minha sugestão é que você não se importe com este item, pois os mecanismos de busca decidem qual a melhor “época” para re-visitar a sua página.

Atributo priority

O indica para os mecanismos de busca qual prioridade daquela URL dentro da sua arquitetura. Do mesmo modo que o este valor é apenas uma dica e eu não me importaria em não fornecer este dado no arquivo do sitemap.xml.

LEIA MAIS
Como Fazer o Google Encontrar o Seu Site?

Como Fazer o Google Encontrar o Seu Site?

O objetivo do Google é mesmo encontrar todo o conteúdo disponível na Internet, mas você precisa dar uma ajudinha. Veja como!

Páginas 404 Não Devem Retornar o Código 200 de Status

Páginas 404 Não Devem Retornar o Código 200 de Status

Hoje em dia é muito comum que página de erro 404 sejam customizadas, mas o trabalho de qualquer profissional de SEO é que estas páginas façam realmente o seu papel. Veja como prevenir que suas páginas de erro 404 causem problemas com os seus rankings.

Redirecionamento 301 em PHP, ASP, htaccess, Coldfusion e Ruby on Rails

Redirecionamento 301 em PHP, ASP, htaccess, Coldfusion e Ruby on Rails

Você quer saber como configurar o redirecionamento 301 no seu site? Veja como e mantenha sua relevância no Google!

Comentários
  1. Legal o post, eu gostaria de saber se existe alguma ferramenta que cria o sitemap automaticamente e periodicamente de nosso site.

    Valeu!

  2. Se o seu site possuir menos de 500 paginas: http://www.xml-sitemaps.com/

  3. Uma dúvida…

    No caso do sitemap index, teremos um sitemap que terá uma lista de locais de outros sitemaps… como nomeamos o arquivo sitemap de index? Tem alguma formatação especial, ou algo do gênero?

    Abs,

    • Não. O que muda é a sintaxe do código. O arquivo pode ser nomeado como sitemap.xml mesmo.

  4. Boa tarde Heron, toda vez que uma página nova é adicionada no site o certo é adicionar no sitemap e reeviar para google certo?

    Agora se utilizar sites dinâmico que adiciona conteúdo todo dia isso se torna complicado, pois nem sempre sabemos oque o cliente adicionou e vai tornar a tarefa manual, imagina ter que ficar mudando sitemap toda semana.

    Tem alguma solução para isso?

    Obrigado abração.

    • A solução é procurar uma maneira de automatizar este processo para mantê-lo sempre ativo.

  5. Quando tenho um site dinamico, em php, e tenho paginas que são geradas a partir de um id que vem por get, como por exemplo http://www.meusite.com/produto.php?id=23234 eu devo montar no site map uma url pra cada produto ou colocar apenas o produto.php?

    • Sim, uma URL para cada produto. Mas lembre-se que um arquivo de sitemap.xml deve conter no máximo 50 mil entradas/URLs diferentes.

  6. Pessoal,
    Olá, eu coloquei o meu Feed como Sitemap.
    Pelo que eu vi, a minha página de Feed mostra os últimos links atualizados e o título do post, mas não mostra todos os posts.
    Isso é ruim?

  7. Como fazer quando temos um site todo com paginas .html e queremos passa-las para dinâmico em php. Basta colocar o endereço das paginas .php tipo index.php e o buscador acha o conteúdo? Só vou mudar a extensão para poder dinamizar algumas partes da pagina.

  8. Meu sitemap aparece o seguinte erro:

    Erro no carregamento da folha de estilos: Ocorreu um erro de rede ao carregar uma folha de estilos XSLT:http://www.meudominio.com/wp-content/plugins/google-sitemap-generator/sitemap.xsl

    Começou a dar erro depois q instalei o wp super cache….

  9. Posso colocar um link hashbang num sitemap.xml?

    Abraços.

  10. O Sitemap é uma ideia de gênio, sugerir as páginas aos buscadores de uma forma simples, e existem plugins muito bons para wordpress que fazem um ótimo trabalho!

    Obrigado pelo artigo.

  11. Por utilizar o Blogger, hospedei meu sitemap no DropBox. Há algum problema?

    O link indicando para o sitemap eu inseri no robots.txt

    • Olá Élida,

      O seu Sitemap pode ser o seu RSS. Basta enviar o seu RSS ao invés deste arquivo. E você também não conseguirá enviar este arquivo no Google Webmaster Tools pois ele não permite sitemaps fora do domínio do site.

      Sendo assim, sua solução é utilizar o RSS mesmo.

  12. Estou começando com um site e é sempre bom aprender com quem sabe, ótimo conteúdo.

  13. Olá,

    Depois de assistir o video sobre Crawl Budget pensei em realizar algumas alterações no meu sitemap e fiquei com algumas dúvidas. Posso apenas alterar o changefreq e a priority sem enviar uma nova url de sitemap?

Deixe seu comentário abaixo

Já pensou em fazer parte do nosso time de mestres?