Sitemap.XML – O Guia Completo

Olá leitores da Agência Mestre,

No artigo de hoje falaremos sobre um arquivo muito importante para os websites da internet, o Sitemap.XML.

Introdução

Os Sitemaps XML – geralmente chamados de Sitemaps, com S maiúsculo – são uma forma de fornecer ao buscador informações sobre o seu site. Resumidamente, um Sitemap é uma lista das URLs do seu site. Criar e enviar um Sitemap ajuda a garantir que o buscador tenha conhecimento de todas as páginas do seu site, incluindo URLs que não seriam normalmente encontrados através do processo normal de rastreamento do buscador. Isso ajuda o crawler a indexar e atualizar o seu site em um menor espaço de tempo.

Os Sitemaps são especialmente úteis se:

  • O seu site tiver conteúdo dinâmico.
  • O seu site tiver páginas que não podem ser facilmente encontradas pelo buscadorbot durante o processo de rastreamento – por exemplo, páginas com conteúdo em AJAX ou Flash.
  • O seu site for novo e houver poucos links para ele. Como o crawler rastreia a web seguindo os links de uma página para a outra, se seu site não estiver bem lincado, vai ser difícil detectá-lo.
  • O seu site possuir um grande arquivo com páginas de conteúdo que não estão bem lincadas umas às outras ou que simplesmente não estejam lincadas.

O que um Sitemap pode conter?

Para os Sitemaps de qualquer formato, considere o seguinte:

  • Um Sitemap pode conter uma lista de URLs ou uma lista de sitemaps.
  • Se seu Sitemap contiver uma lista de outros sitemaps, você poderá salvá-la como um arquivo de índice de sitemap e usar o formato XML fornecido com esse tipo de arquivo. Um arquivo de índice de sitemap não pode listar mais de 1.000 sitemaps.
  • Um arquivo de Sitemap não pode conter mais de 50.000 URLs na sua lista e ser maior que 10 MB quando não compactado. Se o seu sitemap for maior que isso, divida-o em vários sitemaps menores. Esses limites ajudam a garantir que seu servidor não seja sobrecarregado ao enviar arquivos muito extensos para o buscador.
  • Especifique todos os URLs usando a mesma sintaxe. Por exemplo, se você especificar o local de seu site como http://www.exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://exemplo.com/. E se o local especificado for http://exemplo.com/, sua lista de URLs não poderá conter URLs que comecem com http://www.exemplo.com/.
  • Não inclua IDs de sessão na sua lista de URLs.
  • O URL do Sitemap deve ser codificado para capacidade de leitura pelo servidor no qual está localizado. Além disso, ele pode conter somente caracteres ASCII. Ele não pode conter caracteres ASCII maiúsculos nem determinados códigos de controle ou caracteres especiais, como * e {}. Se o URL do seu sitemap tiver esses caracteres, ocorrerá um erro quando você tentar adicioná-lo.

Entendendo o Arquivo

O que temos que entender do Sitemap.XML é que ele é um indicador de URLs para os mecanismos de busca. Cada URL aí citada será utilizada para encontrar informação sobre uma página (URL).

Atributo loc

O item indica qual a URL que você deseja listar.

Atributo lastmod

Em seguida temos o informa a data da última atualização da página, ou seja, você deve manter constamente atualizado o arquivo do sitemap.xml com esta informação; caso não consiga, não utilize este atributo.

Atributo changefreq

O item seguinte, o é utilizado pelos menicanismos de busca como uma dica de quando você altera o conteúdo; a minha sugestão é que você não se importe com este item, pois os mecanismos de busca decidem qual a melhor “época” para re-visitar a sua página.

Atributo priority

O indica para os mecanismos de busca qual prioridade daquela URL dentro da sua arquitetura. Do mesmo modo que o este valor é apenas uma dica e eu não me importaria em não fornecer este dado no arquivo do sitemap.xml.

Receba Novidades

Insira seu email para receber novidades e dicas exclusivas da Agência Mestre!
Divulgue este artigo

18 Comentários para “Sitemap.XML – O Guia Completo”

  1. estudante de SEO

    Uma dúvida…

    No caso do sitemap index, teremos um sitemap que terá uma lista de locais de outros sitemaps… como nomeamos o arquivo sitemap de index? Tem alguma formatação especial, ou algo do gênero?

    Abs,

    Responder
  2. João Netto - Criação de Sites

    Boa tarde Heron, toda vez que uma página nova é adicionada no site o certo é adicionar no sitemap e reeviar para google certo?

    Agora se utilizar sites dinâmico que adiciona conteúdo todo dia isso se torna complicado, pois nem sempre sabemos oque o cliente adicionou e vai tornar a tarefa manual, imagina ter que ficar mudando sitemap toda semana.

    Tem alguma solução para isso?

    Obrigado abração.

    Responder
    • Frank Marcel

      Sim, uma URL para cada produto. Mas lembre-se que um arquivo de sitemap.xml deve conter no máximo 50 mil entradas/URLs diferentes.

      Responder
  3. Gabriela

    Pessoal,
    Olá, eu coloquei o meu Feed como Sitemap.
    Pelo que eu vi, a minha página de Feed mostra os últimos links atualizados e o título do post, mas não mostra todos os posts.
    Isso é ruim?

    Responder
  4. Lopes Filho

    Como fazer quando temos um site todo com paginas .html e queremos passa-las para dinâmico em php. Basta colocar o endereço das paginas .php tipo index.php e o buscador acha o conteúdo? Só vou mudar a extensão para poder dinamizar algumas partes da pagina.

    Responder
  5. André Barbosa

    O Sitemap é uma ideia de gênio, sugerir as páginas aos buscadores de uma forma simples, e existem plugins muito bons para wordpress que fazem um ótimo trabalho!

    Obrigado pelo artigo.

    Responder
    • Fábio Ricotta

      Olá Élida,

      O seu Sitemap pode ser o seu RSS. Basta enviar o seu RSS ao invés deste arquivo. E você também não conseguirá enviar este arquivo no Google Webmaster Tools pois ele não permite sitemaps fora do domínio do site.

      Sendo assim, sua solução é utilizar o RSS mesmo.

      Responder

Deixar um comentário

  • (não será publicado)

XHTML: Você pode usar estas tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>