Conteúdo duplicado é algo muito comum e que muitas vezes é gerado devido a erros simples dos webmasters e profissionais de SEO. Claro existem também espertalhões que propositalmente copiam conteúdo alheio e publicam como se fosse próprio, mas esse não é o caso, nesse artigo falarei um pouco de sobre como evitar a geração de conteúdo duplicado por você mesmo, dentro do seu próprio site e de maneira não proposital.

Conteúdo Duplicado Acidental: uma zebra que pode ser evitada

Alguns casos em que conteúdo duplicado acidental é gerado:

  • Problemas com canonização de páginas, tais como a existência e possibilidade de uso da URL com e sem o www sem redirecionamento
  • Páginas com title tags e meta description idênticas, fato que além de poder ser interpretado como conteúdo duplicado também pode gerar competição desnecessária entre páginas de conteúdo diferente.
  • Home page não canonizada ( exemplo.: www.seusite.com.br e www.seusite.com.br/index.php )
  • Desconhecimento por parte dos desenvolvedores de sites do fato que as URLs são case sensitive ( as maiúsculas e minúsculas são levadas em conta ). As URLs, www.seusite.com.br/Carros e www.seusite.com.br/carros por exemplo embora referenciem a mesma página e sejam de um certo modo a mesma URL, para o crawler são URLs diferentes por temos “C” minúsculo e maiúsculo.

O Google vem se esforçando para desenvolver o algoritmo do Googlebot de modo que ele identifique as páginas duplicadas e indexe as páginas certas dentro do seu site, mas no entanto, sempre é bom evitar o conteúdo duplicado porque podem ocorrer os seguintes casos:

  • A taxa de web crawl pode cair, o Googlebot pode perder tempo identificando ou até indexando páginas erradas e pular as páginas que deveriam realmente ser lidas.
  • O Googlebot pode errar e dar uma página pior como a página oficial e a página correta como conteúdo duplicado.

Ferramentas úteis para detectar conteúdo duplicado

Existem algumas boas ferramentas gratuitas, que podem ajudar a identificar se o seu site tem conteúdo duplicado:

1. Duplicate content tool: Tool gratuita bastando se cadastrar e usar. Com ela é possivel determinar:

  • A existencia de versões com www e sem www da sua Página
  • Verificar o cache do Google
  • Verificar o nível de similaridade entre as páginas do seu site
  • Checagem da dispersão do Pagerank ( se versões com www e sem www das suas páginas caso existam contém diferentes PRs )

2. Xenu: Verifica o seu site e retorna uma tabela contendo todas as URLs disponíveis no seu site, tudo o que você tem que fazer é verificar as meta tags e ver se elas não estão duplicadas.

3. Google Webmaster Tools: Também pode ser usado para encontrar e identificar meta tags duplicadas.