Evitando o Conteúdo Duplicado Acidental

Por Luis Matos


Conteúdo duplicado é algo muito comum e que muitas vezes é gerado devido a erros simples dos webmasters e profissionais de SEO. Claro existem também espertalhões que propositalmente copiam conteúdo alheio e publicam como se fosse próprio, mas esse não é o caso, nesse artigo falarei um pouco de sobre como evitar a geração de conteúdo duplicado por você mesmo, dentro do seu próprio site e de maneira não proposital.

Conteúdo Duplicado Acidental: uma zebra que pode ser evitada

Alguns casos em que conteúdo duplicado acidental é gerado:

  • Problemas com canonização de páginas, tais como a existência e possibilidade de uso da URL com e sem o www sem redirecionamento
  • Páginas com title tags e meta description idênticas, fato que além de poder ser interpretado como conteúdo duplicado também pode gerar competição desnecessária entre páginas de conteúdo diferente.
  • Home page não canonizada ( exemplo.: www.seusite.com.br e www.seusite.com.br/index.php )
  • Desconhecimento por parte dos desenvolvedores de sites do fato que as URLs são case sensitive ( as maiúsculas e minúsculas são levadas em conta ). As URLs, www.seusite.com.br/Carros e www.seusite.com.br/carros por exemplo embora referenciem a mesma página e sejam de um certo modo a mesma URL, para o crawler são URLs diferentes por temos “C” minúsculo e maiúsculo.

O Google vem se esforçando para desenvolver o algoritmo do Googlebot de modo que ele identifique as páginas duplicadas e indexe as páginas certas dentro do seu site, mas no entanto, sempre é bom evitar o conteúdo duplicado porque podem ocorrer os seguintes casos:

  • A taxa de web crawl pode cair, o Googlebot pode perder tempo identificando ou até indexando páginas erradas e pular as páginas que deveriam realmente ser lidas.
  • O Googlebot pode errar e dar uma página pior como a página oficial e a página correta como conteúdo duplicado.

Ferramentas úteis para detectar conteúdo duplicado

Existem algumas boas ferramentas gratuitas, que podem ajudar a identificar se o seu site tem conteúdo duplicado:

1. Duplicate content tool: Tool gratuita bastando se cadastrar e usar. Com ela é possivel determinar:

  • A existencia de versões com www e sem www da sua Página
  • Verificar o cache do Google
  • Verificar o nível de similaridade entre as páginas do seu site
  • Checagem da dispersão do Pagerank ( se versões com www e sem www das suas páginas caso existam contém diferentes PRs )

2. Xenu: Verifica o seu site e retorna uma tabela contendo todas as URLs disponíveis no seu site, tudo o que você tem que fazer é verificar as meta tags e ver se elas não estão duplicadas.

3. Google Webmaster Tools: Também pode ser usado para encontrar e identificar meta tags duplicadas.

LEIA MAIS
Páginas 404 Não Devem Retornar o Código 200 de Status

Páginas 404 Não Devem Retornar o Código 200 de Status

Hoje em dia é muito comum que página de erro 404 sejam customizadas, mas o trabalho de qualquer profissional de SEO é que estas páginas façam realmente o seu papel. Veja como prevenir que suas páginas de erro 404 causem problemas com os seus rankings.

Redirecionamento 301 em PHP, ASP, htaccess, Coldfusion e Ruby on Rails

Redirecionamento 301 em PHP, ASP, htaccess, Coldfusion e Ruby on Rails

Você quer saber como configurar o redirecionamento 301 no seu site? Veja como e mantenha sua relevância no Google!

Como Fazer o Google Encontrar o Seu Site?

Como Fazer o Google Encontrar o Seu Site?

O objetivo do Google é mesmo encontrar todo o conteúdo disponível na Internet, mas você precisa dar uma ajudinha. Veja como!

Comentários
  1. O que é uma homepage “canonizada”? Homepages evangélicas podem ser canonizadas? ;o)
    Falando sério: sempre tive essa dúvida. No sitemap, por exemplo, qual URL devo listar? http://www.meusite.com ou http://www.meusite.com/index.php?

  2. Dica muito boa, melhor ainda a ferramenta de Duplicate.

  3. Olá Leonardo Antoniolli bom dia

    Dizer que uma URL do seu site está canonizada significa dizer que só exisite uma URL válida para aquela determinada página, ou seja, não é possivel por exemplo acessar esta página usando http://www.meusite.com ou http://www.meusite.com/index.php, apenas usando um dos dois modos.
    Recomendamos que você utilize sempre a forma http://www.meusite.com.br no seu sitemap por se tratar de uma forma mais simples, prática e funcional.

  4. Olá Luis, tudo bem?

    Bem legal a matéria. Sempre to aqui no MestreSeo aprendendo!
    Ainda não achei o vídeo do “mindubim”… hehehe

    Seguinte, meu site tá com esse problema de home “não-canonizada”, mesmo já tendo colocado recentemente no sitemap só a url ” http://www.meusite.com.br “. Será que o Google vai excluir a URL “http://www.meusite.com/index.php” com o tempo, ou existe outra forma de canonizar a home?

    Um abraço e obrigado!

  5. E aí Carlos! O mindubim vai virar folclore hehehehe

    Você já viu algum destes nossos posts:
    Redicionamento 301
    Canonizaçao de URLs

    eles explicam outros detalhes para a canonizaçao de URLs.

    Abraços!

  6. Olá Frank,

    Outra dúvida.

    Digamos que possuo um conteúdo duplicado em:

    http://www.site.com.br/exemplo.html

    Ele caiu no filtro do google, passado alguns meses eu modifico o conteúdo para um original e ele passa a ter um conteúdo único.

    Há chances desse caso o google indexar a página? ou terei que aplicar um novo nome para que a página seja adicionada pelo robo do google?

    Agradeço

    • Você consegue que ela seja indexada na URL antiga sim. Basta conseguir novos links. Quando o Google descobrir o novo conteúdo, ele atualiza o seu índice.

  7. Cara gostei deste artigo muito bom cheguei aqui atravez do google com a seguinte pergunta:evitar conteudo duplicado em index e page do wordpress, minha real duvida era a seguinte:
    No google webmaster tenho meta descrição duplicada heim index e page2 e por ai vai como consigo mudar a descriçâo da page2, instalei esses plugins de seo, com eles consigo mudar descrições nas categorias, tags, post em tudo mas este esquema de mudar na page2, page3 eu não consigo. Sera que você tem uma dica para me passar?

Deixe seu comentário abaixo