SEO

Encontre Conteúdo Duplicado Com o Google

Por Flávio Cabral

Veja aqui uma dica de como utilizar o próprio Google para verificar se seu site está com conteúdo duplicado e identificar exatamente quais páginas apresentam esse problema.

Flávio Cabral

Na semana passada, vimos aqui posts do Luis e do Bruno mostrando como evitar conteúdo duplicado e dicas para corrigir esse problema. Agora o que vou fazer é mostrar uma outra forma de detectar esse problema.

Já sabemos que o Google Webmaster Tools pode nos ajudar com isso, mas o próprio Google também é muito útil para isso e veremos agora como utiliza-lo para verificar se você tem um problema de conteúdo duplicado.

O que faremos é simplesmente olhar no index do Google para ver o que ele salvou, e se algo é duplicado.

Use seu bom senso

Comece fazendo uma busca do tipo site:exemplo.com.br.

Dica: após fazer a busca, adicione &filter=0 no fim da URL que foi gerada na barra de endereço do seu navegador para que o Google não omita nenhum resultado.

Preste atenção na quantidade de páginas indexadas. Você realmente tem esse número de páginas ou o número está muito alto? Se estiver, você tem conteúdo duplicado.

Percorra os resultados

Provavelmente foi a primeira coisa que você pensou, e se ainda não fez, percorra as páginas para ver os resultados.

Procure por URLs parecidas, mal formadas, com query strings (como ?=sessionid ou ?first_page etc.), que levem a páginas idênticas. Preste mais atenção nas ultimas páginas, é lá que geralmente ficam escondidos os erros. Veja se os títulos e descrições não são os mesmos.

Verifique os resultados suspeitos

Pegue alguma query string encontrada nos resultados, por exemplo:

?atributo_valor

Será que essa string vai te causar problema? Cheque o que está indexado (página no cache do Google) para ver se há algum problema.

Mesmo que a versão sem a string apresente um conteúdo diferente, ela pode ter as mesmas meta tags e title. Ou seja, conteúdo duplicado.

Descubra quantas páginas estão duplicadas

Não é muito difícil. Utilize o modelo para fazer uma busca:

site:exemplo.com.br inurl:atributo_valor (exemplo que vimos acima)

Aqui você vai ver exatamente quais páginas duplicadas estão sendo geradas por algum atributo.

Pronto, agora com o problema detectado você pode voltar aos nossos posts sobre conteúdo duplicado que irá encontrar algumas boas soluções para isso.

Até a próxima!

=)

fonte: seogadget

LEIA MAIS

Páginas 404 Não Devem Retornar o Código 200 de Status

Hoje em dia é muito comum que página de erro 404 sejam customizadas, mas o trabalho de qualquer profissional de SEO é que estas páginas façam realmente o seu papel. Veja como prevenir que suas páginas de erro 404 causem problemas com os seus rankings.

Redirecionamento 301 em PHP, ASP, htaccess, Coldfusion e Ruby on Rails

Você quer saber como configurar o redirecionamento 301 no seu site? Veja como e mantenha sua relevância no Google!

Como Fazer o Google Encontrar o Seu Site?

Você sabia que existem diferentes formas de ajudar o Google a encontrar o seu site? Coloque nossas dicas em prática e faça seu site aparecer no buscador!

Comentários
  1. Avatar

    Flávio,
    Eu fiz a busca site:nomedosite.com.br e apareceu 232 resultados, depois adicionei &filter=0 no final da URL gerada e foi pra 228, porém ao navegar até a última página dos resultados, o google me mostrou apenas 143 página indexadas, este é o valor real. Ou seja acho que não funciona o lance do &filter=0.
    Ou então isto significa conteúdo duplicado como vc explicou neste post ?

  2. Avatar

    Como faz pra matar conteudo duplicado em uma paginação, digo sem usar ajax, o titulo deveria ser diferente como seria as regras pra paginação?

  3. Avatar

    Ola gostaria de saber qual é o problema ,tipo na ferramentas para webmasters ele mostra que todos os meus posts estao duplicados ( 5800 posts) ai ele mostra os links :

    /2010/01/baixar-filme-download-legion-legiao.html
    /2010/01/baixar-filme-download-legion-legiao.html?pr=5685&site=http://downloadsferoz.com.br/

    todos as paginas tem esse trecho ( ?pr=5685&site=http://downloadsferoz.com.br/)
    o que seria isso ?e teria como eu bloquear isso usando o robots.txt

Os comentários estão fechados.

Já pensou em fazer parte do nosso time de mestres?