Na semana passada, vimos aqui posts do Luis e do Bruno mostrando como evitar conteúdo duplicado e dicas para corrigir esse problema. Agora o que vou fazer é mostrar uma outra forma de detectar esse problema.

Já sabemos que o Google Webmaster Tools pode nos ajudar com isso, mas o próprio Google também é muito útil para isso e veremos agora como utiliza-lo para verificar se você tem um problema de conteúdo duplicado.

O que faremos é simplesmente olhar no index do Google para ver o que ele salvou, e se algo é duplicado.

Use seu bom senso

Comece fazendo uma busca do tipo site:exemplo.com.br.

Dica: após fazer a busca, adicione &filter=0 no fim da URL que foi gerada na barra de endereço do seu navegador para que o Google não omita nenhum resultado.

Preste atenção na quantidade de páginas indexadas. Você realmente tem esse número de páginas ou o número está muito alto? Se estiver, você tem conteúdo duplicado.

Percorra os resultados

Provavelmente foi a primeira coisa que você pensou, e se ainda não fez, percorra as páginas para ver os resultados.

Procure por URLs parecidas, mal formadas, com query strings (como ?=sessionid ou ?first_page etc.), que levem a páginas idênticas. Preste mais atenção nas ultimas páginas, é lá que geralmente ficam escondidos os erros. Veja se os títulos e descrições não são os mesmos.

Verifique os resultados suspeitos

Pegue alguma query string encontrada nos resultados, por exemplo:

?atributo_valor

Será que essa string vai te causar problema? Cheque o que está indexado (página no cache do Google) para ver se há algum problema.

Mesmo que a versão sem a string apresente um conteúdo diferente, ela pode ter as mesmas meta tags e title. Ou seja, conteúdo duplicado.

Descubra quantas páginas estão duplicadas

Não é muito difícil. Utilize o modelo para fazer uma busca:

site:exemplo.com.br inurl:atributo_valor (exemplo que vimos acima)

Aqui você vai ver exatamente quais páginas duplicadas estão sendo geradas por algum atributo.

Pronto, agora com o problema detectado você pode voltar aos nossos posts sobre conteúdo duplicado que irá encontrar algumas boas soluções para isso.

Até a próxima!

=)

fonte: seogadget