No artigo de hoje, falaremos sobre um conceito mais técnico. Em 2009 o Google iniciou o suporte a Canonical Tag ou “canonical link element”, a qual permite você informar ao buscador qual é a versão preferencial de uma página WEB. Para entender mais sobre o assunto, dê o play no vídeo abaixo:

Estrutura

Quem é da área de SEO, já está acostumado com a estrutura da Canonical Tag:

<head>

<link rel=”canonical” href=”url-canonica.html” />

</head>

Mas, se você é leigo no assunto não se preocupe, a ideia central deste post, é mostrar a você que essa tag é muito importante na hora de evitarmos o famoso conteúdo duplicado. Continue lendo para entender como isso funciona.

Conteúdo Duplicado

Por definição, um conteúdo é considerado duplicado quando ele é encontrado em duas URLs distintas, por exemplo:

  • meusite.com.br/index.html
  • meusite.com.br/

Este exemplo de conteúdo duplicado é o mais comum: a maioria dos sites tem sua página inicial acessada por mais de uma URL. Em grande parte dos sites, a seguinte relação de URLs todas permitem o acesso à página inicial:

  • meusite.com.br
  • meusite.com.br/
  • www.meusite.com.br
  • www.meusite.com.br/
  • meusite.com.br/index.html
  • www.meusite.com.br/index.html
  • meusite.com.br/home.aspx
  • meusite.com.br/Home.aspx

Pois é, conseguem imaginar todas as formas de acesso à página inicial de um site? Todas representam conteúdo duplicado, sem exceção, até mesmo a simples diferença do caracter “/” já resulta em conteúdo duplicado. Entrando na área dos sites que usam variáveis de controle de sessão, o problema continua:

  • meusite.com.br/index.jsp?jsessid=141513512mOI909afe
  • meusite.com.br/index.jsp?jsessid=jjaoafsa999a8s9fyasha

Mudou apenas o valor atribuído à variável jssesid, mas isso já é suficiente para duplicar conteúdo, pois a cada novo acesso do bot de busca no site, a variável recebe um novo valor, gerando uma nova URL que possui o mesmo conteúdo que meusite.com.br/index.jsp.

Outras páginas, além da inicial, também podem ser fontes de conteúdo duplicado, por exemplo:

  • meusite.com.br/produtos.php?ver=mesa&tipo=mogno
  • meusite.com.br/produtos.php?ver=mesa&tipo=marfim

Considerando que ambas sejam a mesma mesa, mudando somente a imagem, teremos 2 URLs com 99% de conteúdo duplicado. Ainda, a inversão da ordem dos parâmetros também é fonte de conteúdo duplicado, por exemplo:

  • meusite.com.br/lugar.php?cidade=Itajuba&estado=MG
  • meusite.com.br/lugar.php?estado=MG&cidade=Itajuba

Canonical Tag ou Redirecionamento 301?

O canonical link tem seu funcionamento muito similar ao de um redirecionamento 301, mas é condicional: somente se a search engine considerar que a página visitada (A) e o link referenciado na tag canonical (B) são relativamente iguais é que ela vai trabalhar como um redirecionamento 301, ou seja, transferir os méritos (PageRank, inlinks, etc.) de A (duplicada) para B (versão preferencial).

Essa é a principal diferença do canonical link para o redirecionamento 301:

  • Canonical link: a search engine decide se as páginas são duplicadas e repassa parte da força para a versão preferencial;
  • Redirecionamento 301: a search engine passa parte da força de uma URL para outra incondicionalmente.

A vantagem de usar a tag link com o rel=”canonical” é que você especifica isso diretamente na página, sem se preocupar com configuração no servidor. E, na verdade, usando o canonical link, você dá uma forte dica para a search engine de qual é a URL original. Para os exemplos citados anteriormente, funciona perfeitamente:

Canonização de URL www vs. non-www vs. /  vs.  non-/

  • meusite.com.br/
  • www.meusite.com.br
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/” />

Canonização de URL com variável de sessão:

  • meusite.com.br/index.php?jsessid=141513512mOI909afe
  • meusite.com.br/index.php?jsessid=jjaoafsa999a8s9fyasha
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/index.php” />

Canonização de URL com um parâmetro importante e outros complementares:

  • meusite.com.br/produtos.php?ver=mesa&tipo=mogno
  • meusite.com.br/produtos.php?ver=mesa&tipo=marfim
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/produtos.php?ver=mesa” />

Você deve utilizar o link que melhor lhe convir, estes são apenas exemplos. Existem, ainda, outras formas de indicar para a search engine qual a sua versão preferencial de URL:

  • Utilizar uma linkagem interna consistente – utilizar sempre a mesma URL nos links internos
  • Utilizar o sitemap.xml – sim, ele é um forte indicativo de qual a URL correta

Mais Detalhes Sobre Canonical Links

Este elemento visa ajudar os menos experientes, ou com menos prática, a resolver problemas simples de conteúdo duplicado. Usuários mais experientes não devem abandonar os outros métodos.

É importante notificar que este elemento não funciona entre domínios diferentes (meusite.com.br/page1.html para outrosite.com.br/page1.html), mas funciona entre subdomínios (sub.meusite.com.br/page3.html para meusite.com.br/page3.html) e protocolos de segurança (http://meusite.com.br/login para https://meusite.com.br/login).

Por último, lembre-se que as páginas não precisam ser absolutamente idênticas para que o canonical link funcione, pequenas diferenças são ignoradas. E deixo a recomendação para que sejam sempre usados links absolutos para especificar as URLs. Mais informações você consegue com o Blog do Google, o Matt Cutts, Blog da MOZ e conosco: deixe um comentário! Até a próxima.