Sempre que noticiamos uma atualização de PageRank, como a que aconteceu no começo deste mês (PageRank Atualizado – Abril/09), diversos comentários surgem de pessoas relatando que seus blogs e sites receberam, logo de começo, um PageRank 3 ou, até mesmo, 4, e todas elas ficam fascinadas e empolgadas com a bela arrancada de um site recém criado. Mas por que isso acontece? Por que sites e blogs recém criados já recebem um PageRank “alto”?

Antes de mais nada, vamos relembrar a fórmula do PageRank:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Na fórmula, PR(A) é o PageRank da página A; T1 à Tn são as páginas com links para a página A; d é um fator de depreciação que pode ter valores entre zero e 1 (normalmente é usado 0.85); e C(Tx) é o número de links para outras páginas a partir da página Tx.

Atenção: esta é a fórmula original do PageRank, ou seja, ele já não é mais calculado exatamente desta maneira, embora o princípio geral ainda seja o mesmo. Uma mudança fundamental foi a adição de fatores como grau de relacionamento de conteúdo entre as páginas e a análise de contexto entre as páginas envolvidas no link. Contudo, esta fórmula servirá para o ensaio sobre o comportamento do PageRank que eu apresento neste artigo.

PageRank 3 na Primeira Atualização – Como?

Vamos supor que eu acabei de criar o meu site A e, logo nos primeiros momentos, consegui links de outros 10 sites. Cada site com os seguintes valores de PageRank:

  • (Meu site) PR(A) = 0
  • PR(B) = PR(C) = PR(D) = 4
  • PR(E) = PR(F) = PR(G) = PR(H) = PR(I) =3
  • PR(J) = PR(K) = 2

E, para facilitar as contas, vou repetir os links que cada um dos 10 sites tem da seguinte maneira:

  • C(B) = C(C) = C(D) = 10
  • C(E) = C(F) = C(G) = C(H) = C(I) = 8
  • C(J) = C(K) = 9

Portanto, os 3 sites com PageRank 4, linkam para 10 páginas, os 5 sites de PageRank 3 linkam para 8 páginas e os 2 sites com PageRank 2, linkam para 9 páginas. Hora das contas:

  • PR(A) = (1-0.85) + 0.85*(PR(B)/C(B) + … + PR(K)/C(K))
  • PR(A) = (1-0.85) + 0.85*( 3*4/10 + 5*3/8 + 2*2/9)
  • PR(A) = 3.14

Voi-la! Com 10 links de entrada e PageRank variando de 2 a 4 nesses links, é possível conseguir um PageRank 3 logo na primeira atualização de PageRank que o site cruzar!

Um Site Novo com PageRank 3 e o meu Antigo com 2. Por quê?

Especialmente quando a atualização está bem próxima do lançamento do site, o Google ainda não coletou e processou informação suficiente sobre o site, sobre os links que ele faz e links que recebe e ainda não tem histórico suficiente para obter um valor mais condizente, sendo assim, valores “absurdos” podem ser atribuídos a sites e blogs recém criados.

É claro que eu condicionei este meu experimento a uma situação específica para mostrar o ponto que eu queria, mas é mais que o suficiente para levantar hipóteses mais consistentes sobre a razão de sites recém criados obterem valores mais altos de PageRank logo no início de sua história.

Numa situação real, talvez os 10 links que eu utilizei como exemplo, sejam na verdade 1000, mas o conceito ainda é válido: são 1000 links ainda não totalmente avaliados e, com as informações que o Google obteve, atribuiu um PageRank 3 para o site.

Extendendo o conceito para o percentual de ganho de links entre as atualizações, o site tinha antes 0 links e agora tem 10, ou 1000, links de entrada – um aumento de mais de 100% na quantidade de links do site, um bom motivo para aplicar um valor mais generoso de PageRank.

Como ficou o seu site? Qual a sua teoria? Você concorda comigo? Comente!