O BrowseRank é uma métrica para classificação de páginas que, ao contrário do Pagerank, não utiliza os links de entrada das páginas como parâmetro, mas sim o comportamento dos usuários nas páginas. Essa métrica foi desenvolvida por engenheiros da Microsoft e tem como finalidade definir a relevância das páginas de uma maneira mais burocrática, uma vez que levaria em consideração os dados de milhões de usuários ao redor do mundo.

Como o BrowseRank é Calculado?

Os dados levados em consideração para a análise do comportamento do usuário são as páginas acessadas, o momento em que elas foram acessadas e como o usuário chegou em cada página. A partir desses dados é montado um grafo do comportamento geral dos usuários, da seguinte maneira:

grafo de navegação

O grafo representa o processo de navegação do usuário pelas páginas e é utilizado para o cálculo da importância de cada uma delas. Quanto maior o tempo e o número de visitas dos usuários em uma determinada página, maior a possibilidade de que ela seja importante.

Vale lembrar que embora o BrowseRank leve em consideração os acessos a uma determinada página para estipular se ela é relevante ou não, o algoritmo não é um simples contador de visitas pois, dessa maneira, seria bastante simples burlar a classificação (bastaria um sistema que realizasse um determinado número de acessos a URL que se deseja classificar).

Para perder o aspecto de um contador de entradas, o algoritmo utiliza o modelo de tempo contínuo de Markov para simular uma caminhada aleatória pelas páginas do grafo montado a partir dos dados dos usuários e assim coletar as páginas que seriam mais relevantes. Você pode conferir mais detalhes desse processo no estudo original da microsoft sobre o BrowseRank.

Recentemente, a Microsoft lançou um estudo sobre a framework Markov e sua importância na computação. Nesse estudo os pesquisadores da Microsoft citam que é possível melhorar o sistema de anti-spam para o BrowseRank através dessa mesma framework, associando a média de tempo dos usuários pela forma que os mesmos chegaram a cada página ao algoritmo já utilizado.

Nesse estudo os pesquisadores fazem alusão ao BrowseRank plus, que utilizaria essas melhorias. Ou seja, na primeira versão do BrowseRank existe somente uma média de tempo geral, independente da maneira como os usuários chegaram as páginas. Já o BrowseRank plus utiliza várias médias de tempo, uma para cada site de entrada.

O BrowseRank é Eficiente?

Há quem diga que o BrowseRank  é mais eficiente quando comparado com o PageRank por ser mais difícil de ser manipulado através de spams. Entretanto, essa é uma afirmação controversa, pois as redes sociais podem influenciar os resultados obtidos através do BrowseRank.

Embora as redes sociais sejam sites que tenham muito acesso por parte dos usuários, boa parte de seu conteúdo não é relevante para a grande maioria.

Abaixo, segue uma tabela dos top 20 sites segundo os algoritmos: PageRank, TrustRank, BrowseRank e BrowseRank plus:

tabela top 20 sites por algoritmo de classificação

Como é possível perceber, entre os principais resultados do BrowseRank e BrowseRank plus estão várias redes sociais como Orkut, Facebook e MySpace que, embora sejam sites muito utilizados, não apresentam páginas de grande relevância quanto o assunto é conteúdo.

Embora os parâmetros utilizados pelo PageRank e BrowseRank sejam diferentes, os links para o PageRank e o comportamento do usuário para o BrowseRank, ambos se baseiam no fato de que as pessoas ainda são melhores para selecionar o que é mais ou menos relevante do que as máquinas.

É fato que nenhuma das duas métricas é perfeita, mas vale a pena estar ciente dos estudos realizados nessa área e acompanhar o desenvolvimento dessas métricas.