next up previous
Next: Um problema Up: No Title Previous: Introdução

Estratégia

 Talvez a primeira coisa a notar é o seguinte. Não temos uma catálogo das páginas de nosso universo; se tivéssemos, estaríamos mais no âmbito de `algoritmos em grafos'. O nosso objetivo é tentar descobrir algo deste universo desconhecido através de amostragens. Para fixar um exemplo, supomos que queremos estudas as páginas HTML da USP.

A técnica que sugerimos é simples de descrever. Você começa com uma página, lista todos os links para páginas HTML da USP que aparecem nesta página, escolhe um ao acaso, e manda bala. Ao repetir este processo um certo número de vezes, digamos t, você vai estar em alguma página HTML da USP. Se t for grande, você pode considerar esta página como sendo uma página escolhida ao acaso, de acordo com uma certa distribuição de probabilidade bem definida, que só depende da característica de `conexidade' da rede USP.

Você deve montar uma tabela de endereços de n páginas assim escolhidas, para algum n grande a ser especificado posteriormente (especificaremos t no futuro também). Em uma fase posterior do projeto, faremos algumas estatísticas sobre esta tabela de endereços. (Quantas vezes aparece um endereço do IME? Existem páginas cujos endereços são bastante frequentes? Há links entre as páginas desta tabela? Há páginas às quais há várias referências?)



 
next up previous
Next: Um problema Up: No Title Previous: Introdução

Imre Simon
10/23/1998