8.4 Algumas aplicações
Nesta seção faremos quatro aplicações da Lei dos Grandes Números. Elas podem ser lidas em qualquer ordem. A terceira é aplicação da Lei Fraca, a primeira e a última, da Lei Forte. A segunda é na verdade uma aplicação da Desigualdade de Tchebyshev, como feito na demostração da Lei Fraca.
Teorema de Glivenko-Cantelli
O teorema abaixo tem um papel central em Estatística Matemática. Ele relaciona a chamada função de distribuição empírica, construída a partir de observações de variáveis aleatórias i.i.d., com a função de distribuição comum a essas variáveis, em princípio desconhecida. Suas aplicações ocorrem em várias áreas, como por exemplo Econometria e Aprendizado de Máquina.
Teorema 8.12 (Teorema de Glivenko-Cantelli).
Sejam variáveis aleatórias i.i.d. com função de distribuição , e defina
Então
Demonstração.
Defina e , as funções análogas a e porém contínuas à esquerda.
Seja . Tome e tais que , e para . Isso pode ser feito a partir da função quantil , tomando uma coleção de pontos em com separação menor que (a condição pode parecer incompatível com o fato de ter saltos, mas isso não é um problema se os pontos onde salta mais que estiverem entre os ).
Seja . Pela Lei dos Grandes Números de Borel, quase certamente existem aleatórios tais que e para todo e todo . Seja .
Agora seja tal que para algum . Temos
Subtraindo, obtemos
e
Logo, para , vale . Argumento similar vale para e também para . Para , vale . Ou seja, para todo . Portanto,
Fazendo e tomando a interseção sobre , obtemos a convergência do enunciado. ∎
Teorema de Weierstrass
A esta altura está claro que Análise Real e Teoria da Medida são ferramentas mais que importantes para o estudo de Probabilidade. Porém, um fato notável é que temos uma via de mão dupla. Há teoremas da Análise que podem ser obtidos com demonstrações probabilísticas. O Teorema de Weierstrass diz que toda função contínua, por mais complicada que seja, pode ser aproximada uniformemente por uma sequência de polinômios.1313 13 O Teorema 8.13 foi provado originalmente por Weierstrass em 1885. A demonstração probabilística que fornecemos é devida a Bernstein, publicada em 1912. Observe que trata-se de um teorema puramente de Análise Real.
Teorema 8.13 (Teorema de Weierstrass).
Sejam uma função contínua e . Existe um polinômio tal que para todo .
Sejam e como no enunciado. Podemos supor que e , pois há uma bijeção entre e em forma de polinômio. Como é contínua no intervalo fechado , existe tal que para todo . Ademais, existe tal que para todos tais que , porque é uniformemente contínua (Teorema A.17).
O polinômio que vai aproximar será a esperança de uma variável aleatória cuja distribuição é parametrizada por .
Fixe algum . Para , defina uma variável aleatória e . Note que toma valores em e tem média .
O polinômio desejado será dado por
que é chamado polinômio de Bernstein.
Estimamos usando a Desigualdade de Tchebyshev:
o que conclui a prova do Teorema de Weierstrass.
Método de Monte Carlo
No problema da agulha de Buffon (Seção 1.1.3), vimos que ao lançarmos aleatoriamente uma agulha de comprimento sobre um piso cortado por um feixe de retas paralelas e equidistantes também de , a probabilidade de a agulha cruzar uma das retas do piso é de . Sendo assim, se lançarmos uma agulha sucessivas vezes e de modo independente, a Lei Forte dos Grandes Números nos diz que
onde é a função indicadora do evento que a agulha cruza alguma reta do piso na -ésima tentativa. Portanto, a Lei dos Grandes Números pode ser usada em simulações de lançamentos de agulha para estimarmos o valor de . Isto é, se aproxima de quando o número de tentativas, , é grande. Mais que isto, a Desigualdade de Tchebyshev nos diz que
Ou seja, temos inclusive um certo controle do quão grande deve ser o número de lançamentos, , para que uma aproximação com margem de erro tenha determinado nível de confiabilidade (no caso, ).1414 14 Este experimento já foi realizado por diversas personalidades ao longo do tempo, sendo que a provável primeira aproximação foi realizada pelo astrônomo suíço R. Wolf em 1850 que ao lançar uma agulha 5.000 vezes encontrou a aproximação .
Esta mesma ideia pode ser utilizada para se estimar, via Lei dos Grandes Números, diversas outras quantidades como no exemplo a seguir.
Exemplo 8.14.
Seja uma função integrável, gostaríamos de determinar quanto vale a integral . Sejam e duas sequências variáveis aleatórias independentes, todas elas com distribuição uniforme no intervalo e a sequência dada por . Isto é, para todo , são as coordenadas de um ponto sorteado uniformemente no quadrado e é a variável que indica se tal ponto se encontra abaixo do gráfico da função . Como a sequência é i.i.d., pela Lei Forte dos Grandes Números,
Ou seja, simulando distribuições uniformes no intervalo , podemos aproximar a integral definida por mais complicada que seja a função . ∎
Damos o nome de Método de Monte Carlo a qualquer cálculo que façamos via simulação (seja com computadores, lançando agulhas, dados, etc.), onde utilizamos a Lei dos Grandes Números para justificar o referido cálculo, como no exemplo acima. Tal ideia é utilizada em diversos campos do conhecimento, podendo ser aplicada desde o cálculo de velocidade de moléculas a probabilidades relacionadas a campeonatos de futebol.
Números normais
Suponha que um número tenha sido sorteado de modo uniforme em . O que podemos dizer sobre a frequência relativa com que cada dígito aparece na expansão decimal de ?
De modo mais formal, seja uma variável aleatória com distribuição uniforme em e defina , tomando valores em como sendo a sequência de dígitos na expansão decimal de .
Analogamente ao Lema 4.28, a sequência é i.i.d. com distribuição uniforme no conjunto . Portanto, para todo dígito , a sequência , dada por , também é i.i.d. com distribuição . Pela Lei Forte dos Grandes Números,
Dizemos que um número é simplesmente normal na base se todos os dígitos de sua expansão decimal aparecem com frequência relativa igual a . Observe que um número racional é simplesmente normal na base se, e somente se, sua dízima periódica contém todos os 10 dígitos e todos eles têm a mesma frequência de . Pela afirmação acima, um número sorteado uniformemente em é simplesmente normal na base , quase certamente. Acredita-se que , e sejam normais apesar de não haver ainda uma prova.
Dizemos que um número é normal na base se, para todo , todas as sequências de dígitos aparecem em sua expansão decimal com frequência relativa igual a . Utilizando a Lei Forte dos Grandes Números e com algum esforço adicional, pode-se mostrar que um número sorteado uniformemente em é quase certamente normal na base . A prova será dada como exercício guiado ao final deste capítulo.
Dado um número natural , dizemos que um número real é simplesmente normal na base se todos os dígitos de sua expansão na base aparecem com frequência relativa igual a , e dizemos que um número real é normal na base se, para todo , todas as sequências de dígitos aparecem em sua expansão decimal com frequência relativa igual a . No mesmo exercício guiado vamos mostrar que um número sorteado uniformemente em é quase certamente normal na base .
Finalmente, dizemos que um número é normal se ele é normal em toda base. Observe que um número sorteado uniformemente em é quase certamente normal, pois o evento de ser normal é interseção enumerável de eventos com probabilidade . Apesar disso, a construção explícita de um número normal é algo bastante desafiador.