A Desigualdade de Concentração de Chernoff diz que a probabilidade de um grande desvio decai, pelo menos, exponencialmente rápido.
Porém, em muitos casos, vale algo muito mais forte: a velocidade de decaimento é exatamente exponencial, com uma taxa que pode ser descrita quase explicitamente.
Definição 15.4(Função taxa).
Seja uma variável aleatória.
Definimos a função taxa associada à distribuição de , como a função dada por
(15.5)
onde é a função geradora de momentos da variável .
Podemos pensar na função taxa como uma tentativa de obter a melhor estimativa possível a partir de (15.2).
A razão pela qual a função merece esse nome é que,
uma vez que maximizamos sobre todo ,
a desigualdade (15.2) deixa de ser apenas mais uma cota superior, sendo de fato a melhor cota superior possível.
A maximização em (15.5) é conhecida como a transformada de Legendre, isto é, a função taxa é a transformada de Legendre do logaritmo da função geradora de momentos.
Dado , para descrever a maneira mais fácil (ou menos difícil) de estar em , vamos denotar
Se for um intervalo da reta, denotaremos por o seu interior (o intervalo excluindo as extremidades de ) e por o seu fecho (o intervalo incluindo as extremidades de caso sejam números reais), respectivamente.
Teorema 15.6(Princípio dos Grandes Desvios de Cramér).
Sejam variáveis aleatórias i.i.d., com distribuição comum , e um intervalo de .
Se , então
onde é a função taxa da variável . Em particular, quando , temos a taxa exata de decaimento exponencial para estas probabilidades:
Caso , vale
para todo .
A demonstração do teorema acima será dada na próxima seção.
Antes disso, vamos discutir a relação entre a função geradora de momentos, , e sua transformada de Legendre, a função taxa .
Vejamos como encontrar graficamente e algebricamente.
No caso de o supremo em (15.5) ser atingido em para algum no interior do intervalo onde é finita,
a derivada de se anula em ,
donde
(15.7)
Às vezes é possível expressar em termos de , e assim calcular por
Esse processo de encontrar tal que e expressar está ilustrado na Figura 15.1 e nos exemplos abaixo.
Reciprocamente, se existe tal que , então o supremo em (15.5) é atingido em , pois, como mostraremos mais abaixo, é uma função convexa.
Figura 15.1: Obtenção da função taxa a partir da função .
Exemplo 15.8.
Se , temos
assim
portanto,
Exemplo 15.9.
Se ,
temos
Analisando o gráfico de , observamos que o supremo de é atingido em algum somente se .
Neste caso,
e
Se , o supremo vale , pois tende a quando .
Se , o supremo vale pois para todo .
Em resumo,
Os casos e refletem o fato de que variáveis de Poisson nunca tomam valores negativos, e tomam o valor zero com probabilidade .
∎
Exercício 15.10.
Calcule a função taxa da variável nos seguintes casos:
(a)
.
(b)
.
(c)
q.c.
∎
Como dito anteriormente, é uma função convexa, a função I também goza da mesma propriedade.
Proposição 15.11.
As funções e são convexas.
Demonstração.
Consideremos inicialmente a função .
Sejam e .
Para e ,
o que mostra que a função taxa é convexa.
Passamos agora à convexidade de . Sejam e .
Usando a Desigualdade de Hölder (Apêndice D.7),