Nesta seção, provaremos uma série de desigualdades de fundamental importância, que fornecem estimativas para probabilidades de eventos ou momentos de variáveis aleatórias.
O primeiro teorema é emblemático, a simplicidade de sua prova contrasta com sua enorme aplicabilidade, como veremos ao longo deste livro.
Repare que começamos a utilizar esperança e momentos para estimar probabilidades.
Teorema 6.19(Desigualdade de Markov).
Sejam uma variável aleatória, e .
Então
Demonstração.
Como , segue que .
Portanto,
∎
Teorema 6.20(Desigualdade de Tchebyshev).
Seja uma variável aleatória integrável e seja uma constante.
Então
Demonstração.
Aplicamos a Desigualdade de Markov a com :
Exemplo 6.21.
Estimar a probabilidade de uma variável aleatória não diferir de sua média por mais que duas vezes o valor do seu desvio-padrão .
Usando a Desigualdade de Tchebyshev,
Veremos agora uma desigualdade muito útil, que diz respeito a funções convexas.
Dado um intervalo aberto , dizemos que é uma função convexa se
para quaisquer e com .
Essa condição de convexidade pode ser reescrita da seguinte maneira: para todos em , vale
(6.22)
Podemos obter outras caracterizações de convexidade explorando a possível diferenciabilidade de .
Se existe e é não-decrescente em todo , então pelo Teorema do Valor Médio satisfaz (6.22) e portanto é convexa.
Em particular, se existe e é não-negativa em todo , então é convexa.
São convexas em as funções , e com .
As funções , e são convexas em .
Teorema 6.23(Desigualdade de Jensen).
Seja um intervalo aberto, uma função convexa, e uma variável aleatória integrável assumindo valores em .
Então está definida e
Observamos que o teorema acima não exclui a possibilidade de .
Preliminarmente, afirmamos que, para cada fixo, existe tal que
para todo (caso seja diferenciável, podemos tomar e estamos falando que o gráfico de está acima de suas retas tangentes).
Com efeito, considerando os possíveis valores dos lados esquerdo e direito de (6.22) e usando o Teorema A.1, obtemos tal que
para todo e todo , provando a afirmação.
Finalmente, tomando e usando no lugar de , obtemos
o que conclui a demonstração.
∎
Vejamos alguns exemplos comuns de uso da Desigualdade de Jensen.
Exemplo 6.24.
Se é integrável e , então
Se é integrável e positiva, então
Com efeito, a primeira desigualdade é obtida usando-se a desigualdade de Jensen com no lugar de e , a segunda usa , e as outras são imediatas da Desigualdade de Jensen.
∎
O próximo teorema é uma importante aplicação da Desigualdade de Jensen.
Teorema 6.25(Desigualdade de Lyapunov).
Sejam uma variável aleatória e .
Então
Demonstração.
Se a desigualdade vale trivialmente.
Suponha que . Como , segue que é integrável.
Observando que a função é convexa, temos pela Desigualdade de Jensen que
.
Elevando todos os termos a , obtemos a desigualdade desejada.
∎
Terminamos esta seção com a Desigualdade de Cauchy-Schwarz e uma de suas principais aplicações, a Desigualdade de Paley-Zygmund.
Apesar de fundamentais em diversas aplicações, essas desigualdades não serão usadas no restante deste livro e podem ser omitidas em um curso introdutório.
Teorema 6.26(Desigualdade de Cauchy-Schwarz).
Se e têm segundo momento finito, então é integrável e
Ainda, se , então existe tal que , ou então .
Demonstração.
Primeiro veja que é integrável porque .
Sejam e .
Se ou , o teorema vale trivialmente.
Assumimos então que e .
Observamos que
donde
Se , vale a igualdade na equação acima, donde
logo e portanto com .
∎
Munidos dessa desigualdade, podemos finalmente provar a Proposição 6.18.
Sejam e as padronizações de e , respectivamente.
Então,
onde a última desigualdade é a Desigualdade de Cauchy-Schwarz.
Suponha que .
Neste caso, vale a igualdade na equação acima.
Pela recíproca da Desigualdade de Cauchy-Schwarz, q.c. ou q.c. com .
Por outro lado, como , segue que q.c. e, portanto, q.c. com algum e .
Reciprocamente, se q.c. com algum e , então q.c., donde .
Repetindo-se o mesmo argumento com no lugar de , obtemos que
valendo a igualdade se, e somente se, q.c. com algum e .
∎
Exemplo 6.27.
Sejam e variáveis aleatórias de Bernoulli com parâmetro , onde e são eventos independentes. Então,
Por outro lado,
Como , a Desigualdade de Cauchy-Schwarz é satisfeita, valendo a igualdade nos casos extremos e .
∎
As desigualdades a seguir cotam as probabilidades de uma variável aleatória ser grande ou pequena em função dos seus dois primeiros momentos. Elas são também conhecidas como método do primeiro e segundo momentos.
Teorema 6.28.
Seja uma variável aleatória assumindo valores inteiros e não-negativos.
Então,
Demonstração.
Como , aplicando a Desigualdade de Markov, obtemos . ∎
Teorema 6.29(Desigualdade de Paley-Zygmund).
Seja uma variável aleatória não-negativa com segundo momento finito.
Para todo vale
Demonstração.
Basta escrever
Aplicando a Desigualdade de Cauchy-Schwarz ao último termo, obtemos
Logo,
O que conclui a prova do teorema.
∎
O caso especial já é extremamente interessante, pois dá uma cota para que a variável aleatória assuma valores não-nulos a partir da estimativa de seu segundo momento em termos do quadrado do seu primeiro momento.