11.2 Função de probabilidade condicional
Consideramos agora o caso em que a partição é dada pelos valores assumidos por uma outra variável aleatória.
Definição 11.12 (Partição induzida por uma variável aleatória).
Seja uma variável aleatória simples. Sejam os distintos valores assumidos por e , de forma que . Definimos a partição induzida por como .
Observe que sempre é -mensurável. Ademais, se para alguma função , então também é -mensurável. Reciprocamente, se é -mensurável, então para alguma .
Definição 11.13 (Esperança condicional dada uma variável aleatória).
Sejam e variáveis aleatórias simples. Definimos a esperança condicional de dado como sendo a variável aleatória
Ou seja, assume o valor no evento .
Neste contexto, a Observação 11.9 nos diz que é, dentre todas a variáveis aleatórias que podem ser expressas como para alguma , a que minimiza .
Na prática, podemos calcular da seguinte maneira. Primeiro definimos a função de probabilidade condicional de dado como
para todo tal que . Nos pontos tais que podemos definir . Depois calculamos
Exemplo 11.16.
Seja um vetor aleatório com função de probabilidade conjunta dada por , , e . Então, a função de probabilidade marginal de , , é dada por
o que por sua vez nos permite calcular a função de probabilidade condicional de dado , , através de (11.14), obtendo
isto é,
Portanto, podemos calcular, via (11.15), que
logo quase certamente. ∎
Exemplo 11.17.
Sejam e variáveis independentes e . Conforme visto no Exemplo 4.20, , logo, . Assim,
onde na terceira igualdade utilizamos o fato de e serem independentes. Portanto, para todo ,
Logo, quase certamente. ∎
Nos exemplos acima, foi calculado a partir de via (11.14). Isso é útil quando literalmente podemos observar e queremos atualizar nossas expectativas com respeito à distribuição de . Há também o caso em que , ao invés de calculado, é especificado ou deduzido por primeiros princípios, e serve para aplicar (11.15) entre outras ferramentas.
Exemplo 11.18.
Um jogador lança um dado, e denota o número observado. Em seguida lança uma moeda honesta vezes, e denota o número de coroas obtidas. Queremos calcular e . Para cada e , temos . Calculamos então . Portanto, e, tomando a esperança iterada, . ∎
A partir da função de probabilidade condicional de dado , podemos também estudar a distribuição condicional de dado , definida por
para todo evento .
Exemplo 11.20.
Jogamos moedas honestas, as que exibem cara permanecem como estão e as que exibem coroa são novamente lançadas. Sejam o número de coroas obtidas após a primeira rodada de lançamentos e o número de coroas restantes após a segunda rodada de lançamentos. Neste caso, . Sendo assim, a distribuição condicional corresponde à distribuição . ∎
O comportamento conjunto de e , ou de isoladamente, pode ser estudado a partir dessa distribuição condicional, calculando-se a média sobre . Mais precisamente,
para quaisquer subconjuntos .
Exemplo 11.22.
A proposição abaixo diz que, se uma variável não nos dá informação alguma acerca de outra variável , então a melhor aproximação para o valor de sabendo-se o valor de nada mais é do que a própria esperança de , não importando o valor de .
Proposição 11.23 (Variáveis independentes).
Sejam e variáveis aleatórias simples. Se e são independentes, então .
Demonstração.
Imediato pois
para todo . ∎
Exemplo 11.24.
Sejam variáveis com a mesma esperança, e uma variável aleatória assumindo valores em independente de . Definimos
a soma dos primeiros termos da sequência. Ou seja, é a soma de uma quantidade aleatória de variáveis aleatórias. Mais formalmente, definimos , para todo , e então definimos . Vamos mostrar que
e, portanto, pelo Teorema 11.5,
isto é, o valor médio de uma soma aleatória é o valor médio do número de parcelas vezes o valor médio de cada parcela. Com efeito,
Na segunda igualdade usamos o Teorema 11.8. Na quarta, usamos que é independente de , donde podemos aplicar a Proposição 11.23. Na quinta, usamos o fato de as variáveis terem a mesma esperança. ∎