11.6 Distribuição condicional regular
Na Seção 11.4 definimos para quaisquer variáveis aleatórias e com integrável, mas não dissemos como calculá-la. A Seção 11.2 se restringe ao caso em que ambas as variáveis são discretas, enquanto a Seção 11.3 descreve o caso de variáveis com densidade conjunta porém sem fornecer demonstrações rigorosas das propriedades enunciadas. O objetivo agora é dar significado à noção de distribuição condicional de dado no caso geral, unificando a abordagem das seções anteriores.
Definição 11.56.
Sejam e variáveis aleatórias definidas em um mesmo espaço de probabilidade. Uma distribuição condicional regular de dado é qualquer função de em , que a cada e associa um número, denotado , satisfazendo:
-
(1)
Para todo fixo, a função que leva em é uma medida de probabilidade em ;
-
(2)
Para todo fixo, a função que leva em é uma função mensurável;
-
(3)
Para todos , vale
Antes de prosseguir, é oportuno fazer algumas observações.
Primeiro, caso e sejam discretas, a equação acima se reduz a (11.21), portanto a definição de distribuição condicional regular generaliza (11.19).
Segundo, quando é absolutamente contínua, a equação acima se reduz a (11.28) pela regra da cadeia. Se e têm densidade conjunta, podemos deduzir, a partir de (11.29), que vale (11.28) para todos , e portanto a definição (11.27) resulta em uma distribuição condicional regular.
Por último, a definição acima pode parecer bastante abstrata, e talvez inútil, pois mesmo sabendo que sempre existe uma distribuição condicional regular, isso não diz como encontrá-la. Mencionamos de passagem que uma forma explícita de se obter uma distribuição condicional regular seria a seguinte. Primeiro calculamos
para os valores onde a expressão acima está bem definida e resulta em uma função de distribuição na variável .1818 18 É importante tomar o limite primeiro em e depois em , caso contrário pode não ser uma função de distribuição para nenhum , como podemos ver tomando , caso em que teríamos “” para todo . Depois definimos como sendo a única medida tal que para todo . Entretanto, essa forma não é a mais recomendada, nem do ponto de vista teórico nem do prático. Isso porque a fórmula (11.57) está na forma “diferencial” já que o limite em nos dá uma “derivada” na variável , enquanto a fórmula no item (3) está na forma integral, o que é bem mais robusto. Na prática, é melhor encontrar um candidato ad hoc para a distribuição condicional regular e verificar que ele satisfaz à definição (o limite acima pode nos ajudar a adivinhar quem deveria ser o candidato). Foi exatamente o que fizemos no parágrafo anterior, para justificar a fórmula (11.26)!
Os dois próximos teoremas serão demonstrados no Apêndice D.6.
Teorema 11.58.
Dadas duas variáveis aleatórias quaisquer e , sempre existe uma distribuição condicional regular de dado .
Vamos definir a partir de , e depois usá-la para construir explicitamente de forma a satisfazer às duas propriedades do Teorema 11.39. Ademais, o faremos de forma que seja coerente com as fórmulas (11.15) e (11.34).
Teorema 11.59.
Sejam e variáveis aleatórias e uma distribuição condicional regular. Então, para toda função mensurável , vale
sendo que a integral interna fornece uma função mensurável de .
Agora vamos supor que é integrável ou não-negativa. Observamos que está definida para -quase todo .1919 19 Se é não-negativa, , donde para -quase todo . Se é integrável, , donde para -quase todo . Em ambos casos, está definida para -quase todo . Definimos então
nos pontos para os quais a integral está definida, e caso contrário. Pela regra da cadeia, a fórmula acima se reduz a (11.34) caso e tenham densidade conjunta, ou (11.15) caso sejam discretas.
Definimos como a variável aleatória que assume o valor no evento , como havíamos feito nas Seções 11.2 e 11.3.
Proposição 11.62.
Se é integrável ou não-negativa, então a variável aleatória , como definida acima, satisfaz às duas propriedades do Teorema 11.39.
Demonstração.
Seja . Por definição, para algum . Tomando , pelo Teorema 11.59,
Procedendo de modo idêntico com a parte negativa e observando que a diferença está bem definida para -quase todo , obtemos
o que conclui a prova. ∎
Portanto, goza de todas as propriedades enunciadas na Seção 11.4. Em particular, e com isso justificamos também (11.37).
Veremos como se apresenta a distribuição condicional regular de dado em alguns casos especiais, além dos casos quando ambas são discretas ou possuem densidade conjunta, que vimos nas Seções 11.2 e 11.3.
Caso em que é discreta
O caso em que é uma variável aleatória discreta generaliza a abordagem da Seção 11.1. Neste caso, não precisamos da teoria de distribuição condicional regular, e somos obrigados a tomar literalmente
para todo tal que . Os valores tais que são irrelevantes, e para ter uma definição completa podemos tomar, por exemplo, .
Caso de variável discreta com parâmetro contínuo desconhecido
Suponha que seja discreta, seja absolutamente contínua, e que uma distribuição condicional regular seja conhecida. Seja uma função de probabilidade condicional associada.
Neste caso, uma distribuição condicional regular de dado tem densidade dada por
se , e caso contrário.
Mais precisamente, definimos . Para verificar a condição (2), definimos o conjunto enumerável , e observamos que, para cada fixo, podemos expressar como soma enumerável das funções mensuráveis
O numerador acima é uma função mensurável de pelo Lema 5.83, pois é dado pela integral em de uma função mensurável de e . Para verificar a condição (1), note que é não-negativa por definição, e é -aditiva em como consequência da -aditividade da integral. Ademais,
se , e caso contrário. Finalmente, para verificar condição (3) desenvolvemos
Exemplo 11.63 (Ensaios de Bernoulli com parâmetro dado por uma Beta).
Sejam e , variáveis aleatórias tais que e a distribuição condicional de dado que é . Neste caso,
para todo . Observamos também que , pois é uma função de densidade. Portanto, a distribuição condicional de dado que é uma distribuição Beta de parâmetros e . ∎
Caso em que é especificado
Os Exemplos 11.18, 11.20, 11.32 e 11.33 ilustraram o caso em que é especificado, juntamente com . Tal especificação deve satisfazer às condições (1) e (2), enquanto equação em (3) serve para determinar a distribuição conjunta , cuja marginal serve para determinar , e a integral (11.61) serve para calcular . O seguinte exemplo não se enquadra nos contextos das Seções 11.2 ou 11.3.
Exemplo 11.64.
Seja . Se , então uma moeda com probabilidade de sair cara é lançada vezes independentemente. Seja a variável aleatória que representa o número de caras obtidas.
A distribuição condicional de dado que é . Portanto, , ou seja, , logo