11.3 Densidade condicional

Dadas duas variáveis aleatórias simples XX e YY, na seção anterior definimos a variável aleatória 𝔼[X|Y],\mathbb{E}[X\,|\,Y], que assume o valor 𝔼[X|Y=y]\mathbb{E}[X\,|\,Y=y] no evento {Y(ω)=y}\{Y(\omega)=y\}. Naquele contexto, o valor 𝔼[X|Y=y]\mathbb{E}[X\,|\,Y=y] para yy tal que (Y=y)>0\mathbb{P}(Y=y)>0 pode ser calculado a partir da distribuição condicional

X|Y(B|y)=(XB|Y=y)=(XB,Y=y)(Y=y),\mathbb{P}_{X|Y}(B|y)=\mathbb{P}(X\in B\,|\,Y=y)=\frac{\mathbb{P}(X\in B,Y=y)}% {\mathbb{P}(Y=y)}, (11.25)

como feito nas Seções 3.45.4. Entretanto, quando YY é uma variável aleatória contínua, a fórmula (11.25) resulta na forma indeterminada 00\frac{0}{0}. Gostaríamos de poder definir X|Y(B|y)\mathbb{P}_{X|Y}(B|y) de forma tal que permita recuperar as propriedades vistas na seção anterior.

Nesta seção consideraremos o caso em que XX e YY têm densidade conjunta. Faremos uma apresentação informal buscando motivar as definições e propriedades mais importantes. Uma justificativa mais rigorosa das propriedades aqui enunciadas será dada na Seção 11.6.

Por analogia a (11.14) definimos a densidade condicional de XX dado YY por

fX|Y(x|y)=fX,Y(x,y)fY(y)f_{X|Y}(x|y)=\frac{f_{X,Y}(x,y)}{f_{Y}(y)} (11.26)

para todo yy tal que fY(y)>0f_{Y}(y)>0. Para os pontos yy onde fY(y)=0f_{Y}(y)=0, definimos, por convenção fX|Y(x|y)=fX(x)f_{X|Y}(x|y)=f_{X}(x).

Observe-se que, se multiplicamos a equação acima por Δx\Delta x, obtemos

fX|Y(x|y)Δx\displaystyle f_{X|Y}(x|y)\,\Delta x =fX,Y(x,y)ΔxΔyfY(y)Δy(xXx+Δx,yYY+Δy)(yYy+Δy)\displaystyle=\frac{f_{X,Y}(x,y)\Delta x\Delta y}{f_{Y}(y)\Delta y}\approx% \frac{\mathbb{P}(x\leqslant X\leqslant x+\Delta x,y\leqslant Y\leqslant Y+% \Delta y)}{\mathbb{P}(y\leqslant Y\leqslant y+\Delta y)}
=(xXx+Δx|yYy+Δy).\displaystyle=\mathbb{P}(x\leqslant X\leqslant x+\Delta x|y\leqslant Y% \leqslant y+\Delta y).

Ou seja, coerentemente com a ideia de que fX(x)Δxf_{X}(x)\,\Delta x representa a probabilidade de XX estar em [x,x+Δx][x,x+\Delta x], aqui fX|Y(x|y)Δxf_{X|Y}(x|y)\,\Delta x representa a probabilidade condicional de tal evento dado que YY está em [y,y+Δy][y,y+\Delta y].

A densidade condicional de XX dado YY define uma distribuição parametrizada por yy, à que chamamos distribuição condicional de XX dado YY, dada por

X|Y(B|y)=BfX|Y(x|y)dx\mathbb{P}_{X|Y}(B|y)=\int_{B}f_{X|Y}(x|y)\,\mathrm{d}x (11.27)

para todo intervalo BB\subseteq\mathbb{R}. Repare na semelhança com (11.19).

Assim como vimos no caso discreto, a distribuição conjunta de XX e YY, ou de XX isoladamente, pode ser calculada a partir dessa distribuição condicional, tomando-se a média sobre yy, isto é,

(XB,YC)=CX|Y(B|y)fY(y)dy,\mathbb{P}(X\in B,Y\in C)=\int_{C}\mathbb{P}_{X|Y}(B|y)f_{Y}(y)\,\mathrm{d}y, (11.28)

para quaisquer intervalos BB e CC, veja a semelhança com (11.21).

Observe que logramos obter expressões úteis envolvendo probabilidades condicionais, apesar de estarmos condicionando em um evento de medida zero. Essas expressões justificam-se mutuamente, pois

B×CfX,Y(x,y)dxdy=C(BfX,Y(x,y)fY(y)dx)fY(y)dy.\iint_{B\times C}f_{X,Y}(x,y)\mathrm{d}x\mathrm{d}y=\int_{C}\Big{(}\int_{B}% \tfrac{f_{X,Y}(x,y)}{f_{Y}(y)}\mathrm{d}x\Big{)}f_{Y}(y)\mathrm{d}y. (11.29)
Exemplo 11.30.

Sejam XX e YY com densidade conjunta

fX,Y(x,y)={6xy(2xy),0<x<1,0<y<1,0,caso contrário.f_{X,Y}(x,y)=\begin{cases}6xy(2-x-y),&0<x<1,0<y<1,\\ 0,&\text{caso contr\'{a}rio}.\end{cases}

Vamos determinar a densidade condicional de XX dado YY. Primeiramente,

fY(y)=+fX,Y(x,y)dx=016xy(2xy)dx=4y3y2f_{Y}(y)=\int_{-\infty}^{+\infty}f_{X,Y}(x,y)\mathrm{d}x=\int_{0}^{1}6xy(2-x-y% )\mathrm{d}x=4y-3y^{2}

se y(0,1)y\in(0,1) e 0 caso contrário. Para y[0,1]y\in[0,1], calculamos

fX|Y(x|y)=fX,Y(x,y)fY(y)=6x(2xy)43y𝟙[0,1](x)f_{X|Y}(x\,|\,y)=\frac{f_{X,Y}(x,y)}{f_{Y}(y)}=\frac{6x(2-x-y)}{4-3y}\mathds{1% }_{[0,1]}(x)

Para y[0,1]y\not\in[0,1], tomamos, por exemplo, fX|Y(x|y)=6x(1x)𝟙[0,1](x)f_{X|Y}(x\,|\,y)=6x(1-x)\mathds{1}_{[0,1]}(x). ∎

Exemplo 11.31.

Sejam XX e YY com densidade conjunta

fX,Y(x,y)={12yexy,0<x< e 0<y<2,0,caso contrário.f_{X,Y}(x,y)=\begin{cases}\frac{1}{2}ye^{-xy},&0<x<\infty\text{ \ e \ }0<y<2,% \\ 0,&\text{caso contr\'{a}rio}.\end{cases}

Vamos determinar a densidade condicional de XX dado YY. Temos

fY(y)=+fX,Y(x,y)dx=120yexydx=12f_{Y}(y)=\int_{-\infty}^{+\infty}f_{X,Y}(x,y)\mathrm{d}x=\frac{1}{2}\int_{0}^{% \infty}ye^{-xy}\mathrm{d}x=\frac{1}{2}

para 0<y<20<y<2. Logo Y𝒰[0,2]Y\sim\mathcal{U}[0,2]. Assim, para y(0,2)y\in(0,2) temos

fX|Y(x|y)=fX,Y(x,y)fY(y)={yexy,x>0,0,x0.f_{X|Y}(x\,|\,y)=\frac{f_{X,Y}(x,y)}{f_{Y}(y)}=\begin{cases}ye^{-xy},&x>0,\\ 0,&x\leqslant 0.\end{cases}\qed

Uma situação muito comum na prática é quando são especificadas fYf_{Y} e fX|Yf_{X|Y}. Neste caso, podemos estudar a variável XX a partir de YY e da informação sobre como esta influencia aquela. Mais precisamente, podemos usar

fX,Y(x,y)=fX|Y(x|y)fY(y)f_{X,Y}(x,y)=f_{X|Y}(x|y)\,f_{Y}(y)

e

fX(x)=+fX|Y(x|y)fY(y)dy.f_{X}(x)=\int_{-\infty}^{+\infty}f_{X|Y}(x|y)f_{Y}(y)\,\mathrm{d}y.
Exemplo 11.32.

Sejam XX e YY variáveis aleatórias tais que Y𝒰[0,2]Y\sim\mathcal{U}[0,2] e, condicionado a que Y=yY=y, XX tem distribuição uniforme em [0,y][0,y]. Isto é,

fX|Y(x|y)={1y,0<x<y<2,0,caso contrário.f_{X|Y}(x\,|\,y)=\begin{cases}\frac{1}{y},&0<x<y<2,\\ 0,&\text{caso contr\'{a}rio}.\end{cases}

Sendo assim, podemos calcular as densidades conjunta e marginal utilizando as fórmulas acima, obtendo

fX,Y(x,y)=fX|Y(x|y)fY(y)={12y,0<x<y<2,0,caso contrário.f_{X,Y}(x,y)=f_{X|Y}(x|y)\,f_{Y}(y)=\begin{cases}\frac{1}{2y},&0<x<y<2,\\ 0,&\text{caso contr\'{a}rio}.\end{cases}

e

fX(x)=+fX|Y(x|y)fY(y)dy=x212y12dy=12logx2f_{X}(x)=\int_{-\infty}^{+\infty}f_{X|Y}(x|y)f_{Y}(y)\,\mathrm{d}y=\int_{x}^{2% }\frac{1}{2y}\,\frac{1}{2}\,\mathrm{d}y=-\frac{1}{2}\log\frac{x}{2}

para x(0,2]x\in(0,2] e zero caso contrário. ∎

Exemplo 11.33.

Sejam XX e YY variáveis aleatória, onde YGama(2,λ)Y\sim\mathop{\mathrm{Gama}}\nolimits(2,\lambda) e condicionado que Y=yY=y, XX tem distribuição 𝒰[0,y]\mathcal{U}[0,y]. Isto é, a densidade condicional fX|Yf_{X|Y} é especificada e vale 1y𝟙[0,y](x)\tfrac{1}{y}\mathds{1}_{[0,y]}(x). Sendo assim, podemos determinar a densidade de XX como

fX(x)\displaystyle f_{X}(x) =+fX|Y(x|y)fY(y)dy=𝟙[0,+)(x)x+1yλ2yeλydy\displaystyle=\int_{-\infty}^{+\infty}f_{X|Y}(x|y)f_{Y}(y)\,\mathrm{d}y=% \mathds{1}_{[0,+\infty)}(x)\int_{x}^{+\infty}\tfrac{1}{y}\lambda^{2}ye^{-% \lambda y}\,\mathrm{d}y
=λeλx𝟙(0,+)(x).\displaystyle=\lambda e^{-\lambda x}\mathds{1}_{(0,+\infty)}(x).

Isto é, XExp(λ)X\sim\mathop{\mathrm{Exp}}\nolimits(\lambda). ∎

A partir da distribuição condicional de XX dado YY, podemos calcular a esperança condicional de XX dado YY. Por analogia a (11.15), definimos

𝔼[X|Y=y]=+xfX|Y(x|y)dx.\mathbb{E}[X|Y=y]=\int_{-\infty}^{+\infty}x\cdot f_{X|Y}(x|y)\,\mathrm{d}x. (11.34)
Exemplo 11.35.

Se XX e YY são as variáveis do Exemplo 11.32, podemos calcular

𝔼[X|Y=y]=+xfX|Y(x|y)dx=0yxydx=y2,\mathbb{E}[X|Y=y]=\int_{-\infty}^{+\infty}x\cdot f_{X|Y}(x|y)\,\mathrm{d}x=% \int_{0}^{y}\frac{x}{y}\,\mathrm{d}x=\frac{y}{2},

o que já era de se esperar dado que, condicionado ao evento {Y=y}\{Y=y\}, a variável XX tem distribuição uniforme em [0,y][0,y]. ∎

Como na seção anterior, definimos 𝔼[X|Y]\mathbb{E}[X|Y] como a variável aleatória que toma valor 𝔼[X|Y=y]\mathbb{E}[X|Y=y] no evento {Y=y}\{Y=y\}. Observe que 𝔼[X|Y]\mathbb{E}[X|Y] é uma variável aleatória que pode ser expressa como uma função de YY.

Exemplo 11.36.

No Exemplo 11.31, calculemos 𝔼[X2|Y]\mathbb{E}\left[X^{2}\big{|}Y\right] e 𝔼[X2|Y=1]\mathbb{E}\left[X^{2}\big{|}Y=1\right].

Considerando a densidade condicional já calculada no Exemplo 11.31, temos

𝔼[X2|Y=y]=0+x2yexydx=2y0+eyxdx=2y2.\mathbb{E}[X^{2}\big{|}Y=y]=\int_{0}^{+\infty}x^{2}ye^{-xy}\mathrm{d}x=\frac{2% }{y}\int_{0}^{+\infty}e^{-yx}\mathrm{d}x=\frac{2}{y^{2}}.

Logo,

𝔼[X2|Y]=2Y2 e 𝔼[X2|Y=1]=2.\mathbb{E}\big{[}X^{2}\big{|}Y\big{]}=\frac{2}{Y^{2}}\quad\text{ e }\quad% \mathbb{E}\big{[}X^{2}\big{|}Y=1\big{]}=2.\qed

Como no Teorema 11.5, vale a propriedade da esperança iterada:

𝔼X=𝔼[𝔼[X|Y]].\mathbb{E}X=\mathbb{E}\big{[}\mathbb{E}[X|Y]\big{]}. (11.37)

No contexto da seção anterior, esta fórmula toma a forma

𝔼X=y𝔼[X|Y=y]pY(y),\mathbb{E}X=\sum_{y}\mathbb{E}[X|Y=y]\,p_{Y}(y),

enquanto que no contexto desta seção temos,

𝔼X=+𝔼[X|Y=y]fY(y)dy.\mathbb{E}X=\int_{-\infty}^{+\infty}\mathbb{E}[X|Y=y]\,f_{Y}(y)\,\mathrm{d}y.
Exemplo 11.38.

Continuando os Exemplos 11.3211.35,

𝔼X=+𝔼[X|Y=y]fY(y)dy=02y212dy=12.\mathbb{E}X=\int_{-\infty}^{+\infty}\mathbb{E}[X|Y=y]\,f_{Y}(y)\,\mathrm{d}y=% \int_{0}^{2}\frac{y}{2}\,\frac{1}{2}\,\mathrm{d}y=\frac{1}{2}.\qed