4.2 Vetores aleatórios discretos e contínuos

Dizemos que um vetor aleatório 𝑿{\boldsymbol{X}} é discreto se existe um subconjunto enumerável AnA\subseteq\mathbb{R}^{n} tal que (𝑿A)=1\mathbb{P}({\boldsymbol{X}}\in A)=1. Neste caso, a função de probabilidade conjunta de 𝑿{\boldsymbol{X}} é dada por

p𝑿(𝒙)=(𝑿=𝒙).p_{{\boldsymbol{X}}}({\boldsymbol{x}})=\mathbb{P}\big{(}{\boldsymbol{X}}={% \boldsymbol{x}}\big{)}.

Um vetor aleatório 𝑿{\boldsymbol{X}} é discreto se, e somente se, suas coordenadas X1,,XnX_{1},\dots,X_{n} são discretas.

A função de probabilidade marginal de uma componente XkX_{k} é obtida somando-se nas demais variáveis:

pXk(xk)\displaystyle p_{X_{k}}(x_{k}) =(Xk=xk)\displaystyle=\mathbb{P}(X_{k}=x_{k})
=x1xk1xk+1xnp𝑿(x1,,xk1,xk,xk+1,,xn).\displaystyle=\sum_{x_{1}}\cdots\sum_{x_{k-1}}\sum_{x_{k+1}}\cdots\sum_{x_{n}}% \,p_{{\boldsymbol{X}}}(x_{1},\dots,x_{k-1},x_{k},x_{k+1},\dots,x_{n}).

Para a última igualdade acima basta observar que o evento {Xk=xk}\{X_{k}=x_{k}\} pode ser escrito como a união disjunta de

{Xk=xk,𝑿A}=x1xk1xk+1xn{(X1,,Xn)=(x1,,xn)}\{X_{k}=x_{k},{{\boldsymbol{X}}}\in A\}=\cup_{x_{1}}\cdots\cup_{x_{k-1}}\cup_{% x_{k+1}}\cdots\cup_{x_{n}}\{(X_{1},\dots,X_{n})=(x_{1},\dots,x_{n})\}

com o evento {Xk=xk,𝑿A}\{X_{k}=x_{k},{{\boldsymbol{X}}}\not\in A\}, que tem probabilidade zero.

Exemplo 4.14.

No Exemplo 4.4, vamos obter a função de probabilidade conjunta de 𝑿{\boldsymbol{X}}, e as funções de probabilidade marginais de X1X_{1} e X2X_{2}.

Primeiramente, pela descrição do vetor (X1,X2)(X_{1},X_{2}), sabemos que pX1,X2(0,2)=pX1,X2(2,0)=14p_{X_{1},X_{2}}(0,2)=p_{X_{1},X_{2}}(2,0)=\frac{1}{4}, pX1,X2(1,1)=12p_{X_{1},X_{2}}(1,1)=\frac{1}{2}, e pX1,X2p_{X_{1},X_{2}} vale zero fora desses três pontos. Somando em sobre x2x_{2}, encontramos a função de probabilidade marginal, que é dada por pX1(0)=pX1(2)=14p_{X_{1}}(0)=p_{X_{1}}(2)=\frac{1}{4} e pX1(1)=12p_{X_{1}}(1)=\frac{1}{2}.

Observe que os mesmos valores podem ser lidos a partir dos saltos da função de distribuição marginal obtida no Exemplo 4.8. ∎

Proposição 4.15 (Critério de independência, caso discreto).

Seja 𝐗=(X1,,Xn){{\boldsymbol{X}}}=(X_{1},\dots,X_{n}) um vetor aleatório discreto. Então X1,,XnX_{1},\dots,X_{n} são independentes se, e somente se, p𝐗(𝐱)=pX1(x1)pXn(xn)p_{{\boldsymbol{X}}}({\boldsymbol{x}})=p_{X_{1}}(x_{1})\cdots p_{X_{n}}(x_{n}) para todo 𝐱n{\boldsymbol{x}}\in\mathbb{R}^{n}.

Demonstração.

A implicação direta é trivial. Para a implicação inversa, suponha que p𝑿(𝒙)=pX1(x1)pXn(xn)p_{{\boldsymbol{X}}}({\boldsymbol{x}})=p_{X_{1}}(x_{1})\cdots p_{X_{n}}(x_{n}) para todo 𝒙n{\boldsymbol{x}}\in\mathbb{R}^{n}. Neste caso,

(X1B1,,XnBn)=x1B1xnBnp𝑿(𝒙)==[x1B1pX1(x1)][xnBbpXn(xn)]=(X1B1)(XbBn),\mathbb{P}(X_{1}\in B_{1},\dots,X_{n}\in B_{n})=\sum_{x_{1}\in B_{1}}\cdots% \sum_{x_{n}\in B_{n}}p_{{\boldsymbol{X}}}({\boldsymbol{x}})=\\ =\left[\sum_{{x_{1}\in B_{1}}}p_{X_{1}}(x_{1})\right]\cdots\left[\sum_{{x_{n}% \in B_{b}}}p_{X_{n}}(x_{n})\right]=\mathbb{P}(X_{1}\in B_{1})\cdots\mathbb{P}(% X_{b}\in B_{n}),

para todos B1,,BnB_{1},\dots,B_{n}\in\mathcal{B}, e portanto as X1,,XnX_{1},\dots,X_{n} são independentes. ∎

Dados um vetor aleatório 𝑿{\boldsymbol{X}} e uma função mensurável66 6 Qualquer função que é contínua ou que pode ser aproximada por funções contínuas é uma função mensurável. De fato é muito difícil construir uma função que não seja mensurável. Veja a Seção 3.7 para mais detalhes. f𝑿:nf_{{\boldsymbol{X}}}:\mathbb{R}^{n}\to\mathbb{R}, dizemos que 𝑿{\boldsymbol{X}} é absolutamente contínuo com função de densidade conjunta f𝐗f_{{\boldsymbol{X}}} se

(aj<Xjbj,j=1,,n)=a1b1anbnf𝑿(x1,,xn)dxndx1\mathbb{P}(a_{j}<X_{j}\leqslant b_{j},\ j=1,\dots,n)=\int_{a_{1}}^{b_{1}}\dots% \int_{a_{n}}^{b_{n}}f_{{\boldsymbol{X}}}(x_{1},\dots,x_{n})\,\mathrm{d}x_{n}% \cdots\mathrm{d}x_{1}

para todas as escolhas de aj<bja_{j}<b_{j} para j=1,,nj=1,\dots,n.

A função de distribuição conjunta de um vetor aleatório absolutamente contínuo com densidade conjunta f𝑿f_{{{\boldsymbol{X}}}} pode ser calculada por:

F𝑿(𝒙)=x1xnf𝑿(𝒔)dsnds1.\displaystyle F_{{\boldsymbol{X}}}({{\boldsymbol{x}}})=\int_{-\infty}^{x_{1}}% \cdots\int_{-\infty}^{x_{n}}f_{{\boldsymbol{X}}}({\boldsymbol{s}})\,\mathrm{d}% s_{n}\cdots\mathrm{d}s_{1}.

Se suspeitamos que um vetor aleatório possui densidade conjunta, podemos obter um candidato a densidade calculando

f𝑿(𝒙)\displaystyle f_{{\boldsymbol{X}}}({\boldsymbol{x}}) =nx1xnF𝑿(x1,,xn).\displaystyle=\frac{\partial^{n}}{\partial x_{1}\cdots\partial x_{n}}F_{{% \boldsymbol{X}}}(x_{1},\dots,x_{n}).

Uma vez calculada f𝑿f_{{\boldsymbol{X}}} por essa fórmula, podemos verificar se é de fato uma densidade conjunta mostrando que sua integral coincide com F𝑿F_{{\boldsymbol{X}}}.

A função de densidade marginal de uma componente XkX_{k} é obtida integrando-se nas demais variáveis:

fXk(xk)=++n1 vezesf𝑿(x1,,xk,,xn)dx1dxnexceto xk.f_{X_{k}}(x_{k})=\underbrace{\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+% \infty}}_{n-1\text{ vezes}}f_{{\boldsymbol{X}}}(x_{1},\dots,x_{k},\dots,x_{n})% \underbrace{\mathrm{d}x_{1}\cdots\mathrm{d}x_{n}}_{\text{exceto }x_{k}}.

Vejamos que a densidade marginal fXkf_{X_{k}} é uma densidade de XkX_{k}. Como f𝑿f_{{\boldsymbol{X}}} é não-negativa, segue que fXkf_{X_{k}} será não-negativa para cada kk. Além disso, para todo intervalo BB, definindo a região 𝑩={𝒙n:xkB}{\boldsymbol{B}}=\{{\boldsymbol{x}}\in\mathbb{R}^{n}:x_{k}\in B\}, obtemos

Xk(B)\displaystyle\mathbb{P}_{X_{k}}(B) =(XkB)=(𝑿𝑩)=𝑩f𝑿(𝒙)dn𝒙\displaystyle=\mathbb{P}(X_{k}\in B)=\mathbb{P}({\boldsymbol{X}}\in{% \boldsymbol{B}})=\int_{{\boldsymbol{B}}}f_{{\boldsymbol{X}}}({\boldsymbol{x}})% \,\mathrm{d}^{n}{\boldsymbol{x}}
=B++n1 vezesf𝑿(x1,,xk,,xn)dx1dxnexceto xkdxk\displaystyle=\int_{B}\underbrace{\int_{-\infty}^{+\infty}\cdots\int_{-\infty}% ^{+\infty}}_{n-1\text{ vezes}}f_{{\boldsymbol{X}}}(x_{1},\dots,x_{k},\dots,x_{% n})\underbrace{\mathrm{d}x_{1}\cdots\mathrm{d}x_{n}}_{\text{exceto }x_{k}}% \mathrm{d}x_{k}
=BfXk(xk)dxk.\displaystyle=\int_{B}f_{X_{k}}(x_{k})\mathrm{d}x_{k}.

Logo, fXk(xk)f_{X_{k}}(x_{k}) é uma densidade de XkX_{k}.

Exemplo 4.16.

Considere o quadrado Q={(x,y)2:|x|+|y|<1}Q=\{(x,y)\in\mathbb{R}^{2}:|x|+|y|<1\}, e suponha que XX e YY tenham densidade conjunta dada por fX,Y(x,y)=12𝟙Q(x,y)f_{X,Y}(x,y)=\frac{1}{2}\mathds{1}_{Q}(x,y). Podemos determinar a densidade marginal de XX integrando:

fX(x)=+12𝟙Q(x,y)dy=(1|x|)𝟙[1,1](x).f_{X}(x)=\int_{-\infty}^{+\infty}\tfrac{1}{2}\mathds{1}_{Q}(x,y)\,\mathrm{d}y=% (1-|x|)\mathds{1}_{[-1,1]}(x).

Analogamente, se integramos em xx obtemos fY(y)=(1|y|)𝟙[1,1](y)f_{Y}(y)=(1-|y|)\mathds{1}_{[-1,1]}(y). ∎

Proposição 4.17 (Critério de independência, caso contínuo).

Seja 𝐗=(X1,,Xn){\boldsymbol{X}}=(X_{1},\dots,X_{n}) um vetor aleatório cujas coordenadas X1,,XnX_{1},\dots,X_{n} tenham função de densidade fX1,,fXnf_{X_{1}},\dots,f_{X_{n}}. Então X1,,XnX_{1},\dots,X_{n} são independentes se, e somente se, a função dada por f𝐗(𝐱)=fX1(x1)fXn(xn)f_{{\boldsymbol{X}}}({\boldsymbol{x}})=f_{X_{1}}(x_{1})\cdots f_{X_{n}}(x_{n}) é uma densidade conjunta de 𝐗{\boldsymbol{X}}.

Demonstração.

Suponha que f𝑿(𝒙)=fX1(x1)fXn(xn)f_{{\boldsymbol{X}}}({\boldsymbol{x}})=f_{X_{1}}(x_{1})\cdots f_{X_{n}}(x_{n}) seja uma densidade conjunta de 𝑿{\boldsymbol{X}}. Integrando,

F𝑿(𝒙)=x1xnfX1(s1)fXn(sn)dsnds1=FX1(x1)FXn(xn)\displaystyle\mathclap{F_{{\boldsymbol{X}}}({\boldsymbol{x}})=\int_{-\infty}^{% x_{1}}\cdots\int_{-\infty}^{x_{n}}f_{X_{1}}(s_{1})\cdots f_{X_{n}}(s_{n})\,% \mathrm{d}s_{n}\cdots\mathrm{d}s_{1}=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})}

e, pela Proposição 4.10, X1,,XnX_{1},\dots,X_{n} são independentes.

Reciprocamente, suponha que X1,,XnX_{1},\dots,X_{n} são independentes. Neste caso,

F𝑿(𝒙)\displaystyle F_{{\boldsymbol{X}}}({{\boldsymbol{x}}}) =FX1(x1)FXn(xn)\displaystyle=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})
=x1fX1(t1)dtxnfXn(tn)dt\displaystyle=\int_{-\infty}^{x_{1}}f_{X_{1}}(t_{1})\,\mathrm{d}t\cdots\int_{-% \infty}^{x_{n}}f_{X_{n}}(t_{n})\,\mathrm{d}t
=x1xn(fX1(t1)fXn(tn))dtndt1\displaystyle=\int_{-\infty}^{x_{1}}\cdots\int_{-\infty}^{x_{n}}\big{(}f_{X_{1% }}(t_{1})\cdots f_{X_{n}}(t_{n})\big{)}\,\mathrm{d}t_{n}\cdots\mathrm{d}t_{1}

e, portanto, fX1(x1)fXn(xn)f_{X_{1}}(x_{1})\cdots f_{X_{n}}(x_{n}) é uma densidade conjunta de 𝑿{\boldsymbol{X}}. ∎

Observemos que a proposição acima não fornece um critério imediato para concluir que X1,,XnX_{1},\dots,X_{n} não são independentes, pois densidades conjuntas não são únicas. Para isso, devemos verificar que existe toda uma região não-degenerada (a1,b1]××(an,bn](a_{1},b_{1}]\times\dots\times(a_{n},b_{n}] onde f𝑿(𝒙)fX1(x1)fXn(xn)f_{{\boldsymbol{X}}}({{\boldsymbol{x}}})\neq f_{X_{1}}(x_{1})\cdots f_{X_{n}}(% x_{n}), para justificar que a Definição 4.9 não é satisfeita, ou mostrar a desigualdade em um ponto onde todas as funções envolvidas são contínuas.

Exemplo 4.18.

No Exemplo 4.16, verifiquemos formalmente que XX e YY não são independentes. Para isto, basta observar que fX,Y(x,y)=12𝟙Q(x,y)=0f_{X,Y}(x,y)=\frac{1}{2}\mathds{1}_{Q}(x,y)=0 para todo (x,y)(23,34]×(23,34](x,y)\in(\frac{2}{3},\frac{3}{4}]\times(\frac{2}{3},\frac{3}{4}], enquanto fX(x)fY(y)=(1x)(1y)>0f_{X}(x)f_{Y}(y)=(1-x)(1-y)>0. ∎

Se um vetor aleatório 𝑿{\boldsymbol{X}} possui densidade conjunta, então cada uma das suas componentes X1,,XnX_{1},\dots,X_{n} são variáveis aleatórias que também possuem densidade (a marginal), mas não vale a recíproca! Abaixo temos um exemplo simples de vetor aleatório contínuo que não tem densidade.

Contra-exemplo 4.19 (Inexistência de densidade conjunta).

Seja X𝒰[0,1]X\sim\mathcal{U}[0,1], Y=1XY=1-X. Apesar de XX e YY serem absolutamente contínuas com densidade fX=fY=𝟙[0,1]f_{X}=f_{Y}=\mathds{1}_{[0,1]}, o vetor (X,Y)(X,Y) é singular. Mais precisamente, ((X,Y)=(x,y))=0\mathbb{P}\big{(}(X,Y)=(x,y)\big{)}=0 para todo ponto (x,y)2(x,y)\in\mathbb{R}^{2}, mas (X,Y)(X,Y) não tem densidade conjunta. Para ver que ele não pode ter densidade, observe que (X,Y)(X,Y) assume valores em um segmento de reta, e a integral de qualquer função em um segmento de reta sempre dá zero. É interessante também analisar a função de distribuição conjunta, dada por

FX,Y(x,y)={0,x0 ou y0 ou x+y1,y,0y1,x1,x,0x1,y1,x+y1,x1,y1,x+y1,1,x1,y1.\displaystyle F_{X,Y}(x,y)=\begin{cases}0,&x\leqslant 0\text{ ou }y\leqslant 0% \text{ ou }x+y\leqslant 1,\\ y,&0\leqslant y\leqslant 1,x\geqslant 1,\\ x,&0\leqslant x\leqslant 1,y\geqslant 1,\\ x+y-1,&x\leqslant 1,y\leqslant 1,x+y\geqslant 1,\\ 1,&x\geqslant 1,y\geqslant 1.\end{cases}

Calculando a derivada cruzada, vemos que 2yxF𝑿(x,y)=0\frac{\partial^{2}}{\partial y\partial x}F_{{\boldsymbol{X}}}(x,y)=0 para todo par (x,y)(x,y) no plano 2\mathbb{R}^{2}, exceto em duas retas e um segmento de reta, onde a derivada cruzada não existe. ∎