3.5 Distribuições mistas e singulares

Uma variável aleatória discreta XX vive em um conjunto enumerável de pontos, cada um dos quais tem probabilidade de ocorrência positiva. Nesse contexto, tudo se expressa em termos de somatórios ponderados pela função pXp_{X}.

Uma variável aleatória XX com densidade fXf_{X} vive em \mathbb{R}, sua distribuição em cada intervalo (x,x+Δx](x,x+\Delta x] é similar à de uma distribuição uniforme em (x,x+Δx](x,x+\Delta x], exceto que seu peso é ponderado por um fator fX(x)Δxf_{X}(x)\cdot\Delta x. Nesse contexto, tudo se expressa em termos de integrais do elemento infinitesimal de probabilidade dado por fX(x)dxf_{X}(x)\,\mathrm{d}x.

Existem variáveis aleatórias que são misturas dos tipos discreto e absolutamente contínuo. Mais precisamente, dizemos que XX é uma variável aleatória mista com componentes discreta com função de probabilidade pXp_{X} e absolutamente contínua com densidade fXf_{X} se

(a<Xb)=a<xbpX(x)+abfX(x)dx,a<b.\mathbb{P}(a<X\leqslant b)=\sum_{a<x\leqslant b}p_{X}(x)+\int_{a}^{b}f_{X}(x)% \,\mathrm{d}x,\quad a<b.

Neste caso, suas propriedades serão determinadas por combinações de somatórios e integrais. Formalmente, se XX é absolutamente contínua com densidade fXf_{X}, podemos dizer que XX é mista tomando pX=0p_{X}=0; analogamente se XX é discreta com função pXp_{X}, XX é um caso particular de variável mista com fX=0f_{X}=0.

Exemplo 3.34.

Sejam XExp(λ)X\sim\mathop{\mathrm{Exp}}\nolimits(\lambda) e Y=min(X,1)Y=\min(X,1). Neste caso, YY é uma variável aleatória mista com função de distribuição dada por

FY(y)={0,y<0,1eλy,0y<1,1.1y.F_{Y}(y)=\begin{cases}0,&y<0,\\ 1-e^{-\lambda y},&0\leqslant y<1,\\ 1.&1\leqslant y.\end{cases}

Logo, as componentes discreta e absolutamente contínua de YY são as funções

pY(y)={eλ,y=1,0,y1,fY(y)={λeλy,y(0,1),0,y(0,1).p_{Y}(y)=\begin{cases}e^{-\lambda},&y=1,\\ 0,&y\neq 1,\end{cases}\qquad f_{Y}(y)=\begin{cases}\lambda e^{-\lambda y},&y% \in(0,1),\\ 0,&y\notin(0,1).\end{cases}\qed

Há uma outra categoria bastante curiosa de variáveis aleatórias. São variáveis aleatórias cuja função de distribuição é contínua, logo não há uma componente discreta, mas tampouco possuem função de densidade, ou seja não há componente absolutamente contínua. Tais variáveis são ditas singulares.

Exemplo 3.35 (Distribuição de Cantor).

Começamos definindo uma função Ψ:(0,1](0,1]\Psi:(0,1]\to(0,1] com propriedades diabólicas (que será uma “inversa” da chamada “função de Cantor”). Dado x(0,1]x\in(0,1], escreva x=(0,x1x2x3x4)2x=(0{,}x_{1}x_{2}x_{3}x_{4}\dots)_{2} na base 22, ou seja, cada dígito xjx_{j} é um número em {0,1}\{0,1\}. Caso xx tenha mais de uma expansão binária, escolhemos a que termina com infinitos dígitos “1” ao invés da expansão finita. O número y=Ψ(x)y=\Psi(x) é definido tomando-se yj=2xj{0,2}y_{j}=2x_{j}\in\{0,2\}, e escrevendo-se y=(0,y1y2y3y4)3y=(0{,}y_{1}y_{2}y_{3}y_{4}\dots)_{3} na base 33.

Afirmamos que Ψ\Psi é injetiva. Com efeito, suponha que 0<x<x10<x<x^{\prime}\leqslant 1. Então existe kk tal que xk=0x_{k}=0, xk=1x_{k}^{\prime}=1, e xj=xjx_{j}=x_{j}^{\prime} para todo j<kj<k. Ademais, existe l>kl>k tal que xl=1x_{l}^{\prime}=1, pois não temos expansões finitas. Vamos mostrar que y<yy<y^{\prime}, onde y=Ψ(x)y=\Psi(x) e y=Ψ(x)y^{\prime}=\Psi(x^{\prime}). Como justificado acima, yj=yjy_{j}=y_{j}^{\prime} para j<kj<k, yk=0y_{k}=0, yk=2y_{k}^{\prime}=2, e yl=2y_{l}^{\prime}=2. Daí segue que y>yy^{\prime}>y, provando a injetividade. Afirmamos também que Ψ\Psi não toma valores em (13,23](\frac{1}{3},\frac{2}{3}]. Com efeito, os números y(13,23]y\in(\frac{1}{3},\frac{2}{3}] são exatamente os números com primeiro dígito y1=1y_{1}=1 (note que 13=(0.0222)3\frac{1}{3}=(0.0222\dots)_{3} e 23=(0.1222)3\frac{2}{3}=(0.1222\dots)_{3}). Logo, a imagem de Ψ\Psi está contida em um conjunto de comprimento 23\frac{2}{3}. Da mesma forma, Ψ\Psi não toma valores em (19,29](\frac{1}{9},\frac{2}{9}] ou (79,89](\frac{7}{9},\frac{8}{9}], pois estes são os números cujos dois primeiros dígitos são 0101 e 2121. Logo, a imagem de Ψ\Psi, que denotamos C(0,1]C\subseteq(0,1], está contida em um conjunto de comprimento (23)2(\frac{2}{3})^{2}. Procedendo desta maneira, vemos que a CC está contido em um conjunto de comprimento (23)k(\frac{2}{3})^{k} para qualquer kk e, portanto, CC tem “comprimento” zero.

Agora seja XX uma variável aleatória com distribuição uniforme em (0,1](0,1], e tome Y=Ψ(X)Y=\Psi(X). Como FXF_{X} é contínua e Ψ\Psi é injetiva, (Y=y)=0\mathbb{P}(Y=y)=0 para qualquer yy, ou seja, FYF_{Y} é contínua. Entretanto, (YC)=1\mathbb{P}(Y\in C)=1, e CC tem “comprimento” zero, logo YY não pode ter densidade. ∎

Vemos que a variável aleatória YY do exemplo acima ocupa um lugar estranho entre as discretas e as absolutamente contínuas. Por um lado, nenhum ponto em particular tem probabilidade positiva de ocorrer, isto é pY=0p_{Y}=0, o que afasta operações com somatórios como no caso discreto. Por outro lado, essa variável aleatória vive em um conjunto pequeno da reta (mais precisamente em CC, que tem “comprimento” zero), não sendo aplicável tampouco o uso de integrais em f(x)dxf(x)\,\mathrm{d}x para nenhuma ff.