3.3 Variáveis aleatórias absolutamente contínuas

Seja fX:f_{X}:\mathbb{R}\to\mathbb{R} uma função não-negativa e contínua por partes. Dizemos que uma variável aleatória XX, sua função de distribuição FXF_{X} e sua lei X\mathbb{P}_{X} são absolutamente contínuas com densidade fXf_{X} se

X(B)=(XB)=BfX(x)dx\mathbb{P}_{X}(B)=\mathbb{P}(X\in B)=\int_{B}f_{X}(x)\,\mathrm{d}x

para todo intervalo BB. Neste caso, dizemos que fXf_{X} é uma função de densidade de probabilidade de XX, ou simplesmente uma função de densidade de XX.

No tratamento de variáveis aleatórias que possuem densidade, tudo pode ser feito em termos de integrais. A função de distribuição de uma variável aleatória absolutamente contínua com densidade fXf_{X} é dada por

FX(t)=tfX(s)ds.\displaystyle F_{X}(t)=\int_{-\infty}^{t}f_{X}(s)\,\mathrm{d}s. (3.25)
Exemplo 3.26.

Sortear um número em [0,1][0,1]. Definimos

fX(x)={1,x[0,1]0,caso contrário,f_{X}(x)=\begin{cases}1,&x\in[0,1]\\ 0,&\text{caso contr\'{a}rio},\end{cases}

e assim

FX(t)=tfX(x)dx={0,t0,t,0t1,1,t1.F_{X}(t)=\int_{-\infty}^{t}f_{X}(x)\,\mathrm{d}x=\begin{cases}0,&t\leqslant 0,% \\ t,&0\leqslant t\leqslant 1,\\ 1,&t\geqslant 1.\end{cases}\qed

Se suspeitamos que uma variável aleatória possui densidade, podemos obter um candidato a densidade calculando

fX(x)=ddxFX(x).f_{X}(x)=\frac{\mathrm{d}}{\mathrm{d}x}F_{X}(x).

Depois podemos confirmar se fXf_{X} é de fato uma função densidade de XX verificando (3.25).

Note que a função FXF_{X} pode não ser diferenciável em todos os pontos, como a do exemplo acima que não é diferenciável em x=0x=0 ou x=1x=1. Porém, o valor de fXf_{X} nestes dois pontos não importa pois não afetam o valor da integral. Por certo, nos cálculos referentes à variável aleatória XX, a função fXf_{X} sempre aparece dentro de uma integral, e se modificamos fXf_{X} em um conjunto finito de pontos, obtemos outra função de densidade para XX sem que isso cause nenhum tipo de problema.

Se f:f:\mathbb{R}\to\mathbb{R} é uma função satisfazendo

f(x)\displaystyle f(x) 0x,\displaystyle\geqslant 0\ \ \forall x\in\mathbb{R}, +f(x)dx=1,\displaystyle\int_{-\infty}^{+\infty}f(x)\,\mathrm{d}x=1,

diremos que ff é uma função de densidade. Dada uma função de densidade ff, sempre podemos definir uma função de distribuição FF pela fórmula (3.25), logo, pelo Teorema 3.17, existe uma variável aleatória definida em algum espaço de probabilidade e que tem ff como sua função de densidade.

A seguir descreveremos alguns dos exemplos mais importantes de variáveis aleatórias absolutamente contínuas. Obviamente há outras, não descritas aqui e que também são muito importantes, sobretudo em Estatística.

Distribuição uniforme

Dizemos que a variável aleatória XX tem distribuição uniforme no intervalo [a,b][a,b], denotado por X𝒰[a,b]X\sim\mathcal{U}[a,b], se

fX(x)=1ba 1[a,b](x)={1ba,x[a,b],0,x[a,b].f_{X}(x)=\frac{1}{b-a}\,\mathds{1}_{[a,b]}(x)=\begin{cases}\frac{1}{b-a},&x\in% [a,b],\\ 0,&x\not\in[a,b].\\ \end{cases}

A distribuição uniforme é a distribuição absolutamente contínua mais simples. Segundo esta distribuição, a probabilidade de XX estar em um dado subintervalo de [a,b][a,b] depende apenas do comprimento desse subintervalo.

A distribuição uniforme pode ser pensada como o limite de uma distribuição uniforme discreta em {a,a+ban,a+2ban,,a+(n2)ban,a+(n1)ban,b}\{a,a+\frac{b-a}{n},a+2\frac{b-a}{n},\dots,a+(n-2)\frac{b-a}{n},a+(n-1)\frac{b% -a}{n},b\}, quando nn é muito grande.

Exemplo 3.27.

O ponto de ruptura XX de algum cabo numa rede elétrica de 5km{5\ \mathrm{km}} pode ser modelado por uma variável aleatória com distribuição uniforme em [0,5][0,5]. Neste caso, fX=15𝟙[0,5]f_{X}=\frac{1}{5}\mathds{1}_{[0,5]}. A probabilidade de um determinado cabo se romper nos primeiros 800m{800\mathrm{m}} da rede é igual a 00,815dx=425\int_{0}^{0,8}\frac{1}{5}\mathrm{d}x=\frac{4}{25}. ∎

Distribuição exponencial

Dizemos que XX tem distribuição exponencial com parâmetro λ>0\lambda>0, denotado por XExp(λ)X\sim\mathop{\mathrm{Exp}}\nolimits(\lambda), se sua função de distribuição for dada por

FX(x)={1eλx,x0,0,x0.F_{X}(x)=\begin{cases}1-e^{-\lambda x},&x\geqslant 0,\\ 0,&x\leqslant 0.\end{cases}

A distribuição exponencial se caracteriza pela propriedade conhecida por perda de memória,

(X>t+s|X>s)=(X>t+s)(X>s)=eλ(t+s)eλs=eλt=(X>t)\displaystyle\mathbb{P}(X>t+s|X>s)=\frac{\mathbb{P}(X>t+s)}{\mathbb{P}(X>s)}=% \frac{e^{-\lambda(t+s)}}{e^{-\lambda s}}=e^{-\lambda t}=\mathbb{P}(X>t)

para todos t,s>0t,s>0, ou seja, a variável XX esquece aquilo que já “viveu”.

Essa é a distribuição adequada para modelar o decaimento radioativo de átomos instáveis, bem como a vida útil de inúmeros materiais e objetos inanimados, como lâmpadas incandescentes ou óleos isolantes. Esses objetos deixam de funcionar não por envelhecimento ou deterioração ao longo do tempo, mas sim por um evento raro que ocorre independentemente da idade acumulada. A distribuição exponencial pode ser pensada como o limite de distribuições geométricas com pequenos intervalos de tempo. Isto é, se X1nGeom(λn)X\sim\frac{1}{n}\mathop{\mathrm{Geom}}\nolimits(\frac{\lambda}{n}) com nn muito grande, então a distribuição de XX se aproxima da distribuição exponencial com parâmetro λ\lambda.

Distribuição normal

Dizemos que a variável aleatória XX tem distribuição normal com parâmetros μ\mu\in\mathbb{R}σ2>0\sigma^{2}>0, denotado por X𝒩(μ,σ2)X\sim\mathcal{N}(\mu,\sigma^{2}), se XX tem como densidade

fX(x)=12πσ2e(xμ)22σ2,x.f_{X}(x)=\frac{1}{\sqrt{2\pi\sigma^{2}}}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},% \quad x\in\mathbb{R}.

O parâmetro μ\mu é o valor central de XX, em torno do qual a distribuição é simétrica, e σ\sigma é relacionado à dispersão de XX em torno de sua média, dado pela distância entre o centro e os pontos de inflexão. Nos Capítulos 56 veremos que μ\mu e σ\sigma são a “média” e o “desvio-padrão” de XX. Quando μ=0\mu=0 e σ2=1\sigma^{2}=1, a distribuição 𝒩=𝒩(0,1)\mathcal{N}=\mathcal{N}(0,1) é chamada normal padrão.

Exercício 3.28.

Mostre que se X𝒩(μ,σ2)X\sim\mathcal{N}(\mu,\sigma^{2}) então a variável aleatória Xμσ\frac{X-\mu}{\sigma} tem distribuição normal padrão. ∎

Sendo assim, podemos determinar a função de distribuição de uma variável normal qualquer se conhecermos a função de distribuição de uma normal padrão.

Como veremos ao longo deste livro, a distribuição normal tem um papel fundamental em probabilidade, de modo que com muita frequência precisamos determinar sua função de distribuição, ou seja determinar o valor da integral

Φ(z)=12πzex22dx.\Phi(z)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{z}e^{-\frac{x^{2}}{2}}\mathrm{d}x.

A integral acima não pode ser expressa como composição de funções elementares. Sendo assim, devemos calcular a integral acima por outros métodos, sem apelar ao Teorema Fundamental do Cálculo. Valores aproximados para a função Φ(z)\Phi(z) podem ser encontrados na tabela na página Tabela Normal.

Exemplo 3.29.

Seja X𝒩(2,5)X\sim\mathcal{N}(2,5), podemos determinar FX(3)F_{X}(3) observando que X25\frac{X-2}{\sqrt{5}} tem distribuição normal padrão, logo

FX(3)=(X3)=(X25325)Φ(0,447)0,67.F_{X}(3)=\mathbb{P}(X\leqslant 3)=\mathbb{P}(\tfrac{X-2}{\sqrt{5}}\leqslant% \tfrac{3-2}{\sqrt{5}})\approx\Phi(0{,}447)\approx 0{,}67.\qed

Apesar de não ser possível expressar a integral indefinida de ex22e^{-\frac{x^{2}}{2}} como uma função elementar, podemos mostrar que a função fXf_{X} é de fato uma densidade. Supondo que X𝒩X\sim\mathcal{N} é uma normal padrão,

(+ex22dx)2\displaystyle{\left(\int_{-\infty}^{+\infty}{e^{-\frac{x^{2}}{2}}}\mathrm{d}x% \right)}^{2} =+ex22dx+ey22dy=++ex2+y22dxdy\displaystyle=\int_{-\infty}^{+\infty}{e^{-\frac{x^{2}}{2}}}\mathrm{d}x\int_{-% \infty}^{+\infty}{e^{-\frac{y^{2}}{2}}}\mathrm{d}y=\int_{-\infty}^{+\infty}% \int_{-\infty}^{+\infty}{e^{-\frac{x^{2}+y^{2}}{2}}}\mathrm{d}x\mathrm{d}y
=02π0+rer22drdθ=2π[er22]0=2π,\displaystyle=\int_{0}^{2\pi}\int_{0}^{+\infty}r{e^{-\frac{r^{2}}{2}}}\mathrm{% d}r\mathrm{d}\theta=2\pi{\left[-e^{-\frac{r^{2}}{2}}\right]_{0}^{\infty}}=2\pi,

onde realizamos uma mudança de coordenadas cartesianas para polares. Para o caso X𝒩(μ,σ2)X\sim\mathcal{N}(\mu,\sigma^{2}), basta fazer a mudança de variáveis xμ=σux-\mu=\sigma u, para reduzirmos ao caso da normal padrão.

Outras distribuições absolutamente contínuas

Veremos agora outras distribuições absolutamente contínuas de grande importância em aplicações, e que aparecerão em alguns exemplos e exercícios ao longo do livro.

Dizemos que XX tem distribuição Gama com parâmetros α>0\alpha>0 e β>0\beta>0, notação XGama(α,β)X\sim\mathop{\mathrm{Gama}}\nolimits(\alpha,\beta), se admite função densidade dada por

fX(x)=cβαxα1eβx 1(0,+)(x)f_{X}(x)=c\,\beta^{\alpha}x^{\alpha-1}e^{-\beta x}\,\mathds{1}_{(0,+\infty)}(x)

onde c=c(α)=1/0+xα1exdxc=c(\alpha)=1/\int_{0}^{+\infty}x^{\alpha-1}e^{-x}\mathrm{d}x.

Dizemos que XX tem distribuição de Cauchy com parâmetros aa\in\mathbb{R} e b>0b>0, notação XCauchy(a,b)X\sim\mathop{\mathrm{Cauchy}}\nolimits(a,b), se XX possui densidade dada por

fX(x)=bπ[b2+(xa)2].f_{X}(x)=\frac{b}{\pi[b^{2}+(x-a)^{2}]}.

Dizemos que XX tem distribuição de Laplace com parâmetros aa\in\mathbb{R} e b>0b>0, notação XLaplace(a,b)X\sim\mathop{\mathrm{Laplace}}\nolimits(a,b), se XX possui densidade dada por

fX(x)=12be|xa|b.f_{X}(x)=\frac{1}{2b}e^{-\frac{|x-a|}{b}}.

Dizemos que uma XX tem distribuição de Gumbel se sua função de distribuição é dada por

FX(x)=eex.F_{X}(x)=e^{-e^{-x}}.

Dizemos que XX tem distribuição Beta com parâmetros a,b>0a,b>0, notação XBeta(a,b)X\sim\mathop{\mathrm{Beta}}\nolimits(a,b), se XX possui densidade dada por

fX(x)=cxa1(1x)b1 1(0,1)(x),f_{X}(x)=c\,x^{a-1}(1-x)^{b-1}\,\mathds{1}_{(0,1)}(x),

onde c=c(a,b)=1/01xa1(1x)b1dxc=c(a,b)=1/\int_{0}^{1}x^{a-1}(1-x)^{b-1}\mathrm{d}x.