5.5 Integral de Lebesgue

Em Análise Real, primeiro vemos a integral de Riemann, que aproxima a área abaixo de uma curva por retângulos verticais. Entretanto, este não é o procedimento mais adequado quando analisamos sequências de funções. Por exemplo, suponha que queremos mostrar que

limn0+enx2xdx=0\lim_{n\to\infty}\int_{0}^{+\infty}\frac{e^{-nx^{2}}}{\sqrt{x}}\,\mathrm{d}x=0

ou

ddt0+etxf(x)dx=0+xetxf(x)dx\frac{\mathrm{d}}{\mathrm{d}t}\int_{0}^{+\infty}e^{tx}f(x)\,\mathrm{d}x=\int_{% 0}^{+\infty}xe^{tx}f(x)\,\mathrm{d}x

para alguma função contínua e limitada ff. Em princípio, poderíamos usar um emaranhado de teoremas do Cálculo Avançado. A integral de Lebesgue, por outro lado, aproxima a área abaixo de uma curva por retângulos horizontais, e essa pequena diferença a torna muitíssimo mais flexível. Por exemplo, as identidades acima ficam muito mais simples se usamos o Teorema da Convergência Dominada, que apresentaremos nesta seção.

O principal motivo para usar a integral de Lebesgue é a forma robusta com que ela comuta com limites, derivadas, séries e outras integrais.

Comparação entre a integral de Riemann em
Comparação entre a integral de Riemann em
Figura 5.4: Comparação entre a integral de Riemann em \mathbb{R} e a integral de Lebesgue em um espaço de medida.

Outra razão para introduzir a integral de Lebesgue é que a maioria dos espaços de medida (incluindo espaços de probabilidade!) não podem ser facilmente particionados em pequenos intervalos ou cubos contíguos como em n\mathbb{R}^{n}, mas ainda assim podemos medir suas partes. Para definir a integral neste caso, ao invés de particionar o domínio e medir a altura do gráfico no contradomínio, particionamos o contradomínio e medimos pedaços do domínio, como mostrado na Figura 5.4.

5.5.1 Construção

Vamos construir a integral de uma função ff com respeito a uma medida μ\mu, denotada

Ωfdμ ou Ωf(ω)μ(dω).\int_{\Omega}f\,\mathrm{d}\mu\quad\text{ ou }\quad\int_{\Omega}f(\omega)\,\mu(% \mathrm{d}\omega).

Seja (Ω,,μ)(\Omega,\mathcal{F},\mu) um espaço de medida. Dizemos que f:Ωf:\Omega\to\mathbb{R} é uma função simples se é mensurável e toma apenas finitos valores.

Se ff é uma função simples não-negativa, definimos sua integral por

Ωfdμ=xxμ({ωΩ:f(ω)=x}).\int_{\Omega}f\,\mathrm{d}\mu=\sum_{x}x\cdot\mu\big{(}\{\omega\in\Omega:f(% \omega)=x\}\big{)}.
Teorema 5.57.

Sejam ff e gg funções simples não-negativas e a[0,+)a\in[0,+\infty). Então valem as seguintes propriedades:

  1. (1)

    Unitariedade: Ω𝟙Adμ=μ(A)\int_{\Omega}\mathds{1}_{A}\,\mathrm{d}\mu=\mu(A) para todo AA\in\mathcal{F}.

  2. (2)

    Monotonicidade: se fg0f\geqslant g\geqslant 0, então ΩfdμΩgdμ0\int_{\Omega}f\,\mathrm{d}\mu\geqslant\int_{\Omega}g\,\mathrm{d}\mu\geqslant 0.

  3. (3)

    Linearidade: Ω(af+g)dμ=aΩfdμ+Ωgdμ\int_{\Omega}(af+g)\,\mathrm{d}\mu=a\int_{\Omega}f\,\mathrm{d}\mu+\int_{\Omega% }g\,\mathrm{d}\mu.

Demonstração.

O operador é unitário por construção. Linearidade é provada de forma idêntica ao Teorema 5.9. Para monotonicidade, observamos que Ωfdμ=Ω(g+fg)dμ=Ωgdμ+Ω(fg)dμΩgdμ0\int_{\Omega}f\,\mathrm{d}\mu=\int_{\Omega}(g+f-g)\mathrm{d}\mu=\int_{\Omega}g% \,\mathrm{d}\mu+\int_{\Omega}(f-g)\mathrm{d}\mu\geqslant\int_{\Omega}g\,% \mathrm{d}\mu\geqslant 0. ∎

O próximo passo é definir a integral de uma função f:Ω[0,+]f:\Omega\to[0,+\infty] mensurável, o que fazemos aproximando-a por baixo por funções simples:

Ωfdμ=sup{Ωgdμ:0gf e g é simples}.\int_{\Omega}f\,\mathrm{d}\mu=\sup\Big{\{}\textstyle\int_{\Omega}g\,\mathrm{d}% \mu:0\leqslant g\leqslant f\text{ e $g$ \'{e} simples}\Big{\}}. (5.58)

Note que para funções não-negativas simples, essa definição coincide com a anterior tomando-se g=fg=f.

Teorema 5.59.

Vale o Teorema 5.57 supondo funções f,g:Ω[0,+]f,g:\Omega\to[0,+\infty] mensuráveis e constante a[0,+]a\in[0,+\infty].

O operador é unitário por construção e é monótono por inclusão: quanto maior ff, mais funções simples entram no supremo em (5.58). Falta provar a linearidade. Para isso, usaremos o Teorema da Convergência Monótona, um dos teoremas fulcrais da Teoria da Medida.

Teorema 5.60 (Teorema da Convergência Monótona).

Seja (fn)n(f_{n})_{n} uma sequência de funções mensuráveis de Ω\Omega em [0,+][0,+\infty] tais que fn+1(ω)fn(ω)f_{n+1}(\omega)\geqslant f_{n}(\omega) para todo nn\in\mathbb{N} e ωΩ\omega\in\Omega. Então

limnΩfn(ω)μ(dω)=Ω(limnfn(ω))μ(dω).\lim_{n\to\infty}\int_{\Omega}f_{n}(\omega)\mu(\mathrm{d}\omega)=\int_{\Omega}% (\lim_{n\to\infty}f_{n}(\omega))\mu(\mathrm{d}\omega).
Demonstração.

Denotemos limnfn=f\lim_{n\to\infty}f_{n}=f. Pela monotonicidade da integral, a sequência Ωfndμ\int_{\Omega}f_{n}\,\mathrm{d}\mu é não-decrescente e limitada por Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu. Logo, ela tem limite, e

limnΩfndμΩfdμ.\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu\leqslant\int_{\Omega}f\,% \mathrm{d}\mu.

Resta mostrar a desigualdade oposta. Seja 0gf0\leqslant g\leqslant f simples, tomando valores a1,,aka_{1},\dots,a_{k}. Seja 0<α<10<\alpha<1 e An={ω:fn(ω)αg(ω)}A_{n}=\{\omega:f_{n}(\omega)\geqslant\alpha g(\omega)\}. Como fgf\geqslant g e 0fnf0\leqslant f_{n}\uparrow f, para cada ω\omega existe nn tal que fn(ω)αg(ω)f_{n}(\omega)\geqslant\alpha g(\omega), logo AnΩA_{n}\uparrow\Omega e

Ωfndμ\displaystyle\int_{\Omega}f_{n}\,\mathrm{d}\mu Ω(fn𝟙An)dμΩ(αg𝟙An)dμ\displaystyle\geqslant\int_{\Omega}(f_{n}\mathds{1}_{A_{n}})\,\mathrm{d}\mu% \geqslant\int_{\Omega}(\alpha g\mathds{1}_{A_{n}})\,\mathrm{d}\mu
=αj=1kajμ({ωAn:g(ω)=aj})αj=1kajμ(g=aj)\displaystyle=\alpha\sum_{j=1}^{k}a_{j}\mu\big{(}\{\omega\in A_{n}:g(\omega)=a% _{j}\}\big{)}\to\alpha\sum_{j=1}^{k}a_{j}\mu\big{(}g=a_{j}\big{)}
=αΩgdμ.\displaystyle=\alpha\int_{\Omega}g\,\mathrm{d}\mu.

Logo,

limnΩfndμαΩgdμ.\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu\geqslant\alpha\int_{\Omega}% g\,\mathrm{d}\mu.

Como isso vale para todo 0<α<10<\alpha<1, concluímos que

limnΩfndμΩgdμ.\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu\geqslant\int_{\Omega}g\,% \mathrm{d}\mu.

Como isso vale para toda função simples gg tal que 0gf0\leqslant g\leqslant f,

limnΩfndμΩfdμ.\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu\geqslant\int_{\Omega}f\,% \mathrm{d}\mu.\qed

Como fizemos para a esperança, inúmeras propriedades da integral de Lebesgue serão demonstradas combinando-se o Teorema da Convergência Monótona com a aproximação por funções simples.

Proposição 5.61.

Dada uma função mensurável f:Ω[0,+]f:\Omega\to[0,+\infty], existe uma sequência de funções simples fnf_{n} tais que 0fnf0\leqslant f_{n}\uparrow f para todo ω\omega.

Demonstração.

Seja ψn:[0,+][0,+)\psi_{n}:[0,+\infty]\to[0,+\infty) a função definida em (5.46) e observamos que 0ψn(x)x0\leqslant\psi_{n}(x)\uparrow x para todo x[0,+]x\in[0,+\infty]. Tomando fn=ψnff_{n}=\psi_{n}\circ f obtemos a sequência desejada. ∎

Agora estamos aptos a terminar a prova do Teorema 5.59.

Demonstração do Teorema 5.59.

Falta provar a linearidade. Sejam f,g:Ω[0,+]f,g:\Omega\to[0,+\infty] funções mensuráveis a[0,+]a\in[0,+\infty]. Se a[0,+)a\in[0,+\infty), temos Ω(af)dμ=aΩfdμ\int_{\Omega}(af)\,\mathrm{d}\mu=a\int_{\Omega}f\,\mathrm{d}\mu diretamente de (5.58). Se a=+a=+\infty, demonstra-se a mesma igualdade tomando-se uma sequência (an)n(a_{n})_{n}, tal que an+a_{n}\uparrow+\infty e aplicando-se o Teorema da Convergência Monótona. Finalmente, pela Proposição 5.61, existem sequências de funções simples não-negativas fnff_{n}\uparrow f e gngg_{n}\uparrow g. Usando o Teorema da Convergência Monótona três vezes e linearidade para a integral de funções simples não-negativas,

Ω(f+g)dμ\displaystyle\int_{\Omega}(f+g)\,\mathrm{d}\mu =limnΩ(fn+gn)dμ=limn(Ωfndμ+Ωgndμ)=\displaystyle=\lim_{n\to\infty}\int_{\Omega}(f_{n}+g_{n})\,\mathrm{d}\mu=\lim_% {n\to\infty}\Big{(}\int_{\Omega}f_{n}\,\mathrm{d}\mu+\int_{\Omega}g_{n}\,% \mathrm{d}\mu\Big{)}=
=limnΩfndμ+limnΩgndμ=Ωfdμ+Ωgdμ,\displaystyle=\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu+\lim_{n\to% \infty}\int_{\Omega}g_{n}\,\mathrm{d}\mu=\int_{\Omega}f\,\mathrm{d}\mu+\int_{% \Omega}g\,\mathrm{d}\mu,

o que conclui a prova. ∎

Dizemos que uma propriedade vale para μ\mu-quase todo ωΩ\omega\in\Omega, ou em μ\mu-quase toda parte, abreviado por μ\mu-q.t.p., se existe um conjunto AA\in\mathcal{F} tal que μ(Ac)=0\mu(A^{c})=0 e tal que essa propriedade vale para todo ωA\omega\in A. Caso μ\mu esteja claro no contexto, podemos dizer simplesmente “q.t.p.” omitindo μ\mu.

Exercício 5.62.

Seja f:Ω[0,+]f:\Omega\to[0,+\infty] uma função mensurável. Mostre que Ωfdμ=0\int_{\Omega}f\,\mathrm{d}\mu=0 se, e somente se, f=0f=0 q.t.p. ∎

Dada uma função mensurável f:Ω[,+]f:\Omega\to[-\infty,+\infty], denote sua parte positiva por f+f^{+} e sua parte negativa por ff^{-}. Definimos

Ωfdμ=Ωf+dμΩfdμ\int_{\Omega}f\,\mathrm{d}\mu=\int_{\Omega}f^{+}\,\mathrm{d}\mu-\int_{\Omega}f% ^{-}\,\mathrm{d}\mu

caso uma das integrais seja finita, caso contrário dizemos que Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu não está definida. Quando ambas as integrais são finitas, dizemos que ff é integrável. Observe que, se ff é integrável, então ff é finita q.t.p.

Essa definição também dá origem a um operador linear.

Teorema 5.63.

Sejam f,g:Ωf,g:\Omega\to\mathbb{R} funções mensuráveis. Sejam a,ba,b\in\mathbb{R}. Suponha que gg seja integrável. Então valem as seguintes propriedades.

  1. (1)

    Monotonicidade: se fgf\geqslant g para todo ω\omega, então Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu está definida e ΩfdμΩgdμ\int_{\Omega}f\,\mathrm{d}\mu\geqslant\int_{\Omega}g\,\mathrm{d}\mu.

  2. (2)

    Linearidade: Ω(af+bg)dμ=aΩfdμ+bΩgdμ\int_{\Omega}(af+bg)\,\mathrm{d}\mu=a\int_{\Omega}f\,\mathrm{d}\mu+b\int_{% \Omega}g\,\mathrm{d}\mu, desde que Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu esteja definida.

Demonstração.

Começamos pela linearidade. Mostraremos primeiro que Ω(af)dμ=aΩfdμ\int_{\Omega}(af)\mathrm{d}\mu=a\int_{\Omega}f\,\mathrm{d}\mu. Suponhamos inicialmente que a>0a>0. Desenvolvendo,

Ω(af)dμ\displaystyle\int_{\Omega}(af)\,\mathrm{d}\mu =Ω(af+)dμΩ(af)dμ\displaystyle=\int_{\Omega}(af^{+})\,\mathrm{d}\mu-\int_{\Omega}(af^{-})\,% \mathrm{d}\mu
=aΩf+dμaΩfdμ\displaystyle=a\int_{\Omega}f^{+}\,\mathrm{d}\mu-a\int_{\Omega}f^{-}\,\mathrm{% d}\mu
=a(Ωf+dμΩfdμ)=aΩfdμ.\displaystyle=a\Big{(}\int_{\Omega}f^{+}\,\mathrm{d}\mu-\int_{\Omega}f^{-}\,% \mathrm{d}\mu\Big{)}=a\int_{\Omega}f\,\mathrm{d}\mu.

Essas expressões não contêm “\infty-\infty” porque estamos supondo que Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu está definida. Para o caso a0a\leqslant 0 basta considerar f-f no lugar de ff.

Para terminar a prova da linearidade, resta mostrar que Ω(f+g)dμ=Ωfdμ+Ωgdμ\int_{\Omega}(f+g)\,\mathrm{d}\mu=\int_{\Omega}f\,\mathrm{d}\mu+\int_{\Omega}g% \,\mathrm{d}\mu. Observamos que

(f+g)+(f+g)=f+g=f+f+g+g,(f+g)^{+}-(f+g)^{-}=f+g=f^{+}-f^{-}+g^{+}-g^{-},

donde

(f+g)++f+g=(f+g)+f++g+.(f+g)^{+}+f^{-}+g^{-}=(f+g)^{-}+f^{+}+g^{+}.

Observando que todas as funções acima são não-negativas, pela aditividade dada pelo Teorema 5.59 segue que

Ω(f+g)+dμ+Ωfdμ+Ωgdμ=Ω(f+g)dμ+Ωf+dμ+Ωg+dμ.\int_{\Omega}(f+g)^{+}\,\mathrm{d}\mu+\int_{\Omega}f^{-}\,\mathrm{d}\mu+\int_{% \Omega}g^{-}\,\mathrm{d}\mu=\int_{\Omega}(f+g)^{-}\,\mathrm{d}\mu+\int_{\Omega% }f^{+}\,\mathrm{d}\mu+\int_{\Omega}g^{+}\,\mathrm{d}\mu.

Como estamos supondo que Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu está definida, temos Ωfdμ<\int_{\Omega}f^{-}\,\mathrm{d}\mu<\infty ou Ωf+dμ<\int_{\Omega}f^{+}\,\mathrm{d}\mu<\infty. Suponhamos que valha o primeiro caso; se for o segundo, o argumento será análogo. Como gg é integrável, temos Ωgdμ<\int_{\Omega}g^{-}\,\mathrm{d}\mu<\infty e Ω(f+g)dμΩfdμ+Ωgdμ<\int_{\Omega}(f+g)^{-}\,\mathrm{d}\mu\leqslant\int_{\Omega}f^{-}\,\mathrm{d}% \mu+\int_{\Omega}g^{-}\,\mathrm{d}\mu<\infty. Assim, podemos subtrair esses três termos de ambos os lados, obtendo

Ω(f+g)+dμΩ(f+g)dμ=Ωf+dμΩfdμ+Ωg+dμΩgdμ,\int_{\Omega}(f+g)^{+}\,\mathrm{d}\mu-\int_{\Omega}(f+g)^{-}\,\mathrm{d}\mu=% \int_{\Omega}f^{+}\,\mathrm{d}\mu-\int_{\Omega}f^{-}\,\mathrm{d}\mu+\int_{% \Omega}g^{+}\,\mathrm{d}\mu-\int_{\Omega}g^{-}\,\mathrm{d}\mu,

o que conclui a prova da linearidade.

Para monotonicidade, observe que, sendo gg integrável e fgf\geqslant g, temos fgf^{-}\leqslant g^{-}, logo Ωfdμ<\int_{\Omega}f^{-}\,\mathrm{d}\mu<\infty e, portanto, Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu está definida. Por linearidade,

Ωfdμ=Ωgdμ+Ω(fg)dμΩgdμ,\displaystyle\int_{\Omega}f\,\mathrm{d}\mu=\int_{\Omega}g\,\mathrm{d}\mu+\int_% {\Omega}(f-g)\mathrm{d}\mu\geqslant\int_{\Omega}g\,\mathrm{d}\mu,

o que conclui a prova. ∎

5.5.2 Principais propriedades

Dado um conjunto BB\in\mathcal{F}, a integral de ff em BB é definida como

Bfdμ=Ω(f𝟙B)dμ.\int_{B}f\,\mathrm{d}\mu=\int_{\Omega}(f\mathds{1}_{B})\,\mathrm{d}\mu.
Exercício 5.64.

Seja f:Ω[,+]f:\Omega\to[-\infty,+\infty] uma função mensurável. Mostre que Afdμ0\int_{A}f\,\mathrm{d}\mu\geqslant 0 para todo AA\in\mathcal{F} se, e somente se, f0f\geqslant 0 q.t.p. ∎

A esperança de uma variável aleatória XX nada mais é do que a integral de Lebesgue da função mensurável XX com respeito à medida \mathbb{P}.

Teorema 5.65.

Seja (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) um espaço de probabilidade e XX uma variável aleatória. Então a esperança de XX é dada por

𝔼X=ΩXd,\mathbb{E}X=\int_{\Omega}X\,\mathrm{d}\mathbb{P},

desde que uma das duas esteja definida.

Demonstração.

Se XX é da forma X=k=1nak𝟙AkX=\sum_{k=1}^{n}a_{k}\mathds{1}_{A_{k}}, pela unitariedade e linearidade da esperança e da integral, segue que 𝔼X=k=1nak(Ak)=ΩXd\mathbb{E}X=\sum_{k=1}^{n}a_{k}\mathbb{P}(A_{k})=\int_{\Omega}X\,\mathrm{d}% \mathbb{P}. Se XX é não-negativa, obtemos a identidade usando ambas as versões do Teorema da Convergência Monótona, para a esperança e para a integral. Finalmente, no caso em que XX é uma variável aleatória qualquer, basta observar que 𝔼X=𝔼X+𝔼X=ΩX+dΩXd=ΩXd\mathbb{E}X=\mathbb{E}X^{+}-\mathbb{E}X^{-}=\int_{\Omega}X^{+}\,\mathrm{d}% \mathbb{P}-\int_{\Omega}X^{-}\,\mathrm{d}\mathbb{P}=\int_{\Omega}X\,\mathrm{d}% \mathbb{P}, desde que uma das duas diferenças acima esteja definida. ∎

A integral de Lebesgue tem a vantagem adicional de nos permitir estender a noção de esperança para variáveis aleatórias estendidas X:Ω[,+]X:\Omega\to[-\infty,+\infty], via a fórmula 𝔼X=ΩXd\mathbb{E}X=\int_{\Omega}X\,\mathrm{d}\mathbb{P}.

Seja ff uma função mensurável de (Ω1,1)(\Omega_{1},\mathcal{F}_{1}) em (Ω2,2)(\Omega_{2},\mathcal{F}_{2}). Dada uma função mensurável g:Ω2[,+]g:\Omega_{2}\to[-\infty,+\infty], podemos definir o seu pull-back em Ω1\Omega_{1} dado pela função fg=gff^{*}g=g\circ f em Ω1\Omega_{1}. Juntamente com σ(f)\sigma(f) e fμf_{*}\mu definidos na Seção 3.7, obtemos o seguinte diagrama:

Em suma, a partir de uma função que leva pontos ω1Ω1\omega_{1}\in\Omega_{1} a pontos ω2Ω2\omega_{2}\in\Omega_{2}, podemos puxar uma σ\sigma-álgebra em Ω2\Omega_{2} de volta para uma σ\sigma-álgebra em Ω1\Omega_{1}, e empurrar uma medida em Ω1\Omega_{1} adiante para uma medida em Ω2\Omega_{2}, e puxar um observável definido em Ω2\Omega_{2} de volta para um observável definido em Ω1\Omega_{1}.

Teorema 5.66 (Mudança de variável).

Sejam (Ω1,1,μ)(\Omega_{1},\mathcal{F}_{1},\mu) um espaço de medida, (Ω2,2)(\Omega_{2},\mathcal{F}_{2}) um espaço mensurável, f:Ω1Ω2f:\Omega_{1}\to\Omega_{2} uma função mensurável, e g:Ω2[0,+]g:\Omega_{2}\to[0,+\infty] também mensurável. Então

Ω2gd(fμ)=Ω1(fg)dμ.\int_{\Omega_{2}}g\,\mathrm{d}(f_{*}\mu)=\int_{\Omega_{1}}(f^{*}g)\,\mathrm{d}\mu.
Demonstração.

Supondo que g=𝟙Cg=\mathds{1}_{C} para algum C2C\in\mathcal{F}_{2}, temos que fg=𝟙Df^{*}g=\mathds{1}_{D} onde D=f1(C)1D=f^{-1}(C)\in\mathcal{F}_{1}. Substituindo essas identidades, obtemos

Ω2gd(fμ)=(fμ)(C)=μ(f1(C))=μ(D)=Ω1(fg)dμ.\int_{\Omega_{2}}g\,\mathrm{d}(f_{*}\mu)=(f_{*}\mu)(C)=\mu(f^{-1}(C))=\mu(D)=% \int_{\Omega_{1}}(f^{*}g)\,\mathrm{d}\mu.

Por linearidade, a identidade vale para funções simples não-negativas. Pelo Teorema da Convergência Monótona, mostramos que vale para qualquer g:Ω2[0,+]g:\Omega_{2}\to[0,+\infty] mensurável. ∎

Quando consideramos uma variável aleatória XX em um espaço de probabilidade, aplicando o teorema acima com g(x)=x+g(x)=x^{+} e g(x)=xg(x)=x^{-}, obtemos

𝔼X=xX(dx),\mathbb{E}X=\int_{\mathbb{R}}x\,\mathbb{P}_{X}(\mathrm{d}x),

que é válido desde que um dos lados esteja definido.

Proposição 5.67 (Funções iguais q.t.p.).

Sejam (Ω,,μ)(\Omega,\mathcal{F},\mu) um espaço de medida e f,g:Ω[,+]f,g:\Omega\to[-\infty,+\infty] funções mensuráveis. Se f=gf=g q.t.p., então

Ωfdμ=Ωgdμ,\int_{\Omega}f\,\mathrm{d}\mu=\int_{\Omega}g\,\mathrm{d}\mu,

desde que uma das duas esteja definida.

Demonstração.

Tome A={ω:f(ω)=g(ω)}A=\{\omega:f(\omega)=g(\omega)\}\in\mathcal{F}. Defina f1=f𝟙Af_{1}=f\mathds{1}_{A} e f2=f1+𝟙Acf_{2}=f_{1}+\infty\cdot\mathds{1}_{A^{c}}. Então 0f1+f+f2+ e 0f1+g+f2+.0\leqslant f_{1}^{+}\leqslant f^{+}\leqslant f_{2}^{+}\text{ e }0\leqslant f_{% 1}^{+}\leqslant g^{+}\leqslant f_{2}^{+}. Como Ωf2dμ=Ωf1dμ+μ(Ac)=Ωf1dμ,\int_{\Omega}f_{2}\,\mathrm{d}\mu=\int_{\Omega}f_{1}\,\mathrm{d}\mu+\infty% \cdot\mu(A^{c})=\int_{\Omega}f_{1}\,\mathrm{d}\mu, por monotonicidade obtemos Ωf+dμ=Ωg+dμ.\int_{\Omega}f^{+}\,\mathrm{d}\mu=\int_{\Omega}g^{+}\,\mathrm{d}\mu. Por um argumento similar, Ωfdμ=Ωgdμ.\int_{\Omega}f^{-}\,\mathrm{d}\mu=\int_{\Omega}g^{-}\,\mathrm{d}\mu. Assumindo que uma dessas duas seja finita, obtemos Ωfdμ=Ωgdμ.\int_{\Omega}f\,\mathrm{d}\mu=\int_{\Omega}g\,\mathrm{d}\mu.

Finalmente, mostraremos que o operador integral é linear não apenas no integrando mas também na medida com respeito à qual se integra.

Proposição 5.68.

Sejam μ1\mu_{1} e μ2\mu_{2} medidas em (Ω,)(\Omega,\mathcal{F}) e f:Ω[0,+]f:\Omega\to[0,+\infty] mensurável. Então Ωfd(μ1+μ2)=Ωfdμ1+Ωfdμ2\int_{\Omega}f\,\mathrm{d}(\mu_{1}+\mu_{2})=\int_{\Omega}f\,\mathrm{d}\mu_{1}+% \int_{\Omega}f\,\mathrm{d}\mu_{2}.

Demonstração.

Se f=𝟙Af=\mathds{1}_{A} para algum AA\in\mathcal{F}, ambos os lados se reduzem a μ1(A)+μ2(A)\mu_{1}(A)+\mu_{2}(A) e portanto vale a identidade. Estendemos a identidade para funções simples não-negativas por linearidade, e para funções mensuráveis não-negativas usando o Teorema da Convergência Monótona. ∎

5.5.3 Convergência

Conforme discutido na Seção 5.3, em inúmeras situações queremos tomar um limite dentro da integral. Começamos discutindo alguns casos para ver o que poderia dar errado.

Pensemos a região abaixo do gráfico de uma função real não-negativa como tendo uma “área”, “volume” ou “massa”. Se a função é dada por f(x)=n𝟙(0,1n](x)f(x)=n\cdot\mathds{1}_{(0,\frac{1}{n}]}(x), ou por g(x)=𝟙(n,n+1](x)g(x)=\mathds{1}_{(n,n+1]}(x), essa massa é sempre igual a 11 e, no entanto, desaparece quando tomamos o limite em nn. Podemos dizer que a massa “escapou ao infinito”. No primeiro exemplo, escapou verticalmente e, no segundo, horizontalmente. Os três teoremas de convergência explicam o que pode acontecer com a massa no limite.

O Teorema da Convergência Monótona diz que nada de estranho pode acontecer com uma sequência crescente de funções, mais precisamente que não se pode ganhar massa. O próximo teorema nos diz que para uma sequência de funções mensuráveis não-negativas, até podemos perder massa no limite, mas nunca ganhar.

Teorema 5.69 (Lema de Fatou).

Seja (Ω,,μ)(\Omega,\mathcal{F},\mu) um espaço de medida e (fn)n1(f_{n})_{n\geqslant 1} uma sequência de funções mensuráveis de Ω\Omega em [0,+][0,+\infty]. Então,

Ω(lim infnfn(ω))μ(dω)lim infnΩfn(ω)μ(dω).\int_{\Omega}(\liminf_{n\to\infty}f_{n}(\omega))\,\mu(\mathrm{d}\omega)% \leqslant\liminf_{n\to\infty}\int_{\Omega}f_{n}(\omega)\,\mu(\mathrm{d}\omega).
Demonstração.

Tomando gn(ω)=infknfk(ω),g_{n}(\omega)=\inf_{k\geqslant n}f_{k}(\omega), temos que

0gn(ω)lim infnfn(ω).0\leqslant g_{n}(\omega)\uparrow\liminf_{n\to\infty}f_{n}(\omega).

Usando o Teorema da Convergência Monótona, como gn(ω)fn(ω),g_{n}(\omega)\leqslant f_{n}(\omega),

lim infnΩfn(ω)μ(dω)limnΩgn(ω)μ(dω)=\displaystyle\liminf_{n\to\infty}\int_{\Omega}f_{n}(\omega)\mu(\mathrm{d}% \omega)\geqslant\lim_{n\to\infty}\int_{\Omega}g_{n}(\omega)\mu(\mathrm{d}% \omega)=
=Ωlimngn(ω)μ(dω)=Ω(lim infnfn(ω))μ(dω),\displaystyle\qquad\qquad=\int_{\Omega}\lim_{n}g_{n}(\omega)\mu(\mathrm{d}% \omega)=\int_{\Omega}(\liminf_{n\to\infty}f_{n}(\omega))\mu(\mathrm{d}\omega),

o que conclui a prova. ∎

A possibilidade de desigualdade estrita no Lema de Fatou é ilustrada pelos exemplos n𝟙(0,1n]n\cdot\mathds{1}_{(0,\frac{1}{n}]} e 𝟙(n,n+1]\mathds{1}_{(n,n+1]}. Um exemplo extremo é 𝟙[n,+)\mathds{1}_{[n,+\infty)}. Nesses exemplos, a massa escapou para o infinito. Outra situação que leva à desigualdade estrita é quando a massa fica zanzando, como por exemplo a sequência (fn)n(f_{n})_{n} dada por fn=𝟙(0,1]f_{n}=\mathds{1}_{(0,1]} para nn par e fn=𝟙(1,2]f_{n}=\mathds{1}_{(1,2]} para nn ímpar.

Observe que o Lema de Fatou quase não tem hipóteses. Vimos algo análogo em (5.48), porém optamos por não dar-lhe nome porque, naquele contexto, vinha com a hipótese (desnecessária) de que lim infnfn\liminf_{n}f_{n} fosse finito.

O Teorema da Convergência Dominada diz que, se os gráficos das funções da sequência (fn)n(f_{n})_{n} estão confinados em uma região de massa finita, então não pode haver perda ou ganho de massa no limite. Isso porque o gráfico de fnf_{n} divide esta região de massa finita em duas partes e, caso houvesse perda de massa em uma das partes, necessariamente haveria ganho na outra.

Teorema 5.70 (Teorema da Convergência Dominada).

Seja (Ω,,μ)(\Omega,\mathcal{F},\mu) um espaço de medida e (fn)n1(f_{n})_{n\geqslant 1} uma sequência de funções mensuráveis de Ω\Omega em [,+][-\infty,+\infty], tais que fn(ω)f(ω)f_{n}(\omega)\to f(\omega) quando nn\to\infty para μ\mu-quase todo ω\omega. Suponha que existe g:Ω[0,+]g:\Omega\to[0,+\infty] integrável, tal que |fn|g|f_{n}|\leqslant g q.t.p. para todo n1n\geqslant 1. Então ff é integrável e

limnΩfn(ω)μ(dω)=Ω(limnfn(ω))μ(dω).\lim_{n\to\infty}\int_{\Omega}f_{n}(\omega)\mu(\mathrm{d}\omega)=\int_{\Omega}% \big{(}\lim_{n\to\infty}f_{n}(\omega)\big{)}\mu(\mathrm{d}\omega).
Demonstração.

Modificando fn,f,gf_{n},f,g num conjunto de medida zero, podemos supor que fn(ω)f(ω)f_{n}(\omega)\to f(\omega) e |fn|g<|f_{n}|\leqslant g<\infty para todo ω\omega. Como |f|=limn|fn||g||f|=\lim_{n}|f_{n}|\leqslant|g|, temos que ff é integrável.

Agora observe que fn+g0f_{n}+g\geqslant 0 para todo nn. Aplicando o Lema de Fatou, obtemos Ω(f+g)dμlim infnΩ(fn+g)dμ\int_{\Omega}(f+g)\,\mathrm{d}\mu\leqslant\liminf_{n\to\infty}\int_{\Omega}(f_% {n}+g)\,\mathrm{d}\mu e, como gg é integrável, Ωfdμlim infnΩfndμ.\int_{\Omega}f\,\mathrm{d}\mu\leqslant\liminf_{n\to\infty}\int_{\Omega}f_{n}\,% \mathrm{d}\mu. De forma análoga, fn+g0-f_{n}+g\geqslant 0 para todo nn, o que nos dá Ω(f+g)dμlim infnΩ(fn+g)dμ\int_{\Omega}(-f+g)\,\mathrm{d}\mu\leqslant\liminf_{n\to\infty}\int_{\Omega}(-% f_{n}+g)\,\mathrm{d}\mu e portanto Ωfdμlim supnΩfndμ.\int_{\Omega}f\,\mathrm{d}\mu\geqslant\limsup_{n\to\infty}\int_{\Omega}f_{n}\,% \mathrm{d}\mu. Dessas duas desigualdades, obtemos limnΩfndμ=Ωfdμ,\lim_{n\to\infty}\int_{\Omega}f_{n}\,\mathrm{d}\mu=\int_{\Omega}f\,\mathrm{d}\mu, o que conclui a prova. ∎

Mencionamos brevemente uma importante aplicação do Teorema da Convergência Dominada, que permite derivar dentro da integral. O enunciado e prova são análogos aos do Teorema 5.49 e serão omitidos.

5.5.4 Integral de Riemann e integral imprópria

Estamos introduzindo uma nova definição de integral. Por certo, isso gera inquietudes mais que legítimas. Nas definições e teoremas envolvendo variáveis aleatórias absolutamente contínuas, podemos substituir a integral de Riemann pela de Lebesgue? Em outras palavras, esta generaliza aquela? Neste caso, teria esta alguma vantagem? E na direção oposta, teria aquela alguma vantagem sobre esta? Para a penúltima pergunta, basta mencionar os Teoremas da Convergência Monótona e da Convergência Dominada.

Teorema 5.71.

Seja f:[a,b]f:[a,b]\to\mathbb{R} uma função mensurável. Se ff é Riemann-integrável então também é Lebesgue-integrável e os valores das integrais coincidem, isto é,

abf(x)dx=[a,b]fdm,\int_{a}^{b}f(x)\,\mathrm{d}x=\int_{[a,b]}f\,\mathrm{d}m,

onde mm é a medida de Lebesgue definida na Seção 1.4.2.

Demonstração.

Se a abf(x)dx=L\int_{a}^{b}f(x)\,\mathrm{d}x=L\in\mathbb{R}, então para todo ε>0\varepsilon>0, existem funções-degrau gg e hh tais que gfhg\leqslant f\leqslant h e Lε<abg(x)dxabh(x)dx<L+εL-\varepsilon<\int_{a}^{b}g(x)\,\mathrm{d}x\leqslant\int_{a}^{b}h(x)\,\mathrm{% d}x<L+\varepsilon. Logo, gg e hh (e portanto ff) são limitadas, e por conseguinte [a,b]fdm\int_{[a,b]}f\,\mathrm{d}m está definida. Por outro lado, como gg e hh são funções-degrau, sua integral de Riemann e de Lebesgue coincidem, logo Lε<[a,b]fdm<L+εL-\varepsilon<\int_{[a,b]}f\,\mathrm{d}m<L+\varepsilon. Como isso vale para todo ε>0\varepsilon>0, concluímos que [a,b]fdm=L\int_{[a,b]}f\,\mathrm{d}m=L. ∎

A recíproca é falsa. Uma função pode ser Lebesgue-integrável sem ser Riemann-integrável. Caso ff não seja limitada, não será Riemann-integrável mesmo que seja contínua em quase todo ponto.

Exemplo 5.72.

Um exemplo simples é f:[0,1]f:[0,1]\to\mathbb{R} dada por f=𝟙f=\mathds{1}_{\mathbb{Q}}. Como m()=0m(\mathbb{Q})=0, temos [0,1]fdm=0\int_{[0,1]}f\,\mathrm{d}m=0 mas esta função não é Riemann-integrável. Para verificarmos este fato, considere qualquer partição de [0,1][0,1] em finitos intervalos não-degenerados, e observe que todos os intervalos conterão números racionais e também irracionais, pois tanto os números racionais quanto os irracionais são densos na reta. Logo, toda função-degrau gfg\leqslant f deve satisfazer g0g\leqslant 0 q.t.p, e toda função-degrau hfh\geqslant f deve satisfazer h1h\geqslant 1 q.t.p. Portanto, gdx0\int g\,\mathrm{d}x\leqslant 0 e hdx1\int h\,\mathrm{d}x\geqslant 1 e tomando ε=13\varepsilon=\frac{1}{3} vemos que não pode haver um número LL tal que Lε<gdxhdx<L+εL-\varepsilon<\int g\,\mathrm{d}x\leqslant\int h\,\mathrm{d}x<L+\varepsilon. ∎

Daqui em diante, usaremos a notação

abf(x)dx e Af(x)dx\int_{a}^{b}f(x)\,\mathrm{d}x\text{ \ e \ }\int_{A}f(x)\,\mathrm{d}x

para denotar a integral de ff com respeito à medida de Lebesgue no intervalo [a,b][a,b]\subseteq\mathbb{R} ou no conjunto AA\in\mathcal{B}, respectivamente.

O Teorema 5.71 considera apenas funções mensuráveis. Tecnicamente, uma função pode ser Riemann-integrável sem ser mensurável (com respeito à σ\sigma-álgebra de Borel). Entretanto, se f:[a,b]f:[a,b]\to\mathbb{R} é Riemann-integrável, seguindo a prova desse teorema pode-se mostrar que existe uma função mensurável gg e um conjunto N[a,b]N\subseteq[a,b] tais que m(N)=0m(N)=0 e f=gf=g em [a,b]N[a,b]\setminus N. As integrais de ff e gg coincidem em qualquer subintervalo de [a,b][a,b].

Mencionamos brevemente a integral imprópria. Como a integral de Riemann é definida apenas para intervalos finitos, a teoria baseada nela trata as integrais em intervalos infinitos como um limite. Existem funções ff que não são Lebesgue-integráveis e para as quais o limite

limz+0zf(x)dx\lim_{z\to+\infty}\int_{0}^{z}f(x)\,\mathrm{d}x

existe e é finito. Ou seja, há funções para as quais a integral imprópria está definida mas integral de Lebesgue não está. Porém, a exclusão dessas funções torna a teoria de integração de Lebesgue muito mais robusta. Quase todos os teoremas deste capítulo deixam de valer se atribuímos significado de integral ao limite acima, incluindo a mudança de variável, regra da cadeia, cálculo da esperança, e teoremas de convergência. Se usássemos esse limite para calcular a esperança de uma variável aleatória, a Lei dos Grandes Números não seria válida. Mas isso não quer dizer que o limite acima não tenha importância. Ao contrário, ele é conhecido como integral de Dirichlet, tem um papel central em Análise Harmônica, e inclusive será usado na Seção 10.4.

Pode-se fazer discussão semelhante com respeito a séries condicionalmente convergentes. Observe que a soma de uma família de números estendidos não-negativos, definida em (C.1), coincide com a integral de Lebesgue da função f(α)=xαf(\alpha)=x_{\alpha} com respeito à medida de contagem em Λ\Lambda. Dessa forma, a soma de uma família de números estendidos indexados por \mathbb{N} é dada por

kxk=k=1xk+k=1xk,\sum_{k\in\mathbb{N}}x_{k}=\sum_{k=1}^{\infty}x_{k}^{+}-\sum_{k=1}^{\infty}x_{% k}^{-},

desde que uma das duas séries do lado direito convirja, e, neste caso,

kxk=k=1xk+k=1xk=limkj=1kxj+limkj=1kxj=limkj=1kxj=k=1xk.\sum_{k\in\mathbb{N}}x_{k}=\sum_{k=1}^{\infty}x_{k}^{+}-\sum_{k=1}^{\infty}x_{% k}^{-}=\lim_{k}\sum_{j=1}^{k}x_{j}^{+}-\lim_{k}\sum_{j=1}^{k}x_{j}^{-}=\lim_{k% }\sum_{j=1}^{k}x_{j}=\sum_{k=1}^{\infty}x_{k}.

Novamente, esta definição coincide com a integral de f(k)=xkf(k)=x_{k} com respeito à medida de contagem em \mathbb{N}. Caso ambas as séries divirjam, dizemos que kxk\sum_{k\in\mathbb{N}}x_{k} não está definida. Com essa definição, a soma k(1)k1k\sum_{k\in\mathbb{N}}(-1)^{k}\,\frac{1}{k} não está definida, da mesma forma que x1senxdx\int_{\mathbb{R}}x^{-1}\mathop{\mathrm{sen}}\nolimits x\,\mathrm{d}x não está definida. Note que há uma diferença entre “k\sum_{k\in\mathbb{N}}” definida aqui e “k=1\sum_{k=1}^{\infty}” definida no Apêndice A.1, pois a série harmônica alternada k=1(1)k1k\sum_{k=1}^{\infty}(-1)^{k}\,\frac{1}{k} converge.

5.5.5 Densidade de medidas

Nesta seção vamos explorar o conceito de densidade e como se aplica a variáveis aleatórias absolutamente contínuas.

Proposição 5.73.

Seja (Ω,,μ)(\Omega,\mathcal{F},\mu) um espaço de medida e f:Ω[0,+]f:\Omega\to[0,+\infty] uma função mensurável. Então,

ν(A)=Afdμ,A,\nu(A)=\int_{A}f\,\mathrm{d}\mu,\quad\forall A\in\mathcal{F}, (5.74)

define uma outra medida em (Ω,)(\Omega,\mathcal{F}).

A demonstração fica como exercício. Quando ν\nu é definida a partir de μ\mu desta maneira, costuma-se denotar ν=fμ\nu=f\mu e dν=fdμ\mathrm{d}\nu=f\,\mathrm{d}\mu.

Exemplo 5.75.

Seja Ω={1,2,3,4,5,6}\Omega=\{1,2,3,4,5,6\}, =𝒫(Ω)\mathcal{F}=\mathcal{P}(\Omega) e (A)=#A6\mathbb{P}(A)=\frac{\#A}{6}. Considere a função g(n)=27ng(n)=\frac{2}{7}n. Pela Proposição 5.73, a função 𝐏\mathbf{P} dada por 𝐏(A)=Ω(g𝟙A)d\mathbf{P}(A)=\int_{\Omega}(g\mathds{1}_{A})\mathrm{d}\mathbb{P} define uma nova medida em (Ω,)(\Omega,\mathcal{F}). De fato, isso define uma medida de probabilidade (exercício!). ∎

Quando duas medidas μ\mu e ν\nu são relacionadas por (5.74), chamamos a função ff de derivada de Radon-Nikodým de ν\nu com respeito a μ\mu, denotada por dνdμ\frac{\mathrm{d}\nu}{\mathrm{d}\mu}, de forma que ν(A)=Adνdμ(ω)μ(dω)\nu(A)=\int_{A}\frac{\mathrm{d}\nu}{\mathrm{d}\mu}(\omega)\mu(\mathrm{d}\omega). Neste caso, dizemos que a derivada dνdμ\frac{\mathrm{d}\nu}{\mathrm{d}\mu} existe. A proposição abaixo diz que a derivada de Radon-Nikodým é essencialmente única.

Proposição 5.76.

Sejam μ\mu uma medida σ\sigma-finita e f,g:Ω[,+]f,g:\Omega\to[-\infty,+\infty] duas funções mensuráveis. Se Ωfdμ\int_{\Omega}f\,\mathrm{d}\mu e Ωgdμ\int_{\Omega}g\,\mathrm{d}\mu estão definidas, e Afdμ=Agdμ\int_{A}f\,\mathrm{d}\mu=\int_{A}g\,\mathrm{d}\mu para todo AA\in\mathcal{F}, então f=gf=g q.t.p.

Demonstração.

Supomos inicialmente que ff e gg são não-negativas. Tome BnΩB_{n}\uparrow\Omega tais que μ(Bn)<\mu(B_{n})<\infty para todo nn. Defina An={ωBn:0g(ω)n,g(ω)<f(ω)}A_{n}=\{\omega\in B_{n}:0\leqslant g(\omega)\leqslant n,g(\omega)<f(\omega)\}. Como μ(An)μ(Bn)<\mu(A_{n})\leqslant\mu(B_{n})<\infty, temos que g𝟙Ang\mathds{1}_{A_{n}} é finita e integrável. Logo, An(fg)dμ=AnfdμAngdμ=0\int_{A_{n}}(f-g)\mathrm{d}\mu=\int_{A_{n}}f\mathrm{d}\mu-\int_{A_{n}}g\mathrm% {d}\mu=0. Pelo Exercício 5.62, μ(An)=0.\mu(A_{n})=0. Mas An{f>g}A_{n}\uparrow\{f>g\}, logo μ(f>g)=0\mu(f>g)=0. Um argumento idêntico mostra que μ(f<g)=0\mu(f<g)=0, concluindo a prova.

Consideramos agora o caso geral. Como as integrais de ff e gg estão definidas e coincidem, podemos supor sem perda de generalidade que ff^{-} e gg^{-} são integráveis. Logo, ff^{-} e gg^{-} são finitas para μ\mu-quase todo ω\omega. Modificando ff e gg em um conjunto de medida nula, podemos supor também que ff^{-} e gg^{-} são finitas para todo ω\omega. Aplicando o caso anterior às funções (f+f+g)(f+f^{-}+g^{-}) e (g+f+g)(g+f^{-}+g^{-}), podemos concluir que essas duas funções coincidem q.t.p., e portanto f=gf=g q.t.p. ∎

Observação 5.77.

A proposição é falsa sem a hipótese de que μ\mu é σ\sigma-finita. Tomando Ω={1}\Omega=\{1\}, μ({1})=+\mu(\{1\})=+\infty, f(1)=1f(1)=1 e g(1)=2g(1)=2, podemos ver que Afdμ=Agdμ\int_{A}f\,\mathrm{d}\mu=\int_{A}g\,\mathrm{d}\mu para todo AΩA\subseteq\Omega apesar de que fgf\neq g em todo ponto. ∎

Proposição 5.78 (Regra da cadeia).

Sejam ν,μ\nu,\mu medidas em um espaço mensurável (Ω,)(\Omega,\mathcal{F}) tais que dνdμ\frac{\mathrm{d}\nu}{\mathrm{d}\mu} existe, e seja g:Ω[0,+]g:\Omega\to[0,+\infty] mensurável. Então,

Ωgdν=Ωg(ω)dνdμ(ω)μ(dω).\int_{\Omega}g\,\mathrm{d}\nu=\int_{\Omega}g(\omega)\tfrac{\mathrm{d}\nu}{% \mathrm{d}\mu}(\omega)\,\mu(\mathrm{d}\omega).
Demonstração.

Suponha que g=𝟙Ag=\mathds{1}_{A} para algum AA\in\mathcal{F}. Neste caso, temos

Ω𝟙Adν=ν(A)=Adνdμdμ=Ω𝟙Adνdμdμ,\int_{\Omega}{\mathds{1}}_{A}\,\mathrm{d}\nu=\nu(A)=\int_{A}\tfrac{\mathrm{d}% \nu}{\mathrm{d}\mu}\,\mathrm{d}\mu=\int_{\Omega}\mathds{1}_{A}\cdot\tfrac{% \mathrm{d}\nu}{\mathrm{d}\mu}\,\mathrm{d}\mu,

provando a identidade desejada. Por linearidade, a proposição também vale quando gg é uma função simples não-negativa. Pelo Teorema da Convergência Monótona, vale para o caso geral. ∎

Definição 5.79 (Variáveis aleatórias absolutamente contínuas).

Dizemos que uma variável aleatória XX em um espaço de probabilidade (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) é uma variável aleatória absolutamente contínua se dXdm\frac{\mathrm{d}\mathbb{P}_{X}}{\mathrm{d}m} existe. Neste caso, fX=dXdmf_{X}=\frac{\mathrm{d}\mathbb{P}_{X}}{\mathrm{d}m} é uma densidade de XX. Veja que fXf_{X} é determinada por XX e \mathbb{P}, mas este último é omitido na notação.

Pela Proposição 5.76, a densidade de uma variável aleatória absolutamente contínua é única no sentido de que qualquer outra é igual em quase todo ponto. Repare que na Seção 3.3 não demos uma definição geral de distribuição absolutamente contínua, pois nem sempre existe uma densidade Riemann-integrável. Por outro lado, tomando a integral em (5.74) como de Lebesgue, a definição acima é a mais geral possível, como veremos na Seção 11.5.

Recordemos que uma variável aleatória é discreta se existe uma função não-negativa pXp_{X} tal que X(A)=xpX(x)δx(A)\mathbb{P}_{X}(A)=\sum_{x}p_{X}(x)\delta_{x}(A) para todo AA\in\mathcal{B}. Isso é o mesmo que dXdν=pX\frac{\mathrm{d}\mathbb{P}_{X}}{\mathrm{d}\nu}=p_{X}, onde ν\nu é a medida de contagem em \mathbb{R}. Mais geralmente, XX é mista com componentes discreta e absolutamente contínua, como definido na Seção 3.5, se X=μd+μc\mathbb{P}_{X}=\mu_{d}+\mu_{c}, onde dμddν=pX\frac{\mathrm{d}\mu_{d}}{\mathrm{d}\nu}=p_{X} e dμcdm=fX\frac{\mathrm{d}\mu_{c}}{\mathrm{d}m}=f_{X}.

Teorema 5.80 (Esperança de funções de variáveis mistas).

Seja X{X} uma variável aleatória mista com componentes discreta e absolutamente contínua e seja g:[0,+]g:\mathbb{R}\to[0,+\infty] mensurável. Então

𝔼[g(X)]=xg(x)pX(x)+g(x)fX(x)dx.\mathbb{E}[g(X)]=\sum_{{x}}g({x})\cdot p_{{X}}({x})+\int_{\mathbb{R}}g(x)f_{X}% (x)\,\mathrm{d}x.
Demonstração.

Aplicando os Teoremas 5.655.66, depois a Proposição 5.68 e a regra da cadeia, obtemos

𝔼[g(X)]\displaystyle\mathbb{E}[g(X)] =Ωg(X)d=gdX=gdμd+gdμc\displaystyle=\int_{\Omega}g(X)\,\mathrm{d}\mathbb{P}=\int_{\mathbb{R}}g\,% \mathrm{d}\mathbb{P}_{X}=\int_{\mathbb{R}}g\,\mathrm{d}\mu_{d}+\int_{\mathbb{R% }}g\,\mathrm{d}\mu_{c}
=gpXdν+gfXdm=xg(x)pX(x)+gfXdm,\displaystyle=\int_{\mathbb{R}}g\,p_{X}\,\mathrm{d}\nu+\int_{\mathbb{R}}g\,f_{% X}\,\mathrm{d}m=\sum_{x}g(x)\cdot p_{X}(x)+\int_{\mathbb{R}}g\,f_{X}\,\mathrm{% d}m,

o que prova o teorema. ∎

Observe que o Teorema 5.39 corresponde a caso particular em que pX=0p_{X}=0. Já o Teorema 5.28 segue do Teorema 5.39 tomando-se g(x)=x+g(x)=x^{+} e g(x)=xg(x)=x^{-}.

5.5.6 Espaços produto e integrais iteradas

Veremos agora condições sob as quais uma função f(x,y)f(x,y) de duas variáveis xx e yy pode ser integrada com respeito a ambas variáveis, e se o resultado independe da ordem de integração. Para isso precisamos primeiro formalizar o espaço onde estará definida uma função de duas variáveis.

Definição 5.81 (σ\sigma-álgebra produto).

Sejam (Ω1,1)(\Omega_{1},\mathcal{F}_{1}) e (Ω2,2)(\Omega_{2},\mathcal{F}_{2}) dois espaços mensuráveis. Definimos a σ\sigma-álgebra produto de 1\mathcal{F}_{1} e 2\mathcal{F}_{2}, denotada por 12\mathcal{F}_{1}\otimes\mathcal{F}_{2}, como sendo a σ\sigma-álgebra gerada pela classe99 9 Aqui há um pequeno abuso de notação: 1×2\mathcal{F}_{1}\times\mathcal{F}_{2} não é exatamente um produto cartesiano, pois é uma coleção de retângulos A×BA\times B e não uma coleção de pares (A,B)(A,B).

1×2={A1×A2Ω1×Ω2:A11,A22}\mathcal{F}_{1}\times\mathcal{F}_{2}=\{A_{1}\times A_{2}\subseteq\Omega_{1}% \times\Omega_{2}:A_{1}\in\mathcal{F}_{1},\ A_{2}\in\mathcal{F}_{2}\}

no espaço amostral Ω1×Ω2\Omega_{1}\times\Omega_{2}.

Em outras palavras, 12\mathcal{F}_{1}\otimes\mathcal{F}_{2} é a σ\sigma-álgebra gerada pela coleção de todos os “retângulos” cujos “lados” estão em 1\mathcal{F}_{1} e 2\mathcal{F}_{2}. Note que 12\mathcal{F}_{1}\otimes\mathcal{F}_{2} é muito maior do que o 1×2\mathcal{F}_{1}\times\mathcal{F}_{2}. Por exemplo, em 2=×\mathbb{R}^{2}=\mathbb{R}\times\mathbb{R}, observamos que o círculo

{(x,y)2:x2+y2<1},\{(x,y)\in\mathbb{R}^{2}:x^{2}+y^{2}<1\},

está em ()()\mathcal{B}(\mathbb{R})\otimes\mathcal{B}(\mathbb{R}), pois é união enumerável de retângulos, mas não está em ()×()\mathcal{B}(\mathbb{R})\times\mathcal{B}(\mathbb{R}). Literalmente, o círculo não é um retângulo!

O seguinte teorema garante a existência de uma medida no espaço produto que fatora para retângulos. A prova será dada no Apêndice D.4.

Teorema 5.82 (Medida produto).

Sejam (Ω1,1,μ1)(\Omega_{1},\mathcal{F}_{1},\mu_{1}) e (Ω2,2,μ2)(\Omega_{2},\mathcal{F}_{2},\mu_{2}) dois espaços de medida σ\sigma-finita. Então, existe uma única medida ν\nu na σ\sigma-álgebra 12\mathcal{F}_{1}\otimes\mathcal{F}_{2} tal que

ν(A1×A2)=μ1(A1)μ2(A2)\nu(A_{1}\times A_{2})=\mu_{1}(A_{1})\cdot\mu_{2}(A_{2})

para todos A11,A22A_{1}\in\mathcal{F}_{1},A_{2}\in\mathcal{F}_{2}. Essa medida ν\nu, denotada por μ1μ2\mu_{1}\otimes\mu_{2} é chamada medida produto de μ1\mu_{1} e μ2\mu_{2}.

Para que uma integral iterada faça sentido, ao integrar com respeito a uma das variáveis, o resultado deveria ser uma função mensurável da outra variável. O lema abaixo também será provado no Apêndice D.4.

Lema 5.83.

Sejam (Ω1,1,μ)(\Omega_{1},\mathcal{F}_{1},\mu) e (Ω2,2,ν)(\Omega_{2},\mathcal{F}_{2},\nu) espaços de medida σ\sigma-finita. Seja g:Ω1×Ω2[0,+]g:\Omega_{1}\times\Omega_{2}\to[0,+\infty] uma função mensurável com respeito à σ\sigma-álgebra produto 12\mathcal{F}_{1}\otimes\mathcal{F}_{2}. Para todo xΩ1x\in\Omega_{1} fixo, a função yg(x,y)y\mapsto g(x,y) é 2\mathcal{F}_{2}-mensurável. Ademais, a integral Ω2g(x,y)ν(dy)\int_{\Omega_{2}}g(x,y)\nu(\mathrm{d}y) define uma função 1\mathcal{F}_{1}-mensurável de xx. Analogamente, para todo yΩ2y\in\Omega_{2} fixo, a função xg(x,y)x\mapsto g(x,y) é 1\mathcal{F}_{1}-mensurável e a integral Ω1g(x,y)μ(dx)\int_{\Omega_{1}}g(x,y)\mu(\mathrm{d}x) define uma função 2\mathcal{F}_{2}-mensurável de yy.

Sabendo que a integral com respeito a uma das variáveis resulta em uma função mensurável da outra variável, passamos a estudar integrais iteradas.

Teorema 5.84 (Teorema de Tonelli).

Sejam (Ω1,1,μ)(\Omega_{1},\mathcal{F}_{1},\mu) e (Ω2,2,ν)(\Omega_{2},\mathcal{F}_{2},\nu) espaços de medida σ\sigma-finita, e g:Ω1×Ω2[0,+]g:\Omega_{1}\times\Omega_{2}\to[0,+\infty] uma função mensurável. Então

Ω1(Ω2g(x,y)ν(dy))μ(dx)=Ω2(Ω1g(x,y)μ(dx))ν(dy)\int_{\Omega_{1}}\Big{(}\int_{\Omega_{2}}g(x,y)\,\nu(\mathrm{d}y)\Big{)}\mu(% \mathrm{d}x)=\int_{\Omega_{2}}\Big{(}\int_{\Omega_{1}}g(x,y)\,\mu(\mathrm{d}x)% \Big{)}\nu(\mathrm{d}y)

e essas integrais são iguais a Ω1×Ω2gd(μν)\int_{\Omega_{1}\times\Omega_{2}}g\,\mathrm{d}(\mu\otimes\nu).

A prova será dada no Apêndice D.4. Uma aplicação do Teorema de Tonelli é uma prova alternativa de que a densidade de uma variável aleatória normal é de fato uma função de densidade.

Exemplo 5.85 (Densidade da normal).

Vamos calcular

0+(0+eu2du)ey2dy.\int_{0}^{+\infty}\left(\int_{0}^{+\infty}e^{-u^{2}}{\mathrm{d}}u\right)e^{-y^% {2}}{\mathrm{d}}y.

Com uma mudança de variáveis reescrevemos essa integral como

0+(0+yex2y2dx)ey2dy,\int_{0}^{+\infty}\left(\int_{0}^{+\infty}ye^{-x^{2}y^{2}}{\mathrm{d}}x\right)% e^{-y^{2}}{\mathrm{d}}y,

que, pelo Teorema de Tonelli, é igual a

0+(0+ye(1+x2)y2dy)dx,\int_{0}^{+\infty}\left(\int_{0}^{+\infty}ye^{-(1+x^{2})y^{2}}{\mathrm{d}}y% \right){\mathrm{d}}x,

pois os integrandos são não-negativos. Como a integral iterada acima é igual a π4\frac{\pi}{4}, concluímos que

0+ex2dx=12π.\int_{0}^{+\infty}e^{-x^{2}}{\mathrm{d}}x=\frac{1}{2}\sqrt{\pi}.

Com isso provamos que

+12πex2/2dx=1\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}e^{-x^{2}/2}\,\mathrm{d}x=1

sem ter que usar coordenadas polares. ∎

A teoria acima trata sempre de funções não-negativas. Se consideramos uma função mensurável qualquer, ainda podemos aplicar o Lema 5.83 e o Teorema de Tonelli às suas partes positiva e negativa. Entretanto, poderá haver valores de xx para os quais a integral em yy não estará definida e vice-versa. Isso será de fato um problema, a não ser que integral interna esteja definida para quase todo valor da variável externa.

Teorema 5.86 (Teorema de Fubini).

Sejam (Ω1,1,μ)(\Omega_{1},\mathcal{F}_{1},\mu) e (Ω2,2,ν)(\Omega_{2},\mathcal{F}_{2},\nu) espaços de medida σ\sigma-finita e f:Ω1×Ω2[,+]f:\Omega_{1}\times\Omega_{2}\to[-\infty,+\infty] uma função mensurável. Se

Ω1(Ω2|f(x,y)|ν(dy))μ(dx)<,\int_{\Omega_{1}}\Big{(}\int_{\Omega_{2}}|f(x,y)|\,\nu(\mathrm{d}y)\Big{)}\mu(% \mathrm{d}x)<\infty,

então: Ω2f(x,y)ν(dy)\int_{\Omega_{2}}f(x,y)\,\nu(\mathrm{d}y) está definida para μ\mu-quase todo xx, Ω1f(x,y)μ(dx)\int_{\Omega_{1}}f(x,y)\,\mu(\mathrm{d}x) está definida para ν\nu-quase todo yy, vale a igualdade

Ω1(Ω2f(x,y)ν(dy))μ(dx)=Ω2(Ω1f(x,y)μ(dx))ν(dy),\int_{\Omega_{1}}\Big{(}\int_{\Omega_{2}}f(x,y)\,\nu(\mathrm{d}y)\Big{)}\mu(% \mathrm{d}x)=\int_{\Omega_{2}}\Big{(}\int_{\Omega_{1}}f(x,y)\,\mu(\mathrm{d}x)% \Big{)}\nu(\mathrm{d}y),

e essas integrais são iguais a Ω1×Ω2fd(μν)\int_{\Omega_{1}\times\Omega_{2}}f\,\mathrm{d}(\mu\otimes\nu). Nas duas integrais iteradas logo acima, podemos substituir o valor da integral interna por zero no conjunto (de medida nula) de pontos para os quais ela não está definida.

A prova será dada no Apêndice D.4. Em sua versão mais corrente, o enunciado do Teorema de Fubini tem como hipótese que ff seja integrável com respeito a μν\mu\otimes\nu, que no enunciado acima foi substituída por outra mais conveniente graças ao Teorema de Tonelli. Vejamos um exemplo de integrais iteradas que não comutam, e o que nos diz o Teorema de Fubini nesse caso.

Exemplo 5.87.

Seja f:(0,1)×(0,1)f:(0,1)\times(0,1)\to\mathbb{R} definida por

f(x,y)=xy(x+y)3.f(x,y)=\frac{x-y}{(x+y)^{3}}.

Fazendo u=x+yu=x+y,

0101xy(x+y)3dxdy=01y1+yu2yu3dudy=12.\int_{0}^{1}\int_{0}^{1}\frac{x-y}{(x+y)^{3}}\,\mathrm{d}x\,\mathrm{d}y=\int_{% 0}^{1}\int_{y}^{1+y}\frac{u-2y}{u^{3}}\,\mathrm{d}u\,\mathrm{d}y=-\frac{1}{2}.

Por outro lado, também substituindo u=x+yu=x+y,

0101xy(x+y)3dydx=01x1+x2xuu3dudx=12.\int_{0}^{1}\int_{0}^{1}\frac{x-y}{(x+y)^{3}}\,\mathrm{d}y\,\mathrm{d}x=\int_{% 0}^{1}\int_{x}^{1+x}\frac{2x-u}{u^{3}}\mathrm{d}u\,\mathrm{d}x=\frac{1}{2}.

Podemos assim concluir que

0101|f(x,y)|dxdy=+,\int_{0}^{1}\int_{0}^{1}|f(x,y)|\,\mathrm{d}x\,\mathrm{d}y=+\infty,

pois caso contrário teríamos 0101f(x,y)dxdy=0101f(x,y)dydx\int_{0}^{1}\int_{0}^{1}f(x,y)\,\mathrm{d}x\,\mathrm{d}y=\int_{0}^{1}\int_{0}^% {1}f(x,y)\,\mathrm{d}y\,\mathrm{d}x. ∎

Como toda soma é uma integral de Lebesgue com respeito à medida de contagem, podemos obter propriedades muito úteis de somas infinitas iteradas. Por exemplo, o Teorema C.2 segue direto do Teorema de Tonelli.

Teorema 5.88 (Teorema de Fubini para somas).

Seja (xm,n)m,n(x_{m,n})_{m,n\in\mathbb{N}} uma sequência de números reais estendidos duplamente indexada por mm e nn.

Se m=1n=1|xm,n|<, então m=1n=1xm,n=n=1m=1xm,n\text{Se }\quad\sum_{m=1}^{\infty}\sum_{n=1}^{\infty}|x_{m,n}|<\infty,\quad% \text{ ent\~{a}o }\quad\sum_{m=1}^{\infty}\sum_{n=1}^{\infty}x_{m,n}=\sum_{n=1% }^{\infty}\sum_{m=1}^{\infty}x_{m,n}

estão definidas e coincidem.

Demonstração.

Segue direto do Teorema de Fubini, pois somas infinitas são integrais com respeito à medida de contagem e, quando são somáveis, coincidem com a respectiva série. ∎

Vejamos um exemplo de somas iteradas que não comutam.

Exemplo 5.89.

Considere a sequência duplamente indexada

xm,n=11000011000011000011x_{m,n}=\begin{array}[]{|rrrrrr}\hline\cr 1&-1&0&0&0&\dots\\ 0&1&-1&0&0&\dots\\ 0&0&1&-1&0&\dots\\ 0&0&0&1&-1&\dots\\ \vdots&\vdots&\vdots&\vdots&\ddots&\ddots\end{array}

que não é somável. Veja que somando-se colunas e depois linhas obtém-se 11 mas somando-se linhas e depois colunas obtém-se 0. ∎

Terminamos este capítulo com uma observação sobre esperança de funções de vetores aleatórios com densidade conjunta.

Observação 5.90 (Vetores aleatórios com densidade conjunta).

A medida de Lebesgue em n\mathbb{R}^{n}, denotada 𝒎{\boldsymbol{m}}, é definida recursivamente como 𝒎=mm{\boldsymbol{m}}=m\otimes\dots\otimes m. Seja h:n[0,+]h:\mathbb{R}^{n}\to[0,+\infty] mensurável. Como (n)=()()\mathcal{B}(\mathbb{R}^{n})=\mathcal{B}(\mathbb{R})\otimes\dots\otimes\mathcal% {B}(\mathbb{R}),1010 10 O produto de nn espaços de medida pode ser definido recursivamente, veja o Apêndice D.4 para uma descrição desse argumento e para a prova de que (n)=()()\mathcal{B}(\mathbb{R}^{n})=\mathcal{B}(\mathbb{R})\otimes\dots\otimes\mathcal% {B}(\mathbb{R}). concluímos que hh é mensurável com respeito à σ\sigma-álgebra produto. Usando o Teorema de Tonelli recursivamente, n1n-1 vezes, obtemos

nhd𝒎=h(x1,,xn)dxndx1.\int_{\mathbb{R}^{n}}h\,\mathrm{d}{\boldsymbol{m}}=\int_{\mathbb{R}}\cdots\int% _{\mathbb{R}}h(x_{1},\dots,x_{n})\,\mathrm{d}x_{n}\cdots\mathrm{d}x_{1}. (5.91)

Munidos da identidade acima, concluímos que a definição de densidade conjunta dada na Seção 4.2 diz simplesmente que

𝑿(B)=Bf𝑿d𝒎\mathbb{P}_{{\boldsymbol{X}}}(B)=\int_{B}f_{{\boldsymbol{X}}}\,\mathrm{d}{% \boldsymbol{m}}

para todo paralelepípedo BnB\subseteq\mathbb{R}^{n}, o que implica a mesma identidade para todo boreliano B(n)B\in\mathcal{B}(\mathbb{R}^{n}) usando o Teorema 3.37 (unicidade de medidas). Ou seja, 𝑿{{\boldsymbol{X}}} ter densidade conjunta f𝑿f_{{\boldsymbol{X}}} é o mesmo que d𝑿d𝒎=f𝑿\frac{\mathrm{d}\mathbb{P}_{{\boldsymbol{X}}}}{\mathrm{d}{\boldsymbol{m}}}=f_{% {\boldsymbol{X}}}.

Podemos agora justificar a fórmula (5.43). Para isso, observamos que

𝔼[g(𝑿)]\displaystyle\mathbb{E}[g({{\boldsymbol{X}}})] =Ωg(𝑿(ω))(dω)\displaystyle=\int_{\Omega}g({{\boldsymbol{X}}}(\omega))\,\mathbb{P}(\mathrm{d% }\omega)
=ng(𝒙)𝑿(d𝒙)\displaystyle=\int_{\mathbb{R}^{n}}g({{\boldsymbol{x}}})\,\mathbb{P}_{{% \boldsymbol{X}}}(\mathrm{d}{{\boldsymbol{x}}})
=ng(𝒙)f𝑿(𝒙)𝒎(d𝒙)\displaystyle=\int_{\mathbb{R}^{n}}g({{\boldsymbol{x}}})f_{{\boldsymbol{X}}}({% {\boldsymbol{x}}})\,{\boldsymbol{m}}(\mathrm{d}{{\boldsymbol{x}}})
=++g(x1,,xn)f𝑿(x1,,xn)dxndx1\displaystyle=\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}g(x_{1},% \dots,x_{n})\,f_{{\boldsymbol{X}}}(x_{1},\dots,x_{n})\,\mathrm{d}x_{n}\cdots% \mathrm{d}x_{1}

para qualquer g:n[0,+)g:\mathbb{R}^{n}\to[0,+\infty) mensurável. Em particular, pelo Lema 3.43, vale para gg contínua e não-negativa. Nas igualdades acima, usamos os Teoremas 5.655.66, a regra da cadeia, e a fórmula (5.91), nesta ordem. ∎