5.5 Integral de Lebesgue
Em Análise Real, primeiro vemos a integral de Riemann, que aproxima a área abaixo de uma curva por retângulos verticais. Entretanto, este não é o procedimento mais adequado quando analisamos sequências de funções. Por exemplo, suponha que queremos mostrar que
ou
para alguma função contínua e limitada . Em princípio, poderíamos usar um emaranhado de teoremas do Cálculo Avançado. A integral de Lebesgue, por outro lado, aproxima a área abaixo de uma curva por retângulos horizontais, e essa pequena diferença a torna muitíssimo mais flexível. Por exemplo, as identidades acima ficam muito mais simples se usamos o Teorema da Convergência Dominada, que apresentaremos nesta seção.
O principal motivo para usar a integral de Lebesgue é a forma robusta com que ela comuta com limites, derivadas, séries e outras integrais.
Outra razão para introduzir a integral de Lebesgue é que a maioria dos espaços de medida (incluindo espaços de probabilidade!) não podem ser facilmente particionados em pequenos intervalos ou cubos contíguos como em , mas ainda assim podemos medir suas partes. Para definir a integral neste caso, ao invés de particionar o domínio e medir a altura do gráfico no contradomínio, particionamos o contradomínio e medimos pedaços do domínio, como mostrado na Figura 5.4.
5.5.1 Construção
Vamos construir a integral de uma função com respeito a uma medida , denotada
Seja um espaço de medida. Dizemos que é uma função simples se é mensurável e toma apenas finitos valores.
Se é uma função simples não-negativa, definimos sua integral por
Teorema 5.57.
Sejam e funções simples não-negativas e . Então valem as seguintes propriedades:
-
(1)
Unitariedade: para todo .
-
(2)
Monotonicidade: se , então .
-
(3)
Linearidade: .
Demonstração.
O operador é unitário por construção. Linearidade é provada de forma idêntica ao Teorema 5.9. Para monotonicidade, observamos que . ∎
O próximo passo é definir a integral de uma função mensurável, o que fazemos aproximando-a por baixo por funções simples:
Note que para funções não-negativas simples, essa definição coincide com a anterior tomando-se .
Teorema 5.59.
Vale o Teorema 5.57 supondo funções mensuráveis e constante .
O operador é unitário por construção e é monótono por inclusão: quanto maior , mais funções simples entram no supremo em (5.58). Falta provar a linearidade. Para isso, usaremos o Teorema da Convergência Monótona, um dos teoremas fulcrais da Teoria da Medida.
Teorema 5.60 (Teorema da Convergência Monótona).
Seja uma sequência de funções mensuráveis de em tais que para todo e . Então
Demonstração.
Denotemos . Pela monotonicidade da integral, a sequência é não-decrescente e limitada por . Logo, ela tem limite, e
Resta mostrar a desigualdade oposta. Seja simples, tomando valores . Seja e . Como e , para cada existe tal que , logo e
Logo,
Como isso vale para todo , concluímos que
Como isso vale para toda função simples tal que ,
Como fizemos para a esperança, inúmeras propriedades da integral de Lebesgue serão demonstradas combinando-se o Teorema da Convergência Monótona com a aproximação por funções simples.
Proposição 5.61.
Dada uma função mensurável , existe uma sequência de funções simples tais que para todo .
Demonstração.
Seja a função definida em (5.46) e observamos que para todo . Tomando obtemos a sequência desejada. ∎
Agora estamos aptos a terminar a prova do Teorema 5.59.
Demonstração do Teorema 5.59.
Falta provar a linearidade. Sejam funções mensuráveis . Se , temos diretamente de (5.58). Se , demonstra-se a mesma igualdade tomando-se uma sequência , tal que e aplicando-se o Teorema da Convergência Monótona. Finalmente, pela Proposição 5.61, existem sequências de funções simples não-negativas e . Usando o Teorema da Convergência Monótona três vezes e linearidade para a integral de funções simples não-negativas,
o que conclui a prova. ∎
Dizemos que uma propriedade vale para -quase todo , ou em -quase toda parte, abreviado por -q.t.p., se existe um conjunto tal que e tal que essa propriedade vale para todo . Caso esteja claro no contexto, podemos dizer simplesmente “q.t.p.” omitindo .
Exercício 5.62.
Seja uma função mensurável. Mostre que se, e somente se, q.t.p. ∎
Dada uma função mensurável , denote sua parte positiva por e sua parte negativa por . Definimos
caso uma das integrais seja finita, caso contrário dizemos que não está definida. Quando ambas as integrais são finitas, dizemos que é integrável. Observe que, se é integrável, então é finita q.t.p.
Essa definição também dá origem a um operador linear.
Teorema 5.63.
Sejam funções mensuráveis. Sejam . Suponha que seja integrável. Então valem as seguintes propriedades.
-
(1)
Monotonicidade: se para todo , então está definida e .
-
(2)
Linearidade: , desde que esteja definida.
Demonstração.
Começamos pela linearidade. Mostraremos primeiro que . Suponhamos inicialmente que . Desenvolvendo,
Essas expressões não contêm “” porque estamos supondo que está definida. Para o caso basta considerar no lugar de .
Para terminar a prova da linearidade, resta mostrar que . Observamos que
donde
Observando que todas as funções acima são não-negativas, pela aditividade dada pelo Teorema 5.59 segue que
Como estamos supondo que está definida, temos ou . Suponhamos que valha o primeiro caso; se for o segundo, o argumento será análogo. Como é integrável, temos e . Assim, podemos subtrair esses três termos de ambos os lados, obtendo
o que conclui a prova da linearidade.
Para monotonicidade, observe que, sendo integrável e , temos , logo e, portanto, está definida. Por linearidade,
o que conclui a prova. ∎
5.5.2 Principais propriedades
Dado um conjunto , a integral de em é definida como
Exercício 5.64.
Seja uma função mensurável. Mostre que para todo se, e somente se, q.t.p. ∎
A esperança de uma variável aleatória nada mais é do que a integral de Lebesgue da função mensurável com respeito à medida .
Teorema 5.65.
Seja um espaço de probabilidade e uma variável aleatória. Então a esperança de é dada por
desde que uma das duas esteja definida.
Demonstração.
Se é da forma , pela unitariedade e linearidade da esperança e da integral, segue que . Se é não-negativa, obtemos a identidade usando ambas as versões do Teorema da Convergência Monótona, para a esperança e para a integral. Finalmente, no caso em que é uma variável aleatória qualquer, basta observar que , desde que uma das duas diferenças acima esteja definida. ∎
A integral de Lebesgue tem a vantagem adicional de nos permitir estender a noção de esperança para variáveis aleatórias estendidas , via a fórmula .
Seja uma função mensurável de em . Dada uma função mensurável , podemos definir o seu pull-back em dado pela função em . Juntamente com e definidos na Seção 3.7, obtemos o seguinte diagrama:
Em suma, a partir de uma função que leva pontos a pontos , podemos puxar uma -álgebra em de volta para uma -álgebra em , e empurrar uma medida em adiante para uma medida em , e puxar um observável definido em de volta para um observável definido em .
Teorema 5.66 (Mudança de variável).
Sejam um espaço de medida, um espaço mensurável, uma função mensurável, e também mensurável. Então
Demonstração.
Supondo que para algum , temos que onde . Substituindo essas identidades, obtemos
Por linearidade, a identidade vale para funções simples não-negativas. Pelo Teorema da Convergência Monótona, mostramos que vale para qualquer mensurável. ∎
Quando consideramos uma variável aleatória em um espaço de probabilidade, aplicando o teorema acima com e , obtemos
que é válido desde que um dos lados esteja definido.
Proposição 5.67 (Funções iguais q.t.p.).
Sejam um espaço de medida e funções mensuráveis. Se q.t.p., então
desde que uma das duas esteja definida.
Demonstração.
Tome . Defina e . Então Como por monotonicidade obtemos Por um argumento similar, Assumindo que uma dessas duas seja finita, obtemos ∎
Finalmente, mostraremos que o operador integral é linear não apenas no integrando mas também na medida com respeito à qual se integra.
Proposição 5.68.
Sejam e medidas em e mensurável. Então .
Demonstração.
Se para algum , ambos os lados se reduzem a e portanto vale a identidade. Estendemos a identidade para funções simples não-negativas por linearidade, e para funções mensuráveis não-negativas usando o Teorema da Convergência Monótona. ∎
5.5.3 Convergência
Conforme discutido na Seção 5.3, em inúmeras situações queremos tomar um limite dentro da integral. Começamos discutindo alguns casos para ver o que poderia dar errado.
Pensemos a região abaixo do gráfico de uma função real não-negativa como tendo uma “área”, “volume” ou “massa”. Se a função é dada por , ou por , essa massa é sempre igual a e, no entanto, desaparece quando tomamos o limite em . Podemos dizer que a massa “escapou ao infinito”. No primeiro exemplo, escapou verticalmente e, no segundo, horizontalmente. Os três teoremas de convergência explicam o que pode acontecer com a massa no limite.
O Teorema da Convergência Monótona diz que nada de estranho pode acontecer com uma sequência crescente de funções, mais precisamente que não se pode ganhar massa. O próximo teorema nos diz que para uma sequência de funções mensuráveis não-negativas, até podemos perder massa no limite, mas nunca ganhar.
Teorema 5.69 (Lema de Fatou).
Seja um espaço de medida e uma sequência de funções mensuráveis de em . Então,
Demonstração.
Tomando temos que
Usando o Teorema da Convergência Monótona, como
o que conclui a prova. ∎
A possibilidade de desigualdade estrita no Lema de Fatou é ilustrada pelos exemplos e . Um exemplo extremo é . Nesses exemplos, a massa escapou para o infinito. Outra situação que leva à desigualdade estrita é quando a massa fica zanzando, como por exemplo a sequência dada por para par e para ímpar.
Observe que o Lema de Fatou quase não tem hipóteses. Vimos algo análogo em (5.48), porém optamos por não dar-lhe nome porque, naquele contexto, vinha com a hipótese (desnecessária) de que fosse finito.
O Teorema da Convergência Dominada diz que, se os gráficos das funções da sequência estão confinados em uma região de massa finita, então não pode haver perda ou ganho de massa no limite. Isso porque o gráfico de divide esta região de massa finita em duas partes e, caso houvesse perda de massa em uma das partes, necessariamente haveria ganho na outra.
Teorema 5.70 (Teorema da Convergência Dominada).
Seja um espaço de medida e uma sequência de funções mensuráveis de em , tais que quando para -quase todo . Suponha que existe integrável, tal que q.t.p. para todo . Então é integrável e
Demonstração.
Modificando num conjunto de medida zero, podemos supor que e para todo . Como , temos que é integrável.
Agora observe que para todo . Aplicando o Lema de Fatou, obtemos e, como é integrável, De forma análoga, para todo , o que nos dá e portanto Dessas duas desigualdades, obtemos o que conclui a prova. ∎
Mencionamos brevemente uma importante aplicação do Teorema da Convergência Dominada, que permite derivar dentro da integral. O enunciado e prova são análogos aos do Teorema 5.49 e serão omitidos.
5.5.4 Integral de Riemann e integral imprópria
Estamos introduzindo uma nova definição de integral. Por certo, isso gera inquietudes mais que legítimas. Nas definições e teoremas envolvendo variáveis aleatórias absolutamente contínuas, podemos substituir a integral de Riemann pela de Lebesgue? Em outras palavras, esta generaliza aquela? Neste caso, teria esta alguma vantagem? E na direção oposta, teria aquela alguma vantagem sobre esta? Para a penúltima pergunta, basta mencionar os Teoremas da Convergência Monótona e da Convergência Dominada.
Teorema 5.71.
Seja uma função mensurável. Se é Riemann-integrável então também é Lebesgue-integrável e os valores das integrais coincidem, isto é,
onde é a medida de Lebesgue definida na Seção 1.4.2.
Demonstração.
Se a , então para todo , existem funções-degrau e tais que e . Logo, e (e portanto ) são limitadas, e por conseguinte está definida. Por outro lado, como e são funções-degrau, sua integral de Riemann e de Lebesgue coincidem, logo . Como isso vale para todo , concluímos que . ∎
A recíproca é falsa. Uma função pode ser Lebesgue-integrável sem ser Riemann-integrável. Caso não seja limitada, não será Riemann-integrável mesmo que seja contínua em quase todo ponto.
Exemplo 5.72.
Um exemplo simples é dada por . Como , temos mas esta função não é Riemann-integrável. Para verificarmos este fato, considere qualquer partição de em finitos intervalos não-degenerados, e observe que todos os intervalos conterão números racionais e também irracionais, pois tanto os números racionais quanto os irracionais são densos na reta. Logo, toda função-degrau deve satisfazer q.t.p, e toda função-degrau deve satisfazer q.t.p. Portanto, e e tomando vemos que não pode haver um número tal que . ∎
Daqui em diante, usaremos a notação
para denotar a integral de com respeito à medida de Lebesgue no intervalo ou no conjunto , respectivamente.
O Teorema 5.71 considera apenas funções mensuráveis. Tecnicamente, uma função pode ser Riemann-integrável sem ser mensurável (com respeito à -álgebra de Borel). Entretanto, se é Riemann-integrável, seguindo a prova desse teorema pode-se mostrar que existe uma função mensurável e um conjunto tais que e em . As integrais de e coincidem em qualquer subintervalo de .
Mencionamos brevemente a integral imprópria. Como a integral de Riemann é definida apenas para intervalos finitos, a teoria baseada nela trata as integrais em intervalos infinitos como um limite. Existem funções que não são Lebesgue-integráveis e para as quais o limite
existe e é finito. Ou seja, há funções para as quais a integral imprópria está definida mas integral de Lebesgue não está. Porém, a exclusão dessas funções torna a teoria de integração de Lebesgue muito mais robusta. Quase todos os teoremas deste capítulo deixam de valer se atribuímos significado de integral ao limite acima, incluindo a mudança de variável, regra da cadeia, cálculo da esperança, e teoremas de convergência. Se usássemos esse limite para calcular a esperança de uma variável aleatória, a Lei dos Grandes Números não seria válida. Mas isso não quer dizer que o limite acima não tenha importância. Ao contrário, ele é conhecido como integral de Dirichlet, tem um papel central em Análise Harmônica, e inclusive será usado na Seção 10.4.
Pode-se fazer discussão semelhante com respeito a séries condicionalmente convergentes. Observe que a soma de uma família de números estendidos não-negativos, definida em (C.1), coincide com a integral de Lebesgue da função com respeito à medida de contagem em . Dessa forma, a soma de uma família de números estendidos indexados por é dada por
desde que uma das duas séries do lado direito convirja, e, neste caso,
Novamente, esta definição coincide com a integral de com respeito à medida de contagem em . Caso ambas as séries divirjam, dizemos que não está definida. Com essa definição, a soma não está definida, da mesma forma que não está definida. Note que há uma diferença entre “” definida aqui e “” definida no Apêndice A.1, pois a série harmônica alternada converge.
5.5.5 Densidade de medidas
Nesta seção vamos explorar o conceito de densidade e como se aplica a variáveis aleatórias absolutamente contínuas.
Proposição 5.73.
Seja um espaço de medida e uma função mensurável. Então,
define uma outra medida em .
A demonstração fica como exercício. Quando é definida a partir de desta maneira, costuma-se denotar e .
Exemplo 5.75.
Seja , e . Considere a função . Pela Proposição 5.73, a função dada por define uma nova medida em . De fato, isso define uma medida de probabilidade (exercício!). ∎
Quando duas medidas e são relacionadas por (5.74), chamamos a função de derivada de Radon-Nikodým de com respeito a , denotada por , de forma que . Neste caso, dizemos que a derivada existe. A proposição abaixo diz que a derivada de Radon-Nikodým é essencialmente única.
Proposição 5.76.
Sejam uma medida -finita e duas funções mensuráveis. Se e estão definidas, e para todo , então q.t.p.
Demonstração.
Supomos inicialmente que e são não-negativas. Tome tais que para todo . Defina . Como , temos que é finita e integrável. Logo, . Pelo Exercício 5.62, Mas , logo . Um argumento idêntico mostra que , concluindo a prova.
Consideramos agora o caso geral. Como as integrais de e estão definidas e coincidem, podemos supor sem perda de generalidade que e são integráveis. Logo, e são finitas para -quase todo . Modificando e em um conjunto de medida nula, podemos supor também que e são finitas para todo . Aplicando o caso anterior às funções e , podemos concluir que essas duas funções coincidem q.t.p., e portanto q.t.p. ∎
Observação 5.77.
A proposição é falsa sem a hipótese de que é -finita. Tomando , , e , podemos ver que para todo apesar de que em todo ponto. ∎
Proposição 5.78 (Regra da cadeia).
Sejam medidas em um espaço mensurável tais que existe, e seja mensurável. Então,
Demonstração.
Suponha que para algum . Neste caso, temos
provando a identidade desejada. Por linearidade, a proposição também vale quando é uma função simples não-negativa. Pelo Teorema da Convergência Monótona, vale para o caso geral. ∎
Definição 5.79 (Variáveis aleatórias absolutamente contínuas).
Dizemos que uma variável aleatória em um espaço de probabilidade é uma variável aleatória absolutamente contínua se existe. Neste caso, é uma densidade de . Veja que é determinada por e , mas este último é omitido na notação.
Pela Proposição 5.76, a densidade de uma variável aleatória absolutamente contínua é única no sentido de que qualquer outra é igual em quase todo ponto. Repare que na Seção 3.3 não demos uma definição geral de distribuição absolutamente contínua, pois nem sempre existe uma densidade Riemann-integrável. Por outro lado, tomando a integral em (5.74) como de Lebesgue, a definição acima é a mais geral possível, como veremos na Seção 11.5.
Recordemos que uma variável aleatória é discreta se existe uma função não-negativa tal que para todo . Isso é o mesmo que , onde é a medida de contagem em . Mais geralmente, é mista com componentes discreta e absolutamente contínua, como definido na Seção 3.5, se , onde e .
Teorema 5.80 (Esperança de funções de variáveis mistas).
Seja uma variável aleatória mista com componentes discreta e absolutamente contínua e seja mensurável. Então
Demonstração.
5.5.6 Espaços produto e integrais iteradas
Veremos agora condições sob as quais uma função de duas variáveis e pode ser integrada com respeito a ambas variáveis, e se o resultado independe da ordem de integração. Para isso precisamos primeiro formalizar o espaço onde estará definida uma função de duas variáveis.
Definição 5.81 (-álgebra produto).
Sejam e dois espaços mensuráveis. Definimos a -álgebra produto de e , denotada por , como sendo a -álgebra gerada pela classe99 9 Aqui há um pequeno abuso de notação: não é exatamente um produto cartesiano, pois é uma coleção de retângulos e não uma coleção de pares .
no espaço amostral .
Em outras palavras, é a -álgebra gerada pela coleção de todos os “retângulos” cujos “lados” estão em e . Note que é muito maior do que o . Por exemplo, em , observamos que o círculo
está em , pois é união enumerável de retângulos, mas não está em . Literalmente, o círculo não é um retângulo!
O seguinte teorema garante a existência de uma medida no espaço produto que fatora para retângulos. A prova será dada no Apêndice D.4.
Teorema 5.82 (Medida produto).
Sejam e dois espaços de medida -finita. Então, existe uma única medida na -álgebra tal que
para todos . Essa medida , denotada por é chamada medida produto de e .
Para que uma integral iterada faça sentido, ao integrar com respeito a uma das variáveis, o resultado deveria ser uma função mensurável da outra variável. O lema abaixo também será provado no Apêndice D.4.
Lema 5.83.
Sejam e espaços de medida -finita. Seja uma função mensurável com respeito à -álgebra produto . Para todo fixo, a função é -mensurável. Ademais, a integral define uma função -mensurável de . Analogamente, para todo fixo, a função é -mensurável e a integral define uma função -mensurável de .
Sabendo que a integral com respeito a uma das variáveis resulta em uma função mensurável da outra variável, passamos a estudar integrais iteradas.
Teorema 5.84 (Teorema de Tonelli).
Sejam e espaços de medida -finita, e uma função mensurável. Então
e essas integrais são iguais a .
A prova será dada no Apêndice D.4. Uma aplicação do Teorema de Tonelli é uma prova alternativa de que a densidade de uma variável aleatória normal é de fato uma função de densidade.
Exemplo 5.85 (Densidade da normal).
Vamos calcular
Com uma mudança de variáveis reescrevemos essa integral como
que, pelo Teorema de Tonelli, é igual a
pois os integrandos são não-negativos. Como a integral iterada acima é igual a , concluímos que
Com isso provamos que
sem ter que usar coordenadas polares. ∎
A teoria acima trata sempre de funções não-negativas. Se consideramos uma função mensurável qualquer, ainda podemos aplicar o Lema 5.83 e o Teorema de Tonelli às suas partes positiva e negativa. Entretanto, poderá haver valores de para os quais a integral em não estará definida e vice-versa. Isso será de fato um problema, a não ser que integral interna esteja definida para quase todo valor da variável externa.
Teorema 5.86 (Teorema de Fubini).
Sejam e espaços de medida -finita e uma função mensurável. Se
então: está definida para -quase todo , está definida para -quase todo , vale a igualdade
e essas integrais são iguais a . Nas duas integrais iteradas logo acima, podemos substituir o valor da integral interna por zero no conjunto (de medida nula) de pontos para os quais ela não está definida.
A prova será dada no Apêndice D.4. Em sua versão mais corrente, o enunciado do Teorema de Fubini tem como hipótese que seja integrável com respeito a , que no enunciado acima foi substituída por outra mais conveniente graças ao Teorema de Tonelli. Vejamos um exemplo de integrais iteradas que não comutam, e o que nos diz o Teorema de Fubini nesse caso.
Exemplo 5.87.
Seja definida por
Fazendo ,
Por outro lado, também substituindo ,
Podemos assim concluir que
pois caso contrário teríamos . ∎
Como toda soma é uma integral de Lebesgue com respeito à medida de contagem, podemos obter propriedades muito úteis de somas infinitas iteradas. Por exemplo, o Teorema C.2 segue direto do Teorema de Tonelli.
Teorema 5.88 (Teorema de Fubini para somas).
Seja uma sequência de números reais estendidos duplamente indexada por e .
estão definidas e coincidem.
Demonstração.
Segue direto do Teorema de Fubini, pois somas infinitas são integrais com respeito à medida de contagem e, quando são somáveis, coincidem com a respectiva série. ∎
Vejamos um exemplo de somas iteradas que não comutam.
Exemplo 5.89.
Considere a sequência duplamente indexada
que não é somável. Veja que somando-se colunas e depois linhas obtém-se mas somando-se linhas e depois colunas obtém-se . ∎
Terminamos este capítulo com uma observação sobre esperança de funções de vetores aleatórios com densidade conjunta.
Observação 5.90 (Vetores aleatórios com densidade conjunta).
A medida de Lebesgue em , denotada , é definida recursivamente como . Seja mensurável. Como ,1010 10 O produto de espaços de medida pode ser definido recursivamente, veja o Apêndice D.4 para uma descrição desse argumento e para a prova de que . concluímos que é mensurável com respeito à -álgebra produto. Usando o Teorema de Tonelli recursivamente, vezes, obtemos
Munidos da identidade acima, concluímos que a definição de densidade conjunta dada na Seção 4.2 diz simplesmente que
para todo paralelepípedo , o que implica a mesma identidade para todo boreliano usando o Teorema 3.37 (unicidade de medidas). Ou seja, ter densidade conjunta é o mesmo que .