10.3 Unicidade e convergência

Nesta seção provaremos o Teorema da Unicidade e o Teorema da Continuidade de Lévy. A maior parte desta seção será uma continuação da Seção 7.4, em que vamos estabelecer propriedades de convergência em distribuição de variáveis aleatórias análogas às de convergência de números reais.

Teorema 10.36 (Teorema da Seleção de Helly).

Dada uma sequência (Fn)n(F_{n})_{n} de funções de distribuição, existem uma subsequência (Fnk)k(F_{n_{k}})_{k} e uma função F:[0,1]F:\mathbb{R}\to[0,1] não-decrescente e contínua à direita tal que Fnk(x)F(x)F_{n_{k}}(x)\to F(x) quando kk\to\infty, para todo xx ponto de continuidade de FF.

Demonstração.

Seja B={r1,r2,r3,}B=\{r_{1},r_{2},r_{3},\dots\} um conjunto denso em \mathbb{R}. Como (Fn(r1))n(F_{n}(r_{1}))_{n} é uma sequência limitada ao intervalo [0,1][0,1], existe uma subsequência (nj1)j(n^{1}_{j})_{j} de \mathbb{N} tal que Fnj1(r1)G(r1)\smash{F_{n^{1}_{j}}(r_{1})\to G(r_{1})}, quando jj\to\infty, para algum número G(r1)[0,1]G(r_{1})\in[0,1]. Da mesma maneira, existe uma subsequência (nj2)j(n^{2}_{j})_{j} de (nj1)j(n^{1}_{j})_{j} tal que Fnj2(r2)G(r2)\smash{F_{n^{2}_{j}}(r_{2})\to G(r_{2})} para algum número G(r2)[0,1]G(r_{2})\in[0,1]. Por conveniência, podemos supor que n12=n11n^{2}_{1}=n^{1}_{1} e n22=n21n^{2}_{2}=n^{1}_{2}. Prosseguindo recursivamente, para todo kk\in\mathbb{N} existe (njk)j(n^{k}_{j})_{j} subsequência de (njk1)j(n^{k-1}_{j})_{j} tal que nlk=nlk1n^{k}_{l}=n^{k-1}_{l} para l=1,,kl=1,\dots,k e tal que Fnjk(rk)G(rk)\smash{F_{n^{k}_{j}}(r_{k})\to G(r_{k})} para algum número G(rk)[0,1]G(r_{k})\in[0,1]. A subsequência (nj)j(n_{j})_{j} desejada é definida tomando-se nj=njjn_{j}=n^{j}_{j} para todo jj\in\mathbb{N}. Observe que, para cada kk\in\mathbb{N}, (nj)j(n_{j})_{j} é subsequência de (njk)j(n^{k}_{j})_{j}, donde Fnj(rk)G(rk)F_{n_{j}}(r_{k})\to G(r_{k}) quando jj\to\infty. Ademais, G:B[0,1]G:B\to[0,1] é não-decrescente.

Defina F(x)=inf{G(r):rB,r>x}F(x)=\inf\{G(r):r\in B,r>x\}. Note que FF é não-decrescente por inclusão, e é contínua à direita, pois infAninfA\inf A_{n}\downarrow\inf A sempre que AnAA_{n}\uparrow A\subseteq\mathbb{R}. Resta mostrar que Fnj(x)F(x)F_{n_{j}}(x)\to F(x) para todo ponto xx onde FF é contínua. Sejam ε>0\varepsilon>0 e xx\in\mathbb{R} ponto de continuidade. Tome δ>0\delta>0 tal que F(x)ε<F(xδ)F(x+δ)<F(x)+εF(x)-\varepsilon<F(x-\delta)\leqslant F(x+\delta)<F(x)+\varepsilon, e tome r,r′′Br^{\prime},r^{\prime\prime}\in B tais que xδ<r<x<r′′<x+δx-\delta<r^{\prime}<x<r^{\prime\prime}<x+\delta. Pela definição de FF e como GG é não-decrescente, F(xδ)G(r)F(x)G(r′′)F(x+δ)F(x-\delta)\leqslant G(r^{\prime})\leqslant F(x)\leqslant G(r^{\prime\prime})% \leqslant F(x+\delta). Daí segue que, para todo jj suficientemente grande, F(x)ε<Fnj(r)Fnj(r′′)<F(x)+εF(x)-\varepsilon<F_{n_{j}}(r^{\prime})\leqslant F_{n_{j}}(r^{\prime\prime})<F(% x)+\varepsilon e, como a função FnjF_{n_{j}} é não-decrescente, F(x)ε<Fnj(x)<F(x)+εF(x)-\varepsilon<F_{n_{j}}(x)<F(x)+\varepsilon; o que conclui esta demonstração. ∎

Observe que o Teorema de Seleção de Helly não garante que a função limite FF seja uma função de distribuição. Intuitivamente, isso pode falhar porque é possível deixar massa escapar ao infinito. Por exemplo, se Xn𝒰[n,2n]X_{n}\sim\mathcal{U}[-n,2n], então FXn(x)13F_{X_{n}}(x)\to\frac{1}{3} para todo xx\in\mathbb{R}. A função limite FF é não-decrescente e contínua à direita, mas não é função de distribuição pois limx±F(x)=13\lim_{x\to\pm\infty}F(x)=\frac{1}{3}. Nesse exemplo, podemos pensar que 13\frac{1}{3} da massa escapou para -\infty e 23\frac{2}{3} da massa escaparam para ++\infty. Por isso introduzimos a seguinte definição.

Definição 10.37.

Dada uma sequência (Xn)n(X_{n})_{n} de variáveis aleatórias, dizemos que a sequência está confinada se, para todo ε>0\varepsilon>0, existe um conjunto compacto KK tal que (XnK)<ε\mathbb{P}(X_{n}\not\in K)<\varepsilon para todo nn\in\mathbb{N}.

Podemos agora enunciar o seguinte corolário do Teorema de Seleção de Helly.

Corolário 10.38.

Seja (Xn)n(X_{n})_{n} uma sequência confinada de variáveis aleatórias. Então existem uma subsequência (Xnk)k(X_{n_{k}})_{k} e uma variável aleatória XX tais que XnkdXX_{n_{k}}\overset{\smash{\mathrm{d}}}{\rightarrow}X.

Demonstração.

Sejam (Fn)n(F_{n})_{n} as respectivas funções de distribuição de (Xn)n(X_{n})_{n}. Pelo Teorema da Seleção de Helly, existem uma subsequência (Fnk)k(F_{n_{k}})_{k} e uma função F:[0,1]F:\mathbb{R}\to[0,1] não-decrescente e contínua à direita tais que Fnk(x)F(x)F_{n_{k}}(x)\to F(x) para todo xx ponto de continuidade de FF. Para que FF seja de fato uma função de distribuição, basta que ela satisfaça limx+(F(x)F(x))=1\lim_{x\to+\infty}\left(F(x)-F(-x)\right)=1. Seja ε>0\varepsilon>0. Tome MM tal que (|Xn|>M)ε\mathbb{P}(|X_{n}|>M)\leqslant\varepsilon para todo nn e tal que ±M\pm M sejam pontos de continuidade de FF. Então F(M)F(M)=limnFn(M)Fn(M)1εF(M)-F(-M)=\lim_{n}F_{n}(M)-F_{n}(-M)\geqslant 1-\varepsilon, o que conclui a prova. ∎

Como no caso de sequências de números determinísticos, podemos usar o corolário acima para obter outro que permitirá estabelecer convergência de uma sequência olhando para subsequências.

Corolário 10.39.

Seja (Xn)n(X_{n})_{n} uma sequência confinada de variáveis aleatórias. Suponha que exista uma variável aleatória XX tal que XnkdXX_{n_{k}}\overset{\smash{\mathrm{d}}}{\rightarrow}X para qualquer subsequência (Xnk)k(X_{n_{k}})_{k} que convirja em distribuição. Então XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X.

Demonstração.

Seja g:g:\mathbb{R}\to\mathbb{R} contínua e limitada. Pelo Teorema de Helly-Bray, basta mostrar que a sequência numérica (𝔼[g(Xn)])n(\mathbb{E}[g(X_{n})])_{n} converge para 𝔼[g(X)]\mathbb{E}[g(X)]. Para isso, basta mostrar que toda subsequência (𝔼[g(Xnk)])k(\mathbb{E}[g(X_{n_{k}})])_{k} tem uma subsubsequência (𝔼[g(Xnkj)])j(\mathbb{E}[g(X_{n_{k_{j}}})])_{j} que converge para 𝔼[g(X)]\mathbb{E}[g(X)] (veja Teorema A.8). Seja (nk)k(n_{k})_{k} uma tal subsequência. Pelo Corolário 10.38, existe uma subsubsequência (nkj)j(n_{k_{j}})_{j} tal que (Xnkj)j(X_{n_{k_{j}}})_{j} converge em distribuição para alguma variável aleatória. Por hipótese, essa variável aleatória é XX, ou seja, XnkjdXX_{n_{k_{j}}}\overset{\smash{\mathrm{d}}}{\rightarrow}X. Pelo Teorema de Helly-Bray, (𝔼[g(Xnkj)])j𝔼[g(X)](\mathbb{E}[g(X_{n_{k_{j}}})])_{j}\to\mathbb{E}[g(X)], como queríamos demonstrar. ∎

De volta à função característica, gostaríamos de um critério para mostrar que uma dada sequência de variáveis aleatórias está confinada.

Lema 10.40.

Seja XX uma variável aleatória. Para todo δ>0\delta>0, vale a estimativa (|X|2δ)2δ0δ𝔼[1cos(tX)]dt.\mathbb{P}\big{(}|X|\geqslant\tfrac{2}{\delta}\big{)}\leqslant\frac{2}{\delta}% \int_{0}^{\delta}\mathbb{E}[1-\cos(tX)]\mathrm{d}t.

Demonstração.

Comutando a esperança e a integral,

1δ0δ𝔼[1cos(tX)]dt\displaystyle\frac{1}{\delta}\int_{0}^{\delta}\mathbb{E}\left[1-\cos(tX)\right% ]\mathrm{d}t =𝔼[1δ0δ[1cos(tX)]dt]=𝔼[1sen(δX)δX]\displaystyle=\mathbb{E}\left[\frac{1}{\delta}\int_{0}^{\delta}\left[1-\cos(tX% )\right]\mathrm{d}t\right]=\mathbb{E}\left[1-\tfrac{\mathop{\mathrm{sen}}% \nolimits(\delta X)}{\delta X}\right]
𝔼[(1sen(δX)δX)𝟙{|X|2δ}]12(|X|2δ),\displaystyle\geqslant\mathbb{E}\left[\left(1-\tfrac{\mathop{\mathrm{sen}}% \nolimits(\delta X)}{\delta X}\right)\mathds{1}_{\{|X|\geqslant\frac{2}{\delta% }\}}\right]\geqslant\tfrac{1}{2}\mathbb{P}\big{(}|X|\geqslant\tfrac{2}{\delta}% \big{)},

pois 1senuu01-\frac{\mathop{\mathrm{sen}}\nolimits u}{u}\geqslant 0 para todo u0u\neq 0 e 1senuu121-\frac{\mathop{\mathrm{sen}}\nolimits u}{u}\geqslant\frac{1}{2} se |u|2|u|\geqslant 2. Comutar a esperança e a integral está justificado pelo Teorema de Tonelli. ∎

A proposição abaixo, junto com o Teorema da Unicidade, permite usar funções características para identificar um limite em distribuição.

Proposição 10.41.

Se XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X, então φXn(t)φX(t)\varphi_{X_{n}}(t)\to\varphi_{X}(t) para todo tt\in\mathbb{R}.

Demonstração.

Seja tt\in\mathbb{R}. Como sen(tx)\mathop{\mathrm{sen}}\nolimits(tx) e cos(tx)\cos(tx) são funções contínuas e limitadas de xx, segue do Teorema de Helly-Bray que 𝔼[cos(tXn)]𝔼[cos(tX)]\mathbb{E}[\cos(tX_{n})]\to\mathbb{E}[\cos(tX)] e 𝔼[sen(tXn)]𝔼[sen(tX)]\mathbb{E}[\mathop{\mathrm{sen}}\nolimits(tX_{n})]\to\mathbb{E}[\mathop{% \mathrm{sen}}\nolimits(tX)], donde φXn(t)φX(t)\varphi_{X_{n}}(t)\to\varphi_{X}(t). ∎

Agora estamos prontos para mostrar o Teorema da Continuidade de Lévy. Na verdade enunciaremos e provaremos abaixo uma versão um pouco mais forte que aquela enunciada na seção anterior. Ela nos diz que basta que a sequência de funções características (φXn)n(\varphi_{X_{n}})_{n} convirja para uma função que seja contínua em t=0t=0, e isto já será suficiente para garantir que o limite das funções características também seja uma função característica. Esta última será a função característica de uma variável aleatória XX que será o limite em distribuição da sequência (Xn)n(X_{n})_{n}.

Teorema 10.42 (Teorema da Continuidade de Lévy).

Sejam (Xn)n(X_{n})_{n\in\mathbb{N}} variáveis aleatórias e (φXn)n(\varphi_{X_{n}})_{n\in\mathbb{N}} suas respectivas funções características. Se existe limnφXn(t)=φ(t)\lim_{n}\varphi_{X_{n}}(t)=\varphi(t) para todo tt real e φ\varphi é contínua em t=0t=0, então existe uma variável aleatória XX, tal que φ=φX\varphi=\varphi_{X} e XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X.

Demonstração.

Do Lema 10.40 e do Teorema da Convergência Dominada,

(|Xn|2δ)\displaystyle\mathbb{P}\big{(}|X_{n}|\geqslant\tfrac{2}{\delta}\big{)} 2δ0δ[1cos(tXn)]dt\displaystyle\leqslant\tfrac{2}{\delta}\int_{0}^{\delta}\left[1-\cos(tX_{n})% \right]\mathrm{d}t
=2δ0δ[1φXn(t)]dt2δ0δ[1φ(t)]dt\displaystyle=\tfrac{2}{\delta}\int_{0}^{\delta}\left[1-\Re\varphi_{X_{n}}(t)% \right]\mathrm{d}t\to\tfrac{2}{\delta}\int_{0}^{\delta}[1-\Re\varphi(t)]% \mathrm{d}t

para todo δ>0\delta>0. Seja ε>0\varepsilon>0. Como φ\varphi é contínua em t=0t=0, podemos tomar δ0>0\delta_{0}>0 tal que |1φ(t)|<ε2|1-\Re\varphi(t)|<\tfrac{\varepsilon}{2} para todo t[0,δ0]t\in[0,\delta_{0}]. Assim podemos tomar n0n_{0} tal que (|Xn|2δ01)<ε\mathbb{P}(|X_{n}|\geqslant 2\delta^{-1}_{0})<\varepsilon para todo n>n0n>n_{0}. Para cada nn0n\leqslant n_{0}, sempre existe δn>0\delta_{n}>0 tal que (|Xn|2δn1)<ε\mathbb{P}(|X_{n}|\geqslant 2\delta^{-1}_{n})<\varepsilon. Tomando δ=min{δ0,δ1,,δn0}\delta=\min\{\delta_{0},\delta_{1},\dots,\delta_{n_{0}}\}, obtemos (|Xn|2δ1)<ε\mathbb{P}(|X_{n}|\geqslant 2\delta^{-1})<\varepsilon para todo nn\in\mathbb{N}. Portanto, a sequência (Xn)n(X_{n})_{n} está confinada.

Pelo Corolário 10.38, existem uma variável aleatória XX e uma subsequência (Xnk)k(X_{n_{k}})_{k} tais que XnkdXX_{n_{k}}\overset{\smash{\mathrm{d}}}{\rightarrow}X. Pela Proposição 10.41, φX=φ\varphi_{X}=\varphi. Agora seja XnkX_{n_{k}^{\prime}} outra subsequência que converge em distribuição para alguma XX^{\prime}. Novamente, pela Proposição 10.41, φX=φ\varphi_{X^{\prime}}=\varphi e, pelo Teorema de Unicidade, XXX^{\prime}\sim X. Pelo Corolário 10.39, XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X, concluindo a prova. ∎

Ficou faltando apenas demonstrar o Teorema de Unicidade.

Prova do Teorema de Unicidade.

Basta mostrar que, dados a,ba,b\in\mathbb{R}, vale (aXb)=(aYb)\mathbb{P}(a\leqslant X\leqslant b)=\mathbb{P}(a\leqslant Y\leqslant b), pois segue que FX=FYF_{X}=F_{Y} tomando-se aa\downarrow-\infty. Para isso, vamos aproximar 𝟙[a,b]\mathds{1}_{[a,b]} por uma combinação de funções trigonométricas e usar a hipótese de que φX=φY\varphi_{X}=\varphi_{Y}.

Sejam <a<b<-\infty<a<b<\infty e ε>0\varepsilon>0. Tome fε(x):[0,1]f^{\varepsilon}(x):\mathbb{R}\to[0,1] contínua tal que f(x)=1f(x)=1 para x[a,b]x\in[a,b] e f(x)=0f(x)=0 para x[aε,b+ε]x\not\in[a-\varepsilon,b+\varepsilon]. Seja n>|a|+|b|+εn>|a|+|b|+\varepsilon. Note que fεf^{\varepsilon} é uma função contínua em [n,n][-n,n] e fε(n)=fε(n)=0f^{\varepsilon}(-n)=f^{\varepsilon}(n)=0.

Pela versão trigonométrica do Teorema de Weierstrass (Teorema A.16), fεf^{\varepsilon} pode ser aproximada em [n,n][-n,n] por polinômios trigonométricos. Em particular, existem mm\in\mathbb{N} e am,,ama_{-m},\dots,a_{m}\in\mathbb{C} tais que a função

fnε(x)=k=mmakeikπnxf^{\varepsilon}_{n}(x)=\sum_{k=-m}^{m}a_{k}e^{i\tfrac{k\pi}{n}x}

assume valores reais e satisfaz

supx[n,n]|fnε(x)fε(x)|1n e supx|fnε(x)|2,\sup_{x\in[-n,n]}|f^{\varepsilon}_{n}(x)-f^{\varepsilon}(x)|\leqslant\tfrac{1}% {n}\quad\text{ e }\quad\sup_{x\in\mathbb{R}}|f^{\varepsilon}_{n}(x)|\leqslant 2, (10.43)

onde a segunda estimativa acima segue da primeira e do fato que fnεf_{n}^{\varepsilon} é uma função periódica de período 2n2n. Tomando-se a esperança,

𝔼[fnε(X)]=k=1makφX(kπn)=k=1makφY(kπn)=𝔼[fnε(Y)].\mathbb{E}[f_{n}^{\varepsilon}(X)]=\sum_{k=1}^{m}a_{k}\varphi_{X}(\tfrac{k\pi}% {n})=\sum_{k=1}^{m}a_{k}\varphi_{Y}(\tfrac{k\pi}{n})=\mathbb{E}[f_{n}^{% \varepsilon}(Y)]. (10.44)

Observe que

(aXb)𝔼[fε(X)]𝔼[fnε(X)]+1n+2(|X|n) e\displaystyle\mathbb{P}(a\leqslant X\leqslant b)\leqslant\mathbb{E}[f^{% \varepsilon}(X)]\leqslant\mathbb{E}[f_{n}^{\varepsilon}(X)]+\tfrac{1}{n}+2\,% \mathbb{P}(|X|\geqslant n)\ \ \text{ e}
(aεYb+ε)𝔼[fε(Y)]𝔼[fnε(Y)]1n2(|Y|n).\displaystyle\mathbb{P}(a-\varepsilon\leqslant Y\leqslant b+\varepsilon)% \geqslant\mathbb{E}[f^{\varepsilon}(Y)]\geqslant\mathbb{E}[f_{n}^{\varepsilon}% (Y)]-\tfrac{1}{n}-2\,\mathbb{P}(|Y|\geqslant n).

Em cada linha acima, a primeira desigualdade é devida à definição de fεf^{\varepsilon} e segunda segue das estimativas em (10.43). Substituindo a identidade (10.44), tomando nn\to\infty e depois ε0\varepsilon\downarrow 0, chegamos a (aXb)(aYb)\mathbb{P}(a\leqslant X\leqslant b)\leqslant\mathbb{P}(a\leqslant Y\leqslant b). De forma idêntica provamos a desigualdade oposta, donde segue que FX=FYF_{X}=F_{Y}, concluindo a prova. ∎