7.4 Mais sobre a convergência em distribuição

Nesta seção faremos um estudo mais profundo da convergência em distribuição. Os teoremas aqui contidos são de natureza mais técnica e serão usados nas Seções 9.39.410.3.

O lema abaixo nos fornece uma informação interessante sobre o conjunto dos pontos de descontinuidade de funções monótonas, em particular vale para funções de distribuição.

Lema 7.37.

O conjunto dos pontos de descontinuidade de qualquer função monótona f:If:I\to\mathbb{R}, onde II é um intervalo não-degenerado da reta, é enumerável. Em particular, qualquer intervalo não-degenerado JIJ\subseteq I contém pontos onde ff é contínua.

Demonstração.

Tome uma sequência de intervalos fechados ([ak,bk])k([a_{k},b_{k}])_{k}, tais que [ak,bk]I[a_{k},b_{k}]\uparrow I quando kk\to\infty. Suponhamos que ff seja não-decrescente; o caso não-crescente é totalmente análogo. Defina D={x:f(x+)f(x)>0}D=\{x\in\mathbb{R}:f(x+)-f(x-)>0\}, o conjunto dos pontos de descontinuidade de ff, e Dn,k={x[ak,bk]:f(x+)f(x)>1n}D_{n,k}=\{x\in[a_{k},b_{k}]:f(x+)-f(x-)>\tfrac{1}{n}\} para todo nn. Temos que #Dn,kn(f(bk)f(ak))\#D_{n,k}\leqslant n(f(b_{k})-f(a_{k})), logo é finito. Como D=n=1k=1Dn,kD=\cup_{n=1}^{\infty}\cup_{k=1}^{\infty}D_{n,k}, segue que DD é enumerável, pois é união enumerável de conjuntos enumeráveis. Por outro lado, pelo Corolário A.13, intervalos não-degenerados não são enumeráveis, portanto eles devem conter pontos de continuidade de ff. ∎

Proposição 7.38 (Unicidade do limite em distribuição).

O limite em distribuição é único, isto é, se XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X e XndYX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}Y então XYX\sim Y.

Demonstração.

Sejam FXF_{X} e FYF_{Y} as funções de distribuição de XX e YY, DXD_{X} e DYD_{Y} seus respectivos pontos de descontinuidade. Por hipótese, FXn(z)FX(z)F_{X_{n}}(z)\to F_{X}(z) e FXn(z)FY(z)F_{X_{n}}(z)\to F_{Y}(z) para todo z(DXDY)cz\in(D_{X}\cup D_{Y})^{c}, logo FX(z)=FY(z),z(DXDY)cF_{X}(z)=F_{Y}(z),\ \forall z\in(D_{X}\cup D_{Y})^{c}. Pelo Lema 7.37, DXDYD_{X}\cup D_{Y} é enumerável, logo para todo tDXDYt\in D_{X}\cup D_{Y}, existem z1,,zn,(DXDY)cz_{1},\dots,z_{n},\dots\in(D_{X}\cup D_{Y})^{c} tais que zntz_{n}\downarrow t. Como FXF_{X} e FYF_{Y} são contínuas à direita,

FX(t)=limnFX(zn)=limnFY(zn)=FY(t).F_{X}(t)=\lim_{n\to\infty}F_{X}(z_{n})=\lim_{n\to\infty}F_{Y}(z_{n})=F_{Y}(t).

Portanto FX(z)=FY(z),zF_{X}(z)=F_{Y}(z),\ \forall z\in\mathbb{R}. ∎

Conforme vimos na seção anterior, a convergência em distribuição é a mais fraca de todas, enquanto a convergência quase certa é uma das mais fortes. Sendo assim, o próximo teorema é um tanto surpreendente, pois nos garante que quando há a convergência em distribuição de uma sequência de variáveis aleatórias para uma outra variável limite, existem cópias com as mesmas distribuições da sequência original e da variável limite para as quais a convergência é quase certa.

Teorema 7.39 (Acoplamento de Skorokhod).

Se XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X, então existe um espaço de probabilidade (Ω,,)(\Omega^{\prime},\mathcal{F}^{\prime},\mathbb{P}^{\prime}) onde estão definidas variáveis aleatórias YY e (Yn)n(Y_{n})_{n} tais que YnXnY_{n}\sim X_{n} para todo nn, YXY\sim X, e Ynq.c.YY_{n}\overset{\mathrm{q.c.}}{\rightarrow}Y.

Demonstração.

Usaremos a função quantil F1F^{-1} definida na Seção 3.1.3 como

F1(u)=min{x:F(x)u},F^{-1}(u)=\min\{x\in\mathbb{R}:F(x)\geqslant u\},

que permite construir uma variável aleatória YY com a distribuição desejada FF a partir de uma uniforme UU, tomando-se Y=F1(U).Y=F^{-1}(U). Para construir as variáveis aleatórias como no enunciado do teorema, usaremos uma mesma variável aleatória UU para todas as FXnF_{X_{n}}. Isto é, tomamos Y=FX1(U) e Yn=FXn1(U).Y=F_{X}^{-1}(U)\text{ e }Y_{n}=F_{X_{n}}^{-1}(U). Vamos mostrar que FXn1(u)FX1(u)F_{X_{n}}^{-1}(u)\to F_{X}^{-1}(u) para todo u(0,1)u\in(0,1) ponto de continuidade de FX1F_{X}^{-1}. Pelo Lema 7.37, os pontos de descontinuidade de FX1F_{X}^{-1} são enumeráveis, logo FXn1(U)q.c.FX1(U),F_{X_{n}}^{-1}(U)\overset{\mathrm{q.c.}}{\rightarrow}F_{X}^{-1}(U), concluindo a prova.

Seja uu ponto de continuidade de FX1F_{X}^{-1}, e seja ε>0\varepsilon>0. Defina x=FX1(u)x=F_{X}^{-1}(u). Por continuidade, existem vv e ww tais que 0<v<u<w<10<v<u<w<1 e xε<FX1(v)xFX1(w)<x+εx-\varepsilon<F_{X}^{-1}(v)\leqslant x\leqslant F_{X}^{-1}(w)<x+\varepsilon. Pelo Lema 7.37, existem yy e zz pontos de continuidade de FXF_{X} tais que xε<y<FX1(v)xFX1(w)<z<x+εx-\varepsilon<y<F_{X}^{-1}(v)\leqslant x\leqslant F_{X}^{-1}(w)<z<x+\varepsilon. Observe que FX(y)<v<u<wFX(z)F_{X}(y)<v<u<w\leqslant F_{X}(z), onde na primeira e última desigualdades utilizamos (3.15). Como FXn(y)FX(y)<uF_{X_{n}}(y)\to F_{X}(y)<u e FXn(z)FX(z)>uF_{X_{n}}(z)\to F_{X}(z)>u, segue que FXn(y)<u<FXn(z)F_{X_{n}}(y)<u<F_{X_{n}}(z) para todo nn suficientemente grande. Por (3.15), esta última desigualdade implica que xε<y<FXn1(u)z<x+εx-\varepsilon<y<F_{X_{n}}^{-1}(u)\leqslant z<x+\varepsilon. Portanto, FXn1(u)FX1(u)F_{X_{n}}^{-1}(u)\to F_{X}^{-1}(u), que é o que queríamos mostrar. ∎

Com o acoplamento de Skorokhod, estamos aptos a provar de modo simples um critério para convergência em distribuição. Esse critério será usado na demonstração do Teorema do Limite Central que veremos no Capítulo 9.

Teorema 7.40 (Teorema de Helly-Bray).

Sejam (Xn)n(X_{n})_{n} e XX variáveis aleatórias definidas em um mesmo espaço de probabilidade. São equivalentes:

  1. (i)(i)

    XndXX_{n}\overset{\smash{\mathrm{d}}}{\rightarrow}X

  2. (ii)(ii)

    𝔼[f(Xn)]𝔼[f(X)]\mathbb{E}[f(X_{n})]\to\mathbb{E}[f(X)] para toda função f:f:\mathbb{R}\to\mathbb{R} contínua e limitada.

  3. (iii)(iii)

    𝔼[f(Xn)]𝔼[f(X)]\mathbb{E}[f(X_{n})]\to\mathbb{E}[f(X)] para toda função f:f:\mathbb{R}\to\mathbb{R} tal que f,f,f′′,f′′′f,f^{\prime},f^{\prime\prime},f^{\prime\prime\prime} são contínuas e limitadas.

Demonstração.

Começamos por (i)(i) \Rightarrow (ii)(ii). Suponha (i)(i) e seja f:f:\mathbb{R}\to\mathbb{R} contínua e limitada. Pelo acoplamento de Skorokhod, existem YXY\sim X e YnXnY_{n}\sim X_{n} tais que Ynq.c.YY_{n}\overset{\mathrm{q.c.}}{\rightarrow}Y. Como ff é contínua, f(Yn)q.c.f(Y)f(Y_{n})\overset{\mathrm{q.c.}}{\rightarrow}f(Y). Como ff é limitada, podemos aplicar o Teorema da Convergência Dominada, obtendo

𝔼[f(Xn)]=𝔼[f(Yn)]𝔼[f(Y)]=𝔼[f(X)],\displaystyle\mathbb{E}[f(X_{n})]=\mathbb{E}[f(Y_{n})]\to\mathbb{E}[f(Y)]=% \mathbb{E}[f(X)],

o que prova (ii)(ii). A implicação (ii)(ii) \Rightarrow (iii)(iii) é trivial.

Agora suponha (iii)(iii). Seja cc um ponto de continuidade de FXF_{X}, e seja ε>0\varepsilon>0. Tome ε\varepsilon^{\prime} tal que FX(cε)>FX(c)εF_{X}(c-\varepsilon^{\prime})>F_{X}(c)-\varepsilon e f:[0,1]f:\mathbb{R}\to[0,1] uma função tal que f,f,f′′,f′′′f,f^{\prime},f^{\prime\prime},f^{\prime\prime\prime} são contínuas e limitadas, f(x)=1f(x)=1 para todo xcεx\leqslant c-\varepsilon^{\prime} e f(x)=0f(x)=0 para todo xcx\geqslant c (por exemplo, há um polinômio apropriado de grau 77 em [cε,c][c-\varepsilon,c]). Então

lim infnFXn(c)=lim infn𝔼[𝟙(,c](Xn)]lim infn𝔼[f(Xn)]==𝔼[f(X)]𝔼[𝟙(,cε](X)]=FX(cε)FX(c)ε.\liminf_{n}F_{X_{n}}(c)=\liminf_{n}\mathbb{E}[\mathds{1}_{(-\infty,c]}(X_{n})]% \geqslant\liminf_{n}\mathbb{E}[f(X_{n})]=\\ =\mathbb{E}[f(X)]\geqslant\mathbb{E}[\mathds{1}_{(-\infty,c-\varepsilon^{% \prime}]}(X)]=F_{X}(c-\varepsilon^{\prime})\geqslant F_{X}(c)-\varepsilon.

Como isso vale para todo ε>0\varepsilon>0, concluímos que lim infnFXn(c)FX(c)\liminf_{n}F_{X_{n}}(c)\geqslant F_{X}(c). De forma análoga (trocando cεc-\varepsilon^{\prime} por c+εc+\varepsilon^{\prime}, e invertendo as desigualdades), podemos obter lim supnFXn(c)FX(c)\limsup_{n}F_{X_{n}}(c)\leqslant F_{X}(c), o que prova (i)(i). ∎

Observamos que em alguns textos a afirmação do item (ii)(ii) do teorema acima é tomada como a definição de convergência em distribuição. Isto permite estender a definição de convergência em distribuição para outros contextos, como, por exemplo, para vetores aleatórios.

Outra observação é que o requisito de tomarmos até a derivada terceira no teorema acima não tem nada de especial. Poderíamos tê-lo feito considerando derivadas até uma determinada ordem nn. Escolhemos derivada terceira porque será suficiente quando provarmos as versões dos Teoremas do Limite Central de Lyapunov e de Lindeberg nas Seções 9.39.4.