12.4 Convergência quase certa de martingales

Nesta seção veremos que supermartingales cujo primeiro momento é limitado têm que convergir quase certamente. A razão por trás disso é a seguinte. Para que o processo não convirja, deve haver uma faixa [a,b][a,b] tal que ele assuma valores abaixo de aa e acima de bb infinitas vezes. Pensemos que um supermartingale reflete o preço de um ativo que, na média, não sobe. Se o preço desse ativo atravessasse a faixa [a,b][a,b] muitas vezes, um investidor poderia acumular lucro comprando uma ação cada vez que o preço está abaixo de aa e vendendo essa ação cada vez que está acima de bb. Entretanto, como essa estratégia também resulta em um supermartingale, esse investidor ainda tem lucro médio negativo, o que implica que o preço desse ativo deve ser cada vez mais disperso, no sentido de que 𝔼|Xn|+\mathbb{E}|X_{n}|\to+\infty. Portanto, exceto nesse caso, o processo tem que convergir.

Teorema 12.27 (Teorema de Convergência de Martingales).

Seja (Xn)n(X_{n})_{n} um supermartingale. Se supn𝔼|Xn|<\sup_{n}\mathbb{E}|X_{n}|<\infty, então existe uma variável aleatória integrável XX_{\infty} tal que XnXX_{n}\to X_{\infty} quase certamente. Em particular, todo supermartingale não-negativo converge quase certamente.

Demonstração.

A maior parte da prova consiste em mostrar que

(Xna i.v. e Xnb i.v.)=0\mathbb{P}\big{(}X_{n}\leqslant a\text{ i.v.\ e }X_{n}\geqslant b\text{ i.v.}% \big{)}=0 (12.28)

para todo par de números reais a<ba<b.

Sejam a<ba<b números reais. Analisemos a estratégia de comprar em baixa e vender em alta. Para isso, definimos os tempos de parada:

τ1\displaystyle\tau_{1} =min{n0:Xna},\displaystyle=\min\{n\geqslant 0:X_{n}\leqslant a\}, τ2\displaystyle\tau_{2} =min{n>τ1:Xnb}\displaystyle=\min\{n>\tau_{1}:X_{n}\geqslant b\}
τ2k+1\displaystyle\tau_{2k+1} =min{n>τ2k:Xna},\displaystyle=\min\{n>\tau_{2k}:X_{n}\leqslant a\}, τ2k+2\displaystyle\tau_{2k+2} =min{n>τ2k+1:Xnb},\displaystyle=\min\{n>\tau_{2k+1}:X_{n}\geqslant b\},
\displaystyle\ \ \vdots \displaystyle\ \ \vdots

com a convenção de que min∅︀=+.\min\emptyset=+\infty. Uma interpretação é que os tempos τk\tau_{k} indicam os momentos de compra do ativo se kk for ímpar ou venda se for par. Definimos

Zn={1, se τk<nτk+1 e k é ímpar,0, se τk<nτk+1 e k é par,Z_{n}=\begin{cases}1,&\text{ se }\tau_{k}<n\leqslant\tau_{k+1}\text{ e $k$ \'{% e} \'{\i}mpar},\\ 0,&\text{ se }\tau_{k}<n\leqslant\tau_{k+1}\text{ e $k$ \'{e} par},\end{cases}

com τ0=0\tau_{0}=0. Observe que ZnZ_{n} é n1\mathcal{F}_{n-1}-mensurável, pois

{Zn=1}=k ímpar({τkn1}{τk+1>n1}).\{Z_{n}=1\}=\bigcup_{k\text{ \'{\i}mpar}}\big{(}\{\tau_{k}\leqslant n-1\}\cap% \{\tau_{k+1}>n-1\}\big{)}.

Essa variável indica se o investidor possui uma ação do ativo (Xn)n(X_{n})_{n} logo antes do instante nn.

Argumento de travessias ascendentes completas.
Figura 12.1: Argumento de travessias ascendentes completas.

O processo

Wn=j=1nZj(XjXj1)W_{n}=\sum_{j=1}^{n}Z_{j}\cdot(X_{j}-X_{j-1})

descreve a variação do capital entre os instantes 0 e nn. Definimos, para cada mm\in\mathbb{N},

Tm=max{k:τ2km},T_{m}=\max\{k:\tau_{2k}\leqslant m\},

que conta o numero de travessias ascendentes completas do processo (Xn)n(X_{n})_{n} sobre o intervalo [a,b][a,b] até o tempo mm. Observe que

Wn(ba)Tn(Xna),W_{n}\geqslant(b-a)\,T_{n}-(X_{n}-a)^{-},

pois (ba)Tn(b-a)\,T_{n} é uma cota inferior para o lucro obtido com as vendas em alta e [Xna][X_{n}-a]^{-} é uma cota superior para a perda acumulada desde a última compra, veja Figura 12.1.

Por outro lado, (Wn)n(W_{n})_{n} também é supermartingale. Com efeito,

𝔼[Wn+1Wn|n]\displaystyle\mathbb{E}\big{[}W_{n+1}-W_{n}|\mathcal{F}_{n}\big{]} =𝔼[Zn+1(Xn+1Xn)|n]=\displaystyle=\mathbb{E}\big{[}Z_{n+1}(X_{n+1}-X_{n})|\mathcal{F}_{n}\big{]}=
=Zn+1𝔼[Xn+1Xn|n]0,\displaystyle\qquad=Z_{n+1}\cdot\mathbb{E}\big{[}X_{n+1}-X_{n}|\mathcal{F}_{n}% \big{]}\leqslant 0,

pois Zn+10Z_{n+1}\geqslant 0 e 𝔼[Xn+1Xn|n]0\mathbb{E}[X_{n+1}-X_{n}|\mathcal{F}_{n}]\leqslant 0 q.c., já que (Xn)n(X_{n})_{n} é um supermartingale. Logo, 𝔼Wn𝔼W0=0\mathbb{E}W_{n}\leqslant\mathbb{E}W_{0}=0, donde concluímos que

𝔼Tn𝔼(Xna)ba.\mathbb{E}T_{n}\leqslant\frac{\mathbb{E}(X_{n}-a)^{-}}{b-a}.

Agora definimos T=limnTnT_{\infty}=\lim_{n}T_{n}, que conta as travessias ascendentes completas do processo (Xn)n(X_{n})_{n} sobre o intervalo [a,b][a,b], sem limite de tempo. Pelo Teorema da Convergência Monótona,

𝔼(T)=limn𝔼Tnsupn𝔼(Xna)basupn𝔼|Xn|+|a|ba,\mathbb{E}(T_{\infty})=\lim_{n}\mathbb{E}T_{n}\leqslant\sup_{n}\frac{\mathbb{E% }(X_{n}-a)^{-}}{b-a}\leqslant\sup_{n}\frac{\mathbb{E}|X_{n}|+|a|}{b-a},

que é finito por hipótese. Sendo integrável, TT_{\infty} é finito quase certamente, o que prova (12.28).

Mostremos agora que (Xn)n(X_{n})_{n} converge quase certamente. No evento {lim infnXn<lim supnXn}\{\liminf_{n}X_{n}<\limsup_{n}X_{n}\}, existem a<ba<b\in\mathbb{Q} tais que XnaX_{n}\leqslant a i.v. e XnbX_{n}\geqslant b i.v. Como 2\mathbb{Q}^{2} é enumerável, por subaditividade obtemos

(lim infnXn<lim supnXn)a,b(Xna i.v. e Xnb i.v.)=0.\mathbb{P}(\liminf_{n}X_{n}<\limsup_{n}X_{n})\leqslant\sum_{a,b\in\mathbb{Q}}% \mathbb{P}\big{(}X_{n}\leqslant a\text{ i.v.\ e }X_{n}\geqslant b\text{ i.v.}% \big{)}=0.

Portanto, Xnq.c.XX_{n}\overset{\mathrm{q.c.}}{\rightarrow}X_{\infty} para alguma variável aleatória estendida XX_{\infty}. Pelo Lema de Fatou, 𝔼|X|lim infn𝔼|Xn|supn𝔼|Xn|<.\mathbb{E}|X_{\infty}|\leqslant\liminf_{n}\mathbb{E}|X_{n}|\leqslant\sup_{n}% \mathbb{E}|X_{n}|<\infty. Ou seja, |X||X_{\infty}| é integrável, logo quase certamente finito. ∎

Exemplo 12.29 (Processo de ramificação).

Seja (Xn,k)n,k(X_{n,k})_{n,k\in\mathbb{N}} uma sequência duplamente indexada de variáveis aleatórias i.i.d. assumindo valores em 0\mathbb{N}_{0}. Definimos a sequência de variáveis aleatórias (Zn)n(Z_{n})_{n}, por

Z0=1 e Zn=k=1Zn1Xn,k, para todo n.Z_{0}=1\quad\text{ e }\quad Z_{n}=\sum_{k=1}^{Z_{n-1}}X_{n,k},\ \text{ para % todo }n\in\mathbb{N}.

Podemos interpretar o processo (Zn)n(Z_{n})_{n} como um modelo de crescimento populacional: cada indivíduo dá origem à próxima geração e logo desaparece, sendo que a prole gerada por cada indivíduo é independente dos demais e com a mesma distribuição. Deste modo, ZnZ_{n} é o número de indivíduos da nn-ésima geração. Gostaríamos de determinar se essa população se extingue ou não e, caso não se extingua, como cresce.

Para estudar o crescimento dessa população, vamos supor que as Xn,kX_{n,k} têm segundo momento finito, e denotar sua média por λ=𝔼X1,1\lambda=\mathbb{E}X_{1,1}, a variância por σ2=𝕍X1,1\sigma^{2}=\mathbb{V}X_{1,1} e pj=(X1,1=j)p_{j}=\mathbb{P}(X_{1,1}=j). Defina n=σ((Xj,k)k,j=1,,n)\mathcal{F}_{n}=\sigma((X_{j,k})_{k\in\mathbb{N},j=1,\dots,n}) e

Mn=λnZnM_{n}=\lambda^{-n}Z_{n}

para todo nn\in\mathbb{N}.

Afirmamos que (Mn)n(M_{n})_{n} é um martingale com respeito a (n)n(\mathcal{F}_{n})_{n}. Com efeito, ZnZ_{n} é mensurável com respeito a n\mathcal{F}_{n} e

𝔼[Zn+1|n]=k𝔼[Xn+1,k𝟙{Znk}|n]=kλ𝟙{Znk}=λZn,\mathbb{E}[Z_{n+1}|\mathcal{F}_{n}]=\sum_{k\in\mathbb{N}}\mathbb{E}[X_{n+1,k}% \mathds{1}_{\{Z_{n}\geqslant k\}}|\mathcal{F}_{n}]=\sum_{k\in\mathbb{N}}% \lambda\mathds{1}_{\{Z_{n}\geqslant k\}}=\lambda Z_{n},

onde na primeira igualdade usamos que as variáveis envolvidas são não-negativas e na segunda usamos que {Znk}n\{Z_{n}\geqslant k\}\in\mathcal{F}_{n} e que Xn+1,kX_{n+1,k} é independente de n\mathcal{F}_{n}. A independência entre Xn+1,kX_{n+1,k} e n\mathcal{F}_{n} é bastante óbvia, uma justificativa rigorosa será dada pelo Corolário 13.11.

Tomando a esperança na equação acima, Zn+1Z_{n+1} é integrável, pois 𝔼Zn+1=λ𝔼Zn==λn+1<\mathbb{E}Z_{n+1}=\lambda\,\mathbb{E}Z_{n}=\dots=\lambda^{n+1}<\infty. Substituindo, obtemos 𝔼[Mn+1|n]=λn1λZn=Mn\mathbb{E}[M_{n+1}|\mathcal{F}_{n}]=\lambda^{-n-1}\lambda Z_{n}=M_{n}, provando que (Mn)n(M_{n})_{n} é um martingale.

Passemos então a estudar o comportamento de (Zn)n(Z_{n})_{n} em termos de λ\lambda.

O caso 0λ<10\leqslant\lambda<1 é o mais fácil. Como (Zn>0)=(Zn1)𝔼Zn=λn\mathbb{P}(Z_{n}>0)=\mathbb{P}(Z_{n}\geqslant 1)\leqslant\mathbb{E}Z_{n}=% \lambda^{n}, temos que Znq.c.0Z_{n}\overset{\mathrm{q.c.}}{\rightarrow}0 quando nn\to\infty pelo Lema de Borel-Cantelli. Ou seja, a população se extinguirá quase certamente.

Consideremos agora o caso λ=1\lambda=1. Se p1=1p_{1}=1, então o processo (Zn)n(Z_{n})_{n} se torna trivial com Zn=1Z_{n}=1 para todo nn\in\mathbb{N} q.c. Supomos então que p1<1p_{1}<1, que neste caso implica p0>0p_{0}>0. Como (Zn)n(Z_{n})_{n} é um martingale não-negativo, pelo Teorema de Convergência de Martingales, existe uma variável aleatória ZZ_{\infty}, tal que Znq.c.ZZ_{n}\overset{\mathrm{q.c.}}{\rightarrow}Z_{\infty}. Como ZnZ_{n} é sempre um número inteiro, Zn=ZZ_{n}=Z_{\infty} para todo nn grande, quase certamente. Por outro lado, como p0>0p_{0}>0, temos (Zn=k,para todo n grande)=0\mathbb{P}(Z_{n}=k,\ \text{para todo $n$ grande})=0 para todo kk\in\mathbb{N}, pois (Zn=Zn+1==Zn+j=k)(1p0k)j\mathbb{P}(Z_{n}=Z_{n+1}=\cdots=Z_{n+j}=k)\leqslant(1-{p_{0}}^{k})^{j} para todo jj. Portanto, Z=0Z_{\infty}=0 q.c., e a população se extinguirá nesse caso.

O caso λ>1\lambda>1 exige mais ferramentas. Pelo Teorema de Convergência de Martingales, Mnq.c.MM_{n}\overset{\mathrm{q.c.}}{\rightarrow}M_{\infty} para alguma variável aleatória MM_{\infty}. Se p0>0p_{0}>0, a população tem chance de se extinguir logo nas primeiras gerações. Por outro lado, no evento {M>0}\{M_{\infty}>0\}, a população não apenas sobrevive como também cresce exponencialmente rápido, pois Zn12λnMZ_{n}\geqslant\frac{1}{2}\lambda^{n}M_{\infty} para todo nn suficientemente grande. Logo, gostaríamos de mostrar que (M>0)>0\mathbb{P}(M_{\infty}>0)>0, o que será feito na próxima seção. ∎

Exemplo 12.30 (Recorrência do passeio aleatório simétrico).

Sejam xx e yy\in\mathbb{Z}. Considere (Sn)n(S_{n})_{n} o passeio aleatório simétrico começando de S0=xS_{0}=x e defina o tempo de parada τ=inf{n0:Sn=y}\tau=\inf\{n\geqslant 0:S_{n}=y\}. Afirmamos que

(τ<)=1.\mathbb{P}(\tau<\infty)=1.

Podemos supor sem perda de generalidade que y=0y=0 e x0x\geqslant 0 (caso contrário consideramos SnyS_{n}-y ou Sn-S_{n} no lugar de SnS_{n}). Pelo Teorema do Martingale Parado, (Snτ)n(S_{n\wedge\tau})_{n} é um martingale. Como Snτ0S_{n\wedge\tau}\geqslant 0, pelo Teorema de Convergência de Martingales, (Snτ)n(S_{n\wedge\tau})_{n} converge quase certamente. Porém, (Sn)n(S_{n})_{n} sempre dá saltos de ±1\pm 1, logo não pode convergir. Logo, a única forma de (Snτ)n(S_{n\wedge\tau})_{n} convergir é que τ<\tau<\infty, donde concluímos que este evento é quase certo. Observamos que esta prova da recorrência tem a particularidade de não usar estimativas quantitativas de nenhum tipo. ∎

O exemplo acima é talvez o tipo mais comum de aplicação desta teoria: uma vez que identificamos um martingale, observamos que ele deve convergir quase certamente e tiramos conclusões a partir disso. Abaixo damos exemplos de martingales e submartingales que não convergem.

Exemplo 12.31.

Um exemplo trivial que ilustra a necessidade da hipótese supn𝔼|Xn|<\sup_{n}\mathbb{E}|X_{n}|<\infty é o submartingale determinístico dado por Xn=nX_{n}=n para todo nn\in\mathbb{N}, que obviamente não satisfaz tal hipótese e não converge. ∎

Exemplo 12.32.

Seja (Xn)n(X_{n})_{n} uma sequência independente tal que (Xn=4n)=(Xn=4n)=12\mathbb{P}(X_{n}=4^{n})=\mathbb{P}(X_{n}=-4^{n})=\frac{1}{2}, e tome Sn=X1++XnS_{n}=X_{1}+\dots+X_{n}. Então (Sn)n(S_{n})_{n} é um martingale, lim supnSn=+\limsup_{n}S_{n}=+\infty q.c. e lim infnSn=\liminf_{n}S_{n}=-\infty q.c. ∎

Exemplo 12.33.

Seja (Xn)n(X_{n})_{n} uma sequência independente tal que (Xn=1)=12\mathbb{P}(X_{n}=1)=\frac{1}{2}, (Xn=2n1)=2n\mathbb{P}(X_{n}=-2^{n-1})=2^{-n} e (Xn=0)=122n\mathbb{P}(X_{n}=0)=\frac{1}{2}-2^{-n}. Tome Sn=X1++XnS_{n}=X_{1}+\dots+X_{n}. Então (Sn)n(S_{n})_{n} é um martingale e Sn+S_{n}\to+\infty q.c. ∎

Exemplo 12.34.

O passeio aleatório simétrico (Sn)n(S_{n})_{n} não converge, pois sempre dá saltos de ±1\pm 1. Podemos concluir pelo Teorema de Convergência de Martingales que supn𝔼|Sn|=+\sup_{n}\mathbb{E}|S_{n}|=+\infty. Ademais, como |Sn||S_{n}| é um submartingale, 𝔼|Sn|\mathbb{E}|S_{n}| é não-decrescente em nn, logo 𝔼|Sn|+\mathbb{E}|S_{n}|\to+\infty. ∎