14.3 Transformações ergódicas e misturadoras

Voltemos à questão da frequência com que as órbitas visitam um dado conjunto. Seja (E,,μ)(E,\mathcal{E},\mu) um espaço de probabilidade e TT uma transformação que preserva medida. Dado AA\in\mathcal{E}, o Teorema Ergódico nos diz que a frequência de visitas a AA, dada por

limn#{k{0,,n1}:Tk(x)A}n,\lim_{n}\frac{\#\{k\in\{0,\dots,n-1\}:T^{k}({x})\in A\}}{n},

está bem definida. Queremos saber qual propriedade a transformação TT deve ter de modo a assegurar que o limite seja simplesmente μ(A){\mu(A)} para quase todo ponto inicial xx. A resposta é que a transformação TT deve revolver todo o espaço E{E}. A próxima definição dá uma forma precisa a essa ideia.

Definição 14.18 (Transformação ergódica).

Uma transformação TT que preserva medida é dita ergódica se μ(A)=0\mu(A)=0 ou 11 para todo ATA\in\mathcal{I}_{T}.

Em outras palavras, a transformação TT é ergódica se não há forma de separar hermeticamente o espaço em regiões AA e AcA^{c}, ambas com medida positiva, de forma que cada órbita de TT fique restrita a uma dessas duas regiões.

A proposição abaixo responde à pergunta colocada no início desta seção.

Proposição 14.19.

Seja TT uma transformação que preserva medida. São equivalentes:

  1. (i)(i)

    A transformação TT é ergódica;

  2. (ii)(ii)

    Toda f:Ef:E\to\mathbb{R} mensurável e TT-invariante é constante q.t.p.;

  3. (iii)(iii)

    Para toda f:Ef:E\to\mathbb{R} mensurável e integrável, 𝐄[f|T]=𝐄f\mathbf{E}[f|\mathcal{I}_{T}]=\mathbf{E}f q.t.p.;

  4. (iv)(iv)

    Para toda f:Ef:E\to\mathbb{R} mensurável e limitada, 𝐄[f|T]=𝐄f\mathbf{E}[f|\mathcal{I}_{T}]=\mathbf{E}f q.t.p.;

  5. (v)(v)

    Para todos A,BA,B\in\mathcal{E}, vale 1nk=0n1μ(Tk(A)B)μ(A)μ(B).\frac{1}{n}\sum_{k=0}^{n-1}\mu(T^{-k}(A)\cap B)\to\mu(A)\cdot\mu(B).

Demonstração.

A estratégia será mostrar a seguinte cadeia de implicações: ( i ) ( i i ) ( i i i ) ( i v ) ( v ) ( i ) \text{\ref{item:1erg}}\Rightarrow\text{\ref{item:2erg}}\Rightarrow\text{\ref{% item:3erg}}\Rightarrow\text{\ref{item:5erg}}\Rightarrow\text{\ref{item:4erg}}% \Rightarrow\ref{item:1erg}. A demonstração da primeira implicação é quase idêntica à prova do Corolário 13.17 e será omitida.

Assuma (ii)(ii) e seja ff integrável. Pelo Exercício 14.14, 𝐄[f|T]\mathbf{E}[f|\mathcal{I}_{T}] é TT-invariante. Por (ii)(ii), 𝐄[f|T]=c\mathbf{E}[f|\mathcal{I}_{T}]=c q.t.p. Integrando ambos os lados, concluímos que c=𝐄fc=\mathbf{E}f, o que prova (iii)(iii).

A implicação ( i i i ) ( i v ) \text{\ref{item:3erg}}\Rightarrow\text{\ref{item:5erg}} é trivial.

Dados quaisquer A,BA,B\in\mathcal{E} e assumindo o item (iv)(iv), 𝐄[𝟙A|T]=μ(A)\mathbf{E}[\mathds{1}_{A}|\mathcal{I}_{T}]=\mu(A) q.t.p. e, pelo Corolário 14.17,

limn1nk=0n1μ(Tk(A)B)=𝐄[𝟙B𝔼[𝟙A|T]]=μ(A)μ(B).\lim_{n}\frac{1}{n}\sum_{k=0}^{n-1}\mu(T^{-k}(A)\cap B)=\mathbf{E}\left[% \mathds{1}_{B}\cdot\mathbb{E}[\mathds{1}_{A}|\mathcal{I}_{T}]\right]=\mu(A)% \cdot\mu(B).

Isso mostra o item (v)(v).

Finalmente, seja ATA\in\mathcal{I}_{T} e tome B=AB=A. Assumindo o item (v)(v),

μ(A)=limn1nk=0n1μ(Tk(A)A)=μ(A)μ(A),\mu(A)=\lim_{n}\frac{1}{n}\sum_{k=0}^{n-1}\mu(T^{-k}(A)\cap A)=\mu(A)\cdot\mu(% A),

logo, μ(A)=0\mu(A)=0 ou 11, ou seja, TT é ergódica. ∎

Combinando a proposição acima com o Teorema Ergódico de Birkhoff, obtemos o seguinte corolário.

Corolário 14.20.

Sejam TT uma transformação ergódica e f:Ef:E\to\mathbb{R} uma função mensurável e integrável. Então

limn1nk=0n1fTk=Efdμμ-q.t.p.\lim_{n}\frac{1}{n}\sum_{k=0}^{n-1}f\circ T^{k}=\int_{E}f\,\mathrm{d}\mu\quad% \text{$\mu$-q.t.p.}

Em palavras, o corolário acima nos diz que a “média temporal” (tomada ao longo dos sucessivos passos da órbita) do observável ff converge para a sua “média espacial” (calculada sobre o espaço E{E}).

Exemplo 14.21 (Rotação do círculo).

O operador de rotação no círculo T:[0,1)[0,1)T:[0,1)\to[0,1), definido no Exemplo 14.10, é ergódico se, e somente se, seu parâmetro λ\lambda for irracional. Na Seção 14.4 daremos uma prova curta que usa séries de Fourier e uma mais maçante baseada em aproximações. ∎

Consideraremos agora um tipo especial de transformação que preserva medida. São transformações cuja dinâmica não apenas revolve o espaço mas também misturam todas as suas regiões.

Definição 14.22 (Transformação misturadora).

Uma transformação que preserva medida T:EET:{E}\to{E} é dita misturadora se

limnμ(Tn(A)B)=μ(A)μ(B)\lim_{n}\mu(T^{-n}(A)\cap B)=\mu(A)\cdot\mu(B)

para todos A,BA,B\in\mathcal{E}.

A definição acima nos diz que os eventos Tn(A)T^{-n}(A) e BB se tornam praticamente independentes quando nn cresce. Isto é bem mais forte do que o comportamento médio das órbitas não depender da condição inicial.

Proposição 14.23.

Toda transformação misturadora é ergódica.

Demonstração.

Sejam TT uma transformação misturadora e ATA\in\mathcal{I}_{T}. Tomando B=AB=A na Definição 14.22, temos

μ(A)μ(A)=limnμ(Tn(A)A)=μ(A),\mu(A)\cdot\mu(A)=\lim_{n}\mu(T^{-n}(A)\cap A)=\mu(A),

pois Tn(A)A=AT^{-n}(A)\cap A=A, logo μ(A)=0\mu(A)=0 ou 11, isto é, TT é ergódica. ∎

Um exemplo de transformação misturadora será dado no final desta seção, dentro do contexto de sequências estacionárias. A transformação do Exemplo 14.11 também é misturadora.2424 24 De fato, esse exemplo é equivalente a aplicar o operador deslocamento em uma sequência i.i.d., no espírito do Lema 4.28, mas não entraremos em detalhes. Vejamos alguns exemplos de transformações ergódicas que não são misturadoras.

Contra-exemplo 14.24.

Tome E={0,1}E=\{0,1\}, μ({0})=μ({1})=12\mu(\{0\})=\mu(\{1\})=\tfrac{1}{2}, e T(x)=1xT(x)=1-x. Neste caso, T={∅︀,{0,1}}\mathcal{I}_{T}=\{\emptyset,\{0,1\}\}, logo TT é ergódica. Tomando A=B={0}A=B=\{0\}, vemos que μ(A)μ(B)=14\mu(A)\cdot\mu(B)=\tfrac{1}{4}, enquanto μ(Tn(A)B)=0\mu(T^{-n}(A)\cap B)=0 ou 12\frac{1}{2} dependendo da paridade de nn. Logo, TT não pode ser misturadora. Este exemplo é equivalente ao Exemplo 14.5. ∎

Contra-exemplo 14.25 (Rotação do círculo).

Outro exemplo de transformação ergódica que não é misturadora é a rotação irracional no círculo [0,1)[0,1), vista no Exemplo 14.21. Daremos mais detalhes na Seção 14.4. ∎

Sequências estacionárias

Seja 𝑿=(X1,X2,){\boldsymbol{X}}=(X_{1},X_{2},\dots) uma sequência estacionária definida no espaço de probabilidade (Ω,,)(\Omega,\mathcal{F},\mathbb{P}). Como visto na Seção 14.1, há uma correspondência entre sequências estacionárias definidas no contexto de um experimento aleatório e sequências da forma (fTk)k0(f\circ T^{k})_{k\in\mathbb{N}_{0}}, onde TT é uma transformação que preserva medida. Sendo assim, todas as definições e teoremas obtidos podem ser reformulados em termos de sequências estacionárias.

Sejam 𝑿{\boldsymbol{X}} sequência estacionária e AA\in\mathcal{F} um evento da forma A={ω:𝑿(ω)B}A=\{\omega:{\boldsymbol{X}}(\omega)\in B\}, para algum B()B\in\mathcal{B}(\mathbb{R}^{\mathbb{N}}) dado. Dizemos que AA é invariante por translações de 𝑿{\boldsymbol{X}} se A={θ𝑿(ω)B}.A=\{\theta{\boldsymbol{X}}(\omega)\in B\}. Denotaremos por 𝑿\mathcal{I}_{{\boldsymbol{X}}} a σ\sigma-álgebra dos eventos invariantes por translações de 𝑿{\boldsymbol{X}}. Dizemos que a sequência estacionária 𝑿{\boldsymbol{X}} é ergódica, se (A)=0\mathbb{P}(A)=0 ou 11 para todo A𝑿A\in\mathcal{I}_{{\boldsymbol{X}}}. Isso é equivalente à propriedade de o operador de deslocamento θ\theta ser ergódico no espaço de probabilidade induzido (,(),𝑿)(\mathbb{R}^{\mathbb{N}},\mathcal{B}(\mathbb{R}^{\mathbb{N}}),\mathbb{P}_{{% \boldsymbol{X}}}).

Enunciamos agora uma consequência imediata do Teorema Ergódico de Birkhoff.

Teorema 14.26 (Teorema Ergódico para sequências estacionárias).

Seja 𝐗=(X1,X2,){\boldsymbol{X}}=(X_{1},X_{2},\dots) uma sequência estacionária com X1X_{1} integrável. Então,

limn1nk=1nXk=𝔼[X1|𝑿]\lim_{n}\frac{1}{n}\sum_{k=1}^{n}X_{k}=\mathbb{E}[X_{1}|\mathcal{I}_{{% \boldsymbol{X}}}]

q.t.p. Se 𝐗{\boldsymbol{X}} for uma sequência ergódica, então 𝔼[X1|𝐗]=𝔼X1\mathbb{E}[X_{1}|\mathcal{I}_{{\boldsymbol{X}}}]=\mathbb{E}X_{1} q.t.p.

Passemos ao exemplo mais forte de sequência ergódica.

Proposição 14.27.

Se 𝐗{\boldsymbol{X}} é uma sequência i.i.d., então é ergódica.

Demonstração.

A ideia é bem semelhante à prova da Lei 0-1 de Kolmogorov. Dado qualquer A𝑿A\in\mathcal{I}_{{\boldsymbol{X}}}, por definição existe B()B\in\mathcal{B}(\mathbb{R}^{\mathbb{N}}) tal que A={(Xn,Xn+1,)B}A=\{(X_{n},X_{n+1},\dots)\in B\} para todo nn\in\mathbb{N}. Pelo Teorema 13.5 (aproximação por álgebras), existe uma sequência de eventos Bn(n)B_{n}\in\mathcal{B}(\mathbb{R}^{n}) tais que

(AAn)0,\mathbb{P}(A\triangle A_{n})\to 0,

onde An={(X1,,Xn)Bn}A_{n}=\{(X_{1},\dots,X_{n})\in B_{n}\}. Logo,

(An)(A) e (AAn)(A).\mathbb{P}(A_{n})\to\mathbb{P}(A)\quad\text{ e }\quad\mathbb{P}(A\cap A_{n})% \to\mathbb{P}(A).

Seja nn\in\mathbb{N} fixo. Como A𝑿A\in\mathcal{I}_{{\boldsymbol{X}}}, temos A={(Xn+1,Xn+2,)B}A=\{(X_{n+1},X_{n+2},\dots)\in B\}, logo AA e AnA_{n} são independentes, isto é,

(AAn)=(A)(An).\mathbb{P}(A\cap A_{n})=\mathbb{P}(A)\cdot\mathbb{P}(A_{n}).

Tomando o limite em nn, (A)=(A)(A)\mathbb{P}(A)=\mathbb{P}(A)\cdot\mathbb{P}(A), logo (A)=0\mathbb{P}(A)=0 ou 11. ∎

Combinando os enunciados acima, temos o seguinte corolário.

Corolário 14.28 (Lei Forte dos Grandes Números).

Seja 𝐗=(X1,X2,){\boldsymbol{X}}=(X_{1},X_{2},\dots) uma sequência de variáveis aleatórias i.i.d. com X1X_{1} integrável. Então

1nk=1nXkq.c.𝔼X1.\frac{1}{n}\sum_{k=1}^{n}X_{k}\overset{\mathrm{q.c.}}{\rightarrow}\mathbb{E}X_% {1}.

Dizemos que a sequência estacionária 𝑿{{\boldsymbol{X}}} é misturadora se

(θn𝑿A,𝑿B)(𝑿A)(𝑿B)\mathbb{P}(\theta^{n}{{\boldsymbol{X}}}\in A,\ {{\boldsymbol{X}}}\in B)\to% \mathbb{P}({{\boldsymbol{X}}}\in A)\mathbb{P}({{\boldsymbol{X}}}\in B)

para todos A,B()A,B\in\mathcal{B}(\mathbb{R}^{\mathbb{N}}). Isso é equivalente à propriedade de o operador de deslocamento θ\theta ser misturador no espaço de probabilidade induzido (,(),𝑿)(\mathbb{R}^{\mathbb{N}},\mathcal{B}(\mathbb{R}^{\mathbb{N}}),\mathbb{P}_{{% \boldsymbol{X}}}).

Exemplo 14.29.

A sequência definida no Exemplo 14.5 é ergódica mas não é misturadora. ∎

Exemplo 14.30 (Deslocamento de sequências i.i.d.).

Se as variáveis aleatórias X1,X2,X_{1},X_{2},\dots são i.i.d., então a sequência 𝑿=(X1,X2,){{\boldsymbol{X}}}=(X_{1},X_{2},\dots) é misturadora.

Tome μ=X\mu=\mathbb{P}_{X} em \mathbb{R}^{\mathbb{N}}. Sejam A,B()A,B\in\mathcal{B}(\mathbb{R}^{\mathbb{N}}) e seja ε>0\varepsilon>0. Pelo Teorema 13.5 (aproximação por álgebras), existem nn\in\mathbb{N} e eventos A~,B~()\tilde{A},\tilde{B}\in\mathcal{B}(\mathbb{R}^{\mathbb{N}}) que dependem apenas das nn primeiras coordenadas, tais que

μ(AA~)<ε e μ(BB~)<ε.\mu(A\triangle\tilde{A})<\varepsilon\quad\text{ e }\quad\mu(B\triangle\tilde{B% })<\varepsilon. (14.31)

Seja knk\geqslant n. Observe que

μ(θk(A)θk(A~))=μ(θk(AA~))=μ(AA~)<ε,\mu(\theta^{-k}(A)\triangle\theta^{-k}(\tilde{A}))=\mu(\theta^{-k}(A\triangle% \tilde{A}))=\mu(A\triangle\tilde{A})<\varepsilon,

onde a primeira igualdade é devida ao fato de que pré-imagem comuta com diferença simétrica e a segunda se deve ao fato de que θ\theta preserva medida.

Por outro lado, como (X1,,Xn)(X_{1},\dots,X_{n}) é independente de (Xk+1,,Xk+n)(X_{k+1},\dots,X_{k+n}),

μ(θk(A~)B~)=μ(θk(A~))μ(B~)=μ(A~)μ(B~).\displaystyle\mu(\theta^{-k}(\tilde{A})\cap\tilde{B})=\mu(\theta^{-k}(\tilde{A% }))\cdot\mu(\tilde{B})=\mu(\tilde{A})\cdot\mu(\tilde{B}).

Combinando essa identidade com (14.31), segue que

|μ(θk(A)B)μ(A)μ(B)|4ε|\mu(\theta^{-k}(A)\cap B)-\mu(A)\mu(B)|\leqslant 4\varepsilon

para todo knk\geqslant n. Como ε\varepsilon é arbitrário, μ(θk(A)B)μ(A)μ(B)\mu(\theta^{-k}(A)\cap B)\to\mu(A)\mu(B). ∎

Eventos e funções quase invariantes

Em muitas situações práticas, temos uma transformação ergódica TT e gostaríamos de concluir que um dado evento AA satisfaz μ(A)=0\mu(A)=0 ou 11, ou que uma dada função ff é constante q.t.p. Para isso, basta que AA ou ff sejam invariantes, porém essa condição é muito forte. Vejamos outra mais fácil de verificar.

Definição 14.32 (Quase invariante).

Dizemos que um evento AA\in\mathcal{E} é quase TT-invariante se μ(AT1(A))=0\mu(A\triangle T^{-1}(A))=0. Denotamos por T\mathcal{I}^{*}_{T} a classe dos conjuntos quase TT-invariantes. Dizemos que uma função mensurável f:Ef:{E}\to\mathbb{R} é quase TT-invariante se f=fTf=f\circ T q.t.p.

Exercício 14.33.

Mostre que T\mathcal{I}_{T}^{*} é uma σ\sigma-álgebra. Mostre que ff é quase TT-invariante se, e somente se for T\mathcal{I}_{T}^{*}-mensurável. ∎

As proposições abaixo estabelecem as relações entre conjuntos TT-invariantes, quase TT-invariantes e transformações ergódicas.

Proposição 14.34.

Seja TT é uma transformação que preserva medida. Para todo ATA\in\mathcal{I}_{T}^{*}, existe BTB\in\mathcal{I}_{T} tal que μ(AB)=0\mu(A\triangle B)=0.

Demonstração.

Seja ATA\in\mathcal{I}_{T}^{*}. Tome B={x:Tn(x)Ai.v.}B=\{x:T^{n}(x)\in A\ \text{i.v.}\}. Temos que BTB\in\mathcal{I}_{T}, pois T1(B)={x:Tn+1(x)Ai.v.}=B.T^{-1}(B)=\{x:T^{n+1}(x)\in A\ \text{i.v.}\}=B. Além disso, observe que ABk=0(Tk(A)Tk1(A))A\triangle B\subseteq\cup_{k=0}^{\infty}(T^{-k}(A)\triangle T^{-k-1}(A)). Por outro lado, como TT preserva medida e ATA\in\mathcal{I}_{T}^{*},

μ(Tk(A)Tk1(A))=μ(Tk(AT1(A)))=μ(AT1(A))=0\mu(T^{-k}(A)\triangle T^{-k-1}(A))=\mu(T^{-k}(A\triangle T^{-1}(A)))=\mu(A% \triangle T^{-1}(A))=0

para todo k0k\in\mathbb{N}_{0}, o que conclui a prova. ∎

Proposição 14.35.

Se TT é ergódica, então μ(A)=0\mu(A)=0 ou 11 para todo AA quase TT-invariante e toda ff quase TT-invariante é constante q.t.p.

Demonstração.

Dado ATA\in\mathcal{I}_{T}^{*}, pela Proposição 14.34, existe BTB\in\mathcal{I}_{T} com μ(AB)=0\mu(A\triangle B)=0, logo μ(A)=μ(B)=0\mu(A)=\mu(B)=0 ou 11, pois TT é ergódica. A prova da afirmação sobre ff quase TT-invariante é idêntica à do Corolário 13.17 e será omitida. ∎