3.1 Variáveis aleatórias
Uma quantidade numérica que pode ser observada num certo experimento aleatório é representada por uma função .
Exemplo 3.1.
Lança-se um dado e observa-se a face superior. Neste caso, podemos tomar e . ∎
Exemplo 3.2.
Lançam-se dois dados e considera-se o maior dos valores. Neste caso, podemos tomar e . ∎
Vamos impor uma restrição sobre a função que permitirá atribuir probabilidade a eventos como “o valor observado de é no máximo ”.
Definição 3.3 (Variável Aleatória).
Uma variável aleatória em um espaço de probabilidade é uma função real definida no espaço tal que o conjunto é evento aleatório para todo , isto é, para todo .
Daqui para frente, denotaremos o evento simplesmente por .
Exemplo 3.4 (Variável aleatória constante).
Se para todo , então
Portanto, é uma variável aleatória. ∎
Dizemos que uma variável aleatória é degenerada se existe tal que . No exemplo acima, é degenerada com .
Exemplo 3.5 (Função indicadora).
Dado , definimos
Se e , então
Portanto, é uma variável aleatória. ∎
Contra-exemplo 3.6.
Sejam e e considere os conjuntos e . Então é variável aleatória em , mas não é. ∎
3.1.1 Espaço induzido e lei de uma variável aleatória
A -álgebra de Borel na reta , denotada por , é a menor -álgebra que contém todos os intervalos da reta (veja a Seção 1.4.1 para mais detalhes). Os conjuntos tais que são chamados borelianos. Na prática, essa classe contém todos os subconjuntos de que nos interessam.
Dado um espaço de probabilidade e uma variável aleatória , definimos o espaço de probabilidade induzido por como , onde
Ou seja, o espaço amostral é o conjunto dos números reais, os eventos aleatórios são os conjuntos borelianos, e a medida de probabilidade é aquela induzida por . A medida de probabilidade em induzida por é chamada de lei da variável aleatória ou distribuição de . Na Seção 3.7, mostraremos que está realmente definida para todo .
A importância teórica e conceitual do espaço de probabilidade induzido por uma variável aleatória , bem como sua distribuição , é que ele permite descrever o comportamento estatístico de abstraindo-se todos os detalhes do espaço de probabilidade original. Mais precisamente, toda pergunta formulada apenas em termos de pode ser respondida com ao invés de .
Exemplo 3.8.
Um dado é lançado três vezes. Seja o valor obtido no primeiro lançamento. Esse experimento pode ser modelado por , e para todo , nesse caso é dado por , onde cada é identificado como uma tripla . O espaço induzido por é dado por , com dado por
Para calcular , podemos fazer
ou
3.1.2 Função de distribuição
Assim como a ideia de lei de uma variável, o conceito que definiremos agora é uma outra maneira equivalente de descrever a estrutura probabilística da variável aleatória.
Definição 3.9 (Função de distribuição).
A função de distribuição da variável aleatória , é a função , definida como
A função de distribuição, também conhecida como função de distribuição acumulada, determina a lei da variável aleatória. Veremos a demostração deste fato na Seção 3.6, mas gostaríamos de enunciá-lo precisamente agora.
Teorema 3.10.
Sejam e variáveis aleatórias. Se para todo , então para todo .
Por isso a função de distribuição é uma característica fundamental da variável aleatória. Caso (e portanto ), escrevemos .
Exemplo 3.11.
Duas moedas honestas são lançadas. Seja a variável que conta o número de caras observadas. Temos que
Observe que o salto da função de distribuição corresponde à probabilidade de a variável aleatória assumir aquele valor, como se vê na Figura 3.1. ∎
Exemplo 3.12.
Selecionamos um ponto ao acaso do intervalo com . Seja a variável aleatória que representa a coordenada do ponto. Primeiro observamos que, ao selecionar um ponto ao acaso em um intervalo, estamos dizendo implicitamente que quaisquer subintervalos de mesmo tamanho têm a mesma probabilidade de conter o ponto escolhido. Isso implica que para todo . Para , tomando obtemos . Para temos que , e para obtemos . Portanto,
cujo gráfico está ilustrado na Figura 3.2.
∎
Variáveis aleatórias diferentes podem ter a mesma função de distribuição. Por exemplo, se a variável aleatória definida no Exemplo 3.1 e definimos , então, enquanto para todo .
Dada uma sequência de números reais, denotamos por a propriedade de que e . Analogamente, escrevemos para denotar que e .
Proposição 3.13 (Propriedades da função de distribuição).
Se é uma variável aleatória, sua função de distribuição satisfaz às seguintes propriedades:
-
(1)
é não-decrescente;
-
(2)
é contínua à direita;
-
(3)
e .
Demonstração.
Para o item (1), basta ver que implica , que, pelo item (6) do Teorema 1.35, implica
Para (2), observe que implica , que, pela continuidade da probabilidade, implica
Pela Observação A.2, isso implica que , ou seja, é contínua à direita. Para (3), observe que implica , que, pela continuidade da probabilidade, implica
Analogamente, implica , que implica . ∎
Ao final desta seção, mostraremos que, dada uma função com as três propriedades dadas pela proposição acima, sempre existe uma variável aleatória cuja função de distribuição é . Diremos que uma dada com essas propriedades é uma função de distribuição.
De forma geral, uma função de distribuição é qualquer função satisfazendo às três propriedades acima. Ao final desta seção, mostraremos que dada uma função de distribuição , sempre existe uma variável aleatória cuja função de distribuição é .
Segue da definição de função de distribuição que e , para todos . A proposição abaixo nos diz como obter a distribuição em outros tipos de intervalos. Denotamos .
Proposição 3.14.
A função de distribuição de uma variável aleatória satisfaz: e para todos números . Em particular, se, e somente se, é contínua em .
Demonstração.
Provaremos apenas a primeira igualdade, as outras são análogas. Observe que , donde
Logo, , pela continuidade da probabilidade. ∎
3.1.3 Função quantil
Imagine que estamos implementando um algoritmo usando uma certa linguagem de programação e queremos simular uma variável aleatória com uma dada função de distribuição . Em geral, as linguagens de programação são capazes de gerar uma variável aleatória distribuída “uniformemente” no intervalo . Veremos na Seção 3.3 o que quer dizer estar distribuída uniformemente em , mas por enquanto basta saber que para . A partir de uma variável com essa distribuição, é possível obter uma variável com função de distribuição ?
Caso o valor de seja, por exemplo, , queremos atribuir a o valor que ocupa, dentre os possíveis valores assumidos por , a “posição” correspondente a numa escala entre e . Mais precisamente, buscamos o valor tal que e . Observe que, ao buscar tal valor de , estamos tentando inverter a função de distribuição de .
A função quantil de uma variável aleatória é a inversa da sua função de distribuição, no seguinte sentido. Dada uma função de distribuição , definimos
ou seja, é o ponto mais à esquerda a partir do qual o gráfico de fica acima da altura . Caso seja como o da Figura 3.2, nada mais é do que a pré-imagem de . Porém, no exemplo da função da Figura 3.1, os valores e têm todo um intervalo como pré-imagem, e qualquer outro tem pré-imagem vazia. Para e , tomamos o ponto mais à esquerda do intervalo e, para os demais pontos, completamos o gráfico de com segmentos verticais para definir a inversa. A definição de é ilustrada na Figura 3.3.
Mencionamos aqui algumas propriedades da função quantil que podem ser observadas visualmente, e cuja prova será omitida. Para todo , temos , valendo a igualdade se é estritamente crescente num intervalo aberto contendo . Para todo , temos , valendo a igualdade se é contínua num intervalo aberto contendo .
A propriedade que vamos usar é que, dados e ,
Essa propriedade segue da definição de e do fato de ser não-decrescente e contínua à direita.
A discussão acima culmina com a demonstração formal da existência de variáveis aleatórias com quaisquer distribuições. No mesmo espírito do parágrafo inicial acima, o ponto de partida é a existência de uma variável aleatória uniforme, o que enunciaremos agora.
Teorema 3.16 (Variável aleatória uniforme).
Existe uma variável aleatória em um espaço de probabilidade tal que para .
A demonstração exige ferramentas avançadas e será dada na Seção 3.6.
Teorema 3.17.
Se uma função satisfaz às três propriedades listadas na Proposição 3.13, então existe um espaço de probabilidade e uma variável aleatória cuja função de distribuição é .
Demonstração.
Seja uma variável aleatória com distribuição uniforme em e defina . Para cada , por (3.15) temos
portanto é a função de distribuição de , como queríamos demonstrar. ∎