3.2 Variáveis aleatórias discretas
Dizemos que uma variável aleatória , sua função de distribuição e sua lei são discretas se existe um conjunto enumerável tal que
Definimos a função de probabilidade de uma variável aleatória como
O tratamento de variáveis aleatórias discretas é feito em termos de somatórios com a função de probabilidade. Por exemplo, a lei de uma variável aleatória discreta é dada por
e sua função de distribuição é dada por
Com efeito, esta última equação é um caso particular da anterior tomando-se , e para justificar aquela usamos -aditividade da medida de probabilidade :
A primeira e última igualdades valem pois e para todo .
A função de distribuição de uma variável aleatória discreta tipicamente se parece à da Figura 3.1, sendo constante por partes e dando um saltos de tamanho em cada ponto com . Como
a função de distribuição determina a função de probabilidade de uma variável aleatória, e pela equação anterior vale a recíproca. Portanto, para determinar o comportamento estatístico de uma variável aleatória discreta, é equivalente especificar , , ou . A primeira normalmente é mais simples.
De forma geral, uma função de probabilidade é qualquer função satisfazendo
Dada uma função de probabilidade , existe um espaço de probabilidade onde está definida uma variável aleatória discreta cuja função de probabilidade é . Por certo, basta tomar , e e .
Finalizamos esta seção com alguns exemplos conhecidos de variáveis aleatórias discretas.
Distribuição uniforme discreta
Seja um conjunto finito, dizemos que tem distribuição uniforme discreta (ou equiprovável) em , quando sua função de probabilidade for constante em , isto é
Distribuição de Bernoulli
Dado , dizemos que é uma variável de Bernoulli com parâmetro , o que denotamos , se e .
Chamamos de ensaios de Bernoulli à realização sucessiva e independente de um mesmo experimento, sendo que cada realização resulta em “sucesso” com probabilidade e “fracasso” com probabilidade , e dizemos que é o parâmetro desses ensaios. O caso mais simples é quando realizamos apenas um ensaio, e tomamos como sendo a indicadora do evento de sucesso nessa única tentativa, e nesse caso temos .
Distribuição geométrica
Considere uma sequência de ensaios de Bernoulli, com o mesmo parâmetro , e seja o número de ensaios realizados até que se obtenha o primeiro sucesso. Se denotamos por o evento de sucesso na -ésima tentativa, podemos encontrar a função de probabilidade de como segue:
Na última igualdade, utilizamos a independência dos eventos . Dizemos que tem distribuição geométrica de parâmetro , o que denotaremos por .
Exemplo 3.18.
Lançar um par de dados até obter números iguais. Se denota o número de lançamentos necessários, então . ∎
Observação 3.19.
Alguns textos definem a distribuição geométrica contando o número de falhas anteriores ao primeiro sucesso, ao invés de contar o número total de ensaios. Isso faz com que as distribuições sejam defasadas de uma unidade, pois a função de probabilidade passa a ser dada por para . ∎
Distribuição binomial
Agora, consideremos uma repetição de ensaios de Bernoulli com parâmetro e seja o número de sucessos obtidos nesses ensaios. Para calcularmos sua função de probabilidade, observemos que se há exatamente sucessos, então há fracassos. Devido à independência dos ensaios, cada uma das sequências com sucessos e fracassos ocorre com probabilidade . Logo, a probabilidade de haver exatamente sucessos é vezes o número de sequências binárias de comprimento onde o aparece vezes e o aparece vezes. Isto é, a função de probabilidade de é dada por
Neste caso, dizemos que tem distribuição binomial com parâmetros e , o que denotamos por . Pelo Teorema Binomial,
ou seja, definida acima é de fato uma função de probabilidade.
Exemplo 3.20.
Lançar um dado vezes e contar o número de vezes que se obtém um número múltiplo de . Neste caso, . A probabilidade de se obter um múltiplo de duas vezes é dada por
Distribuição de Poisson
Consideremos agora a repetição de ensaios de variáveis de Bernoulli, todas elas com o mesmo parâmetro . Suponha que é um número muito grande, e , isto é, a probabilidade de sucesso é inversamente proporcional ao número de repetições. Se é a variável que conta o número de sucessos, então . O que podemos afirmar sobre a função de probabilidade de quando ? Para todo fixo, vale
quando . Ademais, podemos observar que , de modo que o limite acima define uma função de probabilidade.
Dizemos que uma variável aleatória tem distribuição de Poisson com parâmetro , o que denotaremos por , se sua função de probabilidade é dada por
Exemplo 3.21.
A padaria da esquina produz deliciosos panetones, cuja receita leva 50 uvas-passas por panetone, e a produção é feita em larga escala. Patrícia acaba de comprar um desses panetones. Qual a distribuição do número de uvas-passas do panetone adquirido por Patrícia? Se o panetone comprado por Patrícia foi produzido dentro de um lote de panetones, temos que o número de passas de seu panetone tem distribuição , pois é o número de uvas-passas utilizadas e é a probabilidade de que cada uma dessas uvas-passas esteja justamente ne porção da massa que foi para o panetone de Patrícia. Porém, sabendo que a produção é feita em larga escala, o valor se torna irrelevante e tal distribuição é bem aproximada por uma distribuição de . ∎
Distribuições hipergeométrica e binomial negativa
Considere uma urna contendo bolas, sendo bolas pretas e bolas brancas. Retiramos, sem reposição, uma amostra de bolas. Seja a variável aleatória que denota o número de bolas pretas retiradas nas extrações. Observe que satisfaz e . A função de probabilidade de é dada por:
para tal que e . Dizemos que uma variável aleatória com essa função de probabilidade tem distribuição hipergeométrica de parâmetros , e , o que denotamos por . Observe que, como as extrações são sem reposição, a independência é perdida. Caso contrário, o número de bolas pretas extraídas teria uma distribuição binomial de parâmetros e .
Exemplo 3.22.
De um baralho comum extraímos, sem reposição, uma amostra de 13 cartas. Seja a variável que denota o quantidade de cartas retiradas com um número par. Então . ∎
Considere uma sequência de ensaios de Bernoulli, com o mesmo parâmetro . Seja a variável aleatória que denota o número de ensaios realizados até que se obtenha sucessos, onde é outro parâmetro do experimento. Podemos observar que assume valores no conjunto . A função de probabilidade de é dada por:
Neste caso, dizemos que tem distribuição binomial negativa de parâmetros e .
Exemplo 3.23.
Lançar um par de dados até obter o oitavo par de números iguais. Se denota o número de lançamentos necessários, então tem distribuição binomial negativa de parâmetros e . ∎
Observação 3.24.
Alguns textos definem a distribuição binomial negativa contando o número de falhas anteriores ao -ésimo sucesso, ao invés de contar o número total de ensaios. ∎