4.3 Soma de variáveis independentes
Trataremos nesta seção de um caso especial de função de vetor aleatório que permeará todo o livro. Somas de variáveis aleatórias independentes aparecem naturalmente em Probabilidade, Estatística e nas Ciências Naturais. Dadas e variáveis aleatórias independentes, qual a distribuição de ?
No caso em que o vetor é discreto, é variável aleatória discreta e sua função de probabilidade pode ser calculada via Lei da Probabilidade Total:
Observe que, como o vetor é discreto, as parcelas da soma acima são não-nulas para no máximo uma quantidade enumerável valores de .
Exemplo 4.20.
Sejam e . A função de probabilidade de pode ser calculada por
Portanto, , o que não chega a ser uma surpresa, dada a definição de variável binomial. Indutivamente, podemos generalizar este fato e mostrar que se para todo são independentes, então . ∎
Quando as variáveis e forem independentes e absolutamente contínuas com densidades e , respectivamente, temos a relação análoga
Para justificá-la, tomamos e desenvolvemos
para todo , o que mostra que a função definida em (4.21) é de fato uma densidade de .
Soma de normais independentes
O caso quando e são distribuições normais é tão importante que preferimos enunciá-lo como a proposição seguinte.
Proposição 4.22.
Sejam e independentes. Então .
Demonstração.
Como e , podemos supor sem perda de generalidade que . A densidade de é então dada por
Para simplificar, escrevemos e . Utilizando a identidade
válida para todos , , e , obtemos
Portanto corresponde à densidade de uma distribuição , como queríamos demonstrar. ∎
Usando a Observação 4.13, pode-se verificar indutivamente que se são variáveis aleatórias independentes com , então . Em palavras, soma de normais independentes é uma variável normal cujos parâmetros são as somas dos respectivos parâmetros.
Exemplo 4.23.
Uma fábrica produz parafusos cujos comprimentos são independentes e têm distribuição . É retirada uma amostra aleatória de parafusos e calculada a média aritmética dos comprimentos da amostra. Qual a probabilidade da média observada diferir do valor médio teórico, , mais que uma tolerância ? Sejam os comprimentos dos parafusos da amostra e , estamos interessados em determinar quanto vale
Como são independentes e com distribuição , segue que , ou seja, tem distribuição . Desse modo
Por exemplo, se , e , podemos calcular o valor acima consultando a tabela na página Tabela Normal e obter
com três algarismos significativos.
Outra pergunta que poderíamos fazer é: qual o tamanho mínimo da amostra de modo que a média observada difira de por no máximo unidades com probabilidade superior a (nível de confiabilidade). Ou seja, devemos encontrar o menor tal que
Novamente com auxílio da tabela da distribuição normal, podemos encontrar de modo que e posteriormente escolher de modo que . Por exemplo, se e , então e . Ou seja, um aumento de para no tamanho da amostra aumenta de para nosso grau de confiança de a média observada diferir de menos que .
Há três variáveis que se relacionam neste problema: , e . Dadas quaisquer duas delas podemos determinar a terceira. Como exemplo do caso faltante, suponha que uma amostra de tamanho é retirada, gostaríamos de afirmar que com probabilidade superior a nossa média observada tem um grau de precisão . Qual o menor valor de ? Como no caso anterior, para , resolvendo , obtemos . Assim, . Ou seja, para a amostra de tamanho , a margem de erro aumentou de para se quisermos aumentar a confiança de para . ∎