6.2 Correlação
Nesta seção vamos introduzir o coeficiente de correlação, estudar suas propriedades, e relacioná-lo com o método dos mínimos quadrados. Observamos que esta seção não será usada no restante do livro.
Dada uma variável aleatória não-degenerada com segundo momento finito, definimos a padronização de como sendo a variável aleatória
Ou seja, a padronização é a transformação afim crescente que leva em com as propriedades que e . Observe também que a padronização de é uma variável aleatória adimensional, pois é medido na mesma unidade de .
Definição 6.15 (Coeficiente de correlação).
Dadas duas variáveis aleatórias e com variâncias finitas e positivas, definimos o coeficiente de correlação entre e como:
O coeficiente de correlação é adimensional, pois ele depende apenas das padronizações de e . Outras propriedades do coeficiente de correlação são dadas na proposição a seguir.
Proposição 6.16 (Propriedades do coeficiente de correlação).
Dadas e variáveis aleatórias com variâncias finitas e positivas, valem:
-
(1)
;
-
(2)
;
-
(3)
;
-
(4)
se ;
-
(5)
se e .
Demonstração.
O item (1) é imediato da definição de coeficiente de correlação e da simetria da covariância. Para o item (2) basta utilizar o item (2) da Proposição 6.14. Do item (2) segue que , o que prova o item (3). Para mostrar o item (4), calculamos
onde a segunda e a terceira igualdades acima seguem dos itens (2) e (1) da Proposição 6.14, respectivamente.
Exemplo 6.17.
Sejam vetor aleatório com densidade conjunta dada por , e , então:
Logo, .
Continuando,
Já sabíamos que o coeficiente de correlação é invariante pela padronização das variáveis. O último item da proposição acima nos diz algo mais forte. O valor absoluto do coeficiente de correlação é preservado por quaisquer transformações afins não-constantes que façamos nas variáveis e .
O coeficiente de correlação é uma indicação do grau de dependência linear entre as variáveis aleatórias e . A proposição a seguir dá ainda mais sentido a esta afirmação.
Proposição 6.18.
Sejam e variáveis aleatórias não-degeneradas com segundo momento finito. Então . Ademais, se, e somente se, q.c. para algum e .
Veremos a demonstração na próxima seção, como corolário da Desigualdade de Cauchy-Schwarz.
Correlação e o método dos mínimos quadrados
O leitor talvez se lembre dos laboratórios de ciências naturais, em que escolhiam-se distintos valores de uma determinada grandeza, observavam-se valores correspondentes de uma outra grandeza que supostamente depende da primeira, e tentava-se traçar a reta que melhor se aproximasse dos pontos no plano, como ilustrado na Figura 6.1. O critério mais comum para dizer que uma reta se aproxime desses pontos mais que outras é o de minimizar o erro quadrático médio, dado por .
Usando notação , queremos minimizar . O ponto que minimiza satisfaz , ou seja, .
Calculando as derivadas parciais, obtemos
Resolvendo o sistema linear , obtemos
Agora considere o experimento aleatório que consiste em selecionar um desses pontos ao acaso, ou seja, assuma que é um vetor aleatório que assume os valores com probabilidade cada. Neste caso, a solução acima pode ser escrita como
Ou seja, se padronizamos tanto quanto , a reta passará pela origem e sua inclinação será justamente o coeficiente de correlação.
Ademais, o problema original pode ser reescrito como: encontre e tal que
seja o menor possível. Ou seja, de todas as variáveis aleatórias que podem ser expressas como para algum e algum , encontramos aquela que minimiza .