[Prévia] [Próxima] [Prévia por assunto] [Próxima por assunto]
[Índice cronológico] [Índice de assunto]

Vamos ter 2o. turno nas eleições presidenciais?



Caros Colegas:

Recentemente defendi o mestrado cujo tema foi a análise de dados categorizados com omissão. Como um dos tipos de dados omissos (ou faltantes) é a não-resposta em pesquisas, também estudei um pouco o viés de não-resposta, dentre outras questões.

Em minha dissertação de mestrado, estudei, por exemplo, os resultados das eleições do 1o. turno de 2004 da cidade de São Paulo, em que o Serra ganhou da Marta Suplicy por 7.7% e o IBOPE divulgou na última pesquisa de intenção de votos antes do pleito que a Marta estava 2% na frente de Serra (apesar do "empate técnico"). Ou seja, o IBOPE errou em 9.9% o resultado! O Datafolha ficou mais próximo, prevendo que Serra estaria na frente de Marta em 3%, mas ainda assim errou em muito (4.7%) o resultado. O que talvez tenha acontecido é que a amostra de eleitores entrevistados pelo IBOPE e Datafolha podem não ter constituído amostras aleatórias da população de eleitores, mas sim amostras enviesadas.

Uma análise mais cautelosa que tivesse estudado a possível ocorrência desse viés, como a que apresentei em minha dissertação, teria detectado que isso poderia ter acontecido. Utilizando apenas os dados do IBOPE, mostrei que até mesmo uma análise mais simples poderia ter previsto que Serra estaria na frente de Marta entre -11.8% e +8.0% (os percentuais negativos indicam que Marta estaria na frente de Serra).

Vendo hoje os resultados do IBOPE e do Datafolha que a TV Globo divulgou no Jornal Nacional, resolvi repetir a mesma análise simplória por curiosidade (outras análises mais apuradas demandariam muito mais tempo) e quis dividir com vocês.

Em ambos os resultados divulgados no jornal, Lula está 12% na frente de Alckmin, considerando os votos válidos, sendo que o resultado de Lula vs. Alckmin do Datafolha é de 50% vs. 38% e do IBOPE é de 49% vs. 37%. Apesar de não terem divulgado o percentual de votos não-válidos, pelas minhas contas são cerca de 8% (as análises se baseiam nesse índice).

Pelas minhas análises, a diferença entre Lula e Alckmin de +12% pode variar entre -5% e +27% para os dois institutos. Ou seja, apesar de Lula ter uma maior amplitude de possibilidades de estar na frente de Alckmin, se a distribuição dos eleitores que tiveram votos não-válidos nas pesquisas for, na realidade, muito mais favorável ao Alckmin do que ao Lula em relação aos votos válidos, então o Lula não terá uma vantagem tão grande como a de 12%, podendo chegar ao caso extremo de perder em até 5% de Alckmin. Nas análises individuais, os 50% apresentados pelo Datafolha para Lula podem variar entre 38% e 54%, enquanto que os 38% de Alckmin podem ir de 27% a 43%.

Gostaria de poder dizer que também estou incorporando nessas análises o erro amostral, mas não o faço porque tanto o Datafolha quanto o IBOPE fazem os levantamentos amostrais por meio do sistema de quotas, que, conforme o Carvalho comentou cerca de 1 mês atrás nesta lista de discussão eletrônica, _não_ é um método probabilístico. (Além disso, seria necessário ter mais informação sobre o plano amostral e os dados brutos do que obviamente é comentado pela mídia e disponibilizado pelos institutos de pesquisa.) Portanto, as análises que fiz consideram apenas como as estimativas pontuais poderiam variar para a amostra dependendo do tipo de viés, que não se pode mensurar. Ao embutir o erro amostral nas análises, a amplitude dos intervalos aumentaria mais ainda.

Apesar das deficiências de tais análises e de ilustrarem que há possibilidade de ter ou não 2o. turno (já que a incerteza da proporção de votos válidos de Lula é de 38% a 54%), como a amostragem por quotas é mais suscetível à ocorrência de vieses e o estudo destes são mais favoráveis ao 2o. turno, acredito que já podemos vislumbrá-lo.

Boa votação!

--
Frederico Zanqueta Poleto
fred@poleto.com
--
"An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem." J. W. Tukey