O Datafolha nas eleições presidenciais de 2010, 2014 e 2018 fez previsões de
tendências de votos que se confirmaram de maneira razoável; embora tenha errado,
naqueles anos, em alguns Estados, quanto a tendência de votação para alguns
governadores.
Mas
nas eleições desse ano, nem com uma exagerada boa vontade, poder-se-ia dizer que
as previsões ficaram dentro das margens de erros. Os levantamentos em São Paulo
para presidente e para governador, bem como para presidente no Rio de Janeiro
foram erros vexatórios.
Não
é a primeira vez que isso acontece. Lembro-me há muitos anos, após serem
abertas as urnas e as previsões falharem, o Bonner e a Fátima Bernardes, com as
maiores caras de paus, dizerem no Jornal Nacional que o eleitor mudou o voto na
última hora. Indecisos sempre existiram, mas eles não fazem esse estrago todo
não.
Afinal
erraram por incompetência ou divulgaram erradamente para tentar influenciar o
eleitor ? Vou considerar que desta vez foi incompetência.
Por
que e como isso acontece? Por que eles acertaram umas previsões e erraram
outras ?
O
Brasil tem mais de 150 milhões de eleitores registrados e aptos a votar. Como é
que pesquisando 2 mil ou 3 mil pessoas pode-se acertar a previsão? Isso é possível.
Só depende da qualidade da amostragem. Explico.
Quais
são os ingredientes de um bolo simples? Farinha de trigo, ovos, leite, manteiga,
açúcar e fermento. Colocando tudo em uma batedeira poderíamos dizer que a
mistura é constituída de x% de farinha, y% de ovos, z% de manteiga etc. Se
mistura for bem homogênea, um simples pedaço do bolo, uma fatia, também é
constituída de x% de farinha, y% de ovos etc. Assim é a nossa sociedade, no
caso o número de eleitores. Uma amostragem de 3 mil pessoas tem de ter o mesmo
percentual de brancos, negros, pobres, ricos, homens, mulheres, jovens, velhos, nordestinos, sulistas etc. que tem no total de eleitores. O problema já começa aí, porque não sabemos
qual a proporção de cada um nesses 150 milhões. Uma boa amostragem pelo menos
tenta ser representativa da população. Nesse caso os nomes se confundem. Em
estatística população significa o todo. Não exatamente os seres humanos.
Na
CNN vi o absurdo dos comentaristas tentarem explicar e justificar porque havia
resultados bem diferentes - isso antes da eleição - de pesquisas feitas por
diferentes institutos: “Porque a metodologia é diferente. Em uns a pesquisa é
presencial, em outros é pelo telefone. Mas os dois estão corretos.” Não
companheiro. Numa eleição só tem um resultado. Ou um está correto e o outro
errado; ou os dois estão errados.
E
com muita boa vontade com o Datafolha acredito que eles erraram na seleção
desta amostragem. Não creio que divulgaram erradamente de propósito. A
realidade mostrou, mais de uma vez, que a divulgação de previsões erradas não
alteraram o resultado. O estrago na reputação é muito maior. Não creio que
valha a pena correr o risco. E devo lembrar que o grupo Folha e o PT não se
cheiram. Contudo, também acredito que isso beneficiou o PT, que baseado nas
previsões saiu batalhando pelo voto útil. O erro a nível nacional foi menor porque
a amostragem errada no Estado de São Paulo ficou um pouco diluída nas
amostragens do resto do país.
Foi
por essa amostragem errada que o Haddad estava na frente do Tarciso de Freitas
e a diferença entre Bolsonaro e Lula era bem maior dos 5% registrados nas
urnas.
Uma
coisa deve ser dita. As pesquisas de intenção de votos, quando feitas
adequadamente, geram levantamentos da probabilidade relativa a todos os eleitores
aptos a votarem e não somente daqueles que desejam ir votar ou efetivamente
votaram. O povo que se absteve também está incluso. Não confundir com votos em
branco, nulos e indecisos. Obviamente que entre os 32 milhões de eleitores que
não foram votar estão os que se tivessem ido votariam em branco ou anulariam o
voto; mas o fato de não comparecer, por preguiça ou por qualquer outro motivo,
como não querer gastar dinheiro no deslocamento, estão milhões, eu disse milhões,
de eleitores de Lula e de Bolsonaro. Isso faz diferença no resultado da
pesquisa ? Sim. O resultado previsto, dependendo o volume de eleitores que se
abstiveram de um candidato ou de outro, não se confirmará.
No
sábado, um dia antes da votação, o IPEC fez uma projeção de 51% a 37% dos votos válidos a favor de Lula.
Eles trabalham com a margem de 2% para mais ou para menos. Vamos usar a boa
vontade de novo. Lula com menos 2 e Bolsonaro com mais dois teríamos 49% contra
39%. Ainda assim uma diferença de 10 pontos, o dobro da real.
O
Datafolha apontava 50% a 36%. O Ipespe, 49% a 35%, e a Quaest, 49% a 38%. A
margem de erro é de dois pontos percentuais no caso do Datafolha e Quaest e de
três pontos no caso do Ipespe. Todos acertaram em relação ao Lula, mas erraram
sobre os votos de Bolsonaro.
Paradoxalmente,
a Paraná Pesquisas, que sempre divulgava resultado suspeitos ( e que recebeu
2,7 milhões do PL: https://br.noticias.yahoo.com/paran%C3%A1-pesquisas-recebeu-r-2-185600340.html),
com o Bolsonaro na frente de Lula, bem diferentes de todos os outros institutos;
para salvar sua credibilidade e estando na casa do sem jeito - já que nem só de
eleições vive uma empresa de pesquisa - mesmo como Bolsonaro dizendo que teria
60% dos votos no primeiro turno, na sexta-feira, 30, divulgou o seu último
levantamento de forma correta. O primeiro e único em que Lula ganhava do
Bolsonaro. Divulgaram Lula com 47,1% (48,4%) e Bolsonaro, 40% (43,2%), com
margem de erro de 2,2 pontos percentuais para cima e para baixo. Foi quem mais
se aproximou da realidade.
As
ferramentas da estatística indutiva ou inferencial quando usadas corretamente e
honestamente produzem resultados coerentes muito próximo dos reais.
A
Paraná Pesquisas lembra-me a empresa amazonense cujo dono tem nome de cowboy de
filme americano e que produz resultados de acordo com os interesses de
determinado candidato.
Erros
grassos desta magnitude realizados pelos institutos de pesquisa não servem para
nada e nem para ninguém. Não ajudam na democracia. Muito pelo contrário, ajudam
bastante a aqueles querem que todas as pesquisas que lhes são contrárias não
sejam divulgadas.
Que
nesse segundo turno as previsões se aproximem mais da realidade. O Datafolha
está nos devendo uma explicação. Ela e todos os demais institutos, como Lula e
Bolsonaro, terão uma segunda chance.