Cláudio Nogueira: Datafolha Errou nas Previsões de Votos e nos Deve Explicações.

O Datafolha nas eleições presidenciais de 2010, 2014 e 2018 fez previsões de tendências de votos que se confirmaram de maneira razoável; embora tenha errado, naqueles anos, em alguns Estados, quanto a tendência de votação para alguns governadores.

Mas nas eleições desse ano, nem com uma exagerada boa vontade, poder-se-ia dizer que as previsões ficaram dentro das margens de erros. Os levantamentos em São Paulo para presidente e para governador, bem como para presidente no Rio de Janeiro foram erros vexatórios.

Não é a primeira vez que isso acontece. Lembro-me há muitos anos, após serem abertas as urnas e as previsões falharem, o Bonner e a Fátima Bernardes, com as maiores caras de paus, dizerem no Jornal Nacional que o eleitor mudou o voto na última hora. Indecisos sempre existiram, mas eles não fazem esse estrago todo não.

Afinal erraram por incompetência ou divulgaram erradamente para tentar influenciar o eleitor ? Vou considerar que desta vez foi incompetência.

Por que e como isso acontece? Por que eles acertaram umas previsões e erraram outras ?

O Brasil tem mais de 150 milhões de eleitores registrados e aptos a votar. Como é que pesquisando 2 mil ou 3 mil pessoas pode-se acertar a previsão? Isso é possível. Só depende da qualidade da amostragem. Explico.

Quais são os ingredientes de um bolo simples? Farinha de trigo, ovos, leite, manteiga, açúcar e fermento. Colocando tudo em uma batedeira poderíamos dizer que a mistura é constituída de x% de farinha, y% de ovos, z% de manteiga etc. Se mistura for bem homogênea, um simples pedaço do bolo, uma fatia, também é constituída de x% de farinha, y% de ovos etc. Assim é a nossa sociedade, no caso o número de eleitores. Uma amostragem de 3 mil pessoas tem de ter o mesmo percentual de brancos, negros, pobres, ricos, homens, mulheres, jovens, velhos, nordestinos, sulistas etc. que tem no total de eleitores. O problema já começa aí, porque não sabemos qual a proporção de cada um nesses 150 milhões. Uma boa amostragem pelo menos tenta ser representativa da população. Nesse caso os nomes se confundem. Em estatística população significa o todo. Não exatamente os seres humanos.

Na CNN vi o absurdo dos comentaristas tentarem explicar e justificar porque havia resultados bem diferentes - isso antes da eleição - de pesquisas feitas por diferentes institutos: “Porque a metodologia é diferente. Em uns a pesquisa é presencial, em outros é pelo telefone. Mas os dois estão corretos.” Não companheiro. Numa eleição só tem um resultado. Ou um está correto e o outro errado; ou os dois estão errados.

E com muita boa vontade com o Datafolha acredito que eles erraram na seleção desta amostragem. Não creio que divulgaram erradamente de propósito. A realidade mostrou, mais de uma vez, que a divulgação de previsões erradas não alteraram o resultado. O estrago na reputação é muito maior. Não creio que valha a pena correr o risco. E devo lembrar que o grupo Folha e o PT não se cheiram. Contudo, também acredito que isso beneficiou o PT, que baseado nas previsões saiu batalhando pelo voto útil. O erro a nível nacional foi menor porque a amostragem errada no Estado de São Paulo ficou um pouco diluída nas amostragens do resto do país.

Foi por essa amostragem errada que o Haddad estava na frente do Tarciso de Freitas e a diferença entre Bolsonaro e Lula era bem maior dos 5% registrados nas urnas.

Uma coisa deve ser dita. As pesquisas de intenção de votos, quando feitas adequadamente, geram levantamentos da probabilidade relativa a todos os eleitores aptos a votarem e não somente daqueles que desejam ir votar ou efetivamente votaram. O povo que se absteve também está incluso. Não confundir com votos em branco, nulos e indecisos. Obviamente que entre os 32 milhões de eleitores que não foram votar estão os que se tivessem ido votariam em branco ou anulariam o voto; mas o fato de não comparecer, por preguiça ou por qualquer outro motivo, como não querer gastar dinheiro no deslocamento, estão milhões, eu disse milhões, de eleitores de Lula e de Bolsonaro. Isso faz diferença no resultado da pesquisa ? Sim. O resultado previsto, dependendo o volume de eleitores que se abstiveram de um candidato ou de outro, não se confirmará.

No sábado, um dia antes da votação, o IPEC fez uma projeção de 51% a 37% dos votos válidos a favor de Lula. Eles trabalham com a margem de 2% para mais ou para menos. Vamos usar a boa vontade de novo. Lula com menos 2 e Bolsonaro com mais dois teríamos 49% contra 39%. Ainda assim uma diferença de 10 pontos, o dobro da real.

O Datafolha apontava 50% a 36%. O Ipespe, 49% a 35%, e a Quaest, 49% a 38%. A margem de erro é de dois pontos percentuais no caso do Datafolha e Quaest e de três pontos no caso do Ipespe. Todos acertaram em relação ao Lula, mas erraram sobre os votos de Bolsonaro.

Paradoxalmente, a Paraná Pesquisas, que sempre divulgava resultado suspeitos ( e que recebeu 2,7 milhões do PL: https://br.noticias.yahoo.com/paran%C3%A1-pesquisas-recebeu-r-2-185600340.html), com o Bolsonaro na frente de Lula, bem diferentes de todos os outros institutos; para salvar sua credibilidade e estando na casa do sem jeito - já que nem só de eleições vive uma empresa de pesquisa - mesmo como Bolsonaro dizendo que teria 60% dos votos no primeiro turno, na sexta-feira, 30, divulgou o seu último levantamento de forma correta. O primeiro e único em que Lula ganhava do Bolsonaro. Divulgaram Lula com 47,1% (48,4%) e Bolsonaro, 40% (43,2%), com margem de erro de 2,2 pontos percentuais para cima e para baixo. Foi quem mais se aproximou da realidade.

As ferramentas da estatística indutiva ou inferencial quando usadas corretamente e honestamente produzem resultados coerentes muito próximo dos reais.

A Paraná Pesquisas lembra-me a empresa amazonense cujo dono tem nome de cowboy de filme americano e que produz resultados de acordo com os interesses de determinado candidato.

Erros grassos desta magnitude realizados pelos institutos de pesquisa não servem para nada e nem para ninguém. Não ajudam na democracia. Muito pelo contrário, ajudam bastante a aqueles querem que todas as pesquisas que lhes são contrárias não sejam divulgadas.

Que nesse segundo turno as previsões se aproximem mais da realidade. O Datafolha está nos devendo uma explicação. Ela e todos os demais institutos, como Lula e Bolsonaro, terão uma segunda chance.

Cláudio Nogueira

Pesquisar este blog

segunda-feira, 3 de outubro de 2022

Datafolha Errou nas Previsões de Votos e nos Deve Explicações.

11 comentários:

Seguidores

Arquivo do blog

Quem sou eu