Com mais de 10 mil artigos científicos retirados de circulação por causa de manipulação de dados, o ano de 2023 conquistou o vexatório recorde de maior número de retratações da história. Se por um lado é positiva a remoção de artigos fraudados, por outro é assustador constatar que um número expressivo de pesquisadores tente construir carreiras, reputações e patrimônios com desperdício de dinheiro público em pesquisa fraudada.
Nos Estados Unidos, o Office of Research Integrity, um órgão ligado ao National Institute of Health (NIH), tem entre suas atividades desenvolver políticas relacionadas à detecção, investigação e prevenção de má-conduta científica. No Brasil, embora não exista nenhum órgão governamental dessa natureza, é importante refletir sobre a eficiência de fazer buscas por artigos fraudados, assumindo uma postura ativa no lugar de uma reativa, feita a partir de alguma denúncia.
A identificação de fraudes não é um trabalho simples, e muitas vezes pode ser extremamente complexo: normalmente, o acesso aos dados brutos do experimento não está disponível – condição necessária para a reavaliação dos resultados e reprodução da análise estatística. No caso de artigos teóricos, com números provenientes de simulações ou algoritmos numéricos sofisticados, a reprodução dos resultados demandaria a reconstrução de programas complicados e até meses para a realização de cálculos computacionais.
É claro que tudo isso demanda tempo e dinheiro, fora o sem-número de especialistas que estariam dispostos a abdicar de suas próprias pesquisas somente para ficar reproduzindo resultados alheios. Esses motivos já seriam suficientes para se questionar a viabilidade da criação de um escritório de busca por fraudes em artigos científicos. É possível, porém, que a principal razão para não se investir em algo desse tipo seja o efeito real sobre a comunidade científica.
O método científico, com uma série de procedimentos que visam testar ad nauseam qualquer hipótese, blinda, de certa maneira, a comunidade científica de conclusões erradas: questionamentos e divergências na reprodução de resultados emergem naturalmente de especialistas. Conclusões vindas de fraudes ou de análises com erros grosseiros não sobrevivem muito tempo e simplesmente são ignoradas pelos bons cientistas. Basta ver, por exemplo, que o recente anúncio de supercondutividade a temperatura e pressão ambiente, publicado em um repositório de preprints, não durou nem um mês para cair em descrédito – foi publicado em 22 de julho de 2023 e em 16 de agosto já havia um texto na Nature apontando o erro no resultado (neste caso, não há suspeita de fraude).
Na direção oposta do exemplo acima, conclusões corretas, ainda que originadas, inicialmente, de supostas manipulações de resultados, podem acabar consolidadas se as alegações forem testadas e se mostrarem sólidas. Esta afirmação pode parecer paradoxal, mas está relacionada a um resultado seminal na área de genética: as ervilhas de Mendel.
Em 1866, o monge Gregor Mendel, o pai da genética moderna, publicou o artigo Experiments in Plant Hybridization. Mendel mostrou como as características biológicas são transmitidas através das gerações de ervilhas, fundamentando um conjunto de leis que hoje levam o seu nome. Porém, em 1936, Ronald Fisher, estatístico e biólogo britânico, apontou que era muito improvável que Mendel tivesse obtido as proporções estatísticas publicadas, pois elas se aproximavam demais do ideal teórico para serem verdadeiras.
A suspeita de que o estudo de Mendel poderia conter dados manipulados se arrastou por vários anos e hoje tem interesse apenas do ponto de vista histórico. Embora não seja aceita a hipótese de fraude científica, reconhece-se que houve um viés de confirmação para adaptar os resultados experimentais à previsão teórica – a verdadeira história poderia ser revelada pelos dados brutos, mas eles não estão mais disponíveis.
De maneira semelhante, Robert Millikan, ganhador do Prêmio Nobel de física de 1923 pelos trabalhos relacionados à carga do elétron e do efeito fotoelétrico, também teve o seu nome envolvido em alegações de má conduta científica. Assim como no caso de Mendel, aceita-se que houve pelo menos um viés de confirmação ao selecionar os dados que corroboravam os resultados previstos pelos modelos teóricos.
Não há dúvida de que pesquisadores que cometem fraudes científicas devem ser punidos com todo o rigor da lei e os artigos devem ser retratados – não se questiona isso. O que fica evidente, porém, com o exemplo de trabalhos seminais de Mendel e Millikan é que tanto a genética como a física progrediram independentemente da existência das fraudes e controvérsias dos resultados. Diferentes grupos de pesquisa, interessados na investigação das mesmas questões, acabam, no curso natural de seu trabalho, identificando e expondo os resultados inválidos uns dos outros – sejam erros honestos ou falcatruas – principalmente quando esses resultados parecem descrever avanços fundamentais.
Hoje, com a proliferação de revistas predatórias e o aumento do número de artigos publicados, o efeito prático seria limitado para se manter, a um custo elevado, um escritório de busca ativa por fraudes, checando resultados que talvez nem seriam levados em conta pela comunidade da área. É claro que as fraudes não são completamente inofensivas à sociedade e é preciso ter um comitê de ética que avalie as denúncias de má conduta científica, mas avaliar denúncias é bem diferente do que sair selecionando artigos aleatoriamente para tentar reproduzir dados.
O principal dano dos artigos falsos ou de má qualidade ocorre quando são utilizados como combustível para alimentar o debate político na arena pública, dando a impressão de que o consenso científico se dá de maneira democrática, com a simples contabilização de quantos artigos concordam com uma hipótese e quantos discordam: um caso recente disso aconteceu na pandemia, com a questão da hidroxicloroquina.
O ponto é que artigos de qualidade duvidosa nem sequer devem ser considerados numa análise séria: erros, mesmo se multiplicados, ainda são erros. Controvérsias científicas, quando de fato existirem, devem ser resolvidas pelos especialistas da área na Academia. Falsas equivalências, colocando no mesmo patamar bons e maus artigos, são catalisadas pelas redes sociais mas, muitas vezes, originam-se na imprensa profissional. Apesar da gritaria irracional das redes ser de difícil solução, uma boa parte dos problemas do debate público já seria reduzida se a mídia profissional olhasse as coisas de maneira mais crítica e menos superficial.
Regras e comitês de ética podem ter alguma influência no sentido de reduzir a quantidade de fraudadores, mas por uma questão lógica não se espera que contraventores se adequem a regras. Os motivos para arriscar-se a cometer plágio ou fraudar dados são complexos e as acusações podem envolver desde pesquisadores bem colocados em universidades de renome, como é o caso recente de Dan Ariely e Francesca Gino, a jovens pesquisadores em início de carreira.
Nas duas situações, mais na segunda do que na primeira, a promoção na carreira, condicionada a uma produtividade excessiva, deve ter alguma relevância na motivação para se cometer o ilícito. Neste caso, as agências de pesquisa e as universidades já dariam uma grande contribuição para coibir fraudes se parassem com as políticas que olham mais para a quantidade de artigos publicados do que para a qualidade.
Marcelo Takeshi Yamashita é assessor-chefe da Assessoria de Comunicação e Imprensa da Unesp. Foi diretor do Instituto de Física Teórica (IFT) no período de 2017 a 2021.
Publicado originalmente na revista Questão de Ciência.
Na imagem acima: pesquisador opera equipamento em laboratório (Crédito: DepositPhotos)