Novo sistema de IA usa dados clínicos e resultados de testes para identificar casos de câncer de próstata que apresentem risco significativo à saúde

Modelo preditivo foi alimentado com dados de pacientes de três países, e alcançou índice de acerto de 85% em testes. Inovação poderá auxiliar médicos na tomada de decisão sobre a realização de exames de biópsia, diminuindo a realização de procedimentos invasivos e desconfortáveis.

O câncer de próstata é o segundo mais comum em homens, e estima-se que 1,5 milhão indivíduos foram diagnosticados em todo o planeta somente em 2022. Nos EUA, levantamento da Sociedade Americana de Câncer indica que 1 a cada 8 homens recebe um diagnóstico deste tipo em algum momento da vida. No Brasil, o Instituto Nacional de Câncer estima que, entre 2023 e 2025, serão diagnosticados 72 mil novos casos, o que o torna o segundo tipo mais comum em nosso país, atrás apenas do câncer de pele não melanoma. Entretanto, embora o câncer de próstata possa resultar na morte do doente, nem sempre sua ocorrência implica risco à vida. Caso seu desenvolvimento decorra de forma muito lenta, a ameaça é menor.

Hoje, o meio principal empregado para determinar se um câncer é clinicamente significativo, ou seja, se apresenta riscos ao paciente, envolve o uso de biópsias. No caso da próstata, são duas as possibilidades: a biópsia transretal, na qual uma agulha ultrapassa o reto e alcança a próstata, e a transperineal, em que o material é coletado por meio da inserção de uma agulha no períneo do paciente. Ainda que o segundo método apresente menos complicações do que o primeiro, ambos os procedimentos são invasivos e desconfortáveis e a decisão de recorrer a eles deve ser embasada por uma avaliação criteriosa.

“O ideal seria conseguir determinar se a biópsia é realmente necessária antes mesmo que o procedimento fosse realizado, de forma a limitar os exames apenas aos pacientes com alta probabilidade de apresentar um câncer agressivo”, diz Flávio Vasconcelos Ordones, urologista do Hospital Público de Tauranga, na Nova Zelândia.

Mirando essas condições ideais, Ordones e pesquisadores do Hospital das Clínicas da Faculdade de Medicina de Botucatu da Unesp (HCFMB) desenvolveram um modelo de aprendizado de máquina capaz de estimar a probabilidade de que um paciente venha a apresentar um câncer de próstata clinicamente significativo.

“A biópsia é um procedimento agressivo. A ideia é que o modelo auxilie o médico na tomada de decisão de realizar ou não esse procedimento”, diz Luís Gustavo Modelli de Andrade, coordenador do Laboratório de Ciência de Dados e Análise Preditiva em Saúde do HCFMB (LabData). “Queremos fazer uma medicina personalizada, na qual se ofereça a biópsia  ao paciente certo e se evite a realização do procedimento em indivíduos com um câncer de baixo risco”, completa Ordones, que teve sua formação e residência no HCFMB. O resultado foi divulgado no artigo A Novel Machine Learning-Based Predictive Model of Clinically Significant Prostate Cancer and Online Risk Calculator, publicado na revista científica Urology.

É preciso considerar a diversidade de pacientes

Atualmente, a decisão de realizar ou não a biópsia em um paciente é tomada exclusivamente com base em análises clínicas. Entre os principais métodos está a análise dos níveis de antígeno prostático específico (PSA), obtidos por meio de exames de sangue. Porém, ainda que o aumento de PSA no organismo possa indicar um tumor em desenvolvimento, também é uma decorrência natural do avanço da idade, o que o torna um método pouco preciso. Outros recursos empregados para identificar e classificar o câncer de próstata incluem o exame de toque retal e exames de ressonância magnética.

Embora tais métodos sejam bastante utilizados isoladamente, eles carecem de maior precisão, e o resultado é que pacientes muitas vezes são submetidos a biópsias desnecessariamente. Além do incômodo para a pessoa, a realização do procedimento também resulta em uma série de gastos extras. Assim, Modelli e Ordones desenvolveram um modelo que combina o resultado dos exames clínicos com informações pessoais do paciente para estimar a probabilidade de que ele venha a apresentar um câncer clinicamente significativo.

Para criar o sistema, Ordones coletou dados de pacientes submetidos entre 2022 e 2024 à biópsia transperineal, um modelo mais moderno e preciso do exame, em três locais diferentes: o Hospital de Tauranga, na Nova Zelândia, o Hospital de Saint Andrews, na Austrália, e o Hospital Universitário de Zurique, na Suíça. Ao todo, foram coletadas informações de 1.272 pacientes.

Ordones destaca que a quantidade de pacientes e o fato de possuírem origens distintas são elementos que diferenciam o novo modelo de outros propostos anteriormente. Para o médico, tais características são essenciais no desenvolvimento de qualquer modelo que se proponha a fazer previsões sobre doenças, pois asseguram uma maior probabilidade de que o sistema funcione bem com qualquer população, e não apenas com grupos de pessoas específicas.

“A maioria dos modelos preditivos baseia-se em uma população única e pouco diversa. Isso dificulta sua utilização com uma população mais geral, porque diferentes pessoas apresentam graus de risco diversos. Sabemos, por exemplo, que pessoas negras tendem a ser mais vulneráveis a esse tipo de câncer. O mesmo ocorre na Nova Zelândia, com a população de maoris”, aponta o urologista.

Como treinar um sistema

O grupo usou os dados obtidos ao longo de dois anos para treinar o modelo de aprendizado de máquina. Isso envolveu a partir da inserção, no sistema, dos dados — como, por exemplo, o resultado de uma biópsia — seguida da indicação ao algoritmo quanto ao significado daquele dado. Essa abordagem permite que o modelo comece a entender e, posteriormente, a descobrir padrões ainda não identificados no material que é inserido. Com estes padrões, ele se torna capaz de identificar sozinho quais informações podem indicar ou não a presença de um câncer.

Modelli destaca que a etapa de treino é uma das mais importantes quando se fala de aprendizado de máquina, porque é nesse momento que o sistema irá, efetivamente, “aprender”. Para que esse aprendizado se mostre efetivo, e o modelo alcance uma boa precisão, é preciso proporcionar-lhe acesso a grande quantidade de dados de treino. Por isso, dentre os dados dos 1.272 pacientes utilizados no estudo, as informações de cerca de 1.000 deles foram reservadas para a etapa de treino. Isso correspondeu a aproximadamente 80% dos dados coletados.

Uma vez concluída a etapa de aprendizagem, o passo seguinte foi a validação dos resultados, no qual foram utilizados os dados dos cerca de 20% dos pacientes restantes. É nesta etapa que se mostra que as análises do sistema funcionam mesmo que se usem dados de fora do grupo de treino. Os resultados mostraram uma acurácia acima do esperado.

“Para medir a eficiência de um modelo, costumamos usar uma ferramenta chamada de curva ROC”, explica Modelli. Trata-se de uma análise estatística que serve para medir o desempenho de um sistema. “Quanto mais próximo de 1,0 for valor atribuído aos resultados apresentados, melhor é o funcionamento do sistema”, diz.

Porém, nem sempre os sistemas em desenvolvimento alcançam valores altos. “Nos trabalhos desenvolvidos pelo LabData, o mais comum é que os sistemas que desenvolvemos cheguem em 0,7 por exemplo. Esse é um valor aceitável, mas o ideal é que seja maior ainda”, diz Modelli. No caso do modelo desenvolvido para a previsão de câncer de próstata, o grupo conseguiu chegar a valores de até 0,85, uma métrica considerada muito positiva pelos pesquisadores.

O novo sistema também foi submetido a uma etapa de uma validação externa, em que analisou dados obtidos de outros centros de pesquisa. Estes dados adicionais vieram do banco de informações de pacientes da Espanha, e diziam respeito a indivíduos submetidos a outro tipo de biópsia, a transretal. “Para mim, o fato de o modelo ter funcionado bem tanto em biópsias transperineais como em transretais  é uma evidência de que ele permite generalização. Ou seja, independentemente do tipo de procedimento realizado, ele é capaz de entregar um bom grau de acurácia na previsão”, afirma Ordones.

Biópsias se modernizaram

O urologista explica que o modo como se conduzem as biópsias vem sofrendo mudanças desde 2017. A partir daquele ano, organizações como a Associação Europeia de Urologia (EAU) e Associação Americana de Urologia (AUA) passaram a recomendar o uso de biópsias transperineais. Apesar dos incentivos, ainda hoje, o tipo de exame mais comum é a biópsia transretal. Nele, uma agulha perfura a parede do reto e entra na próstata, para realizar a coleta de pequenos fragmentos de tecido. O processo é repetido em torno de 10 a 12 vezes, para conseguir um número suficiente de amostras.

Além de dolorido, Ordones diz que o método envolve diversos riscos. Entre eles, o contato da agulha com restos de fezes no reto pode levar à contaminação e resultar em infecções. Segundo um estudo que analisou 75.000 pacientes canadenses que passaram por biópsia transretal, cerca de 1.500 foram internados após o exame. A causa mais comum para a internação foi a infecção decorrente da biópsia.

Já a biópsia transperineal apresenta menos riscos. O fato de que a próstata é alcançada por uma agulha inserida pelo períneo evita a contaminação. “Antigamente, uma das principais críticas era que a biópsia transperineal exigia um centro cirúrgico e anestesia geral. Hoje já pode ser feita em clínicas, e com uso de anestesia local”, diz Ordones, que nos últimos anos têm coordenado o projeto que promoveu a transição das biópsias das salas de cirurgia para dentro das clínicas.

Entretanto, independentemente da possibilidade de acesso a um ou outro tipo de procedimento, permanece como objetivo principal dos médicos que atuam na área a não realização de biópsias desnecessárias em pacientes que não apresentem um câncer agressivo. É por isso que Ordones e Modelli têm a expectativa de que o novo modelo se mostre robusto o suficiente para, em algum momento, ter o seu uso recomendado por associações como a EAU e a AUA.

Para dar início a esta jornada, o grupo de pesquisadores disponibilizou o calculador do modelo, que já pode ser utilizado por qualquer usuário. Para os profissionais da saúde que queiram utilizar a ferramenta, basta preencher os campos com as informações do paciente para que o modelo mostre a probabilidade de que ele apresente um câncer de próstata clinicamente significativo. “Desenvolvemos o calculador para incentivar o uso do nosso modelo, e assim evitar que fique restrito apenas à publicação do artigo”, diz  Modelli.

Imagem acima: foto mostra células de tumor de próstata do lado esquerdo, e células normais do lado direito. Crédito: National Cancer Institute.