Novo sistema de inteligência artificial, capaz de recortar objetos em imagens com alta precisão, é premiado em evento internacional de computação

Possibilidades de aplicação variam das áreas de saúde e de sensoriamento remoto até agricultura e fotografias turísticas. Estudo de pesquisadores da Unesp foi premiado como melhor artigo em conferência que recebeu mais de 1.100 trabalhos científicos.

Combinando diferentes técnicas computacionais, pesquisadores da Unesp desenvolveram um novo sistema de inteligência artificial capaz de atuar com grande precisão para segmentar e recortar objetos no interior de imagens. A inovação foi premiada na categoria “best paper” ( “melhor artigo”) na 23ª Conferência Internacional de Ciências da Computação e suas Aplicações, realizada em julho deste ano na cidade de Atenas, na Grécia. 

O artigo apresentado, intitulado Robust Seeded Image Segmentation using Adaptive Label Propagation and Deep Learning-Based Contour Orientation, foi resultado dos primeiros desenvolvimentos do doutorado de Aldimir José Bruzadin, estudante do Programa de Pós-Graduação em Matemática, do Instituto de Biociências, Letras e Ciências Exatas (Ibilce) da Unesp, campus São José do Rio Preto. Bruzadin explica que durante seu período de mestrado, cursado na mesma instituição, desenvolveu uma inteligência artificial capaz de segmentar imagens de tomografias, facilitando o diagnóstico de pacientes com Covid-19 a partir da análise das imagens. A nova ferramenta é uma extensão desse trabalho anterior.

A segmentação nada mais é do que o processo de recorte, em uma imagem, de objetos que sejam considerados como de interesse. Esse recurso permite excluir da composição seu fundo, ou quaisquer outros elementos que não se queira mostrar. “Esse é um passo essencial na caracterização de imagens. Por exemplo, se você quer que um algoritmo analise uma tomografia de um pulmão e classifique se o paciente está ou não com Covid-19 é preciso que, antes, essa tomografia passe pelo processo de segmentação, de recorte dos objetos de interesse, que, no caso, são os pulmões”, explica Bruzadin. Essa premissa vale não apenas para imagens médicas, mas para qualquer tipo de fotografia que se deseja analisar, independentemente de terem sido produzidas para fins de mapeamento de regiões de desmatamento, controle da qualidade de culturas na agricultura, reconhecimento facial etc.

Conscientes da amplitude do uso da segmentação, ao entrar no doutorado, Bruzadin, juntamente com seu orientador Wallace Casaca, docente do Departamento de Ciências de Computação e Estatística da Unesp, decidiram extrapolar os limites da área médica e desenvolver uma inteligência artificial capaz de manipular qualquer tipo de imagem, apelidadas pelos pesquisadores de “imagens do mundo real”. O doutorando comenta que esse é um grande diferencial do trabalho. “Em geral, os algoritmos são criados de maneira muito focada: aqueles que performam bem na área médica não funcionam com a mesma qualidade em análises de sensoriamento remoto, por exemplo. E, mesmo em uma única área, a qualidade cai. Um algoritmo criado para a análise de pulmão não vai trabalhar bem com a foto de um fígado”, diz. Já o novo sistema de IA conseguiu apresentar alta performance na segmentação da imagem independentemente do tipo de fotografia submetida a ele. Tanto na imagem de um pulmão como de um automóvel, a qualidade de recorte dos objetos de interesse foi igual, e bastante satisfatória.

Interface simplificada expande perfil de usuários

A técnica foi desenvolvida de maneira a tornar seu uso o mais automatizado possível. São necessários poucos cliques em uma fotografia para que o usuário possa selecionar seus alvos de interesse, indicando o que deseja destacar e o que quer excluir. “Chamamos esse tipo de segmentação de ‘semi-supervisionada’, porque a pessoa fornece algumas dicas do que almeja segmentar dentro da imagem,. Isso exige um sistema de fácil manuseio, que possa ser utilizado por qualquer tipo de usuário”, conta Casaca, orientador do projeto.

Assim, a inteligência artificial é alimentada com duas imagens: uma original e outra com pontos nos objetos desejados, chamados de sementes. Inicia-se então o processo de recorte. As informações inseridas passam por uma rede neural artificial responsável por mapear a imagem e evidenciar seus contornos, tanto aqueles mais definidos, chamados de “contornos fortes”, quanto os mais imprecisos, denominados “contornos fracos”. Com o mapeamento feito, é realizada a seleção do objeto de interesse e a exclusão de todas as outras partes da fotografia, consideradas dispensáveis.

O alto grau de precisão foi alcançado a partir do treinamento da inteligência artificial com mais de duzentas imagens, obtidas a partir de bases de dados que já continham o melhor recorte esperado. O programa, então, aprende com outros exemplos já segmentados e tenta imitar os resultados fornecidos. Assim, cada vez que o sistema era executado de forma experimental, os pesquisadores comparavam o resultado obtido com aquele considerado ideal, apontavam para a máquina os erros e realizavam novamente o processamento da imagem. Após essa etapa de aprendizado de máquina, os próximos usuários podem inserir novas fotografias e apontar os objetos que desejam segmentar e, a partir disso, o programa recuperará os aprendizados para aplicar na nova imagem fornecida.

Casaca destaca que, no futuro, o grupo tem como objetivo aplicar a metodologia já desenvolvida para a criação de um aplicativo de celular, que permita a qualquer pessoa fazer segmentações de maneira simples. “Existem muitas aplicações que podem derivar da segmentação. Uma delas, por exemplo, é criar um sistema que permita recortar uma pessoa indesejada em uma foto, uma situação que acontece muito em lugares turísticos. Com a técnica vai ser possível segmentar o alvo evitando o esforço de contornar o objeto manualmente”, explica.

Para Bruzadin, o mais interessante será ver quais são as diferentes aplicações que podem emergir da utilização da técnica em imagens do cotidiano. “Ela pode ser utilizada, por exemplo, para identificação de colheitas. A partir do recorte das imagens, vai ser possível aplicar técnicas de análise que irão apontar se a colheita está saudável ou se está fraca”, diz. “O que nos empolga, ao ver que a IA funciona bem com qualquer imagem, é a possibilidade de uni-la com outros trabalhos e ver até onde consegue ir.”

Evento reuniu pesquisadores de 56 países

Casaca e Marilaine Colnago, docente do Instituto de Química da Unesp, campus Araraquara, e uma das autoras do artigo, foram os representantes do trabalho no ICCSA 2023. O evento é um dos mais importantes do campo de ciências da computação, reunindo pesquisadores do mundo inteiro com o objetivo de debater técnicas, metodologias, ferramentas e novas tendências na área.

Neste ano, o evento recebeu um total de 1.132 trabalhos científicos, com contribuições de 56 países diferentes. A pesquisa da Unesp foi submetida para a sessão principal do evento, chamada de “main track”, juntamente com outros 262 trabalhos Apenas 30% de submissões foram aprovadas pela revisão por pares para serem apresentadas nos dias do evento. Dentre os selecionados para esta categoria, o trabalho da Unesp foi a única contribuição brasileira premiada.

“Receber essa premiação foi muito gratificante. Isso mostra que temos trabalhado de forma árdua e no caminho certo, buscando inovar e avançar na literatura”, diz Casaca. O docente ressalta que o trabalho é realizado inteiramente por pesquisadores da Unesp e de maneira multidisciplinar, reunindo visões e expertises de diferentes áreas como estatística, computação e sensoriamento remoto. Além dos pesquisadores já citados, também participou do artigo Rogério Galante Negri, do Departamento de Engenharia Ambiental da Unesp, campus de São José dos Campos. “Essas premiações demonstram que a Unesp tem feito um trabalho primordial de elevar sua qualidade técnica nos projetos em desenvolvimento na universidade. Isso permite a realização de trabalhos competitivos e que estão no mesmo nível de outros grupos muito agressivos do exterior, do ponto de vista de qualidade da produção científica”, diz.

Imagem acima: imagem original e objeto recortado através do uso do novo sistema. Crédito: divulgação.