Todos os dias são publicados 95 milhões de fotos e vídeos no Instagram; a cada cinco segundos surge um novo perfil no Facebook; a cada hora são feitos mais de 300 milhões de pesquisas no Google; segundo dados levantados pela Cisco, mais de 5 bilhões de pessoas têm acesso à internet no mundo inteiro; usuários que rotineiramente criam e compartilham informações, aumentando o conteúdo armazenado nos data centers. Seja nas redes sociais, nos bancos de dados virtuais, nos portais de notícias ou na bolsa de valores, é inegável o fluxo crescente de informações que têm atingido as mais diversas esferas da sociedade.
O campo científico não fica fora dessa realidade. A astronomia, assim como muitas outras áreas, tem enfrentado um tsunami de informações que, cada vez mais, demandam novas metodologias e técnicas de análise para permitir que o desenvolvimento científico continue em curso. Grandes empreitadas como o telescópio James Webb, enviado para o espaço para coletar dados sobre a formação de estrelas e galáxias, e o Event Horizon Telescope que, em 2019, divulgou a primeira foto de um buraco negro, são alguns exemplos de iniciativas científicas que geram uma quantidade enorme de dados e que demandam a aplicação de técnicas para além da análise humana.
Para aproveitar essas informações ao máximo e lidar com as próximas investidas tecnológicas, pesquisadores de áreas como física, engenharias e astronomia dependem cada vez mais do uso de Inteligência Artificial e de Machine Learning. No campo da astronomia, as técnicas computacionais têm proporcionado progressos significativos na última década, especialmente nas áreas que estudam a formação e evolução das galáxias. Entretanto, outras subáreas do campo se beneficiaram menos das novas ferramentas, pelo menos até agora. É o caso dos chamados corpos menores do sistema solar, como os asteroides, cometas e meteoros.
Buscando suprir essa lacuna, o grupo de pesquisa Machine Learning Applied to Small Bodies (MASB), da Unesp, se dedica a desenvolver algoritmos de uso aberto. “Essa é uma área relativamente nova, os primeiros artigos datam de 2019”, comenta Valerio Carruba, professor da Faculdade de Engenharia e Ciências da Unesp, campus Guaratinguetá. “Estamos no mesmo ponto em que os estudiosos de galáxias estavam cinco ou seis anos atrás, começando a identificar quais são os algoritmos disponíveis, quais as possibilidades e como utilizar modelos melhores para resolver problemas antigos.”
Desde 2019, o MASB, que é coordenado por Carruba, tem se dedicado a investigar o uso dessas ferramentas, e o volume de produção científica que apresentaram desde então resultou em um convite, por parte da editora científica Elsevier, para organizar o primeiro livro que terá como foco o uso de Machine Learning aplicado a objetos menores do sistema solar. A obra trará artigos de pesquisadores de outros dez países e está prevista para ser publicada no final deste ano. Dividido em onze capítulos, o livro irá cobrir o que há de mais recente no campo, passando por temas como identificação de famílias de asteroides, interação de asteroides com ressonâncias seculares e objetos do cinturão de Kuiper.
A era da big data na astronomia
A categoria dos corpos menores inclui objetos como asteroides, cometas e meteoros. São pedaços de rocha, gelo e metal remanescentes da formação do Sistema Solar, há 4,6 bilhões de anos, o que os torna uma espécie de “fósseis” astronômicos. Ainda que o estudo destes objetos receba menos atenção, dentro e fora da academia, do que áreas como buracos negros, ondas gravitacionais e galáxias, seu estudo é essencial para compreender a história e os processos que levaram à formação da nossa vizinhança espacial.
Segundo dados da Nasa, hoje são conhecidos cerca de 1,4 milhão de asteroides e mais de 3.900 cometas. A maioria deles se concentra em três regiões: o Cinturão de Asteroides, situado entre as órbitas de Marte e Júpiter; o Cinturão de Kuiper, uma região localizada depois de Netuno; e a Nuvem de Oort, um grande agrupamento de objetos que envolve o Sistema Solar.
Os pesquisadores da área, entretanto, estão se preparando para uma enxurrada de novas informações que serão obtidas com o começo da operação do telescópio do Observatório Vera C. Rubin (chamado anteriormente de Large Synoptic Survey Telescope, LSST), previsto para 2025. A perspectiva é que o novo telescópio possa identificar em torno de cem mil novos objetos a cada noite de observações, resultando na descoberta de milhões de novos corpos dentro do Sistema Solar. “Será uma revolução na astronomia. Temos de desenvolver métodos de big data para lidar com esse fluxo de dados que virá”, diz Carruba.
Uma das frentes do grupo coordenado por Carruba envolve a identificação de famílias de asteroides. Considera-se que asteroides integram uma mesma família quando apresentam características orbitais semelhantes, como a extensão da órbita, seu achatamento e a inclinação do plano orbital. Objetos que se formaram a partir de uma mesma colisão tendem a apresentar semelhanças nesses aspectos. No entanto, essas características tendem a se alterar com o passar do tempo por conta das influências gravitacionais e não gravitacionais que afetam a órbita desses corpos, e isso dificulta o processo de reconhecimento das famílias originais. Entretanto, alguns asteroides interagem com o que se chama de ressonâncias seculares. Esse fenômeno ocorre quando os períodos das órbitas de asteroides e planetas se alinham de maneira específica, fazendo com que certas características permaneçam constantes ao longo do tempo. Isso permite obter informações únicas sobre a história orbital e os padrões podem ser utilizados para encontrar famílias.
Uma das maneiras de identificar os objetos em ressonância secular é comparando gráficos que indiquem, por exemplo, qual foi a influência gravitacional de um planeta na órbita do asteroide. Anteriormente, todo o processo de análise era feito manualmente, com estudantes e pesquisadores comparando visualmente imagens e identificando possíveis objetos ressonantes. Entretanto, o aumento dos dados tornou a tarefa impossível. “Isso era viável quando havia centenas de argumentos de ressonância. Agora, trabalhamos com dezenas de milhares. Ninguém merece ficar semana após semana olhando e comparando todos esses gráficos”, diz Carruba.
Diante do desafio representado pelo dilúvio de dados, e incentivados pela lacuna de ferramentas específicas para o campo, o grupo passou a desenvolver algoritmos capazes de identificar padrões nas imagens automaticamente. Os algoritmos aceleraram o processo de pesquisa e permitiram que o grupo identificasse milhares de objetos em várias ressonâncias seculares, incluindo as primeiras quatro famílias de asteroides jovens.
Aprendizado de máquina é a aposta da astronomia
Enquanto a Inteligência Artificial tem como foco emular o discernimento humano, o Machine Learning (ou aprendizado de máquina) é um termo guarda-chuva utilizado para o estudo e o desenvolvimento de algoritmos que podem aprender a partir de dados, sem que necessariamente se limitem a replicar a lógica que encadeia nosso raciocínio.
Na pesquisa em corpos menores são usados dois métodos de aprendizado de máquina principais. O primeiro, chamado de “aprendizado não supervisionado”, envolve o envio de dados não categorizados, como os já citados gráficos de ressonância, sem necessariamente indicar anteriormente a quais famílias esses gráficos devem ser atribuídos. Desta forma, a máquina desenvolve seus próprios mecanismos de agrupamento automático, com base nos padrões que identifica, e devolve aos pesquisadores sugestões de categorias.
Outro método é o chamado aprendizado “supervisionado”. Neste caso, o grupo de pesquisa trabalha com categorias específicas, que são informadas para a máquina. Ela, então, deve encontrar padrões nos dados que recebe, e distribuí-los nas categorias pré-estabelecidas.
Rita de Cassia Domingos, integrante do MASB e docente da Faculdade de Engenharia da Unesp, campus São João da Boa Vista, explica que cada método tem aplicações distintas e cabe ao grupo decidir qual utilizar com base nos objetivos da pesquisa. Enquanto o primeiro é eficiente para identificar novas famílias de asteroides, por exemplo, o segundo é extremamente efetivo para conseguir agrupar os objetos celestes em famílias e conjuntos já conhecidos.
Além do agrupamento e descoberta de novas famílias, alguns grupos de pesquisa têm empregado o aprendizado de máquina para identificar as propriedades físicas de um grande número de asteroides e conseguir determinar sua composição com maior precisão em menos tempo. Também tem sido possível identificar e localizar asteroides em fotografias obtidas por observatórios e telescópios com 99% de precisão e um tempo de processamento praticamente instantâneo, o que levou à primeira descoberta de um asteroide com o auxílio de Inteligência Artificial em 2020.
Além disso, Carruba comenta que o uso de inteligências artificiais generativas, como é o caso do ChatGPT, também está sendo explorado para aperfeiçoar a pesquisa de corpos menores no Sistema Solar. Evgeny A Smirnov, um dos colaboradores internacionais com quem Carruba trabalha, demonstrou como o modelo gpt-4-vision-preview é capaz de analisar padrões visuais e classificar com precisão diferentes tipos de asteroides em ressonância. Segundo o pesquisador, que irá escrever um dos capítulos do livro organizado por Carruba, uma das vantagens de utilizar essas ferramentas é que elas não demandam treinamento prévio ou ajustes finos na codificação: a maior parte do trabalho se concentra em escrever os comandos apropriados para obter os resultados desejados.
Hoje, trabalhos que demandavam semanas e até mesmo meses de dedicação podem ser feitos em questão de algumas horas, sem equipamentos extremamente caros ou sofisticados, como afirma Domingos. Esse desenvolvimento tem preparado o campo da astronomia para os próximos anos, que será protagonizado por uma explosão de novos dados em todas as áreas. Se bem analisadas, as novas informações permitirão desvendar alguns dos mistérios que ainda desafiam os pesquisadores, o que inclui a história da formação dos planetas e do Sistema Solar. Com progressos rápidos, entretanto, é difícil prever para onde a ciência caminhará e essa é uma das qualidades apontadas por Carruba: “O que vem depois, não sabemos. Isso é o bom desse campo. Vários algoritmos estão sendo desenvolvidos, muitas coisas estão sendo feitas na área e estamos identificando muitos problemas que podem ser simplificados com o uso de aprendizado de máquina”, diz.
Imagem acima: representação artística do Cinturão de Kuiper, localizado em uma região após Netuno, a uma distância equivalente a 50 Unidades Astronômicas (ou 149.597.871 km). Enquanto o cinturão de asteroides é composto principalmente por objetos rochosos e metálicos, no cinturão de Kuiper os corpos são blocos congelados de metano, amônia e água. Crédito: ESO/M. Kornmesser.