Inteligências artificiais são excelentes em diversas tarefas – principalmente aquelas que envolvem coisas repetitivas e que envolvem encontrar padrões. Então, IAs são confiáveis para identificar espécies?
Em 2023, uma equipe de cientistas publicou no periódico Methods in Ecology and Evolution um artigo onde treinaram um modelo de IA (inteligência artificial) para classificar mais de mil espécies de insetos.
Os sistemas de inteligência artificial são excelentes em realizar tarefas chatas e repetitivas – e classificar espécies envolve repetição e busca de padrões. Portanto, IAs podem, em teoria, ser excelentes nesse tipo de tarefa.
“A classificação de espécies de insetos envolve um processo tedioso de identificação de caracteres morfológicos distintos de insetos por especialistas taxonômicos. O aprendizado de máquina pode aproveitar o poder dos computadores para potencialmente criar um método preciso e eficiente para executar essa tarefa em escala, dado que seu processamento analítico pode ser mais sensível a diferenças físicas sutis em insetos, que os especialistas podem não perceber”, diz o abstrato do artigo.
Entretanto, sistemas de inteligência artificial e machine learning dependem de um banco de dados concreto e padrões para se basear. Caso isso não exista, elas podem falhar miseravelmente em coisas simples.
“No entanto, os métodos de aprendizado de máquina existentes são projetados para classificar apenas amostras de insetos em espécies descritas, falhando assim em identificar amostras de espécies não descritas”, diz o artigo.
IAs são confiáveis para identificar espécies?
Os cientistas treinaram a IA para classificar 1040 espécies de insetos. Os dados fornecidos para o modelo eram compostos de imagens e dados de DNA dos animais. Com alguns dados ocultados, os cientistas podiam controlar o que a IA sabia ou não sabia sobre cada espécie.
Dessa maneira, os pesquisadores obtiveram alguns resultados interessantes. IAs são confiáveis para identificar espécies?
Para as espécies conhecidas, o modelo obteve uma taxa de acertos de 96,66%.
Quando foi pedido que atribuísse espécies com identidades ocultas aos gênero correto, os cientistas obtiveram uma taxa de sucesso de 81,39%. Entretanto, essa taxa de acertos caiu significativamente quando os pesquisadores retiraram um dado importante – os dados de DNA. Nesse caso, a precisão foi de apenas 39,11% para espécies conhecidas de 35,88 para espécies desconhecidas.
Os pesquisadores dizem que essa alta taxa de fracasso pode ser por causa da falta de imagens com boa resolução.
“Algumas dessas fotos eram realmente muito ruins, então não posso acreditar que o modelo se saiu tão bem quanto fez com esses dados”, disse do Live Science Christine Picard, que é professora de biologia da Universidade de Indiana, nos Estados Unidos.
“Ao contrário dos métodos atuais de aprendizado de máquina, a abordagem de aprendizado bayesiano hierárquico profundo proposta pode classificar simultaneamente amostras de espécies descritas e não descritas, uma funcionalidade que pode se tornar fundamental no monitoramento da biodiversidade em todo o mundo. Esta estrutura pode ser personalizada para qualquer problema de classificação taxonômica para o qual dados de imagem e DNA podem ser obtidos, tornando-a relevante para uso em todos os reinos biológicos”, diz o estudo.
Entres as limitações do modelo, a principal citada pelos pesquisadores no artigo foi em relação a insetos que passam por grandes mudanças morfológicas durante seu ciclo de vida (ovos, larvas e pupas), tomando outra forma completamente diferente após a maturidade.
Agora, os cientistas estão tentando melhorar o modelo: “Também estamos investigando o uso de imagens em conjunto com o conjunto de dados de caracteres morfológicos presentes em cada imagem para ver se os modelos de aprendizado de máquina e aprendizado profundo podem aprender a identificar e nomear características de granulação fina em novas amostras de imagem, que não têm dados morfológicos como ponto de partida para traduzir características profundas para descritores semânticos”.
“Os métodos de aprendizado de máquina e profundo estão em constante evolução, e a esperança é que a apresentação dessa metodologia destaque a promessa desses métodos para lidar com a identificação de insetos e além”, diz a equipe.