Pesquisadores estão utilizando modelos de inteligência artificial para decodificar a linguagem dos cães. A pesquisa, conduzida pela Universidade de Michigan, o Instituto Nacional de Astrofísica do México e o Instituto de Óptica e Eletrônica, apresentou resultados promissores em uma conferência internacional. Nesse sentido, eles mostram que modelos de inteligência artificial modernos podem ser a chave para compreender, ao menos em parte, as linguagens dos animais.
Modelos de IA treinados em latidos e fala humana
O estudo emprega um modelo de reconhecimento de fala de última geração, o Wav2Vec2, para identificar a emoção, raça e gênero de um cão a partir de seus latidos. Para isso, foram usados duas variações do modelo para treinamento: um modelo treinado do zero, apenas com latidos de cães; e outro, pré-treinado com quase 1.000 horas de gravações de fala humana e posteriormente ajustado para identificar latidos.
O conjunto de áudios de latidos utilizados consistiu em gravações de 74 cachorros, cujos sons foram capturados em Tepic e Puebla, no México, nas casas dos donos dos cães. Cada áudio foi o resultado das vocalizações dos cachorros quando estimulados em situações de stress, raiva, brincadeira e outras.
LEIA MAIS: Novidade no WhatsApp: áudios serão convertidos em texto automaticamente
O estudo descobriu que o modelo pré-treinado com fala humana obteve melhores resultados, o que mostra que potencialmente padrões derivados da fala humana podem ajudar a entender os sons dos animais.
Resultados da pesquisa
Como dito anteriormente, os pesquisadores utilizaram vocalizações de 74 cães para treinar o modelo, dentre os quais estavam Chihuahuas, Poodles e Schnauzers. O modelo treinado com fala humana e latidos foi capaz de identificar a emoção dos cães com 60.18% de precisão (contra 58,45% do outro modelo), a raça com 62,28% (contra 60,18% do outro modelo), e identificar um cão específico em 49,95% dos casos (contra 23,74% do outro modelo).
Já quanto à identificação do gênero do animal, o modelo treinado do zero apresentou resultados ligeiramente superiores (com 70,07% de acurácia) àquele pré-treinado com vezes humanas (que obteve 68,9% de acurácia).
Deste modo, os resultados do modelo treinado em vozes humanas, em sua maior parte, superaram os obtidos pelo modelo treinado apenas com latidos, indicando que modelos pré-treinados com base em fala humana podem ter boas respostas nesse tipo de análise.
LEIA MAIS: Físicos do Reino Unido e Suíça criam labirinto mais difícil do mundo
Futuro da pesquisa com IA e linguagem animal
Os pesquisadores planejam expandir os testes para mais raças, emoções e espécies, visando compreender o alcance desta tecnologia. Afinal, embora o estudo não decifre completamente o significado de todos os latidos, é visto como um passo promissor nessa direção. Além disso, esta é a primeira vez que modelos de fala humana são usados para decodificar comunicações animais.