A Fundamental AI Research (FAIR) da Meta revelou diversas novidades de pesquisa nesta semana. Entre os novos recursos divulgados está uma marca d’água para detecção de áudio gerado por inteligência artificial (IA), modelos de geração de imagem para texto e de texto para música e modelo de previsão de múltiplos tokens.
Os lançamentos, divulgados no site oficial da Meta, fazem parte do trabalho contínuo da companhia para promover transparência. O AudioSeal é capaz de identificar segmentos de fala produzidos através de IA dentro de um áudio mais logo e serve como uma marca d’água, sendo mais rápido e eficiente do que métodos anteriores.
Já o chamado Meta Chameleon são alguns modelos que integram texto e imagens na entrada e na saída de comandos, eles usam tokenização para texto e imagens em vez de aprendizado com base em difusão, possibilitando uma abordagem mais unificada, facilitando o design, manutenção e escalabilidade dos modelos.
Por fim, a previsão de múltiplos tokens oferece uma abordagem moderna para desenvolver modelos amplos de linguagem (LLMs) com maior eficiência. A Meta também anunciou uma colaboração para lançar o conjunto de dados PRISM, que mapeia características sociodemográficas e preferências de participantes de 75 países,a fim de melhorar os LLMs, promovendo uma abordagem mais inclusiva para o design de tecnologia de IA.
Fonte: Estadão Conteúdo. Foto: Divulgação.