Gemini, plataforma do Google, agora pode gerar músicas com IA
Lyria 3 permite que usuários criem canções inéditas a partir de descrições em texto, vídeo ou imagem, mas há preocupações sobre como o modelo foi treinado
Na última quarta, 18, o Google anunciou um novo modelo do Gemini que permite gerar músicas através de Inteligência Artificial. Com a Lyria 3, usuários podem criar faixas originais de 30 segundos, incluindo instrumentais, arranjos, vocais e letras em 8 línguas diferentes — português, inglês, alemão, espanhol, francês, hindi, japonês e coreano.
Você pode descrever o estilo, ritmo e humor desejados e receber uma música pronta, ou enviar uma foto ou vídeo para que o Gemini analise o conteúdo e crie uma trilha sonora que combine com a imagem. Depois, é possível "ajustar os detalhes". O sistema também gera artes de capa personalizadas para a canção, utilizando a ferramenta Nano Banana.
Descrita pelo Google como o "modelo de geração de música mais avançado até o momento", a ferramenta tem o objetivo de ajudar as pessoas a "se expressarem, explorarem e experimentarem com música de alta fidelidade, usando comandos para criar faixas com fluxo natural de nota para nota". Segundo a empresa, a Lyria 3 foi desenvolvida com a "colaboração de produtores e músicos, para que ela compreenda a musicalidade".
As músicas geradas pelo Gemini possuem o SynthID, uma marca d'água invisível que identifica a faixa como sintética. O recurso está sendo disponibilizado globalmente para usuários acima de 18 anos.
"Também estamos oferecendo mais ferramentas para ajudar a identificar conteúdo de IA, ampliando nossos recursos de verificação para incluir áudio", escreveu o Google. "Basta fazer o upload de um arquivo e perguntar se ele foi gerado usando o Google AI, e o Gemini verificará o SynthID e usará seu próprio raciocínio para retornar uma resposta."
O recurso já está disponível para todos na versão para desktop e será disponibilizado no aplicativo do Gemini em breve. Assinantes dos planos Google AI Plus, Pro e Ultra terão limites mais altos de solicitações.
A segurança do modelo
Em relação à segurança do modelo, o Google afirma que está trabalhando diretamente com artistas para coletar feedback e definir diretrizes que atendam às preocupações do público. "Utilizamos filtragem e rotulagem de dados extensivas para minimizar conteúdo prejudicial em conjuntos de dados e reduzir a probabilidade de letras ofensivas", reforça a empresa.
"Acreditamos que a IA deve aprimorar a criatividade humana, não substituí-la". O Google informa que planeja melhorar a qualidade das músicas e incluir idiomas em atualizações futuras.
Porém, ainda há dúvidas sobre o que foi utilizado para treinar o modelo Lyria 3 na criação de músicas. Um representante disse à Billboard que o Google "leva em consideração os direitos autorais e os contratos com parceiros". Segundo ele, o Lyria 3 só treina com músicas que o YouTube e o Google têm "o direito de usar de acordo com nossos termos de serviço, contratos com parceiros e a legislação aplicável" (via NME).