A imagem que resume uma era: milhões de livros num armazém aguardando destruição após treinamento de IA
Washington Post revela detalhes do projeto "Panamá", iniciado pela Anthropic com intenção de digitalizar milhões de livros para treinar IA
Um modelo de linguagem para IA precisa de informações para ser treinado e se tornar mais preciso e eficaz. A questão é como essas informações são obtidas e se existe uma maneira ética e lucrativa de fazê-lo para a empresa de tecnologia em questão. Não há dúvida de que a opção preferida das empresas tem sido usar o máximo possível de conteúdo físico e digital sem a permissão de ninguém, e há provas disso.
Um vazamento judicial revela que a Anthropic investiu dezenas de milhões de dólares na aquisição e digitalização de obras literárias sem a permissão dos autores. Segundo o Washington Post, o projeto, internamente chamado de "Panamá", fazia parte de uma corrida frenética entre grandes empresas de tecnologia para acumular dados massivos para treinar modelos de inteligência artificial.
Como tudo começou
O Projeto Panamá foi lançado pela Anthropic no início de 2024. De acordo com documentos internos revelados pelo Washington Post, o objetivo era "escanear destrutivamente todos os livros do mundo". Além disso, esses documentos também refletem explicitamente que a empresa não queria que ninguém soubesse que estava trabalhando nisso.
Em cerca de um ano, a empresa gastou dezenas de milhões de dólares comprando milhões de livros, cortando suas lombadas com máquinas hidráulicas e escaneando suas páginas para alimentar os modelos de IA que impulsionam Claude, seu principal chatbot. Segundo as informações, os livros, uma vez digitalizados, acabaram sendo reciclados.
Por que veio à tona?
Os ...
Matérias relacionadas
EUA enfrentam problema com data centers para IA: cada vez mais estados se opõem à sua construção