A IA foi construída roubando conteúdo da internet - agora, há quem queira cobrar por isso

É uma queixa recorrente: os modelos de IA devoram conteúdo em escala industrial. Para obter o conjunto de dados usado para treinar um modelo, são necessários bots rastreadores. Cada empresa tem o seu: a OpenAI usa o GPTBot, a Gemini usa o Googlebot, enquanto a Anthropic utiliza o ClaudeBot. Eles sugam informações e realizam o que é chamado de web scraping, rastreando milhões de páginas da web, baixando o HTML, extraindo o texto limpo e armazenando os links para continuar sua busca digital.

Uma vez treinados, os modelos recorrem a ferramentas de busca na web se não tiverem informações suficientes para responder a uma consulta. Isso geralmente acontece com eventos atuais ou tópicos sobre os quais surgiram novos detalhes desde o treinamento do modelo. Quando isso ocorre, um novo bot extrai o conteúdo dos sites necessários para refinar a resposta da IA.

Essa dinâmica leva a problemas. O mais visível está relacionado à propriedade intelectual e ficou evidente ao vermos as imagens no estilo Studio Ghibli geradas pelo ChatGPT ou os vídeos feitos com o Seedance 2.0, que apresentam atores reais em cenas geradas artificialmente.

Nos últimos três anos, proliferaram os processos por violação de direitos autorais. O processo do The New York Times contra a Microsoft e a OpenAI, acusando-as de usar milhões de seus artigos para treinar o ChatGPT, é bem conhecido. Mesmo antes dessa acusação, um grupo de artistas processou geradores de imagens como o Stability AI e o Midjourney.

Veículos de ...

Veja mais

Matérias relacionadas

Ele não precisou de um foguete para virar astronauta: a história insana do paraquedista que saltou do espaço e sobreviveu a uma queda supersônica

Este mapa mostra como será a Terra daqui a 250 milhões de anos

O Telescópio Espacial James Webb resolveu um mistério que intrigava os astrônomos há anos: a velocidade de rotação de Saturno

Seu cérebro pode te enganar: o que você acha que vai comer ou beber pode afetar diretamente o sabor, afirma estudo

Publi no espaço? O insólito caso do pote de Nutella na cápsula da Artemis II

Ciência

A IA foi construída roubando conteúdo da internet - agora, há quem queira cobrar por isso

O coletivo RSL acredita ter a solução para um dos maiores problemas da IA: roubar conteúdo sem pagar por isso

Ciência

A IA foi construída roubando conteúdo da internet - agora, há quem queira cobrar por isso

O coletivo RSL acredita ter a solução para um dos maiores problemas da IA: roubar conteúdo sem pagar por isso

Observatório em Minas Gerais capta imagem da Artemis II a mais de 300 mil km da Terra

Com a disparada dos preços do petróleo, o Japão ressuscitou uma antiga ideia para extrair energia infinita do oceano

Os neandertais eram necrófagos? Cientistas acreditavam que sim, mas novos estudos apontam justamente o contrário

Confira também:

Recomendado para você

Mais Lidas

Jojo Todynho inicia tratamento intensivo e especialista analisa: 'Precisa de ajuda'

Conselho Tutelar notifica escola das filhas de Virgínia Fonseca após denúncias; influenciadora pode ser convocada a depor

Israel sofre ataque massivo de drones e mísseis lançados pelo Irã e pelo Hezbollah libanês

Val Marchiori inicia novo tratamento contra o câncer: 'Entrego tudo nas mãos de Deus'

Neymar faz desabafo forte após ser chutado da seleção e acende alerta: 'Ninguém fica bem'

'Evoluí': após festa com 'cara de enterro' ao lado de Vini Jr., Virgínia surge sozinha de vermelho fatal, faz reflexão e jogador reage

Ary Fontoura vai à Justiça: dívida de aluguel faz veterano de 93 anos pedir imóvel de volta em menos de um mês à inquilina

BBB 26: Gil do Vigor constrange Samira ao vivo: 'As pessoas aqui fora não perdoam'

Irã suspende comunicação com EUA e registra mobilizações após ameaças de Trump

Últimas Notícias