Gratuito e com raciocínio avançado: o novo modelo do DeepSeek supera o GPT-5
A startup chinesa apresentou dois modelos que igualam o GPT-5 e o Gemini-3 Pro, com capacidade de raciocínio avançado e uso autônomo de ferramentas
A DeepSeek apresentou na segunda-feira (1/12) o DeepSeek-V3.2 e o DeepSeek-V3.2-Speciale. São modelos de IA que combinam raciocínio complexo com capacidade de usar ferramentas de forma autônoma.
A empresa de Hangzhou afirma que o DeepSeek-V3.2 iguala o desempenho do GPT-5 em múltiplos testes de raciocínio. O modelo Speciale atinge o nível do Gemini-3 Pro e conquistou medalhas de ouro em olimpíadas internacionais de matemática e informática.
O DeepSeek-V3.2 integra pela primeira vez o "pensamento" diretamente no uso de ferramentas. Ele pode raciocinar internamente enquanto executa buscas na web, usa uma calculadora ou escreve código.
O sistema funciona em dois modos:
1. Com raciocínio visível (semelhante ao raciocínio visto no ChatGPT e em outros).
2. Ou sem qualquer raciocínio.
A cadeia de pensamento persiste entre chamadas de ferramentas e só é reiniciada quando o usuário envia uma nova mensagem.
Como eles conseguiram isso? Os pesquisadores desenvolveram o DeepSeek Sparse Attention (DSA), uma arquitetura que reduz muito o custo computacional de processar contextos longos. O modelo mantém 671 bilhões de parâmetros totais, mas ativa apenas 37 bilhões por token.
Em números
O DSA corta o custo de inferência em contextos longos em aproximadamente 50% em comparação com a arquitetura densa anterior. O sistema processa janelas de contexto de 128.000 tokens em produção.
O treinamento por reforço consumiu mais de 10% do poder de computação total do pré-treinamento. A equipe gerou mais...
Matérias relacionadas
Estudo brasileiro revela como algoritmos da internet reproduzem — e ampliam — o racismo da sociedade
Comentários
As opiniões expressas nos comentários são de responsabilidade exclusiva de seus autores e não representam a opinião do Terra.