OpenAI lança nova série de modelos de IA com habilidades de "raciocínio"
A OpenAI, apoiada pela Microsoft, anunciou nesta quinta-feira o lançamento da série "Strawberry" de modelos de inteligência artificial projetados para passarem mais tempo processando respostas a consultas para resolverem problemas difíceis.
Os modelos são capazes de "raciocinar" através de tarefas complexas e podem resolver problemas mais desafiadores do que os modelos anteriores em ciências, codificação e matemática, disse a empresa de IA.
A OpenAI usou o codinome Strawberry para se referir ao projeto internamente, enquanto apelidou os modelos anunciados nesta quinta-feira de o1 e o1-mini. O o1 estará disponível no ChatGPT e em sua API a partir desta quinta-feira, informou a empresa.
Noam Brown, um pesquisador da OpenAI focado em melhorar o raciocínio nos modelos da empresa, confirmou que os modelos são os mesmos do projeto Strawberry.
"Estou animado em compartilhar com todos vocês o fruto de nosso esforço na OpenAI para criar modelos de IA capazes de raciocínio verdadeiramente geral", escreveu Brown.
A OpenAI disse que o modelo o1 obteve 83% de pontuação no exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com os 13% do modelo anterior, o GPT-4o.
O modelo também melhorou o desempenho em questões competitivas de programação e excedeu a precisão humana em nível de doutorado em uma referência de problemas científicos, disse a empresa.
Brown disse que os modelos conseguiram atingir as pontuações incorporando uma técnica conhecida como raciocínio de "cadeia de pensamento", que envolve a divisão de problemas complexos em etapas lógicas menores.
Os pesquisadores observaram que o desempenho do modelo de IA em problemas complexos tende a melhorar quando a abordagem é usada como uma técnica de estímulo. Agora, a OpenAI automatizou esse recurso para que os modelos possam resolver os problemas por conta própria, sem a solicitação do usuário.
"Treinamos esses modelos para que passem mais tempo pensando nos problemas antes de responder, como uma pessoa faria. Com o treinamento, eles aprendem a refinar seu processo de raciocínio, tentam estratégias diferentes e reconhecem seus erros", disse a OpenAI.