A Anthropic liberou o Opus 4.8, uma atualização rápida do seu modelo público mais avançado, que traz melhorias de confiabilidade no tratamento de incertezas e estreia a ferramenta Dynamic Workflows em research preview, enquanto mantém o preço padrão da versão anterior e adianta que trabalha nos controles necessários para liberar o Mythos em breve.
A Anthropic anunciou o lançamento do Opus 4.8, a versão mais avançada do seu modelo publicamente disponível, com o preço padrão mantido igual ao da versão anterior.
A atualização foi liberada apenas 41 dias após o Opus 4.7, um ciclo de releases bem mais curto do que o habitual na empresa.
Esse ritmo acelerado parece ter relação tanto com a recepção mais fria ao Opus 4.7 quanto com lançamentos recentes de concorrentes como o Codex da OpenAI e o Gemini Flash do Google.
Além de atingir resultados de destaque em benchmarks, o Opus 4.8 recebeu atenção especial no manejo de dados ruins ou incertos, mostrando-se mais propenso a sinalizar incertezas e menos inclinado a fazer afirmações sem suporte.
Testes iniciais e clientes perceberam essa mudança; um depoimento da Bridgewater destacou que a maior diferença foi a tendência do Opus 4.8 de identificar proativamente problemas com as entradas e saídas de uma análise, algo que outros modelos costumavam deixar para os usuários detectarem.
Na mesma atualização, a Anthropic lançou o recurso Dynamic Workflows em research preview, pensado para ajudar modelos maiores a coordenar tarefas complexas por meio de centenas de subagentes paralelos.
Em palavras da própria empresa, “Claude Code alongside Opus 4.8 can now carry out codebase-scale migrations across hundreds of thousands of lines of code from kickoff to merge, with the existing test suite as its bar”.
A Anthropic segue retendo o Mythos, seu modelo mais avançado, depois que uma prévia levantou preocupações de segurança cibernética.
No texto do anúncio, a companhia afirmou: “We’re making swift progress on developing these safeguards and expect to be able to bring Mythos-class models to all our customers in the coming weeks”.
No conjunto, a atualização reflete uma pressão por iterações rápidas e um foco claro em reduzir respostas equivocadas, especialmente em cenários com dados incertos ou ruídos.