A Anthropic desativou temporariamente os modelos Fable 5 e Mythos 5 após o governo dos EUA apontar um jailbreak específico no Fable 5 que levou a uma ordem de controle de exportação; a empresa diz que as falhas são “vulnerabilidades menores”, os testes prévios indicavam cerca de 5% de conclusão em tarefas adversariais e o caso abre precedentes sobre como autoridades podem intervir em nome da segurança da IA.
Na sexta‑feira à noite a Anthropic desativou repentinamente seus novos modelos Fable 5 e Mythos 5 depois que o governo dos EUA identificou uma forma específica de jailbreak no Fable 5 que motivou uma ordem de controle de exportação.
Como a medida vale para todos os estrangeiros, incluindo residentes nos EUA, a empresa optou por desabilitar os modelos para todo o público.
Até agora não está claro exatamente qual era o jailbreak em questão, e a Anthropic afirma que as falhas mostradas pelo governo seriam “vulnerabilidades menores” que “parecem relativamente simples” e que não ultrapassam capacidades de outros modelos públicos.
Antes do lançamento, a própria Anthropic havia submetido o Fable 5 a exercícios extensos de red‑teaming com apoio do AI Security Institute do Reino Unido e outros testadores externos, e os testes internos apontaram que o modelo completava cerca de 5% de tarefas adversariais relacionadas a cibersegurança.
No card do Fable 5 a empresa também declarava que, caso um jailbreak universal público fosse descoberto, agiria rapidamente para atualizar defesas, mas as informações atuais apontam que o problema é específico e não configuraria um jailbreak universal.
Na manhã de sábado a Anthropic manteve a posição anterior, descrevendo o episódio como “um mal‑entendido”.
Uma solução óbvia seria a Anthropic implementar novos guardrails que impeçam esse jailbreak específico, embora, por natureza, modelos não determinísticos possam apresentar outros vetores de ataque depois.
Há expectativa de que a correção venha em breve e que a ordem de controle de exportação seja suspensa, liberando novamente o acesso ao modelo.
O caso cria, porém, um precedente sobre como o governo dos EUA pode atuar em nome da segurança de IA, e os outros laboratórios de ponta sediados no país estão acompanhando a situação atentamente.
O desenvolvimento de IA tem sido uma sequência de avanços entre esses laboratórios, um buscando superar o outro, e Fable 5/Mythos 5 dificilmente representam o auge dessa corrida.
Também é relevante que o governo norte‑americano tenha proposto testes voluntários de segurança antes de lançamentos de novos modelos, e esse episódio tende a colocar essa ideia em destaque novamente.
Vale lembrar que a Anthropic tem sido uma das vozes mais ativas a favor de regulamentação para IA.
Como resumiu um dos envolvidos: “The ball is in Anthropic’s court”.