Por que a Anthropic suspendeu o Fable 5 e o Mythos 5 e o que isso significa para a segurança de IA

A Anthropic desativou temporariamente os modelos Fable 5 e Mythos 5 após o governo dos EUA apontar um jailbreak específico no Fable 5 que levou a uma ordem de controle de exportação; a empresa diz que as falhas são “vulnerabilidades menores”, os testes prévios indicavam cerca de 5% de conclusão em tarefas adversariais e o caso abre precedentes sobre como autoridades podem intervir em nome da segurança da IA.

Na sexta‑feira à noite a Anthropic desativou repentinamente seus novos modelos Fable 5 e Mythos 5 depois que o governo dos EUA identificou uma forma específica de jailbreak no Fable 5 que motivou uma ordem de controle de exportação.

Como a medida vale para todos os estrangeiros, incluindo residentes nos EUA, a empresa optou por desabilitar os modelos para todo o público.

Até agora não está claro exatamente qual era o jailbreak em questão, e a Anthropic afirma que as falhas mostradas pelo governo seriam “vulnerabilidades menores” que “parecem relativamente simples” e que não ultrapassam capacidades de outros modelos públicos.

Antes do lançamento, a própria Anthropic havia submetido o Fable 5 a exercícios extensos de red‑teaming com apoio do AI Security Institute do Reino Unido e outros testadores externos, e os testes internos apontaram que o modelo completava cerca de 5% de tarefas adversariais relacionadas a cibersegurança.

No card do Fable 5 a empresa também declarava que, caso um jailbreak universal público fosse descoberto, agiria rapidamente para atualizar defesas, mas as informações atuais apontam que o problema é específico e não configuraria um jailbreak universal.

Na manhã de sábado a Anthropic manteve a posição anterior, descrevendo o episódio como “um mal‑entendido”.

Uma solução óbvia seria a Anthropic implementar novos guardrails que impeçam esse jailbreak específico, embora, por natureza, modelos não determinísticos possam apresentar outros vetores de ataque depois.

Há expectativa de que a correção venha em breve e que a ordem de controle de exportação seja suspensa, liberando novamente o acesso ao modelo.

O caso cria, porém, um precedente sobre como o governo dos EUA pode atuar em nome da segurança de IA, e os outros laboratórios de ponta sediados no país estão acompanhando a situação atentamente.

O desenvolvimento de IA tem sido uma sequência de avanços entre esses laboratórios, um buscando superar o outro, e Fable 5/Mythos 5 dificilmente representam o auge dessa corrida.

Também é relevante que o governo norte‑americano tenha proposto testes voluntários de segurança antes de lançamentos de novos modelos, e esse episódio tende a colocar essa ideia em destaque novamente.

Vale lembrar que a Anthropic tem sido uma das vozes mais ativas a favor de regulamentação para IA.

Como resumiu um dos envolvidos: “The ball is in Anthropic’s court”.