A Anthropic abriu um programa público de bug bounty no HackerOne para receber relatórios sobre vulnerabilidades em Claude e outros sistemas, ampliando iniciativas anteriores e prometendo recompensas, enquanto a capacidade do Mythos de identificar e explorar falhas no mundo real segue alvo de debate entre especialistas.
A Anthropic abriu um programa público de bug bounty no HackerOne para receber relatórios de vulnerabilidades em seus sistemas e no Claude.
O escopo cobre o Claude, a API da Anthropic, o Claude Code, clientes oficiais para desktop e mobile, infraestrutura interna, SDKs e integrações MCP, embora algumas categorias estejam excluídas.
A empresa afirmou que relatórios enviados pelo HackerOne serão recompensados e que essa iniciativa amplia esforços anteriores, como o Programa de Divulgação de Vulnerabilidades de 2024 e um bounty de segurança de modelos.
Ao mesmo tempo, a Anthropic promove o Mythos, um framework cujo papel em identificar e explorar vulnerabilidades gerou dúvidas entre observadores.
Alguns especialistas questionam se o Mythos realmente consegue encontrar e explorar falhas em ambientes do mundo real.
Em avaliações controladas, como o Mythos Preview do UK AI Security Institute, modelos de IA demonstraram capacidade de completar simulações de ataques cibernéticos em múltiplas etapas, mas esses testes ocorreram em ambientes limitados e supervisionados.
Defensores do uso dessas ferramentas ressaltam que elas podem auxiliar pesquisadores, mas não substituem o trabalho humano na validação de descobertas de segurança.
Outros alertam para o risco de confundir o desempenho em cenários controlados com eficácia em situações reais de defesa.
No fim das contas, o panorama de segurança tende a depender de uma combinação de assistência por IA e supervisão humana.