Anthropic lança bug bounty no HackerOne e levanta dúvidas sobre o Mythos

A Anthropic abriu um programa público de bug bounty no HackerOne para receber relatórios sobre vulnerabilidades em Claude e outros sistemas, ampliando iniciativas anteriores e prometendo recompensas, enquanto a capacidade do Mythos de identificar e explorar falhas no mundo real segue alvo de debate entre especialistas.

A Anthropic abriu um programa público de bug bounty no HackerOne para receber relatórios de vulnerabilidades em seus sistemas e no Claude.

O escopo cobre o Claude, a API da Anthropic, o Claude Code, clientes oficiais para desktop e mobile, infraestrutura interna, SDKs e integrações MCP, embora algumas categorias estejam excluídas.

A empresa afirmou que relatórios enviados pelo HackerOne serão recompensados e que essa iniciativa amplia esforços anteriores, como o Programa de Divulgação de Vulnerabilidades de 2024 e um bounty de segurança de modelos.

Ao mesmo tempo, a Anthropic promove o Mythos, um framework cujo papel em identificar e explorar vulnerabilidades gerou dúvidas entre observadores.

Alguns especialistas questionam se o Mythos realmente consegue encontrar e explorar falhas em ambientes do mundo real.

Em avaliações controladas, como o Mythos Preview do UK AI Security Institute, modelos de IA demonstraram capacidade de completar simulações de ataques cibernéticos em múltiplas etapas, mas esses testes ocorreram em ambientes limitados e supervisionados.

Defensores do uso dessas ferramentas ressaltam que elas podem auxiliar pesquisadores, mas não substituem o trabalho humano na validação de descobertas de segurança.

Outros alertam para o risco de confundir o desempenho em cenários controlados com eficácia em situações reais de defesa.

No fim das contas, o panorama de segurança tende a depender de uma combinação de assistência por IA e supervisão humana.