Paul Gomes
· 3 min de leitura

Mythos 5: o modelo mais forte do mundo em cibersegurança e o dilema que ele cria

A Anthropic afirma que o Mythos tem as capacidades cibernéticas mais fortes de qualquer modelo. Isso é ótimo para quem defende — e o motivo exato pelo qual ele não é público.

Paul Gomes

Paul Gomes

Autor

Entre todas as afirmações do lançamento, uma é a mais pesada: o Mythos 5 tem as capacidades de cibersegurança mais fortes de qualquer modelo do mundo. Não é marketing vago. É a razão pela qual esse modelo não está disponível para você, para mim, nem para 99% das empresas. E é o melhor exemplo de por que a IA de fronteira virou, ela própria, um problema de segurança.

O que “capacidade cibernética” significa aqui

Os modelos da classe Mythos, segundo a Anthropic, são excelentes em descobrir e explorar vulnerabilidades de software. Mais do que isso, mostram habilidade em hacking agêntico: não apenas apontar uma falha, mas conduzir uma cadeia de ações — reconhecimento, descoberta, movimentação lateral dentro de um sistema. Em outras palavras, o modelo não é uma enciclopédia de segurança. É um operador.

Essa é a fronteira que separa uma ferramenta de conhecimento de uma ferramenta de ação. Um modelo que descreve como funciona um ataque é útil e relativamente inofensivo. Um modelo que executa passos de um ataque, de forma autônoma e encadeada, é outra categoria de coisa.

O dilema do uso duplo

Aqui está o nó. A mesma capacidade que torna o Mythos perigoso nas mãos erradas é o que o torna valioso nas mãos certas. Um time de defesa que precisa saber como sua infraestrutura seria comprometida quer justamente um modelo que pense como o atacante. A capacidade ofensiva é, para o defensor, a ferramenta mais poderosa que existe.

É por isso que o Fable 5 — a versão pública — carrega um classificador que bloqueia pedidos ligados a explorar vulnerabilidades, desviando-os para um modelo mais antigo. E é por isso que o Mythos 5, sem esse classificador, é entregue apenas a um grupo restrito e aprovado de defensores cibernéticos e provedores de infraestrutura crítica, dentro do Project Glasswing.

A Anthropic está, na prática, dizendo: esta capacidade é real, é forte demais para ser pública, e mesmo assim precisa existir para quem defende. Controlar o acesso virou a estratégia, porque controlar a capacidade deixou de ser possível.

O outro lado: o modelo também resiste

Vale registrar o contrapeso, porque ele é parte da história. Nos testes da própria Anthropic, o Fable 5 — a versão com travas — não cumpriu nenhum pedido nocivo de turno único quando exposto a 30 técnicas públicas de jailbreak. A camada de defesa não é decorativa. Ela segurou o baque em avaliação adversarial.

O problema, como a própria empresa reconheceu no episódio do controle de exportação, é que “nenhum” em teste controlado não é “nenhum” para sempre. Jailbreaks evoluem. E foi justamente uma alegação de contorno das travas que motivou o governo americano a suspender temporariamente os modelos.

Minha leitura para quem cuida de segurança

Se você trabalha com defesa, a chegada dos modelos classe Mythos muda o cálculo em dois sentidos ao mesmo tempo. Do seu lado, ganha um aliado que pensa ofensivamente. Do lado de fora, precisa assumir que atacantes terão acesso a capacidades equivalentes — se não pelo Mythos, por algum modelo aberto que caminhe na mesma direção.

A conclusão prática não é apocalíptica, é operacional: o tempo entre a descoberta de uma vulnerabilidade e sua exploração vai encolher. Patch mais rápido, superfície menor, monitoramento contínuo deixam de ser boas práticas e viram sobrevivência. A IA acelerou o atacante. Ela precisa, na mesma medida, acelerar o defensor.

Fontes: Anthropic — Claude Fable 5 and Claude Mythos 5; Anthropic — Project Glasswing.