IA da Anthropic bloqueia até tarefas básicas de cibersegurança
Nova IA da Anthropic bloqueia até tarefas simples de cibersegurança e gera reclamações entre pesquisadores

A Anthropic lançou na terça-feira o Fable, apresentado pela empresa como uma versão pública e com recursos limitados do Mythos, seu sistema voltado para segurança digital. Pouco tempo após o lançamento, a ferramenta passou a receber críticas de pesquisadores e especialistas da área, que consideram as restrições impostas excessivamente rigorosas, dificultando até mesmo a realização de atividades básicas.
De acordo com a TechCrunch, as reclamações começaram a surgir rapidamente em plataformas sociais e comunidades voltadas à área de segurança digital. Valentina “Chompie” Palmiotti, pesquisadora da IBM X-Force, afirmou que o Fable “rejeita qualquer requisição que possa ser tangencialmente relacionada a cibersegurança. Até tarefas inócuas, como ler uma postagem de blog”.
As críticas não pararam por aí. Outro especialista relatou no X que “até pedir uma revisão de código” aciona as barreiras da plataforma, indicando que as restrições adotadas pela ferramenta podem estar impedindo até atividades consideradas comuns e de baixo risco.

O que faz o Fable bloquear pedidos
Sempre que um comando aciona os sistemas internos de proteção, o Fable encerra a interação e apresenta um aviso informando que suas “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia”. Nessas situações, o usuário é redirecionado automaticamente para o Claude Opus 4.8.
Segundo a Anthropic, essas restrições foram implementadas para impedir que a ferramenta seja utilizada no desenvolvimento de malwares ou em tentativas de invasão de sistemas, uma preocupação que acompanha a empresa há bastante tempo. Além disso, solicitações relacionadas à biologia também recebem bloqueios devido ao receio de possíveis aplicações indevidas envolvendo armas biológicas.
Especialistas reclamam dos filtros
Em entrevista à TechCrunch, Matt Suiche, integrante da equipe técnica da empresa de segurança digital Tolmo, afirmou que o Fable acaba interpretando de forma equivocada algumas solicitações. Segundo ele, “se você pede para ele escrever código seguro, ele assume que é trabalho relacionado a cibersegurança em vez de boas práticas de engenharia de software, e você é rebaixado”.
Suiche também observou que o sistema aparenta utilizar filtros fortemente baseados em palavras-chave. De acordo com ele, “parece ser baseado em palavras-chave, então qualquer coisa no campo lexical de ‘cibersegurança’ aciona as restrições”.
Apesar das críticas, o especialista demonstrou compreensão em relação à estratégia adotada pela Anthropic. Ele destacou que a tecnologia ainda está em estágio inicial e que as regras de segurança provavelmente serão ajustadas com o tempo. Na sua avaliação, é mais prudente que a empresa adote bloqueios mais rigorosos no lançamento e faça flexibilizações gradualmente, à medida que ganha experiência e trabalha em conjunto com companhias do setor de cibersegurança.

Como o Mythos chegou ao mercado
O Mythos foi apresentado pela Anthropic em abril e, em um primeiro momento, ficou disponível apenas para um grupo seleto de empresas e instituições participantes do Projeto Glasswing, programa criado para reforçar a segurança de softwares e infraestruturas consideradas críticas.
Recentemente, a companhia expandiu o alcance da plataforma, liberando o acesso para centenas de organizações distribuídas por 15 países. A medida faz parte dos esforços da Anthropic para ampliar o uso de suas ferramentas voltadas à proteção digital e ao fortalecimento da segurança cibernética em larga escala.
Além das barreiras de segurança integradas ao sistema, a Anthropic exige que especialistas da área participem do Cyber Verification Program. Após a aprovação, esses profissionais passam a ter acesso ao Claude com menos restrições para atividades relacionadas à segurança digital e pesquisa cibernética.
Uma iniciativa semelhante também é mantida pela OpenAI, por meio do programa Trusted Access for Cyber, criado para permitir que pesquisadores e profissionais qualificados utilizem ferramentas de IA em trabalhos ligados à cibersegurança com maior flexibilidade e menos bloqueios automáticos.
As críticas continuam circulando entre profissionais da área, principalmente por causa dos bloqueios considerados exagerados. A Anthropic não respondeu ao pedido de comentário da reportagem.
Fonte: Olhar Digital
Previous Post
Next Post