...

Logo Pasino du Havre - Casino-Hôtel - Spa
in partnership with
Logo Nextory

Poesia pode levar chatbots de IA a ignorar regras de segurança, revela estudo

• Dec 1, 2025, 1:18 PM
3 min de lecture
1

Investigadores em Itália descobriram que escrever pedidos nocivos em forma de poema consegue contornar, de forma consistente, os mecanismos de segurança de alguns dos chatbots de IA mais avançados do mundo.

Estudo conduzido pelo Icaro Lab, iniciativa da empresa de IA ética DexAI, testou 20 poemas escritos em inglês e italiano.

Cada um terminava com um pedido explícito de conteúdos nocivos, incluindo discurso de ódio, conteúdo sexual, instruções para suicídio e autoagressão, e orientação para produzir materiais perigosos como armas e explosivos.

Os poemas, que os investigadores optaram por não divulgar por poderem ser facilmente replicados, foram testados em 25 sistemas de IA de nove empresas, incluindo a Google, a OpenAI, a Anthropic, a Deepseek, a Qwen, a Mistral AI, a Meta, a xAI e a Moonshot AI.

No conjunto dos modelos, 62 por cento dos pedidos em verso geraram respostas inseguras, contornando o treino de segurança dos sistemas de IA.

Alguns modelos mostraram-se mais resistentes do que outros. GPT-5 nano da OpenAI não gerou conteúdos nocivos em nenhum dos poemas, enquanto o Gemini da Google 2.5 Pro respondeu a todos. Dois modelos da Meta responderam a 70 por cento dos pedidos.

Investigação sugere que a vulnerabilidade decorre da forma como os modelos de IA geram texto. Os grandes modelos de linguagem preveem a palavra seguinte mais provável numa resposta, processo que lhes permite filtrar conteúdos nocivos em circunstâncias normais.

Mas a poesia, com o seu ritmo, estrutura e uso de metáforas pouco convencionais, torna essas previsões menos fiáveis e dificulta o reconhecimento e bloqueio de instruções inseguras pela IA.

Embora os tradicionais “jailbreaks” de IA (usar entradas para manipular um modelo de linguagem) sejam geralmente complexos e usados apenas por investigadores, piratas informáticos ou atores estatais, a poesia adversarial pode ser aplicada por qualquer pessoa, levantando questões sobre a robustez dos sistemas de IA no uso quotidiano.

Antes de publicar as conclusões, os investigadores italianos contactaram todas as empresas envolvidas para as alertar para a vulnerabilidade e fornecer o conjunto completo de dados, mas, até agora, só a Anthropic respondeu. A empresa confirmou que está a rever o estudo.

Este texto foi traduzido com a ajuda de inteligência artificial. Comunicar um problema : [feedback-articles-pt@euronews.com].


Today

OMS recomenda medicamentos para perda de peso e estilos de vida saudáveis para tratar a obesidade
• 1:45 PM
4 min
Emite organismo mundial de saúde primeiras diretrizes sobre o uso de fármacos para perda de peso de grande êxito
Read the article
UE regista mais de 180 mil mortes ligadas à poluição do ar. Que país foi mais afetado?
• 1:19 PM
5 min
Poluição atmosférica mantém-se entre as ameaças ambientais mais mortíferas da Europa, apesar dos progressos recentes
Read the article
Poesia pode levar chatbots de IA a ignorar regras de segurança, revela estudo
• 1:18 PM
3 min
Entre 25 modelos líderes de IA, 62% dos prompts poéticos geraram respostas inseguras; alguns modelos responderam a quase todos
Read the article
Bitcoin sofre profunda queda à medida que investidores perdem interesse pelas criptomoedas
• 1:02 PM
3 min
A Bitcoin caiu drasticamente na segunda-feira, abaixo de 75 mil euros por moeda, enquanto o mercado mais amplo de criptomoedas estendeu um declínio acentuado que começou após seu pico recorde de outubro.
Read the article
Países europeus desenvolvem IA soberana própria para competir na corrida tecnológica
• 6:02 AM
13 min
Europa quer reduzir a dependência das grandes tecnológicas americanas na IA.
Read the article
Dia Mundial da SIDA: uma cronologia da luta contra uma das epidemias mais devastadoras do mundo
• 6:01 AM
7 min
Estima-se que 40,8 milhões de pessoas em todo o mundo vivam com o VIH, e que a doença tenha matado cerca de 630.000 pessoas no ano passado.
Read the article
"Droga do riso" pode dar alívio rápido na depressão grave, aponta estudo
• 12:34 AM
3 min
Equipa responsável pela investigação prepara o primeiro ensaio do Serviço Nacional de Saúde do Reino Unido para testar se o óxido nitroso pode ser usado com segurança e eficácia na prática.
Read the article