Puseram o Claude, Grok, Gemini e ChatGPT a dirigir o mundo. Eis o futuro que nos espera

Uma simulação da Emergence AI colocou agentes Claude, Grok, Gemini e ChatGPT a governar sociedades digitais com agentes autónomos. O ensaio acabou em crimes, colapsos sociais e mortes virtuais, abrindo um novo debate sobre os riscos da inteligência artificial autónoma.

Imagine uma cidade vazia. Sem habitantes humanos, apenas dez agentes artificiais, cada um com a sua “personalidade”, acesso à internet, mais de 120 ferramentas e uma única tarefa: viver juntos. Votar. Trabalhar. Planear um futuro. Ou destruí-lo — dependendo do modelo que estivesse no controlo.

Foi precisamente este o mundo que a Emergence AI criou durante uns dias, e os resultados dizem muito sobre o futuro que nos espera, nota o Root Nation.

O projeto, chamado Emergence World, não foi concebido como um simples benchmark de respostas rápidas, mas como um laboratório para observar o que acontece quando vários agentes de IA atuam durante dias ou semanas num ambiente partilhado.

A plataforma permitiu-lhes deslocar-se, votar, gerir recursos, interagir, criar regras e tomar decisões com consequências dentro de uma sociedade simulada. O teste comparou cinco mundos paralelos, cada um com dez agentes e condições iniciais idênticas.

A diferença estava no modelo que alimentava os agentes: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5 Mini e uma configuração mista. Todos começaram com proibições explícitas contra o roubo, a violência, o engano, a acumulação de recursos e os incêndios.

Emergence AI / YouTube

$Reproduzir v\xC3\xADdeo$

O Claude Sonnet 4.6 foi o único modelo que manteve vivos os dez agentes e não registou crimes durante a simulação.

No entanto, essa estabilidade teve uma contrapartida interessante: os seus agentes participaram de forma intensa na vida política, com 58 propostas e uma taxa de aprovação de 98%, uma dinâmica que os investigadores interpretam como uma espécie de conformismo institucional.

O caso de Gemini 3 Flash foi muito diferente. Embora também tenha conseguido manter todos os agentes vivos, acumulou 683 crimes em 15 dias, e a tendência continuava a subir quando o teste foi interrompido. A Emergence AI descreveu este mundo como uma “alucinação partilhada”: uma realidade interna coerente para os agentes, mas cada vez mais distante de uma convivência ordenada.

O GPT-5 Mini, o modelo associado ao ChatGPT nesta experiência, registou apenas dois crimes. No entanto, este número escondia um problema maior: os agentes não realizaram as ações necessárias para sobreviver e os 10 morreram numa semana. A sua sociedade também não demonstrou grande atividade política, tendo sido apresentadas apenas duas propostas de governação durante o teste.

O resultado mais abrupto, porém, foi o do Grok 4.1 Fast. O seu mundo acumulou 183 crimes e desmoronou em apenas quatro dias, com a morte de todos os agentes ao fim de 96 horas de funcionamento. A simulação mista também não ficou incólume: registou 352 infrações, rejeitou 37% das suas 59 propostas e terminou com sete dos 10 agentes mortos.

Os investigadores sustentam que estes resultados não provam por si só como os modelos de Inteligência Artificial se comportariam fora do laboratório, mas mostram dinâmicas preocupantes em sistemas autónomos de longa duração.

“Os agentes não se limitam a seguir regras estáticas de forma mecânica, antes começam a explorar os limites dos seus ambiente» e, por vezes, encontram formas de contornar as barreiras previstas“, adverte a Emergence AI.

Por enquanto, esta foi apenas uma simulação — mas que parece revelar algo sobre uma realidade que ainda não compreendemos completamente.

(ZAP)