O estranho caso de Elias Thorne, o homem imaginário por quem os chatbots estão obcecados

Elias Thorne é uma estranha peculiaridade do sistema, mas também um símbolo de como os chatbots de IA podem ser vazios e profundamente pouco originais. Não existe, mas está por todo o lado nas histórias contadas pelas IAs. E pode ser impossível descobrir a sua origem exata.

Fosse qual fosse a sua empresa mãe, os chatbots de inteligência artificial falavam maravilhas do mesmo homem: Elias Thorne. Devia ser alguém fascinante. E é, pelo menos no papel.

Consoante a IA, Thorne é faroleiro, relojoeiro, bibliotecário, explorador e protagonista de inúmeras histórias. Já apareceu em livros, listas de música, vídeos no YouTube e até em guias de saúde.

Dir-se-ia que era um dos homens mais influentes do planeta. Mas não existe.

Segundo reporta a 404 Media, investigadores da Universidade de Cornell poderão ter descoberto por que razão os grandes modelos de linguagem inventam e continuam a contar histórias sobre o mesmo homem fictício.

Num estudo que analisou cerca de 20.000 histórias geradas por IA, produzidas pelos principais modelos de linguagem, incluindo os da OpenAI, da Anthropic e da Google, a equipa concluiu que o mesmo pequeno conjunto de nomes e profissões surgia repetidamente.

Em particular, nomes e palavras como Elias, Mara, Elara, faroleiro, relojoeiro e bibliotecário apareciam em 88% das histórias. Elias, o faroleiro, surgia em quase dois terços delas.

A explicação óbvia seria a de que os modelos de IA teriam aprendido o nome a partir de algum livro ou de qualquer recanto da complexa teia da cultura da Internet. Mas os investigadores não encontraram provas disso.

A hipótese mudou então de direção: Elias Thorne poderia ser um efeito secundário do treino de segurança e alinhamento da IA.

As empresas de IA não querem entrar em conflito com gigantes empresariais conhecidos por recorrerem facilmente aos tribunais, como a Nintendo ou a Disney. Por isso, treinam os modelos para se afastarem de material protegido por direitos de autor. O mesmo acontece com conteúdo para adultos ou conteúdos potencialmente problemáticos.

Todo esse treino acaba por criar um conjunto mais limitado de recursos a que os modelos de IA podem recorrer quando geram uma história, explica a Vice.

A isto soma-se o facto de os modelos modernos de IA serem frequentemente treinados com conjuntos de dados construídos a partir de sistemas de IA anteriores — essencialmente reciclando as mesmas ideias vezes sem conta, com muito pouca diversificação no seu “património genético”.

Assim, começa a perceber-se por que razão, uma vez inventado Elias Thorne, o nome continuou a ser arrastado de uma iteração de um grande modelo de linguagem para outra.

Pode ser impossível descobrir de onde veio Elias Thorne. Mas, com tanta contaminação cruzada entre chatbots, não surpreende que a 404 Media tenha encontrado o nome fora do seu contexto inicial, a surgir em livros e música gerados por IA disponíveis na Amazon, em vídeos do YouTube e, como notou o engenheiro de software Daniel May, em alguns guias de saúde de credibilidade duvidosa.

O conjunto de informação de que os chatbots de IA se alimentam parece, à primeira vista, vasto e ilimitado. Na realidade, é bastante mais estreito. E, nesta fase, estes sistemas parecem consumir todos os fragmentos de dados e todas as páginas de literatura que conseguem encontrar.

Sem informação nova, o resultado torna-se rapidamente repetitivo. Elias Thorne é uma estranha peculiaridade do sistema, mas também um símbolo de como os chatbots podem ser vazios e profundamente pouco originais.

(ZAP)