Dois algoritmos entraram num bar… e tudo o que compramos fica mais caro

Mesmo que não haja reuniões secretas ou acordos ilegais entre algoritmos, quando estes são incumbidos de definir preços em tempo real, podem fazê-los subir de forma preocupante. A Teoria dos Jogos explica porquê — e de que forma a solução pode passar por tirar o “arrependimento” da equação.

Imagine uma pequena cidade com dois comerciantes que vendem um determinado produto. Os clientes preferem naturalmente produtos mais baratos, por isso os comerciantes são obrigados a competir para oferecer o preço mais baixo.

Fartos dos seus lucros magros, os dois comerciantes encontram-se certa noite num bar para discutir um plano secreto: se aumentarem os preços em conjunto, em vez de competirem, ambos podem ganhar mais dinheiro.

Mas esse tipo de fixação artificial e intencional de preços, conhecido como colusão, é ilegal. Os comerciantes decidem não arriscar, e toda a gente continua a beneficiar de produtos baratos.

Há mais de um século que as leis na Europa e nos EUA, em linhas gerais, seguem este modelo: proibir esses acordos de bastidores e, assim, garantir preços justos.

Atualmente, porém, já não é assim tão simples, explica a Quanta Magazine. Em vastas áreas da economia, os vendedores recorrem cada vez mais a programas informáticos chamados algoritmos de aprendizagem, que ajustam repetidamente os preços em resposta a novos dados sobre o estado do mercado.

Estes algoritmos são muitas vezes bastante mais simples do que os de “deep learning” que alimentam atualmente a Inteligência Artificial, mas continuam sujeitos a comportamentos inesperados — que resultam frequentemente na definição de preços mais elevados.

Como podem, então, os reguladores garantir que os algoritmos definem preços justos? A abordagem tradicional já não funciona, porque assenta na capacidade de detetar colusão explícita.

“Os algoritmos, definitivamente, não andam a beber uns com os outros”, diz à Quanta o cientista informático Aaron Roth, investigador da Universidade da Pensilvânia e co-autor de um estudo recente sobre colusão entre algoritmos.

Durante mais de um século, a fiscalização contra a cartelização baseou-se numa ideia simples: proibir combinações explícitas entre concorrentes. Se duas empresas se encontrarem num “canto escuro” para combinar preços, é crime; se não o fizerem, presume-se que o mercado competitivo manterá os preços baixos.

Mas, num mundo em que as empresas usam algoritmos de aprendizagem para ajustar preços em tempo real, esta lógica começa a falhar.

Em 2019, um estudo amplamente citado mostrou que algoritmos em competição, num mercado simulado, conseguiam “aprender” a coludir tacitamente: sempre que um baixava o preço, o outro retaliava com uma descida ainda mais agressiva, criando a ameaça implícita de uma guerra de preços.

O resultado final eram preços mais elevados: o medo mútuo de desencadear essa espiral de descidas levava os algoritmos a manter os preços altos.

No seu estudo, recentemente disponibilizado em pré-publicação no arXiv, a equipa de Aaron Roth mostrou que mesmo algoritmos aparentemente benignos, desenhados apenas para maximizar o próprio lucro, podem, em certas condições, acabar por conduzir a preços mais elevados para os consumidores.

A chave deste fenómeno está na Teoria dos Jogos, ramo da matemática aplicada que estuda situações de interação estratégica entre dois ou mais “jogadores”, onde as escolhas de cada um afetam o resultado para todos — e que nos permite saber, por exemplo, que dividir a conta por igual sai sempre mais caro.

Um conceito central desta teoria é o de “equilíbrio”, uma situação em que nenhuma das partes tem incentivo para mudar de estratégia, dado o comportamento da outra.

Muitos algoritmos de aprendizagem procuram precisamente isso: ajustar-se continuamente até não haver forma óbvia de melhorar o resultado.

Um tipo particularmente importante de algoritmo é o chamado “no-swap-regret”, que, de forma simplificada, garante que mesmo depois de vários ciclos de jogo, o agente não irá olha para trás com arrependimento e não concluirá que teria ganho mais se tivesse sistematicamente substituído uma ação por outra.

Uma equipa de teóricos dos jogos provou, num estudo publicado em 2000, que quando dois algoritmos deste tipo competem entre si em qualquer jogo, acabam por convergir para uma forma específica de equilíbrio, que corresponde à melhor solução possível num cenário de uma única ronda. Em jogos de uma só ronda, as “ameaças” não funcionam, porque não há “amanhã” para as concretizar.

Num estudo publicado no ano passado, Jason Hartline, investigador da Northwestern University, aplicou esses resultados a um modelo de mercado competitivo em que empresas podem ajustar preços ronda após ronda.

A conclusão era otimista: se ambos os concorrentes usarem algoritmos de no-swap-regret, os preços tendem a ser competitivos, e a colusão torna-se impossível. O problema surge quando um desses algoritmos enfrenta um adversário de outro tipo.

No seu recente estudo, Aaron Roth e os colegas analisaram o que acontece se um algoritmo de no-swap-regret competir com uma estratégia “não responsiva”: em vez de reagir ao comportamento do rival, o vendedor escolhe em cada ronda um preço ao acaso, seguindo probabilidades fixas previamente definidas.

Quando os investigadores calcularam quais seriam as probabilidades “ótimas” para essa estratégia não responsiva, encontraram algo inesperado: a melhor forma de maximizar o lucro contra um algoritmo de no-swap-regret é atribuir uma probabilidade muito elevada a preços muito altos, e probabilidades menores a uma faixa alargada de preços mais baixos.

Em termos práticos, esse comportamento força o algoritmo de aprendizagem a subir também os preços, sob pena de em média ficar para trás. De vez em quando, o jogador não responsivo baixa o preço e aproveita para captar clientes, mas passa grande parte do tempo a praticar preços elevados.

À primeira vista, os autores ainda pensaram que este cenário soava artificial. Um vendedor que visse o rival lucrar mais não tentaria simplesmente mudar de estratégia?

Mas uma análise matemática mostra o contrário: quando estes dois tipos de algoritmos se confrontam, o sistema entra num equilíbrio. Ambos têm lucros semelhantes e tão altos quanto possível, dadas as estratégias em uso. Nenhum dos lados tem incentivo para alterar o seu algoritmo.

Os consumidores, porém, ficam sempre presos a preços elevados — um desfecho típico de colusão, mas sem qualquer acordo, ameaça ou coordenação explícita; e para os reguladores, isto cria um dilema. Não basta proibir algoritmos sofisticados que pareçam “espertos demais” ou capazes de comunicar entre si.

Hartline propõe uma solução radicalmente simples: banir todos os algoritmos de preços exceto os de no-swap-regret, que, quando usados por todos, empurram os preços para baixo. Há até métodos recentes para verificar se um algoritmo tem esta propriedade sem precisar de inspecionar o seu código.

Mas mesmo essa abordagem não resolve todos os casos, sobretudo quando algoritmos concorrem com humanos; além disso, alguns especialistas contestam a ideia de que o que Roth descreve seja, tecnicamente, colusão, porque esta pressupõe sempre uma possibilidade real de “optar por não coludir”.

À medida que a definição de preços é cada vez mais delegada em algoritmos, compreender quando e como surgem preços injustificadamente altos, e o que fazer perante isso, está a tornar-se uma questão central da política económica contemporânea.

Entretanto, ficamos a aguardar pelo dia em que os algoritmos de aprendizagem evoluam de novo, talvez com a ajuda da agora tão popular Inteligência Artificial, e se encontrem mesmo num bar para beber uns copos e combinar preços — sendo pouca a esperança de que o façam para os baixar.

(Armando Batista, ZAP)