Algoritmo TurboQuant do Google derruba ações de fabricantes de memória

O Google revelou uma inovação que pode transformar a forma como modelos de inteligência artificial são executados.

Trata-se de um conjunto de algoritmos de compressão que diminui drasticamente a quantidade de memória necessária para operar sistemas avançados, como modelos de linguagem.

O impacto foi imediato no mercado financeiro, com queda nas ações de empresas ligadas à produção de chips de memória e armazenamento.

A tecnologia apresentada inclui três soluções principais: TurboQuant, PolarQuant e Quantized Johnson-Lindenstrauss, conhecido como QJL. Juntas, elas atuam diretamente sobre o chamado cache chave-valor, uma estrutura essencial que armazena informações usadas com frequência durante o funcionamento da IA.

Em testes com modelos como Gemma e Mistral, o TurboQuant conseguiu reduzir o uso de memória para apenas 3 bits, sem necessidade de treinamento adicional, além de acelerar significativamente o processamento.

Como o TurboQuant funciona na prática

O funcionamento do TurboQuant acontece em duas etapas complementares. Primeiro, o PolarQuant transforma os dados em coordenadas polares, substituindo o formato tradicional por uma representação mais eficiente baseada em raio e ângulo. Isso elimina etapas complexas e reduz custos computacionais.

Na sequência, entra o QJL, que aplica uma técnica de correção de erros extremamente leve. Ele projeta possíveis falhas de compressão em um espaço menor, garantindo precisão sem aumentar o uso de memória. O resultado é uma compressão altamente eficiente com desempenho preservado.

Impacto direto no mercado de tecnologia

O anúncio provocou reações imediatas nas bolsas. Empresas como Micron Technology, Western Digital e Seagate Technology registraram quedas, refletindo o receio de que a nova tecnologia reduza a demanda por hardware de memória no futuro.

Instituições financeiras como Morgan Stanley classificaram a inovação como disruptiva, destacando seu potencial de reduzir custos e ampliar o acesso à inteligência artificial, especialmente em serviços de nuvem.

O que muda para o futuro da IA

Apesar da reação inicial do mercado, especialistas apontam que o efeito de longo prazo pode ser mais equilibrado. Isso porque a tecnologia atua apenas na fase de inferência, ou seja, no uso dos modelos já treinados, não impactando diretamente o treinamento, que continua exigindo grande poder computacional.

Além disso, ao tornar a IA mais acessível e barata, o TurboQuant pode incentivar novos usos e aumentar a demanda geral por infraestrutura tecnológica. A expectativa é que a tecnologia seja detalhada em eventos científicos importantes ainda este ano, consolidando seu papel como uma das principais inovações recentes no setor.

(Googlediscovery)