O Google revelou uma inovação que pode transformar a forma como modelos de inteligência artificial são executados.
Trata-se de um conjunto de algoritmos de compressão que diminui drasticamente a quantidade de memória necessária para operar sistemas avançados, como modelos de linguagem.
O impacto foi imediato no mercado financeiro, com queda nas ações de empresas ligadas à produção de chips de memória e armazenamento.
A tecnologia apresentada inclui três soluções principais: TurboQuant, PolarQuant e Quantized Johnson-Lindenstrauss, conhecido como QJL. Juntas, elas atuam diretamente sobre o chamado cache chave-valor, uma estrutura essencial que armazena informações usadas com frequência durante o funcionamento da IA.
Em testes com modelos como Gemma e Mistral, o TurboQuant conseguiu reduzir o uso de memória para apenas 3 bits, sem necessidade de treinamento adicional, além de acelerar significativamente o processamento.
Como o TurboQuant funciona na prática
O funcionamento do TurboQuant acontece em duas etapas complementares. Primeiro, o PolarQuant transforma os dados em coordenadas polares, substituindo o formato tradicional por uma representação mais eficiente baseada em raio e ângulo. Isso elimina etapas complexas e reduz custos computacionais.
Na sequência, entra o QJL, que aplica uma técnica de correção de erros extremamente leve. Ele projeta possíveis falhas de compressão em um espaço menor, garantindo precisão sem aumentar o uso de memória. O resultado é uma compressão altamente eficiente com desempenho preservado.
Impacto direto no mercado de tecnologia
O anúncio provocou reações imediatas nas bolsas. Empresas como Micron Technology, Western Digital e Seagate Technology registraram quedas, refletindo o receio de que a nova tecnologia reduza a demanda por hardware de memória no futuro.
Instituições financeiras como Morgan Stanley classificaram a inovação como disruptiva, destacando seu potencial de reduzir custos e ampliar o acesso à inteligência artificial, especialmente em serviços de nuvem.
O que muda para o futuro da IA
Apesar da reação inicial do mercado, especialistas apontam que o efeito de longo prazo pode ser mais equilibrado. Isso porque a tecnologia atua apenas na fase de inferência, ou seja, no uso dos modelos já treinados, não impactando diretamente o treinamento, que continua exigindo grande poder computacional.
Além disso, ao tornar a IA mais acessível e barata, o TurboQuant pode incentivar novos usos e aumentar a demanda geral por infraestrutura tecnológica. A expectativa é que a tecnologia seja detalhada em eventos científicos importantes ainda este ano, consolidando seu papel como uma das principais inovações recentes no setor.
(Googlediscovery)
