Google lança algoritmo TurboQuant: quantização KV cache de 3 bits sem perda de precisão, velocidade de inferência aumenta até 8 vezes

Notícias do Gate News, a 25 de março, o Google Research lançou o algoritmo de compressão quântica TurboQuant, que consegue comprimir o cache KV de grandes modelos de linguagem para 3 bits, reduzindo o uso de memória pelo menos 6 vezes, sem necessidade de treino ou ajuste fino, sem perder precisão do modelo. No modo de 4 bits, a velocidade de cálculo de atenção na GPU Nvidia H100 é até 8 vezes superior à linha de base de 32 bits não quantificados. A equipe de pesquisa validou o TurboQuant usando modelos Gemma e Mistral em benchmarks de contexto longo como LongBench, Needle In A Haystack e ZeroSCROLLS, alcançando desempenho ótimo em todos os testes. O algoritmo é composto por duas subferramentas: PolarQuant, que elimina o custo de memória das quantizações tradicionais por meio de transformação em coordenadas polares, e QJL, que corrige o erro residual usando apenas 1 bit. A pesquisa foi liderada por Amir Zandieh do Google Research e Vahab Mirrokni, vice-presidente e Google Fellow, em colaboração com KAIST na Coreia do Sul e a Universidade de Nova York, e será apresentada na ICLR 2026. O Google afirmou que uma das principais aplicações dessa tecnologia é resolver o gargalo do cache KV em modelos como Gemini.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Pesquisa da Nomura: oito em cada dez investidores institucionais planejam alocar ativos cripto com 2% a 5% do AUM

A pesquisa com investidores institucionais de ativos digitais de 2026 da Nomura Securities (Nomura) e de sua subsidiária de criptomoedas Laser Digital mostra que, para quase quatro quintos dos investidores institucionais entrevistados, a intenção é alocar de 2% a 5% do total de ativos sob gestão (AUM) no mercado de criptomoedas; a maioria das instituições afirma que pretende fazer isso no decorrer do próximo ano, e não imediatamente.

MarketWhisper6h atrás

Pesquisa da Nomura: 80% dos Investidores Institucionais Dispostos a Alocar 2-5% em Criptomoedas

Uma pesquisa da Nomura revela que 80% dos investidores institucionais buscam investir 2-5% em criptomoedas, favorecendo estratégias de rendimento como staking e empréstimo. Clareza regulatória e gestão de risco são fundamentais para impulsionar o interesse institucional em ativos digitais.

GateNews14h atrás

Mercado de Stablecoins atinge $322B ATH, Volume de Negociação do 1T 2026 chega a US$ 8,3 trilhões

O mercado de stablecoins registrou um crescimento significativo, saltando $2,25 bilhões para atingir $322 bilhão, apesar de uma contração mais ampla do mercado de cripto. O USDC viu um aumento substancial na oferta, enquanto o USDT manteve sua participação de mercado. Stablecoins remuneradas contribuíram de forma marcante para esse crescimento, com a atividade de transações atingindo uma máxima histórica.

GateNews14h atrás

Ethereum Foundation Anuncia Resultados do Projeto ETH Rangers: Mais de US$ 5,8 Milhões em Ativos Recuperados ou Bloqueados

O projeto ETH Rangers da Ethereum Foundation foi concluído com sucesso, financiando 17 pesquisadores para aprimorar a segurança pública no ecossistema. As conquistas incluem recuperar US$ 5,8 milhões em ativos, identificar mais de 785 vulnerabilidades e desenvolver diversas ferramentas de segurança.

GateNews19h atrás

Principais VCs Cripto Veem Quedas Significativas de AUM em Meio à Queda do Mercado de 2025

Durante a queda do mercado cripto em 2025, grandes empresas de venture capital viram quedas significativas em AUM, mas a Haun Ventures cresceu 30%. Paradigm e a16z estão levantando mais de US$ 4,2 bilhões para novos fundos, destacando desempenhos variados entre as firmas.

GateNews22h atrás
Comentário
0/400
Sem comentários