A Synapse Software aplica a tecnologia TurboQuant para reduzir os custos de processamento de documentos de IA

Mensagem de Gate News, 15 de Abril — A Synapse Software integrou o TurboQuant, um algoritmo de quantização vetorial desenvolvido pela Google Research, na sua solução Synap OCR IX para melhorar as capacidades de IA para documentos, ao mesmo tempo que reduz os custos de adoção de IA pelas empresas.

O TurboQuant comprime a cache KV utilizada por (LLMs) e por (VLMs), modelos de linguagem de visão, reduzindo o consumo de memória ao processar documentos longos. Isto permite um processamento de dados mais rápido na mesma infraestrutura de GPU. A tecnologia aborda estrangulamentos de memória que anteriormente exigiam uma infraestrutura de GPU dispendiosa, especialmente no tratamento de contextos alargados e de processamento em grandes lotes sem degradação de desempenho.

A Synapse Software também suporta ambientes baseados em CPU para empresas que não conseguem implementar uma infraestrutura de GPU. Através de uma monitorização de precisão, a empresa obteve um processamento de inferência apenas com CPU de cerca de 100 documentos por minuto, mantendo a perda de qualidade abaixo de 1%, reduzindo o custo total de propriedade (TCO). A abordagem flexível de infraestrutura permite a adoção de IA para OCR em setores sensíveis à segurança, como finanças e administração pública, onde anteriormente a implementação no local e as limitações de infraestrutura dificultavam a aplicação de IA.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Worxphere Rebrands JobKorea With AI-Powered Hiring Tools

Gate News message, April 26 — South Korean HR platform Worxphere has rebranded JobKorea as it transitions from traditional online job boards to AI-driven hiring solutions. The company is consolidating services including JobKorea and Albamon into a unified platform covering permanent employment,

GateNews6h atrás

Olenox anuncia fusão com a CS Digital para desenvolver oportunidades de mineração de Bitcoin fora da rede e com baixo custo

As duas empresas concordariam em fundir-se, com a CS Digital a receber $55 milhões numa operação de permuta total (all-share), para combinar a experiência da Olenox em energia com a experiência da CS Digital em mineração de bitcoin. A empresa combinada procuraria desenvolver iniciativas de mineração fora da rede e de centros de dados de IA nas proximidades de

Coinpedia7h atrás

ComfyUI Angaria $30M a $500M de Avaliação numa Ronda Liderada pela Craft Ventures

Mensagem de notícias da Gate, 25 de abril — A ComfyUI, uma startup de ferramentas para criadores de IA, angariou $30 milhões a uma avaliação de $500 milhões numa ronda de financiamento liderada pela Craft Ventures. A Pace Capital, a Chemistry e a TruArrow também participaram no investimento, na sequência de uma ronda Série A de $19 milhões no final de 2024 apoiada pela Chemistry Ventures, Cursor Capital e pelo fundador da Vercel, Guillermo Rauch.

GateNews04-25 02:51

XChat é Lançado na App Store com Encriptação de Ponta a Ponta e Integração com Grok

Mensagem de Gate News, 25 de Abril — XChat, a aplicação de mensagens independente da X (anteriormente Twitter), foi oficialmente lançada na App Store da Apple a 25 de Abril. A app já está disponível para descarregar e utilizar no iOS, com a versão para Android a chegar em breve. O XChat permite que os utilizadores iniciem sessão diretamente com a sua conta X,

GateNews04-25 02:00

DeepSeek V4-Flash chega ao Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw ligação automática com um clique

Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, disponibilizando três conjuntos de comandos de acesso rápido para ligar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adoptam uma arquitectura MoE, com suporte nativo para contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, os FLOPs por token caem 27% e a cache KV reduz 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre vários fluxos de trabalho, reduzindo custos e riscos de soberania dos dados.

ChainNewsAbmedia04-24 10:45
Comentar
0/400
Nenhum comentário