GLM-5.1 atinge o topo do ranking de código do LMArena: 1.º lugar em open source e 3.º a nível global

Notícias do Gate News, a 10 de abril. Hoje, a plataforma global de avaliação de IA de referência LMArena (plataforma de avaliação de modelos de IA com testes cegos, com participação de milhões de utilizadores) atualizou a tabela de classificação especializada do Code Arena: o GLM-5.1 ficou em primeiro lugar entre os modelos abertos a nível mundial, e em terceiro lugar na classificação global de modelos.

O GLM-5.1 não só herdou as capacidades de codificação em código aberto SOTA da geração anterior, como também alcançou um avanço nas tarefas de longo alcance (Long-Horizon Task), realizando: a construção, do zero, de um ambiente de trabalho Linux em 8 horas; 655 iterações para ultrapassar o gargalo de otimização de uma base de dados vetoriais; e 1000 rondas de chamadas a ferramentas para otimizar a carga de modelos de aprendizagem automática reais.

A destacar ainda que, sob critérios de avaliação equivalentes na tabela METR, o GLM-5.1 é o único modelo aberto a atingir trabalho contínuo ao nível de 8 horas, e é também um dos poucos modelos no mundo, para além do Claude Opus 4.6, com esta capacidade.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A DeepSeek procura $300M a uma $10B avaliação, enquanto as avaliações da OpenAI e da Anthropic alimentam o debate do mercado

A DeepSeek pretende angariar $300 milhões a uma avaliação de $10 mil milhões, significativamente inferior à de principais empresas de IA dos EUA, como a OpenAI e a Anthropic. O baixo custo de treino do modelo R1 deles perturbou o mercado, levando a preocupações dos investidores quanto a disparidades de avaliação e ao potencial de receitas.

GateNews14m atrás

Cerebras dá entrada para IPO à medida que o acordo com a OpenAI se expande para mais de $20B

A Cerebras, uma empresa de chips apoiada pela Nvidia, planeia dar entrada com um pedido de IPO a 18 de abril, fazendo a transição para fornecer capacidade de computação em nuvem após uma parceria lucrativa com a OpenAI. O IPO surge num contexto de investimentos significativos em startups de chips de IA e de valorizações em alta.

GateNews3h atrás

A World alarga integrações de verificação de identidade com Zoom, DocuSign, Tinder e outros

A World, uma empresa co-fundada por Sam Altman, anunciou novas integrações com plataformas como Zoom e Tinder, reforçando o seu sistema de verificação do World ID. O protocolo atualizado permite que as aplicações utilizem verificações de identidade por níveis, com 17,9 milhões de utilizadores a nível global.

GateNews5h atrás

A NVIDIA anuncia o primeiro «modelo de Ising» do mundo concebido para a IA quântica

A NVIDIA anunciou o modelo open source “NVIDIA Ising”, concebido especificamente para a inteligência artificial quântica, para resolver os desafios de calibração e correcção de erros dos processadores quânticos. Ao utilizar tecnologias de linguagem visual, encurta o tempo de calibração para algumas horas e melhora a velocidade e a precisão da descodificação para correcção de erros. O modelo já foi integrado com várias instituições de investigação e está disponível para transferência, impulsionando a adopção de aplicações no mercado da computação quântica.

ChainNewsAbmedia7h atrás

O agente de vending com IA “Valerie” opera uma máquina de vending em São Francisco com a OpenClaw

O agente de IA "Valerie" já gere agora uma máquina de venda automática em São Francisco na OpenClaw, testando até que ponto as pessoas confiam no código com preços, marketing e dinheiro em numerário do mundo real. Resumo O agente de IA "Valerie" gere uma máquina de venda automática física em São Francisco utilizando a framework OpenClaw, definindo preços, dando nomes

Cryptonews8h atrás

DeepSeek angaria fundos com uma avaliação superior a $10 Billion no seu primeiro round de financiamento externo

Mensagem da Gate News, 17 de abril — Segundo a The Information, a empresa de IA DeepSeek está a realizar o seu primeiro round de financiamento externo desde a sua criação, com uma avaliação-alvo superior a $10 billion.

GateNews8h atrás
Comentar
0/400
Nenhum comentário