A NVIDIA lança os pesos do modelo flagship Cosmos-Reason2-32B e alarga a janela de contexto para 256K tokens

Segundo Beating, a NVIDIA lançou os pesos do Cosmos-Reason2-32B, a versão de topo da sua visão-linguagem (VLM) de raciocínio de IA física, concebida para ajudar robôs e sistemas de condução autónoma a compreender princípios espaciais, temporais e físicos. O modelo de 32 mil milhões de parâmetros, construído sobre o Qwen3-VL-32B-Instruct, está disponível sob a NVIDIA Open Model License para uso comercial.

O modelo pode analisar fluxos de vídeo para avaliar a segurança na condução, detetar objetos em imagens com coordenadas 2D/3D e servir como motor de planeamento para robôs humanoides e veículos autónomos. Em comparação com a geração anterior, o Cosmos-Reason2 acrescenta deteção de objetos com localização temporal precisa e alarga a janela de contexto para 256K tokens.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Forefront Tech conclui a definição de preços do $100M IPO, com admissão na Nasdaq sob o código FTHAU

De acordo com a ChainCatcher, a empresa de aquisição com finalidade específica Forefront Tech concluiu a definição de preço de um IPO de 100 milhões de dólares a 30 de abril e vai cotar na Nasdaq sob o símbolo FTHAU. A empresa planeia usar as receitas para perseguir oportunidades de fusões e aquisições em blockchain, fintech, inteligência artificial e no

GateNews4m atrás

O código Claude da Anthropic cobrou a um utilizador a mais 200,98 dólares devido a um erro de faturação, tendo inicialmente recusado o reembolso antes de uma compensação total

De acordo com o monitorização da Beating, um erro de faturação no serviço Claude Code da Anthropic fez com que um subscritor do Max 20x fosse cobrado a mais 200,98 USD em taxas adicionais de utilização, apesar de apenas utilizar 13% da sua quota mensal. O bug foi despoletado quando o histórico de commits do repositório git de um utilizador continha o caractere em maiúscula

GateNews32m atrás

A DeepSeek Introduz um método de primitivas visuais para melhorar o raciocínio multimodal a 30 de abril

De acordo com o relatório técnico da DeepSeek, a 30 de abril a empresa apresentou o Visual Primitives, um método que incorpora unidades visuais básicas, como pontos e caixas delimitadoras, em cadeias de raciocínio para resolver o problema de Reference Gap em tarefas multimodais. O método reduz o consumo de tokens de imagem

GateNews58m atrás

A OpenAI revela porque razão o Codex não deve discutir “goblin”: a recompensa por personalidade “nerd” saiu do controlo

A OpenAI, no blogue oficial, explicou que o Codex evita discussões sobre goblins e outras criaturas, devido a uma preferência por sinais de recompensa na formação de personalidades de “nerds”, que usa metáforas de criaturas, o que provocou contaminação entre personalidades e erro no RLHF. O incidente foi revelado por Barron Roth após a divulgação de instruções do sistema; em seguida, a OpenAI adotou duas estratégias: codificação rígida a curto prazo e eliminação a longo prazo dos sinais de recompensa, para alertar para a fragilidade do design dos incentivos, e para que as auditorias pós-treinamento sejam mais rigorosas.

ChainNewsAbmedia1h atrás

O módulo de interpretabilidade Qwen-Scope de código aberto da Alibaba, cobrindo 7 modelos, a 30 de abril

De acordo com a PANews, a 30 de abril, a Qwen da Alibaba anunciou a disponibilização em open-source do Qwen-Scope, um módulo de interpretabilidade treinado nos modelos das séries Qwen3 e Qwen3.5. O lançamento abrange 7 modelos de linguagem grandes, em variantes densas e de mixture-of-experts, com 14 conjuntos de autoencoders esparsos

GateNews2h atrás

Servidores de IA Nvidia B300 atingem 1 milhão de dólares na China em meio a um aperto na oferta

De acordo com a Reuters, os servidores de IA B300 da Nvidia já são vendidos por cerca de 7 milhões de yuans (1 milhão de dólares) na China, impulsionados por uma operação de repressão às redes de contrabando e pela procura contínua das empresas de tecnologia locais. O preço subiu face aos cerca de 4 milhões de yuans (585.000 dólares) no final de 2025, significativamente

GateNews2h atrás
Comentar
0/400
Nenhum comentário