NVIDIA выпускает веса флагманской модели Cosmos-Reason2-32B и расширяет контекстное окно до 256 тыс. токенов

По данным Beating, NVIDIA выпустила веса для Cosmos-Reason2-32B — флагманской версии физического AI-моделя рассуждений «видение-язык» (VLM), предназначенной, чтобы помочь роботам и системам автономного вождения понимать пространственные, временные и физические принципы. Модель с 32 миллиардами параметров, созданная на базе Qwen3-VL-32B-Instruct, доступна по лицензии NVIDIA Open Model License для коммерческого использования.

Модель может анализировать видеопотоки для оценки безопасности движения, обнаруживать объекты на изображениях с 2D/3D координатами и выступать как планировочный движок для гуманоидных роботов и автономных транспортных средств. По сравнению с предыдущим поколением Cosmos-Reason2 добавляет обнаружение объектов с точной временной локализацией и расширяет контекстное окно до 256K токенов.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Forefront Tech завершает $100M ценообразование IPO, листинг на Nasdaq под кодом FTHAU

По данным ChainCatcher, компания специального назначения по слияниям и поглощениям Forefront Tech завершила ценовое размещение IPO на сумму 100 миллионов долларов 30 апреля и будет торговаться на Nasdaq под тикером FTHAU. Компания планирует использовать вырученные средства для поиска возможностей слияний и поглощений в блокчейне, финтехе, искусственном

GateNews4м назад

Anthropic Claude Code обошлось пользователю в $200,98 из-за ошибки в выставлении счетов; сначала отказали в возврате средств, прежде чем в итоге компенсировали полностью

По данным мониторинга от Beating, ошибка в биллинге в сервисе Anthropic Claude Code привела к тому, что подписчика Max 20x переплатили $200,98 за дополнительные комиссии за использование при том, что они использовали только 13% своего ежемесячного лимита. Ошибка срабатывала, когда в истории коммитов git-репозитория пользователя содержались заглавные буквы

GateNews32м назад

DeepSeek представила метод Visual Primitives для усиления мультимодального рассуждения 30 апреля

Согласно техническому отчёту DeepSeek, 30 апреля компания представила Visual Primitives — метод, который встраивает базовые визуальные единицы, такие как точки и ограничивающие рамки (bounding boxes), в цепочки рассуждений, чтобы решить проблему Reference Gap в мультимодальных задачах. Метод сокращает потребление токенов изображения

GateNews58м назад

OpenAI раскрыл, почему Codex запрещает говорить «гоблинов»: награда за «ботанический» типаж вышла из-под контроля

OpenAI в официальном блоге объяснила запрет Codex на «гоблинов» и другие существа: это связано с предпочтением биоморфных метафор в поощрительных сигналах, которые использовались при обучении шизоидного «книжного» типа личности, что привело к межличностному загрязнению и ошибочному RLHF-наведению. Инцидент раскрыл Barron Roth после того, как были опубликованы системные инструкции; OpenAI применяет две стратегии — краткосрочное жесткое кодирование и долгосрочное удаление поощрительных сигналов, — предупреждая о хрупкости дизайна наград и необходимости более точного посттренировочного аудита.

ChainNewsAbmedia1ч назад

Alibaba открывает исходный код модуля интерпретируемости Qwen-Scope для Qwen, охватывающего 7 моделей, 30 апреля

По данным PANews, 30 апреля Alibaba's Qwen объявила о выпуске с открытым исходным кодом Qwen-Scope — модуля интерпретируемости, обученного на моделях серий Qwen3 и Qwen3.5. Релиз охватывает 7 крупных языковых моделей в вариантах для плотных и mixture-of-experts, а также 14 наборов разреженных автоэнкодеров

GateNews2ч назад

ИИ-серверы Nvidia B300 достигли $1 млн в Китае на фоне дефицита поставок

Как сообщает Reuters, AI-серверы Nvidia B300 теперь продаются в Китае примерно за 7 миллионов юаней (1 миллион долларов США) — на фоне пресечения каналов контрабанды и сохранения спроса со стороны местных технологических компаний. Цена выросла с примерно 4 миллионов юаней (585 000 долларов США) в конце 2025 года, значительно

GateNews2ч назад
комментарий
0/400
Нет комментариев