GLM-5.1 занимает первое место в кодовом рейтинге LMArena; исходный код — №1 в мире и №3 в мире

Gate News новости, 10 апреля, сегодня глобальная авторитетная платформа для оценок ИИ LMArena (платформа для оценки моделей ИИ, в которой участвуют миллионы пользователей, проводя слепые тесты) обновила специализированный рейтинг Code Arena. GLM-5.1 заняла первое место среди глобальных моделей с открытым исходным кодом, а также находится на третьем месте в мире среди всех моделей.

GLM-5.1 не только унаследовала возможности с открытым исходным кодом на уровне SOTA из предыдущего поколения моделей для кодирования, но и добилась прорыва в задачах с длительным горизонтом (Long-Horizon Task), реализовав: сборку Linux-десктопа с нуля за 8 часов; 655 итераций, которые позволили преодолеть узкое место оптимизации в векторных базах данных; 1000 раундов оптимизации вызовов инструментов под реальные нагрузки машинного обучения.

Отдельно стоит отметить, что при одинаковых критериях оценки в рейтинге METR GLM-5.1 — единственная модель с открытым исходным кодом, достигшая уровня 8 часов непрерывной работы, и одна из немногих моделей в мире, обладающих этой способностью, кроме Claude Opus 4.6.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

DeepSeek стремится к $300M при оценке $10B миллиард, поскольку оценки OpenAI и Anthropic вызывают дебаты на рынке

DeepSeek стремится привлечь $300 миллион при оценке $10 миллиард, что заметно ниже, чем у ведущих американских ИИ-компаний, таких как OpenAI и Anthropic. Низкая стоимость обучения модели R1 нарушила рынок, усилив опасения инвесторов по поводу расхождений в оценках и потенциала выручки.

GateNews17м назад

Cerebras подаёт заявку на IPO, поскольку сделка с OpenAI расширяется до более $20B

Cerebras, производитель чипов с поддержкой Nvidia, планирует подать заявку на IPO 18 апреля, переключившись на предоставление вычислительной мощности для облачных сервисов после выгодного партнерства с OpenAI. IPO проходит на фоне существенных инвестиций в стартапы по ИИ-чипам и роста оценок компаний.

GateNews3ч назад

World расширяет интеграции для верификации личности с Zoom, DocuSign, Tinder и другими

World — компания, соучредителем которой является Сэм Альтман, — объявила о новых интеграциях с такими платформами, как Zoom и Tinder, усилив свою систему верификации World ID. Обновлённый протокол позволяет приложениям использовать многоуровневые проверки личности: им пользуются 17,9 млн пользователей по всему миру.

GateNews5ч назад

NVIDIA представила первую в мире «модель Изинга», созданную специально для квантового ИИ

NVIDIA представила открытую модель «NVIDIA Ising», разработанную специально для квантового искусственного интеллекта, чтобы решать задачи калибровки и исправления ошибок квантовых процессоров. Используя технологии визуального языка, она сокращает время калибровки до нескольких часов и повышает скорость и точность исправляющего декодирования. Модель уже интегрирована с несколькими научно-исследовательскими организациями и доступна для загрузки, продвигая прикладное использование квантовых вычислений на рынке.

ChainNewsAbmedia7ч назад

AI-вендинг-агент «Валери» управляет вендинговым автоматом в Сан-Франциско с OpenClaw

AI-агент «Valerie» теперь управляет вендинговым автоматом в Сан-Франциско на OpenClaw, проверяя, насколько далеко люди готовы доверять коду с ценообразованием, маркетингом и реальными наличными. Краткое содержание AI-агент «Valerie» запускает физический вендинговый автомат в Сан-Франциско с использованием фреймворка OpenClaw, устанавливая цены, давая названия

Cryptonews8ч назад

DeepSeek привлекает средства при оценке более $10 миллиардов в первом внешнем раунде финансирования

Сообщение Gate News, 17 апреля — Согласно The Information, компания в сфере ИИ DeepSeek проводит свой первый внешний раунд финансирования с момента основания, целевая оценка превышает $10 миллиардов.

GateNews8ч назад
комментарий
0/400
Нет комментариев