Новини Gate News, 10 квітня. Сьогодні глобальна авторитетна платформа для оцінювання ШІ LMArena (платформа для оцінювання моделей ШІ з сліпими тестами за участі мільйонів користувачів) оновила спеціальний рейтинг Code Arena: GLM-5.1 посів перше місце серед глобальних відкритих моделей із відкритим кодом і третє місце серед глобальних моделей.

GLM-5.1 не лише успадкував відкритий SOTA-кодинг попереднього покоління моделей, але й досяг прориву в задачах із довгостроковою перспективою (Long-Horizon Task), реалізувавши: 8 годин для побудови з нуля Linux-робочого столу; 655 ітерацій, що подолали вузьке місце оптимізації в векторних базах даних; 1000 раундів оптимізації викликів інструментів для реального робочого навантаження ML-моделі.

Варто зазначити, що за однакових критеріїв оцінювання в рейтинговому списку METR GLM-5.1 є єдиною відкритою моделлю, яка досягає рівня безперервної роботи тривалістю 8 годин, а також однією з небагатьох моделей у всьому світі, окрім Claude Opus 4.6, що має таку здатність.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Китай випробує понад 300 гуманоїдних роботів у півмарафоні в Пекіні 19 квітня

Новини індустрії ШІ

У другому робо-півмарафоні в Пекіні візьмуть участь понад 300 гуманоїдних роботів із 70 команд, які змагатимуться на дистанції 21 км. Акцент зроблено на прогресі в автономному русі: 40% працюють без керування. Китай домінує на ринку гуманоїдних роботів, попри виробничі труднощі.

GateNewsЩойно

США прагнуть збільшити імпорт урану з Намібії, щоб живити атомні станції для ШІ

Сировинні товари Новини індустрії ШІ

Сполучені Штати розглядають збільшення імпорту урану з Намібії, щоб забезпечувати ядерну енергетику для центрів обробки даних під потреби ШІ, оскільки Китай домінує в урановому секторі Намібії. Зростання цін на уран відновлює інтерес до видобутку, попри проблеми з постачанням води в посушливому регіоні.

GateNews10хв. тому

Керівники OpenAI Білл Піблз і Кевін Вейл залишають посади під час реорганізації управління

Новини індустрії ШІ

Керівники OpenAI Білл Піблз і Кевін Вейл оголосили про своє звільнення; це частина низки кадрових змін керівництва, оскільки компанія децентралізує свою роботу. Їхні відходи відбулися після кількох інших гучних звільнень і зміни структури компанії.

GateNews1год тому

Zoom співпрацює зі World, щоб додати виявлення дипфейків за допомогою розпізнавання облич

Новини індустрії ШІ

Zoom співпрацює зі World Сема Альтмана, щоб запустити функцію, яка під час відеодзвінків виявляє реальних учасників проти AI-дипфейків. Це має на меті протидіяти зростанню шахрайства з дипфейками, із варіантами верифікації для хостів і учасників.

GateNews1год тому

AI-генеровані звіти про помилки перевантажують команду супроводу cURL

Новини індустрії ШІ

AI-генеровані звіти про помилки перевантажують проєкт cURL: суттєво зросла кількість подань, що спричиняє ресурсне навантаження. Розробники відповідають тим, що обмежують доступ до AI-моделей і призупиняють програми винагород за вразливості, щоб упоратися з припливом.

GateNews2год тому

xAI запускає API Grok Speech-to-Text і Text-to-Speech

Новини індустрії ШІ

xAI запустила API для перетворення мовлення на текст і тексту на мовлення для своєї платформи Grok, даючи розробникам можливість вбудовувати природні голосові взаємодії в застосунки. Це оновлення покращує користувацький досвід і доступність для різних сценаріїв використання.

GateNews2год тому

Прокоментувати

0/400

Немає коментарів