Серія Xiaomi MiMo-V2.5 виходить у відкритий доступ: 1T параметрів із вищою ефективністю токенів порівняно з GPT-5.4

Повідомлення Gate News, 27 квітня — команда Xiaomi MiMo оприлюднила з відкритим кодом серію MiMo-V2.5 великих мовних моделей під ліцензією MIT, що підтримує комерційне розгортання, подальше навчання та доопрацювання. Обидві моделі мають контекстне вікно розміром 1 мільйон токенів. MiMo-V2.5-Pro — це модель суміші експертів із чистим текстом (MoE) з 1,02 трильйонами загальних параметрів і 42 мільярдами активних параметрів, тоді як MiMo-V2.5 — нативна мультимодальна модель із 310 мільярдами загальних параметрів і 15 мільярдами активних параметрів, що підтримує розуміння тексту, зображень, відео та аудіо.

MiMo-V2.5-Pro орієнтована на складні агентні та програмістські задачі. У бенчмарках ClawEval вона досягла 64% Pass@3, споживаючи приблизно 70 000 токенів на траєкторію задачі — на 40%–60% менше токенів, ніж Claude Opus, Gemini 3.1 Pro та GPT-5.4. Модель набрала 78,9 на SWE-bench Verified. У демонстрації V2.5-Pro самостійно реалізувала повний компілятор SysY-to-RISC-V для проєкту курсу компіляторів Пекінського університету за 4,3 години, використавши 672 виклики інструментів, і досягла ідеального результату 233/233 на прихованих тестових наборах.

MiMo-V2.5 призначена для сценаріїв мультимодальних агентів, оснащена виділеним візуальним енкодером (729 мільйонів параметрів) та аудіоенкодером (261 мільйон параметрів), набравши 62,3 на Claw-Eval загальному піднаборі. Обидві моделі використовують гібридну архітектуру, що поєднує sliding window attention (SWA) та глобальну увагу (GA), разом із модулем 3-шарової багатотокенної передбачуваності (MTP) для прискореного виведення. Ваги моделі доступні на Hugging Face.

Поряд із випуском із відкритим кодом команда MiMo запустила «Orbit Quadrillion Token Creator Incentive Program», пропонуючи 100 квадрильйонів токенів безкоштовно протягом 30 днів для користувачів у всьому світі. Окремі розробники, команди та підприємства можуть подати заявку через сторінку програми, з циклом оцінювання приблизно 3 робочих дні; схвалені переваги розподіляються як Token Plans або прямі кредити, сумісні з інструментами на кшталт Claude Code та Cursor.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Microsoft розгортає Copilot для 743 000 співробітників Accenture

Згідно з Reuters, Microsoft розгортає Microsoft 365 Copilot для всіх 743,000 співробітників Accenture, відзначаючи це як її найбільше корпоративне розгортання на сьогодні. Крок розширює план Accenture на 2024 рік щодо надання Copilot до щонайбільше 300,000 співробітників. Опитування Accenture

CryptoFrontier9хв. тому

DeepSeek збільшив(ла) статутний капітал на 50%, частка засновника Лян Веньфеня зросла до 34%

Повідомлення Gate News, 28 квітня — Згідно з даними Qichacha, DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) збільшив(ла) статутний капітал із 10 млн юанів до 15 млн юанів. Частка засновника Лян Веньфеня у статутному капіталі зросла з 1 млн юанів до 5,1 млн юанів

GateNews15хв. тому

Meta Reserves 1GW+ Сонячної енергії та накопичення енергії для дата-центрів ШІ

Meta підписала енергетичні угоди з Overview Energy та Noon Energy, щоб забезпечити потужності для своїх дата-центрів штучного інтелекту, повідомляє The Economic Times. Компанія зарезервувала до 1 гіґавата

CryptoFrontier19хв. тому

Zhipu Z.ai продовжує промоакцію «потрійна квота» в GLM Coding Plan до 30 червня

Повідомлення Gate News, 28 квітня — Zhipu Z.ai оголосила про продовження своєї промоакції «потрійна квота» в GLM Coding Plan з початкового дедлайну 30 квітня до 30 червня, що охоплює як моделі GLM-5.1, так і GLM-5-Turbo. Промоакція доступна за східним часом із 6:00 ранку до 2:00 ранку наступного дня. GLM Coding

GateNews35хв. тому

TSMC прискорює розширення вдвічі швидше: п’ять виробництв 2 нм виходять на повну потужність у 2026 році

Повідомлення Gate News, 28 квітня — Taiwan Semiconductor Manufacturing Company (TSMC) прискорює розширення виробничих потужностей у два рази швидше за історичні темпи, щоб задовольнити різке зростання попиту з боку штучного інтелекту та високопродуктивних обчислень, повідомив Хоу Юнцін (Hou Yongqing), старший віцепрезидент TSMC. Компанія

GateNews40хв. тому

Copilot від GitHub переходить на облік за токенами з 1 червня, щомісячні внески без змін

Повідомлення Gate News, 28 квітня — GitHub оголосив, що всі плани Copilot перейдуть на облік за токенами з 1 червня 2026 року. Наявну цінову модель "premium request" буде замінено на GitHub AI Credits, а використання розраховуватиметься на основі фактичного споживання токенів (включно з вхідними, вихідними та кешованими токенами за ставками, що відповідають публічним цінам публічного API кожної моделі.

GateNews46хв. тому
Прокоментувати
0/400
Немає коментарів