У нещодавньому блозі Nvidia йдеться, що GPU Blackwell коштують майже вдвічі дорожче за годину порівняно з поколінням Hopper, але забезпечують у 35 разів нижчі витрати на інференс на токен. Як тестову модель використали DeepSeek-R1: оренда Blackwell (GB300 NVL72) становить $2,65 за GPU на годину проти $1,41 для Hopper, однак пропускна здатність одного GPU зростає з 90 до 6 000 токенів за секунду. Такий приріст пропускної здатності у 65 разів знижує витрати на мільйон токенів з $4,20 до $0,12.
Показник $0,12 передбачає повну оптимізацію програмного забезпечення, включно з інференсом у низькій точності FP4 та багатотокенним прогнозуванням (MTP). Якщо MTP не ввімкнено, витрати на мільйон токенів досягають приблизно $2,35, а з увімкненим MTP падають до $0,11, демонструючи, що лише ця функція дає ефект оптимізації у 21 раз.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Forefront Tech завершує $100M -ціну IPO, щоб вийти на Nasdaq
Згідно з ChainCatcher, Forefront Tech Holdings Acquisition Corp завершила цінування IPO на суму 100 мільйонів доларів 30 квітня, щоб розміститися на Nasdaq під тикером FTHAU. Кошти буде використано для вивчення можливостей злиття та поглинання в блокчейні, штучному інтелекті, фінтеху та інших
GateNews30хв. тому
Колишній топменеджер Meta залучає кошти для AI-стартапу Flourish із оцінкою $2,5 мільярда
За даними Bloomberg, Томас Редардон, колишній виконавчий директор Meta, який керував роботою над Meta Neural Band, збирає кошти для Flourish — нового AI-стартапу, що фокусується на системах low-power AI. Lux Capital і Google Ventures погодилися стати ключовими інвесторами, а вже були внесені зобов’язання на суму $500 мільйонів за оцінкою $2,5
GateNews32хв. тому
OpenAI відстежує «ґоблінську» проблему до винагородного сигналу нердьової особистості та спостерігає сплеск згадок «ґобліна» на 175% у GPT-5,1
За даними OpenAI, компанія визначила першопричину проблеми «гоблін», яка переслідувала моделі GPT починаючи з GPT-5.1. Сигнал винагороди, який використовували для підсилення риси «Nerdy», заохочував результати з посиланнями на фантастичних істот, причому 76,2% навчального набору даних демонстрували
GateNews1год тому
Parallel Web Systems залучає $100M раунд B на оцінку в $2B , який очолює Sequoia
За даними TechCrunch, Parallel Web Systems — стартап у сфері ШІ, заснований колишнім CEO Twitter Парагом Агарвалом — залучив $100 мільйонів у раунді серії B, який очолила Sequoia, оцінивши компанію в $2 мільярда. Раунд збільшує загальне фінансування компанії до $230 мільйонів — через п’ять місяців після її раунду серії A на $100 мільйонів. Parallel
GateNews1год тому
Вечерня подія з нагоди 8-ї річниці BitMart для користувачів із Тайваню: впровадження AI-автоматизованої торгівлі та локалізованих сервісів
BitMart розмістила біржовий вечір з нагоди 8-ї річниці в готелі Taipei Grand Mayfull у Тайбеї: понад 150 гостей відвідали захід, де вшанували розвиток за вісім років і оголосили про локалізацію та AI-стратегії автоматизованої торгівлі. BitMart Skill у поєднанні з Blave дає змогу користувачам без програмування здійснювати AI-автоматизовану торгівлю та отримувати миттєві аналітичні інсайти в режимі реального часу. Глобальна база користувачів перевищила 13 мільйонів, кількість доступних проєктів — понад 4 800, а обсяг торгів сягнув понад 1 трильйона доларів США. На вечері були живий Дідь Мороз і щедрі подарунки, що демонструє рішучість глибоко працювати з Тайванем.
ChainNewsAbmedia2год тому
SoftBank планує вийти на біржу з Roze у 2026 році, цільова оцінка — 100 мільярдів доларів
За ексклюзивним повідомленням Financial Times (FT) від 30 квітня, SoftBank планує в Сполучених Штатах створити шляхом розділення абсолютно нову незалежну компанію під назвою Roze. Її діяльність охоплюватиме AI-роботів і інфраструктуру центрів обробки даних, а мета — якнайшвидше завершити IPO у 2026 році. Цільова оцінка встановлена на рівні 100 мільярдів доларів. Financial Times також повідомляє, що всередині SoftBank є сумніви щодо цільової оцінки та графіка IPO.
MarketWhisper2год тому