Топові AI-моделі відстають у рутинних корпоративних задачах, заявляє Databricks: менші спеціалізовані моделі випереджають

Повідомлення Gate News, 20 квітня — Топові AI-моделі чудово розв’язують складні задачі, як-от олімпіадну математику, але важко справляються з рутинною роботою в корпораціях, за словами Девіда Мейєра з Databricks. Деякі моделі можуть виправити неправильний номер рахунка-фактури замість того, щоб позначити це як помилку, тоді як інструменти для програмування на кшталт Claude також можуть програвати на завданнях із data engineering.

Розрив пояснюється принциповими відмінностями між корпоративними даними та публічними текстами вебу, які використовують для навчання великих моделей. Корпоративні дані часто мають розпливчасті назви стовпців, багато порожніх полів і коди, збережені як звичайний текст. В одному академічному дослідженні F1-показник AI-моделі, який поєднує точність і повноту, знизився з 0.94 на публічних даних до 0.07 на корпоративних даних для завдання з data engineering. Крім того, великі моделі, як правило, за замовчуванням спираються на знайомі патерни з тренувань; деякі, як (Structured Query Language), за замовчуванням використовували навіть після отримання інструкцій і документації щодо власної мови запитів компанії.

Менші відкриті моделі з підлаштуванням за допомогою reinforcement learning можуть ефективніше виконувати конкретні роботи за значно нижчі витрати на навчання, ніж великі універсальні моделі. Databricks будує менші AI-агенти для конкретних робочих процесів, зокрема KARL, який використовує reinforcement learning для багатокрокового міркування з документами компанії. Індустрія переходить від опори на гігантські моделі до гібридних архітектур, де малі ефективні моделі обробляють рутинний обсяг, а потім ескалюють лише неясні або складні випадки до більших, дорожчих систем.

Нещодавно Databricks придбала Quotient AI, щоб допомогти великим підприємствам запускати AI-агенти більш надійно. Конкуренція в AI-бізнесі тепер зосереджується на проходженні повного AI-циклу, включно з системами зворотного зв’язку для відстеження помилок і безперервного поліпшення моделей з часом, тож інструменти для оцінювання й налаштування стають дедалі ціннішими після розгортання.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Реальність AI-агентів із Силіконової долини: масове марнотратство токенів, інтеграція систем «вкрай хаотична», прогноз Дженсена Хуана «наступного ChatGPT» потребує підтвердження

Під час недавніх конференцій у Силіконовій долині кілька CEO AI-стартапів висловили свої погляди на проблеми використання сучасних AI-агентів, вважаючи, що існують дві ключові труднощі: марнування токенів і системна плутанина. Експерти зазначають, що компаніям потрібно більш обережно визначати, коли використовувати великі мовні моделі, щоб уникнути непотрібної витрати ресурсів. Крім того, взаємодія та співпраця кількох AI-агентів часто спричиняє проблеми з передаванням повідомлень і узгодженістю стану, що свідчить про те, що стандартизацію нині ще треба вдосконалювати. Хоча погляди Хуан Ренсюня щодо показника «зарплати» в токенах були згадані, відгуки вказують, що це не дорівнює продуктивності: реальна цінність полягає в ефективному проєктуванні завдань.

ChainNewsAbmedia13год тому

AI поглинає 80% глобальних венчурних інвестицій; у Q1 2026 витягує 242 мільярди доларів: як учасники крипторинку мають реагувати на перерозподіл капіталу

Згідно з повідомленнями, у першому кварталі 2026 року загальний обсяг глобальних венчурних інвестицій майже досягне 300 мільярдів доларів США, з яких компанії, пов’язані з AI, самі на себе припадають приблизно на 242 млрд доларів США, що становить 80% від венчурних інвестицій. Це демонструє, що AI уже став головним фокусом венчурного ринку. Оскільки кошти концентруються в AI, інші напрями, такі як crypto, зазнають витіснення; учасникам ринку потрібно скоригувати стратегії, інтегруючи AI в бізнес ще глибше, і очікувати тенденції до консолідації інфраструктури.

ChainNewsAbmedia17год тому

Гуманоїдний робот Honor перемагає на півмарафоні в Пекіні Yizhuang 2026 за 50 хвилин 26 секунд

У півмарафоні в Пекіні Yizhuang 2026 рокe представили гуманоїдних роботів, які змагалися на дистанції 21.0975 км. Автономна команда Qitian Dasheng перемогла за 50:26, тоді як дистанційно-керована команда Jueying Chitu фінішувала першою за чистим часом, але посіла нижче місце через штрафи.

GateNews18год тому

Поліція Гонконгу застерігає про криптосхему зі «сAI кількісним трейдингом»: жінка втратила HK$7,7 млн

Поліція Гонконгу розкрила аферу з криптовалютою, під час якої жінка втратила 7,7 мільйона HK$ шахраям, що видавали себе за інвестиційних експертів через Telegram, обіцяючи високі прибутки завдяки AI-трейдингу. Поліція застерегла громадськість про ризики, пов’язані з інвестиціями в криптовалюти.

GateNews19год тому

Засновник Ethereum Лубін: ШІ буде критичною точкою повороту для крипто, але монополія техгігантів створює системні ризики

Засновник Ethereum Джозеф Лубін підкреслив трансформаційний потенціал ШІ для криптовалютного сектору, водночас застерігши від ризиків централізації серед технологічних гігантів. Він уявляє ШІ-керовані автономні транзакції в блокчейні та наголошує на зближенні традиційних фінансів із DeFi.

GateNews04-18 14:01

Luffa співпрацює з платформою для цифрових активів, щоб інтегрувати ШІ-підсилену криптоторгівлю

Luffa, соціальна екосистема Web3, співпрацює з платформою для торгівлі цифровими активами, щоб інтегрувати торговельні функції на основі ШІ, покращуючи безпечну комунікацію та торгівлю в єдиному інтерфейсі, зберігаючи децентралізацію та зменшуючи ризики.

GateNews04-18 06:31
Прокоментувати
0/400
Немає коментарів