Gate News 消息,4 月 20 日——Databricks 的 David Meyer 表示,顶级 AI 模型擅长解决奥林匹克竞赛数学等复杂问题,但在日常企业工作中却力不从心。某些模型可能会把不正确的发票号码改正掉,而不是将其标记为错误;同时,像 Claude 这样的编程工具在数据工程任务上也可能表现不佳。
这一差距源于企业数据与用于训练大型模型的公开网络文本之间存在根本差异。企业数据往往具有含糊的列名、数量众多的空字段,以及以纯文本形式存储的代码。在一项学术研究中,用于平衡精确率和召回率的 AI 模型 F1 分数,在公共数据上为 0.94,而在企业数据上则降至 0.07,用于数据工程任务。此外,大型模型往往会默认采用训练中熟悉的模式;有些即使在收到公司专有查询语言的指令和文档后,仍然默认使用结构化查询语言 (SQL)。
通过强化学习调优的小型开源模型,可以比大型通用模型更高效地完成特定工作,且培训成本显著更低。Databricks 正在为特定工作流程构建更小的 AI 代理,例如 KARL,它使用强化学习进行多步骤推理,且处理的是公司文档。行业正从依赖巨型模型转向混合架构:由小而高效的模型处理日常的海量任务,然后仅在遇到不清楚或复杂的情况时才升级到更大、更昂贵的系统。
Databricks 最近收购了 Quotient AI,帮助大型企业更可靠地运行 AI 代理。如今,AI 业务的竞争焦点在于运行完整的 AI 生命周期,包括用于跟踪错误的反馈系统,以及随着时间推移持续改进模型,使得评估和调优工具在部署之后愈发重要.
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
硅谷 AI Agent 现实:Token 大量浪费、系统整合“极度混乱”,黄仁勳“下一个 ChatGPT”预测有待验证
在近期的硅谷会议中,多位AI新创CEO就当前AI agent的使用问题发表了看法,认为面临token浪费与系统混乱的两大困境。专家指出,企业需要更谨慎地判断何时使用大型语言模型,以避免不必要的资源浪费。此外,多个AI agent的协作常常导致信息传递与状态一致性问题,这表明目前的标准化仍有待改进。尽管黄仁勋提到token薪资指标的观点,但反馈显示这并不等同于生产力,真正的价值在于有效的任务设计。
鏈新聞abmedia13小时前
AI 吞噬全球创投 80%,Q1 2026 吸走 2,420 亿美元:加密行业如何应对资金再分配
根据报道,2026年第一季度全球创投总金额接近3,000亿美元,其中AI相关公司独占约2,420亿美元,占创投的80%。这显示AI已成为创投的主要焦点。随着资金集中于AI,其他领域如crypto受到了挤压,业者需调整策略,将AI更深度整合于业务中,并预期将出现基础设施整并趋势。
鏈新聞abmedia17小时前
致敬人形机器人:2026 北京亦庄半程马拉松以 50 分 26 秒夺冠
2026 年北京亦庄半程马拉松以人形机器人参赛而著称,比赛距离为 21.0975 公里。自动导航团队“Qitian Dasheng”以 50:26 获胜;而远程遥控团队“Jueying Chitu”在净计时上先到达终点并排名第一,但由于受到处罚,最终名次更靠后。
GateNews18小时前
香港警方警告“AI 量化交易”加密诈骗,女子损失 770 万港元
香港警方披露了一起加密货币诈骗案件:一名女性在网上遇到冒充投资专家的骗子,骗子通过 Telegram 进行联系,声称可借助 AI 交易实现高额回报,最终导致她损失 770 万港元。警方提醒公众注意与加密货币投资相关的风险。
GateNews19小时前
以太坊联合创始人鲁宾:AI 将成为加密的关键转折点,但科技巨头的垄断带来系统性风险
以太坊联合创始人约瑟夫·鲁宾强调了人工智能对加密货币行业的变革潜力,同时提醒科技巨头之间的集中化所带来的风险。他设想在区块链上由人工智能驱动的自主交易,并指出传统金融与 DeFi 的融合正在加速。
GateNews04-18 14:01
Luffa与数字资产平台合作整合AI驱动的加密货币交易
Luffa,一个面向Web3的社交生态系统,与一个数字资产交易平台合作,整合由AI驱动的交易功能,在保持去中心化和风险缓解的同时,增强安全通信与交易,并在统一界面中实现。
GateNews04-18 06:31