Gate News消息,4月20日——根据Databricks的David Meyer所述,顶级AI模型擅长解决奥林匹克数学等复杂问题,但在处理日常企业工作时却会遇到困难。某些模型可能会改正错误的发票号码,而不是将其标记为错误;同时,像Claude这样的编码工具在数据工程任务上也可能表现不佳。
这种差距源于企业数据与用于训练大模型的公开网页文本之间存在根本性差异。企业数据往往包含含糊的字段标签、大量空白字段,以及以纯文本形式存储的代码。在一项学术研究中,用于数据工程任务的AI模型的F1分数(在精确率与召回率之间取得平衡)从公共数据上的0.94降至企业数据上的0.07。此外,大模型通常会默认套用训练中熟悉的模式;即便在收到针对某家公司专有查询语言的指令和文档之后,有些模型仍然默认使用结构化查询语言 (SQL)。
经过强化学习微调的小型开源模型可以以更高效率、显著更低的训练成本来处理特定工作,而大型通用模型则难以做到这一点。Databricks正在为特定工作流构建更小的AI代理,例如KARL,它使用强化学习来借助公司文档进行多步骤推理。行业正从依赖超大型模型转向混合架构:由小型高效模型负责处理日常的海量任务,然后仅在遇到不明确或复杂的情况时才升级到更大、更昂贵的系统。
Databricks最近收购了Quotient AI,以帮助大型企业更可靠地运行AI代理。AI业务中的竞争如今聚焦于运行完整的AI生命周期,包括用于追踪错误的反馈系统,并随着时间持续改进模型;因此,在部署之后,评估与调优工具的价值也变得愈发重要。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
الواقع الواقعي لوكلاء الذكاء الاصطناعي في وادي السيليكون: هدرٌ هائل للرموز، وتكاملٌ «شديد الفوضى» للنظام، وتوقعات هوانغ رين-سـونغ عن «ChatGPT التالي» لا تزال بحاجة إلى التحقق
في مؤتمرٍ حديث في وادي السيليكون، أدلى العديد من الرؤساء التنفيذيين لِشركات ناشئة جديدة في مجال الذكاء الاصطناعي بآرائهم حول مشكلات استخدام وكلاء الذكاء الاصطناعي الحالية، معتبرين أنها تواجه صعوبتين أساسيتين: هدر التوكنات والارتباك في الأنظمة. وأشار خبراء إلى أنه يتعين على الشركات أن تكون أكثر حذرًا عند تحديد متى يجب استخدام نماذج اللغات الكبيرة، لتجنب إهدار الموارد غير الضروري. بالإضافة إلى ذلك، غالبًا ما يؤدي التعاون بين عدة وكلاء للذكاء الاصطناعي إلى مشكلات في نقل الرسائل وتناسق الحالة، ما يُظهر أن المعايير الحالية لا تزال بحاجة إلى تحسين. ورغم أن جملة آراء هوانغ رين-سونغ تتناول وجهة نظر حول مؤشر الرواتب المرتبطة بالتوكن، فإن ردود الفعل تشير إلى أن ذلك لا يعني الإنتاجية؛ فالقيمة الفعلية تكمن في تصميم المهام بشكل فعّال.
ChainNewsAbmediaمنذ 13 س
الذكاء الاصطناعي يبتلع 80% من رأس المال الاستثماري العالمي، الربع الأول من عام 2026 يستحوذ على 2420 مليار دولار: كيف يتعامل مزوّدو خدمات العملات المشفرة مع إعادة توزيع الأموال
وفقًا للتقارير، فإن إجمالي استثمارات رأس المال الاستثماري العالمية في الربع الأول من عام 2026 يقترب من 300 مليار دولار، حيث استحوذت الشركات المرتبطة بالذكاء الاصطناعي وحدها على نحو 242 مليار دولار، أي ما يعادل 80% من رأس المال الاستثماري. وهذا يدل على أن الذكاء الاصطناعي أصبح محورًا رئيسيًا لرأس المال الاستثماري. ومع تركز التمويل في مجال الذكاء الاصطناعي، تعرضت مجالات أخرى مثل crypto إلى الضغط، ويحتاج اللاعبون في القطاع إلى تعديل استراتيجياتهم، ودمج الذكاء الاصطناعي بشكل أعمق في أعمالهم، كما يتوقعون ظهور اتجاه نحو دمج البنية التحتية.
ChainNewsAbmediaمنذ 17 س
荣耀人形机器人以50分26秒夺得2026年北京亦庄半程马拉松冠军
2026年北京亦庄半程马拉松以人形机器人参赛,赛程为21.0975公里。自动驾驶团队Qitian Dasheng以50:26夺冠,而遥控团队Jueying Chitu在净计时中率先完赛,但由于处罚排名更低。
GateNewsمنذ 18 س
香港警方警告“AI 量化交易”加密诈骗:女子损失 770 万港元
警方在香港披露了一起加密货币诈骗案件:一名女性通过 Telegram 被冒充投资专家的诈骗分子骗走了 770 万港元。诈骗分子声称可通过人工智能交易带来高额回报。警方提醒公众,投资加密货币存在相关风险。
GateNewsمنذ 19 س
以太坊联合创始人鲁宾:AI 将成为加密的关键转折点,但科技巨头的垄断带来系统性风险
强调以太坊联合创始人约瑟夫·鲁宾,AI 对加密货币行业的变革潜力具有重要意义,同时也警告科技巨头之间的中心化风险。他设想区块链上由 AI 驱动的自主交易,并指出传统金融与 DeFi 的融合正在加速。
GateNews04-18 14:01
Luffa 与数字资产平台合作集成 AI 驱动的加密货币交易
Luffa,作为一个 Web3 社交生态系统,与一家数字资产交易平台合作,集成由 AI 驱动的交易功能,在保持去中心化和风险缓解的同时,增强安全通信与交易,并在统一界面中实现。
GateNews04-18 06:31