Anthropic 发布 Claude Opus 4.7,但削弱了网络能力

Crypto Frontier

Anthropic 于 4 月 16 日 (当地时间) 发布了其旗舰模型的升级版本 Claude Opus 4.7。与之前的 Opus 4.6 模型相比,Opus 4.7 在先进软件工程能力方面展现出“显著提升”,尤其是在困难任务上,并通过更强的严谨性与在复杂、长时间运行操作中的一致性,以及改进的视觉能力来实现。然而,Anthropic 在训练期间刻意削弱了该模型的网络安全攻击-防御能力,并引入安全机制以自动检测并拦截被禁止或高风险的请求。

绩效与基准

在基准测试中,Opus 4.7 的得分整体上高于之前的 Opus 4.6 以及竞争对手 GPT-5.4。不过,Anthropic 强调,Opus 4.7 的整体能力并不匹敌公司最强大的模型 Claude Mythos Preview。根据 Anthropic 的说法:“通过在现实世界中部署和运行这些防护机制,我们将积累经验,最终实现对 Mythos 级模型更广泛的发布。”

部署与定价

Opus 4.7 现已在所有 Claude 产品及 API 界面上线,并与 Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Foundry 服务集成。定价保持与 Opus 4.6 一致:$5 每百万输入 tokens 和 $25 每百万输出 tokens。

令牌(Token)消耗变更

与 Opus 4.6 相比,Opus 4.7 的两项变更将影响 token 用量。首先,Opus 4.7 使用了更新的分词器,从而提升模型处理文本的方式。然而,这意味着相同的输入可能会消耗更多 tokens——大约为上一代消耗的 1 到 1.35 倍。

其次,Opus 4.7 在更高的“思考强度”下执行更多推理,尤其是在代理式场景的后续轮次中。这提升了在复杂问题上的可靠性,但会产生额外的输出 tokens。

Token consumption increase visualization Opus 4.7 的 token 消耗增加。来源:Anthropic

市场分析与背景

分析师将 Opus 4.7 形容为一种“过渡”模型。投资分析师 Adam Button 指出,Opus 4.7 的发布强化了 Anthropic 围绕 Mythos 等“类神模型(godlike models)”的叙事,并印证了市场的怀疑:公开可用的付费模型本质上是受安全机制约束的“轻量版”。

公司背景与财务里程碑

Anthropic 于 2021 年由前 OpenAI 员工创立,致力于开发 Claude 系列大型语言模型。4 月 6 日,Anthropic 宣布其年化营收 (ARR) 已超过 $300 十亿美元$9 ,较 2025 年末的 (十亿美元) 有显著增长。该公司正在积极推进首次公开募股(IPO)。

网络安全风险担忧

Anthropic 高管多次警告 AI 对网络安全的影响。据 4 月 10 日 当地时间 的报道,美国财政部长耶伦(Yellen)和美联储主席鲍威尔(Powell)在 4 月 7 日与华尔街领导人举行紧急会议,讨论 Anthropic 最新的 Mythos AI 模型可能如何加剧网络安全风险。Anthropic 表示,Mythos 不适合公开发布,因为该模型可能被网络犯罪分子与间谍滥用。公司正在向全球领先的网络安全与软件企业选择性地提供对 Mythos 的访问权限。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

ChatGPT 广告进军澳纽加:Free 与 Go 用户先行,付费方案维持无广告

OpenAI于2023年4月17日扩展ChatGPT广告至澳洲、 新西兰及加拿大,针对Free与Go用户,付费用户无广告。此举标志着AI商业化的第二条路径,并考量了商业与监管风险,广告出现可促进付费转化。

鏈新聞abmedia8 分钟前

现代汽车集团围绕人工智能与机器人进行重组,目标到2030年部署30,000台Atlas机器人

现代汽车集团正在重组,重点转向人工智能和机器人,并削减传统业务。该集团计划到2030年在机器人领域投入343亿美元,并旨在推出机器人即服务模式,与Google DeepMind和NVIDIA合作。

GateNews3小时前

NEA 探索在核监管中使用人工智能

NEA关于新技术的工作组于3月25日至26日召开了研讨会,重点探讨如何在核主管机构内部运营以及监管监督中应用人工智能。 摘要 NEA研讨会探讨了人工智能在核监管中的真实世界应用,其中包括

Cryptonews 5小时前

中国将于4月19日在北京半程马拉松测试300+台类人机器人

北京第二届机器人半程马拉松将有来自70支队伍的300多台类人机器人参赛,赛道全长21公里。重点展示自主移动方面的进展,其中40%的机器人无需控制即可运行。尽管生产面临挑战,中国仍在类人机器人市场占据主导地位。

GateNews8小时前

美国寻求增加从纳米比亚进口铀以驱动AI驱动的核电厂

美国正在考虑从纳米比亚增加铀进口,以支持为AI数据中心供能的核能,因为中国主导了纳米比亚的铀行业。不断上涨的铀价格正在重新点燃采矿兴趣,尽管该干旱地区存在供水挑战。

GateNews8小时前

OpenAI 高管比尔·皮布尔斯和凯文·韦尔在领导层重组中离任

OpenAI 高管比尔·皮布尔斯(Bill Peebles)和凯文·韦尔(Kevin Weil)宣布离职,这是公司在将业务去中心化过程中一系列领导层变动的一部分。两人的离开紧随数位其他备受关注的高管离职,以及公司架构的调整。

GateNews9小时前
评论
0/400
镜面球观星vip
· 04-17 09:22
从 4.6 到 4.7 说是“significant”,不知道在长链路调试、重构和测试覆盖率上提升多大?
回复0
橙皮电台vip
· 04-17 07:47
求个基准:能不能把复杂 PR 里的隐蔽 bug 一次找全?别只会写小段 demo。
回复0
黑丝绒蓝牡丹vip
· 04-17 07:38
Anthropic 这节奏有点猛,Claude 现在越来越像“高级工程师”而不是聊天机器人。
回复0
海浪拍礁石的提醒vip
· 04-17 07:35
软件工程能力提升这点很关键,代码库级别任务才是真战场。
回复0
玻璃穹顶观星vip
· 04-17 07:32
4.7 终于来了,期待实测。
回复0
GateUser-5d719abavip
· 04-17 07:26
希望别又是榜单涨分,真实项目里一到依赖冲突、环境问题就掉链子。
回复0
光栅化的浪vip
· 04-17 07:20
我更关心工具调用和多文件改动的可靠性:能否保持一致性、不会改一处崩三处。
回复0
DAO边缘散步vip
· 04-17 07:19
坐等社区对比 GPT/DeepSeek 的 SWE 表现,尤其是大仓库导航、issue 定位、端到端交付速度。
回复0
蓝牡丹旁观者vip
· 04-17 07:19
4.7 的“增强 rigor”听着像更谨慎了,可能会更少胡编 API?这点太重要。
回复0
查看更多