Claude Opus 4.6 最近好像真的降智了…… 上周在 BridgeBench 幻觉基准测试里,它还稳稳排第2,准确率83.3% 结果4月12日重新测试,直接掉到第10名,准确率只剩68.3%,幻觉率暴增98% 前后对比图一看,差距真的很明显 不少人最近用它写代码、做推理时也感觉明显变笨了,指令忘得快、胡说八道增多

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论