5 月 28 日,Anthropic 发布了 Claude Opus 4.8,接替 Opus 4.7 成为新的旗舰模型。定价不变($5/$25 per million input/output tokens),但在几个关键维度上有明显提升。
Opus 4.8 在内部评测中,主动标记代码问题的概率是前代的 4 倍。这意味着它不再倾向于"顺着你说"或者默默放过有问题的代码。在 agentic coding 场景下,这种"不怕得罪你"的诚实度直接影响最终产出质量。
在真实使用中,这个改进很直观:当你提交一段有隐患的代码让 Claude review 时,4.8 更倾向于直说"这里有问题"而不是"看起来还行,不过你可能想考虑一下..."
在需要多步推理、跨文件修改、长上下文理解的编码任务中,Opus 4.8 的表现有明显提升。它更擅长理解项目结构、追踪依赖关系,并在复杂重构中保持一致性。
如果你已经在用 Claude 写代码或做项目,升级到 4.8 是零成本的(API 定价不变)。最值得关注的不是"它变聪明了多少",而是它开始更诚实了。
对于日常使用者来说,这意味着:
对于关注 AI 行业趋势的人,这次更新验证了一个方向:模型竞争正在从"谁更聪明"转向"谁更可靠"。当模型能力已经足够完成大多数任务时,诚实度、一致性和可信赖度才是决定用户留存的关键。
注意:Claude Opus 4.6 和 4.7 不受影响,继续可用。被退役的是最早期的 Opus 4.0(2025 年 5 月版本),详见本期另一篇「计费与退役」。
Claude 日常用户 开发者 / 编程工作流 AI 工具选型决策者