ClaudeOpus4.8表面常规升级,实则暗藏三个关键改动:网页版新增手

鹏哥撩工程 2026-05-29 08:54:15

Claude Opus 4.8 表面常规升级,实则暗藏三个关键改动:网页版新增手动 Effort 开关,可控制模型思考强度;Claude Code 引入 dynamic workflows,能拆分任务、并行 Agent并自我对抗验证,使 75 万行代码移植 11 天完成;模型诚实度大幅提高,说谎概率仅前代的四分之一,错误对齐指标接近 Mythos。SWE-Bench Pro 跑分 69.2%,领先 GPT-5.5 和 Gemini 3.1 Pro,但 Terminal-Bench 被 GPT-5.5 反超。Fast 模式降价至每百万 token 10/50 美元。公告透露 Mythos 即将开放,已发现超 1 万高危漏洞。此次更新实际为 Agent 加上了行动力与诚实双 buff。

0 阅读:4
鹏哥撩工程

鹏哥撩工程

感谢大家的关注