Anthropic发布Sonnet 5：高性价比自主Agent首选

在各大基座模型厂商将 Agent（智能体）能力视为标配的当下，Anthropic 正式推出了其主力中端模型的升级版——Claude Sonnet 5。这款新模型拥有更强大的端到端自主执行与 Agent 构建能力。

Anthropic 在官方博客中指出：“它能够自主制定计划、灵活调用浏览器和终端等工具，并以几个月前只有更大、更昂贵的旗舰模型才能达到的水平，实现完全的自主运行。”

这一产品定位也呼应了其主要竞争对手的最新动作。例如，OpenAI 上周预览发布的 GPT-5.6 Sol 同样主打多 Agent 协作完成长跨度任务；而谷歌在 5 月推出的 Gemini 3.5 Flash 也强调了从传统聊天机器人向自主规划、迭代的 Agent 协作工具的转变。

Sonnet 5 的发布表明，在所有价格区间内，Agent 能力已经成为行业的“新底线”。现在的竞争焦点不再是谁能做到，而是谁能以最低的成本、在无需人类干预的情况下最稳定地实现。

性能方面，Sonnet 5 承诺提供逼近旗舰模型 Opus 4.8 的体验，但价格要低得多。即日起，#Claude Sonnet 5 已成为免费及 Pro 订阅用户的默认模型。在价格上，Sonnet 5 目前享受限时优惠（截至8月31日）：输入每百万 token 收费 2 美元，输出每百万 token 收费 10 美元；此后将恢复至输入 3 美元/百万、输出 15 美元/百万。这一价格明显低于 Opus 4.8、OpenAI 的 GPT-5.5 以及谷歌的 Gemini 3.1 Pro，不过仍略高于 Gemini 3.5 Flash。

相比今年 2 月发布的 Sonnet 4.6，新模型在逻辑推理、工具调用、软件工程和知识性工作等 Agent 核心场景中取得了显著突破。在 Agent 编程测试中，Sonnet 5 取得了 63.2% 的高分，虽然略低于 Opus 4.8 的 69.2%，但远高于 Sonnet 4.6 的 58.1%。

值得一提的是，在测试中，Sonnet 5 展现出了极强的“自我纠错”（Self-Reflection）能力，能够在无需提示的情况下检查自己的输出，并完整执行复杂的多步骤任务。Zapier 的高级工程师 Daniel Shepard 透露：“我们让 Claude Sonnet 5 执行一项两阶段任务——更新 Salesforce 账户层级并向企业联系人发送发布通知，它完美地实现了端到端闭环。”

AgentUpdate 深度解析

随着 Claude Sonnet 5 的推出，AI 行业正式宣告从“大模型军备竞赛”迈入“Agent 实用化与性价比之战”。Sonnet 5 在保持极高推理能力的同时，大幅降低了 API 调用成本，这直接击中了当前企业级 Agent 落地的最大痛点——Token 消耗成本过高。更具启发性的是其原生的“自我纠错”与长流程规划能力，这意味着开发者无需再在 LangChain 或 CrewAI 等框架中编写繁琐的重试逻辑，模型自身即可完成任务闭环。横向对比来看，虽然其编程上限可能略逊于顶配的 Opus 4.8，但性价比让其成为大规模部署自主 Agent（如自动化客服、端到端数据流水线）的首选底座。这标志着未来 AI Agent 生态将全面走向“廉价且高度自治”的新阶段。

Anthropic发布Sonnet 5：高性价比自主Agent首选

推荐阅读

Anthropic推出Claude Science：用工作流重塑科学研究

Claude Code被曝暗中检测中国时区与大厂域名，疑防模型蒸馏

GLM 5.2发布：100万Token超长上下文，如何避免API账单爆炸？

相关工具与资源推荐

相关技能市场

Awesome Claude Skills

Claude Skills Collection

Awesome OpenClaw Skills