SOURCE // NEWS

Anthropic发布Sonnet 5:高性价比自主Agent首选

Anthropic发布Sonnet 5:高性价比自主Agent首选

在各大基座模型厂商将 Agent(智能体)能力视为标配的当下,Anthropic 正式推出了其主力中端模型的升级版——Claude Sonnet 5。这款新模型拥有更强大的端到端自主执行与 Agent 构建能力。

Anthropic 在官方博客中指出:“它能够自主制定计划、灵活调用浏览器和终端等工具,并以几个月前只有更大、更昂贵的旗舰模型才能达到的水平,实现完全的自主运行。”

这一产品定位也呼应了其主要竞争对手的最新动作。例如,OpenAI 上周预览发布的 GPT-5.6 Sol 同样主打多 Agent 协作完成长跨度任务;而谷歌在 5 月推出的 Gemini 3.5 Flash 也强调了从传统聊天机器人向自主规划、迭代的 Agent 协作工具的转变。

Sonnet 5 的发布表明,在所有价格区间内,Agent 能力已经成为行业的“新底线”。现在的竞争焦点不再是谁能做到,而是谁能以最低的成本、在无需人类干预的情况下最稳定地实现。

性能方面,Sonnet 5 承诺提供逼近旗舰模型 Opus 4.8 的体验,但价格要低得多。即日起,#Claude Sonnet 5 已成为免费及 Pro 订阅用户的默认模型。在价格上,Sonnet 5 目前享受限时优惠(截至8月31日):输入每百万 token 收费 2 美元,输出每百万 token 收费 10 美元;此后将恢复至输入 3 美元/百万、输出 15 美元/百万。这一价格明显低于 Opus 4.8、OpenAI 的 GPT-5.5 以及谷歌的 Gemini 3.1 Pro,不过仍略高于 Gemini 3.5 Flash。

相比今年 2 月发布的 Sonnet 4.6,新模型在逻辑推理、工具调用、软件工程和知识性工作等 Agent 核心场景中取得了显著突破。在 Agent 编程测试中,Sonnet 5 取得了 63.2% 的高分,虽然略低于 Opus 4.8 的 69.2%,但远高于 Sonnet 4.6 的 58.1%。

值得一提的是,在测试中,Sonnet 5 展现出了极强的“自我纠错”(Self-Reflection)能力,能够在无需提示的情况下检查自己的输出,并完整执行复杂的多步骤任务。Zapier 的高级工程师 Daniel Shepard 透露:“我们让 Claude Sonnet 5 执行一项两阶段任务——更新 Salesforce 账户层级并向企业联系人发送发布通知,它完美地实现了端到端闭环。”

AgentUpdate 深度解析

随着 Claude Sonnet 5 的推出,AI 行业正式宣告从“大模型军备竞赛”迈入“Agent 实用化与性价比之战”。Sonnet 5 在保持极高推理能力的同时,大幅降低了 API 调用成本,这直接击中了当前企业级 Agent 落地的最大痛点——Token 消耗成本过高。更具启发性的是其原生的“自我纠错”与长流程规划能力,这意味着开发者无需再在 LangChainCrewAI 等框架中编写繁琐的重试逻辑,模型自身即可完成任务闭环。横向对比来看,虽然其编程上限可能略逊于顶配的 Opus 4.8,但性价比让其成为大规模部署自主 Agent(如自动化客服、端到端数据流水线)的首选底座。这标志着未来 AI Agent 生态将全面走向“廉价且高度自治”的新阶段。