SOURCE // NEWS

Anthropic增新防护堵住漏洞,Claude Fable 5重获出口许可

Anthropic增新防护堵住漏洞,Claude Fable 5重获出口许可

消息人士透露,特朗普政府已取消对 Anthropic 旗下 Claude Fable 5 AI模型的出口管制。在此之前,该公司同意扩展现有的安全防护机制,以阻止用户尝试访问特定受限功能。

据悉,这一新防护机制意味着,任何试图解锁这些敏感功能的用户都会收到请求被拦截的通知,其查询将转由性能稍逊的较旧版本 Opus 4.8 模型进行处理。在限制实施之前,涉及敏感网络安全和生物能力的请求本应就由 Opus 4.8 处理,而新防护机制将这一范围延伸到了 Amazon 发表的一篇论文中所指出的特定绕过行为。

漏洞安全公司 Luta Security 创始人兼首席执行官 Katie Moussouris 分析指出,用户之前可以通过让模型“修复代码”而非“识别代码安全问题”来绕过 Fable 5 的安全限制。虽然网络安全专家通常认为这种行为并不严重,但特朗普政府获悉后仍引发了与 Anthropic 的对峙,并一度实施了出口管制,导致该模型在实际操作中被迫下线。

这一技术细节为美国商务部长 Howard Lutnick 此前宣布解除对 AnthropicFable 5Mythos 5 模型限制的信件提供了重要补充。负责推动模型重新上线的 Lutnick 在信中写道:“Anthropic 已同意主动检测并解决模型带来的安全风险。” 美国商务部人工智能安全与创新中心的研究人员在评估后,也认为该防护措施目前足够强大,因而批准了解禁。

尽管商务部的僵局已打破,但 Anthropic 依然面临五角大楼的压力。消息人士透露,美国国防部长 Pete Hegseth 已告知顾问,目前尚无明确途径撤销其在2月28日将该公司列为“供应链风险”的行政命令。这意味着 Anthropic 与政府的关系虽有所缓和,但警报并未完全解除。

AgentUpdate 深度解析

此次 #Anthropic 与美国政府的博弈,揭示了未来 AI Agent 落地过程中的一个关键演进趋势:动态安全降级(Graceful Degradation)与多模型协同防御机制。与以往一刀切的拒绝服务不同,Anthropic 采用将敏感任务降级至旧版 Opus 4.8 处理的策略,既保留了用户的业务连续性,又守住了合规底线。这种“热插拔”式的高低版本模型切换,对于开发复杂 AI Agent 系统的架构师具有极大的启发意义。在多 Agent 协同生态(如 MCP 协议或 LangChain 编排)中,如何防范“越狱(Jailbreak)”和“间接注入”是行业痛点。通过在 Agent 路由层引入实时的语义审查与风险分级,将高风险输入动态路由至更保守、对齐更彻底的基座模型,能够大幅提升企业级 AI 应用的鲁棒性。随着监管常态化,这种安全路由机制或将成为下一代 AI Agent 框架的标配。