Anthropic增新防护堵住漏洞，Claude Fable 5重获出口许可

消息人士透露，特朗普政府已取消对 Anthropic 旗下 Claude Fable 5 AI模型的出口管制。在此之前，该公司同意扩展现有的安全防护机制，以阻止用户尝试访问特定受限功能。

据悉，这一新防护机制意味着，任何试图解锁这些敏感功能的用户都会收到请求被拦截的通知，其查询将转由性能稍逊的较旧版本 Opus 4.8 模型进行处理。在限制实施之前，涉及敏感网络安全和生物能力的请求本应就由 Opus 4.8 处理，而新防护机制将这一范围延伸到了 Amazon 发表的一篇论文中所指出的特定绕过行为。

漏洞安全公司 Luta Security 创始人兼首席执行官 Katie Moussouris 分析指出，用户之前可以通过让模型“修复代码”而非“识别代码安全问题”来绕过 Fable 5 的安全限制。虽然网络安全专家通常认为这种行为并不严重，但特朗普政府获悉后仍引发了与 Anthropic 的对峙，并一度实施了出口管制，导致该模型在实际操作中被迫下线。

这一技术细节为美国商务部长 Howard Lutnick 此前宣布解除对 Anthropic 的 Fable 5 和 Mythos 5 模型限制的信件提供了重要补充。负责推动模型重新上线的 Lutnick 在信中写道：“Anthropic 已同意主动检测并解决模型带来的安全风险。” 美国商务部人工智能安全与创新中心的研究人员在评估后，也认为该防护措施目前足够强大，因而批准了解禁。

尽管商务部的僵局已打破，但 Anthropic 依然面临五角大楼的压力。消息人士透露，美国国防部长 Pete Hegseth 已告知顾问，目前尚无明确途径撤销其在2月28日将该公司列为“供应链风险”的行政命令。这意味着 Anthropic 与政府的关系虽有所缓和，但警报并未完全解除。

AgentUpdate 深度解析

此次 #Anthropic 与美国政府的博弈，揭示了未来 AI Agent 落地过程中的一个关键演进趋势：动态安全降级（Graceful Degradation）与多模型协同防御机制。与以往一刀切的拒绝服务不同，Anthropic 采用将敏感任务降级至旧版 Opus 4.8 处理的策略，既保留了用户的业务连续性，又守住了合规底线。这种“热插拔”式的高低版本模型切换，对于开发复杂 AI Agent 系统的架构师具有极大的启发意义。在多 Agent 协同生态（如 MCP 协议或 LangChain 编排）中，如何防范“越狱（Jailbreak）”和“间接注入”是行业痛点。通过在 Agent 路由层引入实时的语义审查与风险分级，将高风险输入动态路由至更保守、对齐更彻底的基座模型，能够大幅提升企业级 AI 应用的鲁棒性。随着监管常态化，这种安全路由机制或将成为下一代 AI Agent 框架的标配。