随着 AWS 云基础设施的不断扩展,运维流程也变得日益复杂。SRE(站点可靠性工程师)和 #DevOps 工程师往往需要频繁在 AWS 管理控制台、CLI 文档和多个服务仪表板之间切换,手动将业务需求转化为准确的 API 语法,并在跨服务(如 CloudWatch 日志、EC2 实例状态、IAM 策略)排障时耗费大量时间。这种由于“上下文切换”带来的摩擦,严重影响了日常运维与应急响应的效率。
为解决这一痛点,AWS 推出了基于 Amazon #Bedrock AgentCore Runtime 的解决方案。该方案通过引入对模型上下文协议(Model Context Protocol,简称 #MCP)的支持,将 Amazon Quick(一种创新的智能体对话界面)与 AWS 服务无缝连接。通过 AWS API MCP Server,运维人员可以直接使用自然语言,将意图实时转化为 AWS 命令行界面(AWS CLI)指令,从而在关键时刻无需在不同工具间频繁切换。
该架构的核心价值在于,它允许自然语言查询直接翻译为安全的 AWS API 调用。例如,当运维人员输入“显示 us-east-1 区域中所有运行中的 EC2 实例”时,系统将立即返回精准结果。同时,所有操作均在现有的 IAM 权限体系下安全运行,并配有完整的 Amazon CloudWatch 审计追踪以确保合规。这种基于 MCP 协议的统一整合,避免了针对每个工作流重复构建连接逻辑,为 AI Agent 与 AWS 服务的交互建立了标准化的管道。
以下是该系统在日常运维中的具体工作流程:
1. 提出请求:用户使用自然语言(如“显示 us-east-1 中运行的 EC2 实例”)向 Amazon Quick 的自定义 Agent 发起提问。
2. 身份认证:Amazon Quick 通过配置好的 Client ID 和 Client Secret,利用 OAuth 2.0 客户端凭据模式从 Amazon Cognito 用户池获取 JWT 令牌。
3. 请求路由与验证:认证请求抵达 Amazon Bedrock AgentCore Runtime,该运行时根据 Cognito 身份提供商配置来验证 JWT 令牌的安全合法性。
4. 服务调用与翻译:在验证成功后,AgentCore Runtime 安全地调用运行在容器化环境中的 AWS API MCP Server。MCP 服务负责将用户的自然语言查询精准翻译为对应的 AWS CLI 命令。
5. 执行并返回:翻译后的命令通过预先配置的 IAM 执行角色(IAM Execution Role)在 AWS 相应服务上安全执行,并将结果实时反馈给用户。
AWS 官方宣布 Bedrock 支持 Anthropic 主导的 MCP 协议,这是 AI Agent 生态发展中的一个标志性事件。在过去,AI Agent 与企业复杂云资源的连接,往往依赖极其碎片化的自定义 Tool/Plugin 开发,这不仅带来了巨大的维护成本,也限制了 Agent 跨平台泛化的能力。通过引入 MCP 协议,AWS 实际上为大模型与云基础设施之间建立了一条通用的“总线”。与传统的 OpenAPI 规范相比,MCP 能够更动态地暴露上下文,并在多 Agent 协同中发挥协议标准化的威力。这预示着未来的云运维(AIOps)将彻底摆脱繁琐的 API 拼装,走向以标准化 Agent 协议为核心的“对话即控制”时代,也将极大地加速 MCP 协议在整个企业级软件生态中的普及。