Claude Code + AWS Bedrock 技术拆解:从 shell 执行到成本优化
最近 X 和 GitHub 上关于 Claude Code + AWS Bedrock 的讨论进入了一个新阶段。
前一阵大家聊的还是"直连 API 还是走 Bedrock""配额怎么算"这类架构选型话题。最近两天,讨论明显转向了更具体的工程细节:AgentCore 新增的 shell 命令执行能力、Prompt 缓存的降本效果、Claude Code 在 IDE 里的实际体验。
这篇文章把这几个点拆开来说。
1. AgentCore Runtime 的 shell 命令执行
3 月 17 日,AWS 官宣 Bedrock AgentCore Runtime 支持 InvokeAgentRuntimeCommand API。
它解决了什么问题
AI Agent 在工作流中经常需要做"确定性操作":跑测试、安装依赖、执行 git 命令、调 AWS CLI。以前要实现这些,开发者需要在容器里自建命令调度逻辑,包括区分 Agent 调用和 shell 命令、spawn 子进程、捕获 stdout/stderr、管理超时。
现在这些被抽成了平台级 API。
技术细节
- 命令在 Agent 会话的同一容器、同一文件系统中执行
- 输出通过 HTTP/2 实时流式返回
- 返回 exit code
- 不阻塞并发的 Agent 调用
- 覆盖 14 个 AWS 区域(含东京、新加坡、悉尼等亚太区)
意味着什么
这个 API 的出现,说明 AWS 正在把"Agent 在云端自主执行系统操作"标准化。对于做 Agentic Coding(智能体编程)的团队来说,以后不用再自己维护一套命令执行层了。
2. Prompt 缓存对 Claude Code 场景的成本影响
Bedrock 的 Prompt 缓存(Prompt Caching)现在已经 GA(正式可用)。
原理
如果你连续多次调用使用了相同的 prompt 前缀(比如项目上下文、编码规范、文件结构),Bedrock 会在服务端缓存这段内容。后续调用如果命中缓存,输入 token 按缓存读取价格计费,而不是标准输入价格。
以 Claude Opus 4.6 为例:
| 类型 | 价格(每百万 token) |
|---|---|
| 标准输入 | $5 |
| 缓存写入 | 正常价 |
| 缓存读取 | $0.50 |
| 标准输出 | $25 |
缓存 TTL 是 5 分钟。也就是说,只要你在 5 分钟内再次调用,相同前缀部分就能享受 90% 的输入折扣。
对 Claude Code 场景的影响
Claude Code 的使用模式天然适合 Prompt 缓存。因为:
- 你通常在同一个项目里连续工作,项目上下文不变
- 每轮变化的只是新的指令和刚改的文件
- 调用频率高,5 分钟的 TTL 很容易命中
粗略估算:如果你的每次调用包含 10 万 token 的项目上下文和 2000 token 的新指令,在连续工作场景下,缓存可以把输入成本压低 60-70%。
Batch API 叠加
如果你的场景允许异步处理(比如批量代码审查、批量测试生成),Bedrock 的 Batch API 还可以再打五折。两层叠加之后,token 成本会非常可控。
3. Claude Code 接 Bedrock 的配置方式
Claude Code 现在支持四种 Bedrock 认证方式:
aws login(现代 SSO 流)- IAM Identity Center(企业 SSO)
- 传统 IAM Access Key
- Bedrock API Key
推荐的安装方式是原生 CLI:
curl -fsSL https://cli.claude.com/install.sh | sh
配置 Bedrock 后端时,需要设置 CLAUDE_CODE_USE_BEDROCK=1 环境变量,并确保 AWS 凭证可用。
Claude Code 同时支持在终端、VS Code 和 JetBrains 中使用。VS Code 扩展提供了内联 diff、@-mentions、多标签对话等 GUI 能力。
4. 国内开发者的限制
这部分必须讲清楚。
账号与模型权限
AWS 海外账号的注册和 Bedrock 模型访问申请,对国内个人开发者仍然有门槛。很多 Claude 模型需要单独申请开通。
网络延迟
Claude Code 的交互是实时的。国内直连海外 AWS 区域,延迟会直接影响编码体验。在终端里等 Agent 回复时,每多一秒都很影响节奏。
AgentCore 区域限制
目前 AgentCore Runtime 的 shell 命令执行覆盖 14 个区域,不含中国。如果你想在国内环境里完整使用这套能力,目前还不现实。
成本结构
Claude Opus 4.6 的输出 token 定价是 $25/百万。对于重度使用场景(比如全天候代码审查),即使有 Prompt 缓存和 Batch API,月度成本也需要认真核算。
总结
最近这轮讨论的核心变化是:从"要不要用 Bedrock",变成了"在 Bedrock 上怎么把 Agent 用好"。
AgentCore 的 shell 执行、Prompt 缓存、Claude Code 的 IDE 集成,这些看起来是独立的功能点,合在一起其实在回答同一个问题:AI Agent 编程需要什么样的基础设施?
GPT-5.4、Claude 4.6 这些模型是引擎,但引擎需要底盘。AWS 正在把底盘一块一块地装起来。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)