Claude Code + AWS Bedrock 技术拆解：从 shell 执行到成本优化

Jet769

432人浏览 · 2026-03-25 15:28:16

Jet769 · 2026-03-25 15:28:16 发布

最近 X 和 GitHub 上关于 Claude Code + AWS Bedrock 的讨论进入了一个新阶段。

前一阵大家聊的还是"直连 API 还是走 Bedrock""配额怎么算"这类架构选型话题。最近两天，讨论明显转向了更具体的工程细节：AgentCore 新增的 shell 命令执行能力、Prompt 缓存的降本效果、Claude Code 在 IDE 里的实际体验。

这篇文章把这几个点拆开来说。

1. AgentCore Runtime 的 shell 命令执行

3 月 17 日，AWS 官宣 Bedrock AgentCore Runtime 支持 InvokeAgentRuntimeCommand API。

它解决了什么问题

AI Agent 在工作流中经常需要做"确定性操作"：跑测试、安装依赖、执行 git 命令、调 AWS CLI。以前要实现这些，开发者需要在容器里自建命令调度逻辑，包括区分 Agent 调用和 shell 命令、spawn 子进程、捕获 stdout/stderr、管理超时。

现在这些被抽成了平台级 API。

技术细节

命令在 Agent 会话的同一容器、同一文件系统中执行
输出通过 HTTP/2 实时流式返回
返回 exit code
不阻塞并发的 Agent 调用
覆盖 14 个 AWS 区域（含东京、新加坡、悉尼等亚太区）

意味着什么

这个 API 的出现，说明 AWS 正在把"Agent 在云端自主执行系统操作"标准化。对于做 Agentic Coding（智能体编程）的团队来说，以后不用再自己维护一套命令执行层了。

2. Prompt 缓存对 Claude Code 场景的成本影响

Bedrock 的 Prompt 缓存（Prompt Caching）现在已经 GA（正式可用）。

原理

如果你连续多次调用使用了相同的 prompt 前缀（比如项目上下文、编码规范、文件结构），Bedrock 会在服务端缓存这段内容。后续调用如果命中缓存，输入 token 按缓存读取价格计费，而不是标准输入价格。

以 Claude Opus 4.6 为例：

类型	价格（每百万 token）
标准输入	$5
缓存写入	正常价
缓存读取	$0.50
标准输出	$25

缓存 TTL 是 5 分钟。也就是说，只要你在 5 分钟内再次调用，相同前缀部分就能享受 90% 的输入折扣。

对 Claude Code 场景的影响

Claude Code 的使用模式天然适合 Prompt 缓存。因为：

你通常在同一个项目里连续工作，项目上下文不变
每轮变化的只是新的指令和刚改的文件
调用频率高，5 分钟的 TTL 很容易命中

粗略估算：如果你的每次调用包含 10 万 token 的项目上下文和 2000 token 的新指令，在连续工作场景下，缓存可以把输入成本压低 60-70%。

Batch API 叠加

如果你的场景允许异步处理（比如批量代码审查、批量测试生成），Bedrock 的 Batch API 还可以再打五折。两层叠加之后，token 成本会非常可控。

3. Claude Code 接 Bedrock 的配置方式

Claude Code 现在支持四种 Bedrock 认证方式：

aws login（现代 SSO 流）
IAM Identity Center（企业 SSO）
传统 IAM Access Key
Bedrock API Key

推荐的安装方式是原生 CLI：

curl -fsSL https://cli.claude.com/install.sh | sh

配置 Bedrock 后端时，需要设置 CLAUDE_CODE_USE_BEDROCK=1 环境变量，并确保 AWS 凭证可用。

Claude Code 同时支持在终端、VS Code 和 JetBrains 中使用。VS Code 扩展提供了内联 diff、@-mentions、多标签对话等 GUI 能力。

4. 国内开发者的限制

这部分必须讲清楚。

账号与模型权限

AWS 海外账号的注册和 Bedrock 模型访问申请，对国内个人开发者仍然有门槛。很多 Claude 模型需要单独申请开通。

网络延迟

Claude Code 的交互是实时的。国内直连海外 AWS 区域，延迟会直接影响编码体验。在终端里等 Agent 回复时，每多一秒都很影响节奏。

AgentCore 区域限制

目前 AgentCore Runtime 的 shell 命令执行覆盖 14 个区域，不含中国。如果你想在国内环境里完整使用这套能力，目前还不现实。

成本结构

Claude Opus 4.6 的输出 token 定价是 $25/百万。对于重度使用场景（比如全天候代码审查），即使有 Prompt 缓存和 Batch API，月度成本也需要认真核算。

总结

最近这轮讨论的核心变化是：从"要不要用 Bedrock"，变成了"在 Bedrock 上怎么把 Agent 用好"。

AgentCore 的 shell 执行、Prompt 缓存、Claude Code 的 IDE 集成，这些看起来是独立的功能点，合在一起其实在回答同一个问题：AI Agent 编程需要什么样的基础设施？

GPT-5.4、Claude 4.6 这些模型是引擎，但引擎需要底盘。AWS 正在把底盘一块一块地装起来。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【九年回归！不吐不快！】

这篇文章分享了作者半年来使用AI编程助手（Cursor、GitHub Copilot等）的真实体验。关键点包括：AI在生成样板代码、文档注释和单元测试时效率显著提升，尤其适合CRUD等重复性工作；但也存在过度依赖导致代码理解不足、生成隐蔽bug、处理复杂业务逻辑乏力等问题。作者总结出一套"AI作副驾驶"的工作流：核心逻辑和决策仍由人工把控，AI负责辅助性编码任务。最后建议开发者

AtomGit开源社区

langchain 基础

使用@tool装饰器，可以将普通函数转换为langchain函数@tool"""两个整数相加"""3add_number 两个整数相加 {'a': {'title': 'A', 'type': 'integer'}, 'b': {'title': 'B', 'type': 'integer'}}可以通过函数.name等获取函数的信息，将其交给大模型。通过@tool装饰器的函数，也是一个Runnab