各类AI模型API购买与编程工具接入配置指南
各类AI模型API购买与编程工具接入配置指南
免责声明:本文所述网络配置仅为解决开发环境中的网络可达性问题,请遵守当地法律法规。
一、核心概念速览
在正式进入操作流程之前,先了解几个与计费和调用密切相关的核心概念。
1.1 Token(词元)
Token是大模型处理文本的基本单位。一个Token可以是单词、部分单词或单个字符。英文平均1个单词≈1.3个Token;中文平均1个汉字≈1.5-2个Token。API计费按照处理的Token数量来计算。
1.2 上下文(Context)
上下文窗口指模型一次能够“记住”和处理的最大Token数量。上下文窗口越大,模型能处理的文本越长,能理解和回应的对话历史也越长。例如,GLM-4.7-FlashX拥有200K的上下文窗口(约可处理一部中长篇小说的全文)。
上下文长度区间分段计费:许多模型在计费时会根据单次请求的上下文长度(即输入Token总量)落在哪个区间来执行不同的单价。例如:
- GLM-5.1的输入长度在
[0, 32)(即0到32K tokens之间)时,输入单价为6元/百万tokens;- 当输入长度增长到
[32+)(即32K tokens及以上)时,输入单价上升为8元/百万tokens。这意味着在API调用场景中,不仅要关注Token数量的消耗,还需要注意单次请求的上下文总长度可能触发阶梯式定价。
1.3 缓存命中(Cache Hit)
当多次调用API时,如果请求的上下文前缀(如系统提示词System Prompt、对话历史等)完全相同,模型平台会自动复用已缓存的中间计算结果,无需从头重新计算,这就是“缓存命中”。
缓存命中的计费价格远低于标准输入价格(通常为标准输入的10%~20%),是大幅降低API调用成本的关键手段。
隐式缓存:主流平台已实现自动识别重复内容的“隐式缓存”,开发者无需手动配置即可享受缓存命中带来的价格优惠。
影响缓存命中率的核心要素:
- 请求顺序:每次API调用的消息数组(message array),应保持公共前缀部分的顺序和内容完全一致
- 前缀一致性:系统提示词、对话历史等固定前缀内容不变,仅变更末尾的最新用户问题
- Session复用:在同一对话会话中连续发送消息时,历史上下文可被最大化缓存复用,从而显著提升命中率
1.4 缓存存储(Cache Storage)
部分平台(如智谱BigModel)会额外对已建立的上下文缓存按时间收取存储费用,单位为“元/百万tokens/小时”。当前智谱平台对缓存存储实行“限时免费”政策。其他平台(如DeepSeek)不单独收取缓存存储费用。
二、平台注册与API Key获取
2.1 DeepSeek API
2.1.1 注册账号
- 访问DeepSeek开放平台:https://platform.deepseek.com/usage
- 使用手机号进行注册,点击“发送验证码”,填写验证码后完成注册/登录
- 注册登录即代表已同意开放平台协议与隐私政策
- 根据需要完成实名认证:个人开发者需上传身份证信息,等待1-2个工作日审核
2.1.2 获取API Key
- 登录后进入「开发者中心」或「控制台」
- 进入「API管理」或「API Keys」模块
- 点击「创建API Key」或「生成新密钥」
- 选择密钥类型(推荐选择“主密钥Master Key”用于开发测试)
- 创建后立即复制并妥善保存Key(关闭页面后将无法再次查看完整Key)
⚠️ 安全提醒:API Key是敏感凭证,请勿将Key硬编码在客户端代码或提交至公共代码仓库。建议使用环境变量存储,并定期轮换Key(建议每90天更换一次)。
2.1.3 充值计费
DeepSeek API为按量计费模式,支持在控制台进行账户充值,充值后即可调用模型。
2.2 智谱AI(GLM)API
2.2.1 注册账号
- 访问智谱AI开放平台:https://open.bigmodel.cn
- 使用手机号注册并登录
- 按平台提示完成实名认证
新用户福利:新注册用户通常会赠送一定数量的免费Token额度。此外,加入官方企业微信、完成实名认证等操作也可能获得额外赠送的Token。
2.2.2 获取API Key
- 登录后进入平台左侧「控制台」→「API密钥管理」页面
- 点击「创建API密钥」按钮
- 系统会同时生成
api_key和secret_key,两者都需复制保存 - 密钥格式一般为
sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxx
⚠️ 双重密钥说明:智谱平台会同时生成API Key和Secret Key,两者都是敏感凭证,务必妥善保存,切勿公开分享或提交至代码仓库。
有时候只有API Key。
2.2.3 订阅GLM Coding Plan
GLM Coding Plan是智谱AI推出的针对编程场景的订阅制套餐,按季或按年订阅后可享受特定模型的优惠调用额度,并支持无缝接入Claude Code等主流编程工具。
核心调整说明(2026年2月12日起生效):
| 调整项 | 具体内容 |
|---|---|
| 首购优惠 | 已取消,新用户不再享受首购折扣 |
| 套餐价格 | 结构性调整,整体涨幅自30%起 |
| 订阅方式 | 按季订阅与按年订阅优惠保留 |
| 存量用户 | 已订阅用户价格保持不变 |
订阅步骤:
- 通过拼团链接访问订阅页面:www.bigmodel.cn/glm-coding
- 选择适合的订阅档位(按季/按年)
- 完成支付后,登录开放平台确认订阅状态
- 在「模型管理」模块确认GLM模型权限已自动解锁(订阅套餐后默认开启,若未显示可刷新页面或联系客服)
2.3 企业级认证(可选,推荐企业用户)
如果团队需要更高并发配额和更专业的支持,建议完成企业实名认证:
- 在控制台找到「企业认证」或「实名认证」入口
- 提交企业营业执照等资质材料
- 等待平台审核通过(通常1-3个工作日)
- 审核通过后可享受更高调用限额和专属技术支持
2.4 环境变量配置最佳实践(可选)
获取API Key后,建议通过环境变量方式存储,避免密钥硬编码带来的安全风险:
# Linux / macOS
export DEEPSEEK_API_KEY="your_deepseek_key_here"
export GLM_API_KEY="your_glm_key_here"
# Windows PowerShell
$env:DEEPSEEK_API_KEY="your_deepseek_key_here"
$env:GLM_API_KEY="your_glm_key_here"
也可以创建 .env 配置文件(记得将 .env 加入 .gitignore):
DEEPSEEK_API_KEY=your_deepseek_key_here
GLM_API_KEY=your_glm_key_here
三、模型定价概览
3.1 DeepSeek API 定价
DeepSeek API采用按量计费模式,具体定价以官方页面 platform.deepseek.com/usage 公示为准。
3.1.1 DeepSeek V4系列定价(截至2026年4月)
| 模型版本 | 场景 | 单价(元/百万tokens) |
|---|---|---|
| V4-Flash | 缓存命中 | 0.02 |
| V4-Flash | 缓存未命中(输入) | 1 |
| V4-Flash | 输出 | 2 |
| V4-Pro | 缓存命中(原价) | 0.1 |
| V4-Pro | 缓存命中(限时折扣后) | 0.025 |
| V4-Pro | 缓存未命中(输入) | 3 |
| V4-Pro | 缓存未命中(输出) | 6 |
限时优惠说明:2026年4月25日,DeepSeek宣布Pro模型启动2.5折限时优惠活动;4月26日进一步宣布全系列API输入缓存命中价格降至首发价的1/10。Pro模型在2026年5月5日前可叠加2.5折优惠,后续优惠延长至5月31日。
模型定位:
- V4-Flash:总参数2840亿,激活参数130亿,主打低成本和高吞吐,适合中小开发者与轻量应用调用场景
- V4-Pro:总参数1.6万亿,激活参数490亿,定位高性能旗舰任务,在Agentic Coding评测中代码交付质量接近Claude Opus 4.6非思考模式
3.2 智谱AI(GLM)定价
智谱AI开放平台采用按量计费模式,价格因模型版本和上下文长度而异。以下信息来源于 open.bigmodel.cn/pricing 官方定价页。
3.2.1 旗舰模型
| 模型名称 | 输入长度(千tokens) | 输入单价(元/百万tokens) | 输出单价(元/百万tokens) | 缓存命中(元/百万tokens) |
|---|---|---|---|---|
| GLM-5.1 🆕 | [0, 32) | 6 | 24 | 1.3 |
| [32+) | 8 | 28 | 2 | |
| GLM-5-Turbo | [0, 32) | 5 | 22 | 1.2 |
| [32+) | 7 | 26 | 1.8 | |
| GLM-5 | [0, 32) | 4 | 18 | 1 |
| [32+) | 6 | 22 | 1.5 | |
| GLM-4.7 | [0, 32),输出[0, 0.2) | 2 | 8 | 0.4 |
| [0, 32),输出[0.2+) | 3 | 14 | 0.6 | |
| [32, 200) | 4 | 16 | 0.8 | |
| GLM-4.5-Air | [0, 32),输出[0, 0.2) | 0.8 | 2 | 0.16 |
| [0, 32),输出[0.2+) | 0.8 | 6 | 0.16 | |
| [32, 128) | 1.2 | 8 | 0.24 | |
| GLM-4.7-FlashX | 200K | 0.5 | 3 | 0.1 |
| GLM-4.7-Flash | 200K | 免费 | 免费 | 免费 |
缓存存储:当前所有旗舰模型缓存存储均为限时免费。
📌 GLM-5.1 是智谱推出的最新旗舰模型,面向长程任务(Long Horizon Task)设计,能够在一次任务中独立、持续工作长达8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。
3.2.2 多模态模型
| 模型名称 | 输入长度(千tokens) | 输入单价(元/百万tokens) | 输出单价(元/百万tokens) | 缓存命中(元/百万tokens) | 支持模态 |
|---|---|---|---|---|---|
| GLM-5V-Turbo 🆕 | [0, 32) | 5 | 22 | 1.2 | 图片、视频、文件、文本 |
| [32+) | 7 | 26 | 1.8 | 图片、视频、文件、文本 | |
| GLM-4.6V | [0, 32) | 1 | 3 | 0.2 | 图片、视频、文件、文本 |
| [32, 128) | 2 | 6 | 0.4 | 图片、视频、文件、文本 | |
| GLM-4.6V-FlashX | [0, 32) | 0.15 | 1.5 | 0.03 | 图片、视频、文件、文本 |
| [32, 128) | 0.3 | 3 | 0.03 | 图片、视频、文件、文本 | |
| GLM-4.6V-Flash | / | 免费 | 免费 | 免费 | 图片、视频、文件、文本 |
📌 GLM-5V-Turbo 是智谱首个多模态Agent基座模型,面向视觉编程与复杂任务场景深度优化,支持“环境感知 → 任务规划 → 执行落地”的完整闭环,让多模态能力从“能看懂”走向“能行动”。
3.3 缓存命中对成本的实操影响
合理利用缓存机制可大幅降低API使用成本。结合当前主流平台的定价情况,不同场景下的成本对比示例如下:
| 场景 | DeepSeek V4-Flash | DeepSeek V4-Pro(折扣后) | GLM-4.7 | GLM-5.1 |
|---|---|---|---|---|
| 缓存命中 | 0.02元/百万tokens | 0.025元/百万tokens | 0.4~0.8元 | 1.3~2元 |
| 缓存未命中(输入) | 1元/百万tokens | 3元/百万tokens | 2~4元 | 6~8元 |
| 命中/未命中比 | 1:50 | 1:120 | 约1:5 | 约1:5 |
💡 关键结论:
- DeepSeek平台的缓存命中价格极低(Flash仅0.02元/百万tokens),与缓存未命中价格相差50~120倍,合理利用缓存可极大降低成本
- GLM平台缓存命中价格约为标准输入价格的20%,同样具有明显的成本优势
- 实战技巧:在Claude Code、Trae等编程工具中,尽量保持系统提示词(System Prompt)不变、复用对话历史,可显著提升缓存命中率,降低实际支出
四、接入编程工具详细配置
本章节详细描述将已购买的API接入Trae和Claude Code(VS Code扩展)的完整步骤、常见问题与最佳实践。
4.1 接入Trae(AI原生IDE)
Trae是一款AI原生IDE,集成了对话式编程、代码补全与Agent能力。它支持添加第三方模型提供商,可直接使用DeepSeek或智谱GLM的API Key。
4.1.1 准备工作
- 下载并安装最新版Trae:https://www.trae.ai
- 确保已从DeepSeek或智谱开放平台获取有效的API Key(参见第二章)
- 如使用智谱GLM Coding Plan,请确认订阅状态已生效,模型权限已开启
4.1.2 添加智谱GLM模型
- 打开Trae,点击左侧活动栏的「AI对话」图标(或使用快捷键唤出)
- 在对话输入框的右下角,点击当前显示的模型名称(如“Kimi 2.6”)
- 在弹出的模型选择面板底部,点击「添加模型」或「自定义模型」按钮
- 在“提供商”下拉菜单中,选择「智谱AI」或「Zhipu AI」。如果列表中没有该选项,可以选择「Generic OpenAI」或「自定义」并手动填写信息
- 填写模型信息:
- 模型名称:输入模型ID,例如
GLM-5.1、GLM-4.7、GLM-4.7-Flash等(注意大小写,建议严格参照智谱官方模型列表) - API Key:粘贴已获取的智谱API Key(以
sk-开头的字符串) - Base URL(如为自定义提供商):
https://open.bigmodel.cn/api/paas/v4(智谱API的OpenAI兼容端点,自行查看该博客后半部分有claude的URL)
- 模型名称:输入模型ID,例如
- 点击「保存」或「添加」按钮。成功保存后,模型列表中会出现刚才添加的模型
- 在AI对话面板中,点击模型名称,从列表中选择刚添加的GLM模型,即可开始使用
🔧 手动校准说明:如果Trae默认的智谱提供商配置无法连接,可以选择“Generic OpenAI”类型,并手动填入:
- Base URL:
https://open.bigmodel.cn/api/paas/v4/chat/completions- API Key:智谱API Key
- 模型ID:根据实际需求填写(如
GLM-4.7)
4.1.3 添加DeepSeek模型
- 同样在Trae的模型选择面板中,点击「添加模型」
- 在“提供商”下拉菜单中选择「DeepSeek」。若无则选择「Generic OpenAI」或「自定义」
- 填写模型信息:
- 模型名称:
deepseek-chat(对应V4系列对话模型)或deepseek-reasoner(推理模型) - API Key:粘贴DeepSeek API Key
- Base URL(自定义时):
https://api.deepseek.com/v1
- 模型名称:
- 保存并切换到该模型即可使用
4.1.4 Trae Agent模式配置
Trae的Agent模式(如“Builder模式”)可自动规划并执行任务,推荐配置高性能模型以获得更好体验:
- 在「设置」→「Agent」或「Builder」选项卡中,将默认模型切换为 GLM-5.1 或 DeepSeek V4-Pro
- 确保模型名称和API Key配置正确
- 首次使用Agent时,Trae可能会要求安装额外的依赖(如MCP协议支持),请根据提示操作
4.1.5 Trae常见问题与排查
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
| 模型列表中找不到已添加的模型 | 1. 保存未成功 2. UI缓存未刷新 | 重启Trae,或进入「设置」→「模型管理」检查已保存的模型列表 |
| 对话返回3003错误 | 1. 上游API返回429(频率/并发限制)或500(服务器错误) 2. 向不支持图片的模型发送了图片 | 1. 检查API Key余额和配额 2. 移除图片消息,确保模型支持多模态 |
| 响应缓慢或中断 | 1. 上下文过长导致超时 2. 模型输出长度达到限制 | 1. 尝试开启“长上下文模式”或清理对话历史 2. 在提示中要求模型分段输出 |
| 图片理解无效 | 模型本身不支持视觉(如GLM-5.1仅文本) | 更换为GLM-5V-Turbo或GLM-4.6V系列模型 |
| 调用时报“无效模型名称” | 模型ID拼写错误或大小写不匹配 | 检查模型名称与官方文档一致,注意大小写 |
4.2 接入Claude Code(VS Code扩展)
Claude Code现已提供官方VS Code扩展,可在IDE内部直接通过聊天面板进行交互。由于网络环境的限制,中国大陆用户可能需要配置网络代理才能正常使用。
4.2.1 环境准备与安装
- 确保VS Code版本≥1.98.0
- 打开VS Code,按
Ctrl+Shift+X(Windows/Linux)或Cmd+Shift+X(Mac)打开扩展市场 - 搜索 “Claude Code”,找到由 Anthropic 发布的官方扩展并安装
- 安装完成后重启VS Code,工具栏右上角会出现Claude Code图标
4.2.2 配置Claude Code扩展(接入第三方模型)
安装完成后,需要先为扩展配置环境变量,确保网络连通性。以下是两种经过验证的配置方式。
方式一:直接配置DeepSeek端点(适合DeepSeek用户,推荐该方式,其余大模型同理)
DeepSeek开放平台已原生支持 /anthropic 端点(即 https://api.deepseek.com/anthropic),可直接作为Anthropic API的替代品供Claude Code使用。在VS Code的settings.json中进行如下配置:
{
"editor.fontSize": 16,
"[csharp]": {
"editor.defaultFormatter": "ms-dotnettools.csharp"
},
"editor.defaultFormatter": "esbenp.prettier-vscode",
"security.workspace.trust.enabled": false,
"[c]": {
"editor.defaultFormatter": "ms-vscode.cpptools"
},
"[cpp]": {
"editor.defaultFormatter": "ms-vscode.cpptools"
},
"workbench.colorTheme": "Light Modern",
"editor.unicodeHighlight.allowedCharacters": {
" ": true
},
"claudeCode.selectedModel": "deepseek-chat",
"claudeCode.environmentVariables": [
{
"name": "ANTHROPIC_BASE_URL",
"value": "https://api.deepseek.com/anthropic"
},
{
"name": "ANTHROPIC_AUTH_TOKEN",
"value": "你自己的API"
},
{
"name": "API_TIMEOUT_MS",
"value": "600000"
},
{
"name": "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC",
"value": "1"
},
{
"name": "ANTHROPIC_MODEL",
"value": "deepseek-v4-pro"
},
{
"name": "ANTHROPIC_SMALL_FAST_MODEL",
"value": "deepseek-v4-flash"
},
{
"name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
"value": "deepseek-v4-pro"
},
{
"name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
"value": "deepseek-v4-pro"
},
{
"name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
"value": "deepseek-v4-flash"
}
],
"claudeCode.preferredLocation": "panel",
"explorer.confirmDelete": false
}
配置项说明:
| 配置项 | 说明 |
|---|---|
claudeCode.selectedModel |
指定对话模型为 deepseek-v4-pro(主模型) |
ANTHROPIC_BASE_URL |
DeepSeek的Anthropic兼容端点 |
ANTHROPIC_AUTH_TOKEN |
DeepSeek API Key |
ANTHROPIC_MODEL |
主推理模型,设为 deepseek-v4-pro(V4系列旗舰) |
ANTHROPIC_SMALL_FAST_MODEL |
轻量任务模型,设为 deepseek-v4-flash(低成本高吞吐) |
ANTHROPIC_DEFAULT_SONNET_MODEL |
Sonnet层级模型映射为 deepseek-v4-pro |
ANTHROPIC_DEFAULT_OPUS_MODEL |
Opus层级模型映射为 deepseek-v4-pro |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
Haiku层级模型映射为 deepseek-v4-flash |
API_TIMEOUT_MS |
超时时间设为600秒(10分钟),避免长任务中断 |
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC |
禁用非必要网络流量,减少额外请求 |
模型分层逻辑:重量级任务(复杂代码生成、深度推理、架构设计)走 deepseek-v4-pro,轻量任务(工具调用、文件读写、快速问答)走 deepseek-v4-flash。两档模型分工明确,既保住能力上限,又控制成本。
方式二:通过OpenRouter代理接入(适合多模型切换用户)
OpenRouter作为模型聚合平台,可将多种模型(包括DeepSeek)统一转换为Anthropic兼容格式。
步骤一:注册OpenRouter账号,访问 https://openrouter.ai/keys 获取API Key。
步骤二:在VS Code的settings.json中配置:
{
"claudeCode.selectedModel": "deepseek/deepseek-chat",
"claudeCode.environmentVariables": [
{
"name": "ANTHROPIC_BASE_URL",
"value": "https://openrouter.ai/api/anthropic"
},
{
"name": "ANTHROPIC_AUTH_TOKEN",
"value": "替换成OpenRouter API Key"
},
{
"name": "ANTHROPIC_MODEL",
"value": "deepseek/deepseek-chat"
},
{
"name": "ANTHROPIC_SMALL_FAST_MODEL",
"value": "deepseek/deepseek-chat"
},
{
"name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
"value": "deepseek/deepseek-chat"
},
{
"name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
"value": "deepseek/deepseek-chat"
},
{
"name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
"value": "deepseek/deepseek-chat"
}
],
"claudeCode.preferredLocation": "panel"
}
配置项说明:OpenRouter通过 /api/anthropic 端点提供Anthropic兼容格式,模型名称需使用OpenRouter格式(如 deepseek/deepseek-chat)。除了DeepSeek外,OpenRouter还聚合了多种免费或低成本模型,可实现更灵活的模型路由。
方式对比速查
| 对比维度 | 方式一:直接配置 | 方式二:OpenRouter代理 |
|---|---|---|
| 配置复杂度 | ⭐ 简单,直接配置DeepSeek端点 | ⭐⭐ 中等,需额外注册OpenRouter |
| 适用场景 | 仅使用DeepSeek模型 | 需要灵活切换多种模型 |
| Base URL | https://api.deepseek.com/anthropic |
https://openrouter.ai/api/anthropic |
| API Key | DeepSeek API Key | OpenRouter API Key |
| 模型名称格式 | deepseek-v4-pro |
deepseek/deepseek-chat |
以下是整合后的 4.2.3 Claude Code界面汉化 章节,将您提供的 VS Code 汉化包内容和 Claude Code CLI 中文增强方案合并在一起,适合放在技术文档或部署手册中:
4.2.3 Claude Code界面汉化(推荐中文用户)
Claude Code 原生界面为英文,中文开发者可通过以下两种方式获得更好的中文使用体验,根据使用环境选择对应方案。
方案一:VS Code 扩展汉化包(适用于 VS Code 环境)
在 VS Code 扩展市场搜索 [非官方] Claude Code for VS Code 简体中文汉化包(发布者:zstings),点击安装即可。
汉化包核心功能:
- ✅ 自动汉化:VS Code 启动时自动应用汉化,无需手动操作
- ✅ 三阶段汉化:支持前置规则 → 内置规则 → 后置规则,灵活控制翻译顺序
- ✅ 自定义规则:可通过配置添加自己的翻译规则(如将特定术语翻译为团队习惯用语)
- ✅ 自动备份:修改前自动创建备份文件,支持一键还原到原版
- ✅ 更新检测:Claude Code 扩展更新后自动重新应用汉化,无需手动维护
使用命令:
按 Ctrl+Shift+P(Windows/Linux)或 Cmd+Shift+P(macOS)打开命令面板,输入以下命令:
Claude Code 汉化: 应用汉化— 手动应用汉化Claude Code 汉化: 还原原版— 还原到英文原版Claude Code 汉化: 打开配置— 打开汉化配置页面
自定义翻译示例:
{
"claudeCodeZhCn.postTranslationRules": [
{
"original": "Ask before edits",
"chinese": "编辑前询问",
"regex": false
},
{
"original": "\\bfile\\b",
"chinese": "文件",
"regex": true,
"flags": "gi"
}
]
}
⚠️ 注意事项:本项目为社区开发,与 Anthropic 官方无关。在某些系统上可能需要管理员权限修改扩展文件。如遇到 Claude Code 扩展更新后汉化失效,等待汉化包自动检测更新后重新应用即可。
方案二:CLI 中文增强包(适用于终端/命令行环境)
若您使用 Claude Code CLI 版本(终端环境),可通过 claudezh 包获得全中文交互体验。
安装步骤:
# 1. 全局安装 claudezh
npm install -g claudezh
# 2. 以插件模式安装到 Claude Code 中(推荐)
npx claudezh --install-plugin
使用方法:
安装完成后,正常启动 Claude Code:
claude
在 Claude Code 对话中输入以下命令切换语言:
| 命令 | 说明 |
|---|---|
/zh |
切换到简体中文模式 |
/zht |
切换到繁体中文模式 |
/en |
切换回英文模式 |
/review-zh |
中文代码审查 |
/explain-zh |
中文代码解释 |
/test-zh |
中文生成测试 |
/fix-zh |
中文修复 Bug |
若希望独立启动全中文版 CLI,可直接运行:
claudezh
特点:
- ✅ 无需修改 VS Code 配置,纯终端使用
- ✅ 支持 DeepSeek、Kimi 等第三方 API(配合环境变量使用)
- ✅ 轻量级,无额外依赖
方案对比与建议
| 使用场景 | 推荐方案 | 说明 |
|---|---|---|
| VS Code 用户 | 方案一(汉化包) | 自动汉化 + 自定义规则,与编辑器深度集成 |
| 终端/CLI 用户 | 方案二(claudezh) | 纯命令行环境,支持中文命令和第三方 API |
| 两者混用 | 同时配置 | 两种方案互不冲突,可同时安装 |
💡 提示:无论使用哪种方案,若您已配置 DeepSeek 等第三方 API,请确保环境变量(如
ANTHROPIC_AUTH_TOKEN、ANTHROPIC_BASE_URL)已正确设置,以便 Claude Code 正常工作。
4.2.4 Claude Code纯中文输出配置
如果你不仅希望界面是中文,还希望Claude Code的输出内容全部使用中文(无中英混杂)。
可以通过以下方式实现:同时可以采用前文提到的CLI 中文增强包,下载过,cli以及vscode版本下的claude code都可以使用,然后输入 /zh 即可转化为中文对话。
方法一:对话即时约束(零门槛):在Claude Code对话中直接输入:
从现在开始,请始终使用简体中文回答我的所有问题。不要使用英文单词,除非是代码语法本身。
Claude Code具有极强的上下文记忆能力,接收到这条“系统级”指令后,在当前会话中会严格遵守中文输出。
方法二:持久化记忆存储(一劳永逸):输入 Always reply in Chinese.,当系统提示是否保存到记忆时,选择 User memory。这样无论打开哪个项目,都会默认使用中文交流。
方法三:项目级锁定(团队协作推荐):在项目根目录创建 .claude/CLAUDE.md 文件,Claude Code会自动读取作为项目指令:
# 项目语言规范
请严格遵守以下规则:
1. 所有对话、解释、建议必须使用**简体中文**
2. 代码注释必须使用中文
3. 生成的 Commit Message 必须使用中文
4. 严禁出现大段未翻译的英文技术名词(保留专业术语如 API、SDK 除外)
进阶方案:国产模型“换芯”:如果基础指令不生效,或Claude Code依然在输出报错信息时使用英文,可通过配置环境变量强制干预。找到 ~/.claude/settings.json 文件,添加语言预设:
{
"custom_instructions": {
"language": "Always respond in Simplified Chinese. You must not output English explanations or mixed language."
}
}
💡 最彻底的汉化方案:通过接入DeepSeek、智谱GLM等国产模型,这些模型原生就是中文思维,输出内容完全符合中文习惯,无需额外配置。具体接入方法参见4.2.2节。
4.2.5 配置网络代理(中国大陆用户需知)
由于网络可达性原因,中国大陆用户可能无法直接访问Anthropic服务,需要通过HTTP代理进行连接。请在 shell 配置文件中设置环境变量(以 macOS zsh 为例):
echo 'export HTTPS_PROXY="http://127.0.0.1:7890"' >> ~/.zshrc
source ~/.zshrc
代理端口
7890是常见代理客户端的默认HTTP端口,请以你实际使用的工具设置为准。
⚠️ 关键提醒:必须从终端启动 VS Code(使用
code .命令),才能使 VS Code 及其扩展进程继承 shell 中的HTTPS_PROXY环境变量。从 Dock 或 Finder 直接启动 VS Code,Claude Code 扩展将无法读取代理设置。
4.2.6 不同提供商的Base URL速查
| 提供商 | Base URL | 备注 |
|---|---|---|
| DeepSeek(原生) | https://api.deepseek.com/anthropic |
直接支持Anthropic兼容端点 |
| 智谱GLM(Z.AI) | https://open.bigmodel.cn/api/anthropic |
直接支持Anthropic兼容端点 |
| 小米MIMO | https://token-plan-cn.xiaomimimo.com/anthropic | 兼容 |
| OpenRouter | https://openrouter.ai/api/anthropic |
需在OpenRouter后台选定模型 |
| 自定义中转API | 询问服务商是否提供 /v1/messages 端点 |
需确认兼容性 |
4.2.7 验证连接
完成上述配置后,点击 VS Code 右上角的 Claude Code 图标打开聊天面板,发送简单提示(如“hello”或“你当前使用的是什么模型?”),若能正常回复且返回的模型名称正确,则配置成功。
4.2.8 模型使用限制说明
| 模型 | 接入方式 | 兼容性说明 |
|---|---|---|
| DeepSeek V4-Pro / Flash | 原生Anthropic端点 / OpenRouter | 工具调用、Agent能力完整支持 |
| GLM-4.7 / GLM-5.1 | Z.AI原生Anthropic端点 | 工具调用、Agent能力完整支持,编码表现优秀 |
| Claude官方模型 | 原生Anthropic API | 无需额外配置,工具链优化最佳 |
⚠️ Claude Code是为Claude原生模型深度优化的工具,第三方模型在复杂的多步骤工具调用、结构化diff生成等场景中,表现可能不如原版Claude。推荐策略:使用GLM-5.1或GPT-5.4进行高层架构讨论与规划,使用Claude Code执行具体代码实现。
4.2.9 故障排除速查表
| 错误信息 | 常见原因 | 解决方法 |
|---|---|---|
401 Unauthorized |
API Key无效或格式错误 | 重新生成API Key,确认粘贴完整且无多余字符 |
404 Not Found |
Base URL路径错误 | 检查URL是否包含完整路径(如 /anthropic) |
Connection refused |
网络不通或代理未配置 | 检查网络连接,必要时设置 HTTPS_PROXY |
Model not found |
模型名称错误 | 检查模型名称(如 deepseek-v4-pro vs deepseek/deepseek-chat) |
429 Too Many Requests |
调用频率或额度超限 | 在平台控制台检查配额,或等待后重试 |
4.3 VS Code无法登录Claude的解决方案
如果你在VS Code中使用Claude Code扩展时遇到 403、OAuth error、Failed to connect 等错误,根本原因是网络限制导致无法直接访问Anthropic服务,而 VS Code 扩展可能无法正确使用代理。
4.3.1 问题确认
常见报错信息:
OAuth error: Failed to fetch user roles: Request failed with status code 403Unable to connect to Anthropic servicesFailed to connect to api.anthropic.com: ERR_BAD_REQUESTNote: Claude Code might not be available in your country.
快速测试:在终端中运行 curl -I https://api.anthropic.com,如果返回 HTTP/2 403 说明无法直接访问,若超时则可能是 DNS 或防火墙问题。
4.3.2 常见误区(这些方法无效)
| ❌ 无效操作 | 原因 |
|---|---|
| 反复重新登录 | 访问限制是基于网络环境的,与账号无关 |
仅设置 VS Code 的 http.proxy |
Claude Code 扩展不读取 VS Code 的代理设置 |
| 从 Dock/Finder 启动 VS Code | macOS GUI 应用不会继承 shell 环境变量,即使 ~/.zshrc 中已设置 HTTPS_PROXY 也无效 |
4.3.3 正确解决方案
第一步:配置代理
确保本地代理工具已正常运行,并确认 HTTP 代理端口,不同的代理软件端口不同,下图是我使用的工具端口,其他的工具端口查看可以进行Baidu。验证代理可用性:
curl -I --proxy http://127.0.0.1:7897 https://api.anthropic.com
看到 HTTP/1.1 200 Connection established 后跟非 403 的响应(404 也算正常,说明请求到达了 Anthropic 的服务器)即为成功。
第二步:设置 HTTPS_PROXY 环境变量
macOS (zsh):
echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.zshrc
source ~/.zshrc
Linux (bash):
echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.bashrc
source ~/.bashrc
Windows:
- 控制面板 → 系统 → 高级系统设置 → 环境变量
- 在用户变量中新建
HTTPS_PROXY,值为http://127.0.0.1:7897(替换为你的代理端口) - 确定保存后,必须通过
code .命令从终端启动 VS Code
第三步:从终端启动 VS Code
这是最关键的一步——必须从终端启动 VS Code,扩展进程才能继承代理环境变量:
macOS:
# 如果 code 命令被映射到其他编辑器,使用:
open -a "Visual Studio Code" .
# 可设别名方便使用:
echo 'alias vscode="open -a \"Visual Studio Code\""' >> ~/.zshrc
source ~/.zshrc
# 之后直接:
vscode .
Windows:
code .
第四步:如果之前登录失败过,先清除登录状态
macOS/Linux:
claude /logout
claude /login
OAuth 流程正常完成后,roles 接口不再 403,因为流量已走代理。
补充说明:对于 Windows 用户,除了通过控制面板设置系统环境变量,也可以在 PowerShell 中临时设置:
$env:HTTPS_PROXY="http://127.0.0.1:7890"但务必通过
code .命令从该终端窗口启动 VS Code,否则环境变量不会被扩展进程继承。
4.3.4 Remote SSH场景
如果你通过 VS Code SSH 连接到远程机器,Claude Code 扩展运行在远程端,因此远程机器也需要设置 HTTPS_PROXY。
例如,Mac 的桥接网卡 IP 为 192.168.2.1,在远程虚拟机中执行:
echo 'export HTTPS_PROXY="http://192.168.2.1:7897"' >> ~/.bashrc
source ~/.bashrc
同时确保代理工具开启了“允许局域网连接”选项。
4.3.5 故障排除速查表
| 错误信息 | 常见原因 | 解决方法 |
|---|---|---|
401 Unauthorized |
API Key 无效或格式错误 | 重新生成 API Key,确认粘贴完整且无多余字符 |
404 Not Found |
Base URL 路径错误 | 检查 URL 是否包含完整路径(如 /api/anthropic) |
Connection refused |
网络不通或代理未配置 | 检查网络连接,必要时设置 HTTPS_PROXY |
Model not found |
模型名称错误或未在代理配置中选择 | 对于 OpenRouter 检查模型映射;对于智谱确认模型已启用 |
429 Too Many Requests |
调用频率或额度超限 | 在平台控制台检查配额,或等待后重试 |
| Claude Code 面板连接正常,但部分功能仍报 403 | 某些功能使用了不同的网络协议栈,标准HTTP代理未生效 | 可尝试在代理工具中开启透明代理模式,创建虚拟网络接口以捕获所有流量 |
📌 总结:问题的本质是网络可达性限制,而 macOS GUI 应用不继承 shell 环境变量。配置好代理并从终端启动 VS Code,即可解决绝大多数连接问题。
五、成本优化建议
5.1 最大化缓存命中率
- 保持System Prompt不变:在编程工具中,尽量使用固定的系统提示词,避免频繁修改
- 复用对话历史:在同一会话中连续对话,历史上下文会被缓存复用
- 合理设计请求顺序:让每次API调用的消息数组公共前缀部分保持一致
5.2 选择合适的模型
| 使用场景 | 推荐模型 | 理由 |
|---|---|---|
| 日常轻量编程 | DeepSeek V4-Flash / GLM-4.7-Flash | 免费或极低成本 |
| 高性能编程 | GLM-5.1 / DeepSeek V4-Pro | 旗舰模型,编程能力强 |
| 长程复杂任务 | GLM-5.1 | 支持8小时持续工作 |
| 多模态编程 | GLM-5V-Turbo | 支持图片、视频输入 |
| 极低成本测试 | DeepSeek V4-Flash + 缓存命中 | 缓存命中仅0.02元/百万tokens |
5.3 其他省钱技巧
- 关注限时优惠:DeepSeek Pro模型当前有2.5折优惠(至2026年5月31日)
- 利用免费模型:GLM-4.7-Flash和GLM-4.6V-Flash完全免费,适合学习和原型开发
- 拼团订阅Coding Plan:智谱Coding Plan按季或按年订阅更优惠,同时保留存量用户原有价格
- 选择计费区间:编程工具调用通常属于短上下文场景(低于32K tokens),处于低单价区间;对于需要处理长上下文的场景,务必注意长度增长可能带来的阶梯定价影响
- 设置用量告警:在DeepSeek和智谱控制台设置每日/每月调用量上限和余额告警,防止意外超额消费
六、后续扩展计划
📌 本文档将根据平台更新持续维护,后续计划扩展以下内容:
- GPT系列模型(OpenAI)的API购买与接入Trae/Claude Code配置
- 更多第三方中转API服务商的接入方案
- 多模型负载均衡与自动切换策略
- 企业级团队管理与配额分配方案
- 成本监控仪表板搭建指南
最后更新时间:2026年5月
免责声明:本文档中的定价信息可能随时间变化,请以各平台官方页面为准。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)