各类AI模型API购买与编程工具接入配置指南

免责声明:本文所述网络配置仅为解决开发环境中的网络可达性问题,请遵守当地法律法规。

一、核心概念速览

在正式进入操作流程之前,先了解几个与计费和调用密切相关的核心概念。

1.1 Token(词元)

Token是大模型处理文本的基本单位。一个Token可以是单词、部分单词或单个字符。英文平均1个单词≈1.3个Token;中文平均1个汉字≈1.5-2个Token。API计费按照处理的Token数量来计算。

1.2 上下文(Context)

上下文窗口指模型一次能够“记住”和处理的最大Token数量。上下文窗口越大,模型能处理的文本越长,能理解和回应的对话历史也越长。例如,GLM-4.7-FlashX拥有200K的上下文窗口(约可处理一部中长篇小说的全文)。

上下文长度区间分段计费:许多模型在计费时会根据单次请求的上下文长度(即输入Token总量)落在哪个区间来执行不同的单价。例如:

  • GLM-5.1的输入长度在 [0, 32)(即0到32K tokens之间)时,输入单价为6元/百万tokens;
  • 当输入长度增长到 [32+)(即32K tokens及以上)时,输入单价上升为8元/百万tokens。

这意味着在API调用场景中,不仅要关注Token数量的消耗,还需要注意单次请求的上下文总长度可能触发阶梯式定价。

1.3 缓存命中(Cache Hit)

当多次调用API时,如果请求的上下文前缀(如系统提示词System Prompt、对话历史等)完全相同,模型平台会自动复用已缓存的中间计算结果,无需从头重新计算,这就是“缓存命中”。

缓存命中的计费价格远低于标准输入价格(通常为标准输入的10%~20%),是大幅降低API调用成本的关键手段。

隐式缓存:主流平台已实现自动识别重复内容的“隐式缓存”,开发者无需手动配置即可享受缓存命中带来的价格优惠。

影响缓存命中率的核心要素

  • 请求顺序:每次API调用的消息数组(message array),应保持公共前缀部分的顺序和内容完全一致
  • 前缀一致性:系统提示词、对话历史等固定前缀内容不变,仅变更末尾的最新用户问题
  • Session复用:在同一对话会话中连续发送消息时,历史上下文可被最大化缓存复用,从而显著提升命中率

1.4 缓存存储(Cache Storage)

部分平台(如智谱BigModel)会额外对已建立的上下文缓存按时间收取存储费用,单位为“元/百万tokens/小时”。当前智谱平台对缓存存储实行“限时免费”政策。其他平台(如DeepSeek)不单独收取缓存存储费用。

二、平台注册与API Key获取

2.1 DeepSeek API

2.1.1 注册账号
  1. 访问DeepSeek开放平台:https://platform.deepseek.com/usage
  2. 使用手机号进行注册,点击“发送验证码”,填写验证码后完成注册/登录
  3. 注册登录即代表已同意开放平台协议与隐私政策
  4. 根据需要完成实名认证:个人开发者需上传身份证信息,等待1-2个工作日审核
2.1.2 获取API Key
  1. 登录后进入「开发者中心」或「控制台」
  2. 进入「API管理」或「API Keys」模块
  3. 点击「创建API Key」或「生成新密钥」
  4. 选择密钥类型(推荐选择“主密钥Master Key”用于开发测试)
  5. 创建后立即复制并妥善保存Key(关闭页面后将无法再次查看完整Key)

⚠️ 安全提醒:API Key是敏感凭证,请勿将Key硬编码在客户端代码或提交至公共代码仓库。建议使用环境变量存储,并定期轮换Key(建议每90天更换一次)。

2.1.3 充值计费

DeepSeek API为按量计费模式,支持在控制台进行账户充值,充值后即可调用模型。

2.2 智谱AI(GLM)API

2.2.1 注册账号
  1. 访问智谱AI开放平台:https://open.bigmodel.cn
  2. 使用手机号注册并登录
  3. 按平台提示完成实名认证

新用户福利:新注册用户通常会赠送一定数量的免费Token额度。此外,加入官方企业微信、完成实名认证等操作也可能获得额外赠送的Token。

2.2.2 获取API Key
  1. 登录后进入平台左侧「控制台」→「API密钥管理」页面
  2. 点击「创建API密钥」按钮
  3. 系统会同时生成 api_keysecret_key,两者都需复制保存
  4. 密钥格式一般为 sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxx

⚠️ 双重密钥说明:智谱平台会同时生成API Key和Secret Key,两者都是敏感凭证,务必妥善保存,切勿公开分享或提交至代码仓库。
有时候只有API Key。

2.2.3 订阅GLM Coding Plan

GLM Coding Plan是智谱AI推出的针对编程场景的订阅制套餐,按季或按年订阅后可享受特定模型的优惠调用额度,并支持无缝接入Claude Code等主流编程工具。

核心调整说明(2026年2月12日起生效)

调整项 具体内容
首购优惠 已取消,新用户不再享受首购折扣
套餐价格 结构性调整,整体涨幅自30%起
订阅方式 按季订阅与按年订阅优惠保留
存量用户 已订阅用户价格保持不变

订阅步骤

  1. 通过拼团链接访问订阅页面:www.bigmodel.cn/glm-coding
  2. 选择适合的订阅档位(按季/按年)
  3. 完成支付后,登录开放平台确认订阅状态
  4. 在「模型管理」模块确认GLM模型权限已自动解锁(订阅套餐后默认开启,若未显示可刷新页面或联系客服)

2.3 企业级认证(可选,推荐企业用户)

如果团队需要更高并发配额和更专业的支持,建议完成企业实名认证:

  1. 在控制台找到「企业认证」或「实名认证」入口
  2. 提交企业营业执照等资质材料
  3. 等待平台审核通过(通常1-3个工作日)
  4. 审核通过后可享受更高调用限额和专属技术支持

2.4 环境变量配置最佳实践(可选)

获取API Key后,建议通过环境变量方式存储,避免密钥硬编码带来的安全风险:

# Linux / macOS
export DEEPSEEK_API_KEY="your_deepseek_key_here"
export GLM_API_KEY="your_glm_key_here"

# Windows PowerShell
$env:DEEPSEEK_API_KEY="your_deepseek_key_here"
$env:GLM_API_KEY="your_glm_key_here"

也可以创建 .env 配置文件(记得将 .env 加入 .gitignore):

DEEPSEEK_API_KEY=your_deepseek_key_here
GLM_API_KEY=your_glm_key_here

三、模型定价概览

3.1 DeepSeek API 定价

DeepSeek API采用按量计费模式,具体定价以官方页面 platform.deepseek.com/usage 公示为准。

3.1.1 DeepSeek V4系列定价(截至2026年4月)
模型版本 场景 单价(元/百万tokens)
V4-Flash 缓存命中 0.02
V4-Flash 缓存未命中(输入) 1
V4-Flash 输出 2
V4-Pro 缓存命中(原价) 0.1
V4-Pro 缓存命中(限时折扣后) 0.025
V4-Pro 缓存未命中(输入) 3
V4-Pro 缓存未命中(输出) 6

限时优惠说明:2026年4月25日,DeepSeek宣布Pro模型启动2.5折限时优惠活动;4月26日进一步宣布全系列API输入缓存命中价格降至首发价的1/10。Pro模型在2026年5月5日前可叠加2.5折优惠,后续优惠延长至5月31日。

模型定位

  • V4-Flash:总参数2840亿,激活参数130亿,主打低成本和高吞吐,适合中小开发者与轻量应用调用场景
  • V4-Pro:总参数1.6万亿,激活参数490亿,定位高性能旗舰任务,在Agentic Coding评测中代码交付质量接近Claude Opus 4.6非思考模式

3.2 智谱AI(GLM)定价

智谱AI开放平台采用按量计费模式,价格因模型版本和上下文长度而异。以下信息来源于 open.bigmodel.cn/pricing 官方定价页。

3.2.1 旗舰模型
模型名称 输入长度(千tokens) 输入单价(元/百万tokens) 输出单价(元/百万tokens) 缓存命中(元/百万tokens)
GLM-5.1 🆕 [0, 32) 6 24 1.3
[32+) 8 28 2
GLM-5-Turbo [0, 32) 5 22 1.2
[32+) 7 26 1.8
GLM-5 [0, 32) 4 18 1
[32+) 6 22 1.5
GLM-4.7 [0, 32),输出[0, 0.2) 2 8 0.4
[0, 32),输出[0.2+) 3 14 0.6
[32, 200) 4 16 0.8
GLM-4.5-Air [0, 32),输出[0, 0.2) 0.8 2 0.16
[0, 32),输出[0.2+) 0.8 6 0.16
[32, 128) 1.2 8 0.24
GLM-4.7-FlashX 200K 0.5 3 0.1
GLM-4.7-Flash 200K 免费 免费 免费

缓存存储:当前所有旗舰模型缓存存储均为限时免费

📌 GLM-5.1 是智谱推出的最新旗舰模型,面向长程任务(Long Horizon Task)设计,能够在一次任务中独立、持续工作长达8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

3.2.2 多模态模型
模型名称 输入长度(千tokens) 输入单价(元/百万tokens) 输出单价(元/百万tokens) 缓存命中(元/百万tokens) 支持模态
GLM-5V-Turbo 🆕 [0, 32) 5 22 1.2 图片、视频、文件、文本
[32+) 7 26 1.8 图片、视频、文件、文本
GLM-4.6V [0, 32) 1 3 0.2 图片、视频、文件、文本
[32, 128) 2 6 0.4 图片、视频、文件、文本
GLM-4.6V-FlashX [0, 32) 0.15 1.5 0.03 图片、视频、文件、文本
[32, 128) 0.3 3 0.03 图片、视频、文件、文本
GLM-4.6V-Flash / 免费 免费 免费 图片、视频、文件、文本

📌 GLM-5V-Turbo 是智谱首个多模态Agent基座模型,面向视觉编程与复杂任务场景深度优化,支持“环境感知 → 任务规划 → 执行落地”的完整闭环,让多模态能力从“能看懂”走向“能行动”。

3.3 缓存命中对成本的实操影响

合理利用缓存机制可大幅降低API使用成本。结合当前主流平台的定价情况,不同场景下的成本对比示例如下:

场景 DeepSeek V4-Flash DeepSeek V4-Pro(折扣后) GLM-4.7 GLM-5.1
缓存命中 0.02元/百万tokens 0.025元/百万tokens 0.4~0.8元 1.3~2元
缓存未命中(输入) 1元/百万tokens 3元/百万tokens 2~4元 6~8元
命中/未命中比 1:50 1:120 1:5 1:5

💡 关键结论

  • DeepSeek平台的缓存命中价格极低(Flash仅0.02元/百万tokens),与缓存未命中价格相差50~120倍,合理利用缓存可极大降低成本
  • GLM平台缓存命中价格约为标准输入价格的20%,同样具有明显的成本优势
  • 实战技巧:在Claude Code、Trae等编程工具中,尽量保持系统提示词(System Prompt)不变、复用对话历史,可显著提升缓存命中率,降低实际支出

四、接入编程工具详细配置

本章节详细描述将已购买的API接入Trae和Claude Code(VS Code扩展)的完整步骤、常见问题与最佳实践。

4.1 接入Trae(AI原生IDE)

Trae是一款AI原生IDE,集成了对话式编程、代码补全与Agent能力。它支持添加第三方模型提供商,可直接使用DeepSeek或智谱GLM的API Key。

4.1.1 准备工作
  1. 下载并安装最新版Trae:https://www.trae.ai
  2. 确保已从DeepSeek或智谱开放平台获取有效的API Key(参见第二章)
  3. 如使用智谱GLM Coding Plan,请确认订阅状态已生效,模型权限已开启
4.1.2 添加智谱GLM模型
  1. 打开Trae,点击左侧活动栏的「AI对话」图标(或使用快捷键唤出)
  2. 在对话输入框的右下角,点击当前显示的模型名称(如“Kimi 2.6”)
  3. 在弹出的模型选择面板底部,点击「添加模型」或「自定义模型」按钮
  4. 在“提供商”下拉菜单中,选择「智谱AI」或「Zhipu AI」。如果列表中没有该选项,可以选择「Generic OpenAI」或「自定义」并手动填写信息
  5. 填写模型信息:
    • 模型名称:输入模型ID,例如 GLM-5.1GLM-4.7GLM-4.7-Flash 等(注意大小写,建议严格参照智谱官方模型列表)
    • API Key:粘贴已获取的智谱API Key(以sk-开头的字符串)
    • Base URL(如为自定义提供商):https://open.bigmodel.cn/api/paas/v4(智谱API的OpenAI兼容端点,自行查看该博客后半部分有claude的URL)
  6. 点击「保存」或「添加」按钮。成功保存后,模型列表中会出现刚才添加的模型
  7. 在AI对话面板中,点击模型名称,从列表中选择刚添加的GLM模型,即可开始使用

🔧 手动校准说明:如果Trae默认的智谱提供商配置无法连接,可以选择“Generic OpenAI”类型,并手动填入:

  • Base URL:https://open.bigmodel.cn/api/paas/v4/chat/completions
  • API Key:智谱API Key
  • 模型ID:根据实际需求填写(如 GLM-4.7
4.1.3 添加DeepSeek模型
  1. 同样在Trae的模型选择面板中,点击「添加模型」
  2. 在“提供商”下拉菜单中选择「DeepSeek」。若无则选择「Generic OpenAI」或「自定义」
  3. 填写模型信息:
    • 模型名称deepseek-chat(对应V4系列对话模型)或 deepseek-reasoner(推理模型)
    • API Key:粘贴DeepSeek API Key
    • Base URL(自定义时):https://api.deepseek.com/v1
  4. 保存并切换到该模型即可使用
4.1.4 Trae Agent模式配置

Trae的Agent模式(如“Builder模式”)可自动规划并执行任务,推荐配置高性能模型以获得更好体验:

  • 在「设置」→「Agent」或「Builder」选项卡中,将默认模型切换为 GLM-5.1 或 DeepSeek V4-Pro
  • 确保模型名称和API Key配置正确
  • 首次使用Agent时,Trae可能会要求安装额外的依赖(如MCP协议支持),请根据提示操作
4.1.5 Trae常见问题与排查
问题现象 可能原因 解决方案
模型列表中找不到已添加的模型 1. 保存未成功 2. UI缓存未刷新 重启Trae,或进入「设置」→「模型管理」检查已保存的模型列表
对话返回3003错误 1. 上游API返回429(频率/并发限制)或500(服务器错误) 2. 向不支持图片的模型发送了图片 1. 检查API Key余额和配额 2. 移除图片消息,确保模型支持多模态
响应缓慢或中断 1. 上下文过长导致超时 2. 模型输出长度达到限制 1. 尝试开启“长上下文模式”或清理对话历史 2. 在提示中要求模型分段输出
图片理解无效 模型本身不支持视觉(如GLM-5.1仅文本) 更换为GLM-5V-Turbo或GLM-4.6V系列模型
调用时报“无效模型名称” 模型ID拼写错误或大小写不匹配 检查模型名称与官方文档一致,注意大小写

4.2 接入Claude Code(VS Code扩展)

Claude Code现已提供官方VS Code扩展,可在IDE内部直接通过聊天面板进行交互。由于网络环境的限制,中国大陆用户可能需要配置网络代理才能正常使用。

4.2.1 环境准备与安装
  1. 确保VS Code版本≥1.98.0
  2. 打开VS Code,按 Ctrl+Shift+X(Windows/Linux)或 Cmd+Shift+X(Mac)打开扩展市场
  3. 搜索 “Claude Code”,找到由 Anthropic 发布的官方扩展并安装
  4. 安装完成后重启VS Code,工具栏右上角会出现Claude Code图标
4.2.2 配置Claude Code扩展(接入第三方模型)

安装完成后,需要先为扩展配置环境变量,确保网络连通性。以下是两种经过验证的配置方式。

方式一:直接配置DeepSeek端点(适合DeepSeek用户,推荐该方式,其余大模型同理)

DeepSeek开放平台已原生支持 /anthropic 端点(即 https://api.deepseek.com/anthropic),可直接作为Anthropic API的替代品供Claude Code使用。在VS Code的settings.json中进行如下配置:

{
  "editor.fontSize": 16,
  "[csharp]": {
    "editor.defaultFormatter": "ms-dotnettools.csharp"
  },
  "editor.defaultFormatter": "esbenp.prettier-vscode",
  "security.workspace.trust.enabled": false,
  "[c]": {
    "editor.defaultFormatter": "ms-vscode.cpptools"
  },
  "[cpp]": {
    "editor.defaultFormatter": "ms-vscode.cpptools"
  },
  "workbench.colorTheme": "Light Modern",
  "editor.unicodeHighlight.allowedCharacters": {
    " ": true
  },
  "claudeCode.selectedModel": "deepseek-chat",
  "claudeCode.environmentVariables": [
  


    
        {
            "name": "ANTHROPIC_BASE_URL",
            "value": "https://api.deepseek.com/anthropic"
        },
        {
            "name": "ANTHROPIC_AUTH_TOKEN",
            "value": "你自己的API"
        },
        {
            "name": "API_TIMEOUT_MS",
            "value": "600000"
        },
        {
            "name": "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC",
            "value": "1"
        },
        {
            "name": "ANTHROPIC_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_SMALL_FAST_MODEL",
            "value": "deepseek-v4-flash"
        },
        {
            "name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
            "value": "deepseek-v4-flash"
        }
  ],
  "claudeCode.preferredLocation": "panel",
  "explorer.confirmDelete": false
}

配置项说明

配置项 说明
claudeCode.selectedModel 指定对话模型为 deepseek-v4-pro(主模型)
ANTHROPIC_BASE_URL DeepSeek的Anthropic兼容端点
ANTHROPIC_AUTH_TOKEN DeepSeek API Key
ANTHROPIC_MODEL 主推理模型,设为 deepseek-v4-pro(V4系列旗舰)
ANTHROPIC_SMALL_FAST_MODEL 轻量任务模型,设为 deepseek-v4-flash(低成本高吞吐)
ANTHROPIC_DEFAULT_SONNET_MODEL Sonnet层级模型映射为 deepseek-v4-pro
ANTHROPIC_DEFAULT_OPUS_MODEL Opus层级模型映射为 deepseek-v4-pro
ANTHROPIC_DEFAULT_HAIKU_MODEL Haiku层级模型映射为 deepseek-v4-flash
API_TIMEOUT_MS 超时时间设为600秒(10分钟),避免长任务中断
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC 禁用非必要网络流量,减少额外请求

模型分层逻辑:重量级任务(复杂代码生成、深度推理、架构设计)走 deepseek-v4-pro,轻量任务(工具调用、文件读写、快速问答)走 deepseek-v4-flash。两档模型分工明确,既保住能力上限,又控制成本。

方式二:通过OpenRouter代理接入(适合多模型切换用户)

OpenRouter作为模型聚合平台,可将多种模型(包括DeepSeek)统一转换为Anthropic兼容格式。

步骤一:注册OpenRouter账号,访问 https://openrouter.ai/keys 获取API Key。

步骤二:在VS Code的settings.json中配置:

{
  "claudeCode.selectedModel": "deepseek/deepseek-chat",
  "claudeCode.environmentVariables": [
    {
      "name": "ANTHROPIC_BASE_URL",
      "value": "https://openrouter.ai/api/anthropic"
    },
    {
      "name": "ANTHROPIC_AUTH_TOKEN",
      "value": "替换成OpenRouter API Key"
    },
    {
      "name": "ANTHROPIC_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_SMALL_FAST_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
      "value": "deepseek/deepseek-chat"
    }
  ],
  "claudeCode.preferredLocation": "panel"
}

配置项说明:OpenRouter通过 /api/anthropic 端点提供Anthropic兼容格式,模型名称需使用OpenRouter格式(如 deepseek/deepseek-chat)。除了DeepSeek外,OpenRouter还聚合了多种免费或低成本模型,可实现更灵活的模型路由。

方式对比速查
对比维度 方式一:直接配置 方式二:OpenRouter代理
配置复杂度 ⭐ 简单,直接配置DeepSeek端点 ⭐⭐ 中等,需额外注册OpenRouter
适用场景 仅使用DeepSeek模型 需要灵活切换多种模型
Base URL https://api.deepseek.com/anthropic https://openrouter.ai/api/anthropic
API Key DeepSeek API Key OpenRouter API Key
模型名称格式 deepseek-v4-pro deepseek/deepseek-chat

以下是整合后的 4.2.3 Claude Code界面汉化 章节,将您提供的 VS Code 汉化包内容和 Claude Code CLI 中文增强方案合并在一起,适合放在技术文档或部署手册中:

4.2.3 Claude Code界面汉化(推荐中文用户)

Claude Code 原生界面为英文,中文开发者可通过以下两种方式获得更好的中文使用体验,根据使用环境选择对应方案。

方案一:VS Code 扩展汉化包(适用于 VS Code 环境)

在 VS Code 扩展市场搜索 [非官方] Claude Code for VS Code 简体中文汉化包(发布者:zstings),点击安装即可。

汉化包核心功能

  • 自动汉化:VS Code 启动时自动应用汉化,无需手动操作
  • 三阶段汉化:支持前置规则 → 内置规则 → 后置规则,灵活控制翻译顺序
  • 自定义规则:可通过配置添加自己的翻译规则(如将特定术语翻译为团队习惯用语)
  • 自动备份:修改前自动创建备份文件,支持一键还原到原版
  • 更新检测:Claude Code 扩展更新后自动重新应用汉化,无需手动维护

使用命令
Ctrl+Shift+P(Windows/Linux)或 Cmd+Shift+P(macOS)打开命令面板,输入以下命令:

  • Claude Code 汉化: 应用汉化 — 手动应用汉化
  • Claude Code 汉化: 还原原版 — 还原到英文原版
  • Claude Code 汉化: 打开配置 — 打开汉化配置页面

自定义翻译示例

{
  "claudeCodeZhCn.postTranslationRules": [
    {
      "original": "Ask before edits",
      "chinese": "编辑前询问",
      "regex": false
    },
    {
      "original": "\\bfile\\b",
      "chinese": "文件",
      "regex": true,
      "flags": "gi"
    }
  ]
}

⚠️ 注意事项:本项目为社区开发,与 Anthropic 官方无关。在某些系统上可能需要管理员权限修改扩展文件。如遇到 Claude Code 扩展更新后汉化失效,等待汉化包自动检测更新后重新应用即可。

方案二:CLI 中文增强包(适用于终端/命令行环境)

若您使用 Claude Code CLI 版本(终端环境),可通过 claudezh 包获得全中文交互体验。

安装步骤

# 1. 全局安装 claudezh
npm install -g claudezh

# 2. 以插件模式安装到 Claude Code 中(推荐)
npx claudezh --install-plugin

使用方法

安装完成后,正常启动 Claude Code:

claude

在 Claude Code 对话中输入以下命令切换语言:

命令 说明
/zh 切换到简体中文模式
/zht 切换到繁体中文模式
/en 切换回英文模式
/review-zh 中文代码审查
/explain-zh 中文代码解释
/test-zh 中文生成测试
/fix-zh 中文修复 Bug

若希望独立启动全中文版 CLI,可直接运行:

claudezh

特点

  • ✅ 无需修改 VS Code 配置,纯终端使用
  • ✅ 支持 DeepSeek、Kimi 等第三方 API(配合环境变量使用)
  • ✅ 轻量级,无额外依赖

方案对比与建议
使用场景 推荐方案 说明
VS Code 用户 方案一(汉化包) 自动汉化 + 自定义规则,与编辑器深度集成
终端/CLI 用户 方案二(claudezh) 纯命令行环境,支持中文命令和第三方 API
两者混用 同时配置 两种方案互不冲突,可同时安装

💡 提示:无论使用哪种方案,若您已配置 DeepSeek 等第三方 API,请确保环境变量(如 ANTHROPIC_AUTH_TOKENANTHROPIC_BASE_URL)已正确设置,以便 Claude Code 正常工作。

4.2.4 Claude Code纯中文输出配置

如果你不仅希望界面是中文,还希望Claude Code的输出内容全部使用中文(无中英混杂)。
可以通过以下方式实现:同时可以采用前文提到的CLI 中文增强包,下载过,cli以及vscode版本下的claude code都可以使用,然后输入 /zh 即可转化为中文对话。

方法一:对话即时约束(零门槛):在Claude Code对话中直接输入:

从现在开始,请始终使用简体中文回答我的所有问题。不要使用英文单词,除非是代码语法本身。

Claude Code具有极强的上下文记忆能力,接收到这条“系统级”指令后,在当前会话中会严格遵守中文输出。

方法二:持久化记忆存储(一劳永逸):输入 Always reply in Chinese.,当系统提示是否保存到记忆时,选择 User memory。这样无论打开哪个项目,都会默认使用中文交流。

方法三:项目级锁定(团队协作推荐):在项目根目录创建 .claude/CLAUDE.md 文件,Claude Code会自动读取作为项目指令:

# 项目语言规范
请严格遵守以下规则:
1. 所有对话、解释、建议必须使用**简体中文**
2. 代码注释必须使用中文
3. 生成的 Commit Message 必须使用中文
4. 严禁出现大段未翻译的英文技术名词(保留专业术语如 API、SDK 除外)

进阶方案:国产模型“换芯”:如果基础指令不生效,或Claude Code依然在输出报错信息时使用英文,可通过配置环境变量强制干预。找到 ~/.claude/settings.json 文件,添加语言预设:

{
  "custom_instructions": {
    "language": "Always respond in Simplified Chinese. You must not output English explanations or mixed language."
  }
}

💡 最彻底的汉化方案:通过接入DeepSeek、智谱GLM等国产模型,这些模型原生就是中文思维,输出内容完全符合中文习惯,无需额外配置。具体接入方法参见4.2.2节。

4.2.5 配置网络代理(中国大陆用户需知)

由于网络可达性原因,中国大陆用户可能无法直接访问Anthropic服务,需要通过HTTP代理进行连接。请在 shell 配置文件中设置环境变量(以 macOS zsh 为例):

echo 'export HTTPS_PROXY="http://127.0.0.1:7890"' >> ~/.zshrc
source ~/.zshrc

代理端口 7890 是常见代理客户端的默认HTTP端口,请以你实际使用的工具设置为准。

⚠️ 关键提醒:必须从终端启动 VS Code(使用 code . 命令),才能使 VS Code 及其扩展进程继承 shell 中的 HTTPS_PROXY 环境变量。从 Dock 或 Finder 直接启动 VS Code,Claude Code 扩展将无法读取代理设置。

4.2.6 不同提供商的Base URL速查
提供商 Base URL 备注
DeepSeek(原生) https://api.deepseek.com/anthropic 直接支持Anthropic兼容端点
智谱GLM(Z.AI) https://open.bigmodel.cn/api/anthropic 直接支持Anthropic兼容端点
小米MIMO https://token-plan-cn.xiaomimimo.com/anthropic 兼容
OpenRouter https://openrouter.ai/api/anthropic 需在OpenRouter后台选定模型
自定义中转API 询问服务商是否提供 /v1/messages 端点 需确认兼容性
4.2.7 验证连接

完成上述配置后,点击 VS Code 右上角的 Claude Code 图标打开聊天面板,发送简单提示(如“hello”或“你当前使用的是什么模型?”),若能正常回复且返回的模型名称正确,则配置成功。

4.2.8 模型使用限制说明
模型 接入方式 兼容性说明
DeepSeek V4-Pro / Flash 原生Anthropic端点 / OpenRouter 工具调用、Agent能力完整支持
GLM-4.7 / GLM-5.1 Z.AI原生Anthropic端点 工具调用、Agent能力完整支持,编码表现优秀
Claude官方模型 原生Anthropic API 无需额外配置,工具链优化最佳

⚠️ Claude Code是为Claude原生模型深度优化的工具,第三方模型在复杂的多步骤工具调用、结构化diff生成等场景中,表现可能不如原版Claude。推荐策略:使用GLM-5.1或GPT-5.4进行高层架构讨论与规划,使用Claude Code执行具体代码实现。

4.2.9 故障排除速查表
错误信息 常见原因 解决方法
401 Unauthorized API Key无效或格式错误 重新生成API Key,确认粘贴完整且无多余字符
404 Not Found Base URL路径错误 检查URL是否包含完整路径(如 /anthropic
Connection refused 网络不通或代理未配置 检查网络连接,必要时设置 HTTPS_PROXY
Model not found 模型名称错误 检查模型名称(如 deepseek-v4-pro vs deepseek/deepseek-chat
429 Too Many Requests 调用频率或额度超限 在平台控制台检查配额,或等待后重试

4.3 VS Code无法登录Claude的解决方案

如果你在VS Code中使用Claude Code扩展时遇到 403OAuth errorFailed to connect 等错误,根本原因是网络限制导致无法直接访问Anthropic服务,而 VS Code 扩展可能无法正确使用代理。

4.3.1 问题确认

常见报错信息

  • OAuth error: Failed to fetch user roles: Request failed with status code 403
  • Unable to connect to Anthropic services
  • Failed to connect to api.anthropic.com: ERR_BAD_REQUEST
  • Note: Claude Code might not be available in your country.

快速测试:在终端中运行 curl -I https://api.anthropic.com,如果返回 HTTP/2 403 说明无法直接访问,若超时则可能是 DNS 或防火墙问题。

4.3.2 常见误区(这些方法无效)
❌ 无效操作 原因
反复重新登录 访问限制是基于网络环境的,与账号无关
仅设置 VS Code 的 http.proxy Claude Code 扩展不读取 VS Code 的代理设置
从 Dock/Finder 启动 VS Code macOS GUI 应用不会继承 shell 环境变量,即使 ~/.zshrc 中已设置 HTTPS_PROXY 也无效
4.3.3 正确解决方案

第一步:配置代理

确保本地代理工具已正常运行,并确认 HTTP 代理端口,不同的代理软件端口不同,下图是我使用的工具端口,其他的工具端口查看可以进行Baidu。验证代理可用性:
在这里插入图片描述

curl -I --proxy http://127.0.0.1:7897 https://api.anthropic.com

看到 HTTP/1.1 200 Connection established 后跟非 403 的响应(404 也算正常,说明请求到达了 Anthropic 的服务器)即为成功。

第二步:设置 HTTPS_PROXY 环境变量

macOS (zsh)

echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.zshrc
source ~/.zshrc

Linux (bash)

echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.bashrc
source ~/.bashrc

Windows

  1. 控制面板 → 系统 → 高级系统设置 → 环境变量
  2. 在用户变量中新建 HTTPS_PROXY,值为 http://127.0.0.1:7897(替换为你的代理端口)
  3. 确定保存后,必须通过 code . 命令从终端启动 VS Code

第三步:从终端启动 VS Code

这是最关键的一步——必须从终端启动 VS Code,扩展进程才能继承代理环境变量:

macOS

# 如果 code 命令被映射到其他编辑器,使用:
open -a "Visual Studio Code" .

# 可设别名方便使用:
echo 'alias vscode="open -a \"Visual Studio Code\""' >> ~/.zshrc
source ~/.zshrc
# 之后直接:
vscode .

Windows

code .

第四步:如果之前登录失败过,先清除登录状态

macOS/Linux

claude /logout
claude /login

OAuth 流程正常完成后,roles 接口不再 403,因为流量已走代理。

补充说明:对于 Windows 用户,除了通过控制面板设置系统环境变量,也可以在 PowerShell 中临时设置:

$env:HTTPS_PROXY="http://127.0.0.1:7890"

但务必通过 code . 命令从该终端窗口启动 VS Code,否则环境变量不会被扩展进程继承。

4.3.4 Remote SSH场景

如果你通过 VS Code SSH 连接到远程机器,Claude Code 扩展运行在远程端,因此远程机器也需要设置 HTTPS_PROXY

例如,Mac 的桥接网卡 IP 为 192.168.2.1,在远程虚拟机中执行:

echo 'export HTTPS_PROXY="http://192.168.2.1:7897"' >> ~/.bashrc
source ~/.bashrc

同时确保代理工具开启了“允许局域网连接”选项。

4.3.5 故障排除速查表
错误信息 常见原因 解决方法
401 Unauthorized API Key 无效或格式错误 重新生成 API Key,确认粘贴完整且无多余字符
404 Not Found Base URL 路径错误 检查 URL 是否包含完整路径(如 /api/anthropic
Connection refused 网络不通或代理未配置 检查网络连接,必要时设置 HTTPS_PROXY
Model not found 模型名称错误或未在代理配置中选择 对于 OpenRouter 检查模型映射;对于智谱确认模型已启用
429 Too Many Requests 调用频率或额度超限 在平台控制台检查配额,或等待后重试
Claude Code 面板连接正常,但部分功能仍报 403 某些功能使用了不同的网络协议栈,标准HTTP代理未生效 可尝试在代理工具中开启透明代理模式,创建虚拟网络接口以捕获所有流量

📌 总结:问题的本质是网络可达性限制,而 macOS GUI 应用不继承 shell 环境变量。配置好代理并从终端启动 VS Code,即可解决绝大多数连接问题。

五、成本优化建议

5.1 最大化缓存命中率

  1. 保持System Prompt不变:在编程工具中,尽量使用固定的系统提示词,避免频繁修改
  2. 复用对话历史:在同一会话中连续对话,历史上下文会被缓存复用
  3. 合理设计请求顺序:让每次API调用的消息数组公共前缀部分保持一致

5.2 选择合适的模型

使用场景 推荐模型 理由
日常轻量编程 DeepSeek V4-Flash / GLM-4.7-Flash 免费或极低成本
高性能编程 GLM-5.1 / DeepSeek V4-Pro 旗舰模型,编程能力强
长程复杂任务 GLM-5.1 支持8小时持续工作
多模态编程 GLM-5V-Turbo 支持图片、视频输入
极低成本测试 DeepSeek V4-Flash + 缓存命中 缓存命中仅0.02元/百万tokens

5.3 其他省钱技巧

  1. 关注限时优惠:DeepSeek Pro模型当前有2.5折优惠(至2026年5月31日)
  2. 利用免费模型:GLM-4.7-Flash和GLM-4.6V-Flash完全免费,适合学习和原型开发
  3. 拼团订阅Coding Plan:智谱Coding Plan按季或按年订阅更优惠,同时保留存量用户原有价格
  4. 选择计费区间:编程工具调用通常属于短上下文场景(低于32K tokens),处于低单价区间;对于需要处理长上下文的场景,务必注意长度增长可能带来的阶梯定价影响
  5. 设置用量告警:在DeepSeek和智谱控制台设置每日/每月调用量上限和余额告警,防止意外超额消费

六、后续扩展计划

📌 本文档将根据平台更新持续维护,后续计划扩展以下内容:

  • GPT系列模型(OpenAI)的API购买与接入Trae/Claude Code配置
  • 更多第三方中转API服务商的接入方案
  • 多模型负载均衡与自动切换策略
  • 企业级团队管理与配额分配方案
  • 成本监控仪表板搭建指南

最后更新时间:2026年5月
免责声明:本文档中的定价信息可能随时间变化,请以各平台官方页面为准。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐