各类AI模型API购买与编程工具接入配置指南

无宜

642人浏览 · 2026-05-19 12:05:56

无宜 · 2026-05-19 12:05:56 发布

各类AI模型API购买与编程工具接入配置指南

免责声明：本文所述网络配置仅为解决开发环境中的网络可达性问题，请遵守当地法律法规。

一、核心概念速览

在正式进入操作流程之前，先了解几个与计费和调用密切相关的核心概念。

1.1 Token（词元）

Token是大模型处理文本的基本单位。一个Token可以是单词、部分单词或单个字符。英文平均1个单词≈1.3个Token；中文平均1个汉字≈1.5-2个Token。API计费按照处理的Token数量来计算。

1.2 上下文（Context）

上下文窗口指模型一次能够“记住”和处理的最大Token数量。上下文窗口越大，模型能处理的文本越长，能理解和回应的对话历史也越长。例如，GLM-4.7-FlashX拥有200K的上下文窗口（约可处理一部中长篇小说的全文）。

上下文长度区间分段计费：许多模型在计费时会根据单次请求的上下文长度（即输入Token总量）落在哪个区间来执行不同的单价。例如：

GLM-5.1的输入长度在 [0, 32)（即0到32K tokens之间）时，输入单价为6元/百万tokens；

当输入长度增长到 [32+)（即32K tokens及以上）时，输入单价上升为8元/百万tokens。

这意味着在API调用场景中，不仅要关注Token数量的消耗，还需要注意单次请求的上下文总长度可能触发阶梯式定价。

1.3 缓存命中（Cache Hit）

当多次调用API时，如果请求的上下文前缀（如系统提示词System Prompt、对话历史等）完全相同，模型平台会自动复用已缓存的中间计算结果，无需从头重新计算，这就是“缓存命中”。

缓存命中的计费价格远低于标准输入价格（通常为标准输入的10%~20%），是大幅降低API调用成本的关键手段。

隐式缓存：主流平台已实现自动识别重复内容的“隐式缓存”，开发者无需手动配置即可享受缓存命中带来的价格优惠。

影响缓存命中率的核心要素：

请求顺序：每次API调用的消息数组（message array），应保持公共前缀部分的顺序和内容完全一致
前缀一致性：系统提示词、对话历史等固定前缀内容不变，仅变更末尾的最新用户问题
Session复用：在同一对话会话中连续发送消息时，历史上下文可被最大化缓存复用，从而显著提升命中率

1.4 缓存存储（Cache Storage）

部分平台（如智谱BigModel）会额外对已建立的上下文缓存按时间收取存储费用，单位为“元/百万tokens/小时”。当前智谱平台对缓存存储实行“限时免费”政策。其他平台（如DeepSeek）不单独收取缓存存储费用。

二、平台注册与API Key获取

2.1 DeepSeek API

2.1.1 注册账号

访问DeepSeek开放平台：https://platform.deepseek.com/usage
使用手机号进行注册，点击“发送验证码”，填写验证码后完成注册/登录
注册登录即代表已同意开放平台协议与隐私政策
根据需要完成实名认证：个人开发者需上传身份证信息，等待1-2个工作日审核

2.1.2 获取API Key

登录后进入「开发者中心」或「控制台」
进入「API管理」或「API Keys」模块
点击「创建API Key」或「生成新密钥」
选择密钥类型（推荐选择“主密钥Master Key”用于开发测试）
创建后立即复制并妥善保存Key（关闭页面后将无法再次查看完整Key）

⚠️ 安全提醒：API Key是敏感凭证，请勿将Key硬编码在客户端代码或提交至公共代码仓库。建议使用环境变量存储，并定期轮换Key（建议每90天更换一次）。

2.1.3 充值计费

DeepSeek API为按量计费模式，支持在控制台进行账户充值，充值后即可调用模型。

2.2 智谱AI（GLM）API

2.2.1 注册账号

访问智谱AI开放平台：https://open.bigmodel.cn
使用手机号注册并登录
按平台提示完成实名认证

新用户福利：新注册用户通常会赠送一定数量的免费Token额度。此外，加入官方企业微信、完成实名认证等操作也可能获得额外赠送的Token。

2.2.2 获取API Key

登录后进入平台左侧「控制台」→「API密钥管理」页面
点击「创建API密钥」按钮
系统会同时生成 api_key 和 secret_key，两者都需复制保存
密钥格式一般为 sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxx

⚠️ 双重密钥说明：智谱平台会同时生成API Key和Secret Key，两者都是敏感凭证，务必妥善保存，切勿公开分享或提交至代码仓库。
有时候只有API Key。

2.2.3 订阅GLM Coding Plan

GLM Coding Plan是智谱AI推出的针对编程场景的订阅制套餐，按季或按年订阅后可享受特定模型的优惠调用额度，并支持无缝接入Claude Code等主流编程工具。

核心调整说明（2026年2月12日起生效）：

调整项	具体内容
首购优惠	已取消，新用户不再享受首购折扣
套餐价格	结构性调整，整体涨幅自30%起
订阅方式	按季订阅与按年订阅优惠保留
存量用户	已订阅用户价格保持不变

订阅步骤：

通过拼团链接访问订阅页面：www.bigmodel.cn/glm-coding
选择适合的订阅档位（按季/按年）
完成支付后，登录开放平台确认订阅状态
在「模型管理」模块确认GLM模型权限已自动解锁（订阅套餐后默认开启，若未显示可刷新页面或联系客服）

2.3 企业级认证（可选，推荐企业用户）

如果团队需要更高并发配额和更专业的支持，建议完成企业实名认证：

在控制台找到「企业认证」或「实名认证」入口
提交企业营业执照等资质材料
等待平台审核通过（通常1-3个工作日）
审核通过后可享受更高调用限额和专属技术支持

2.4 环境变量配置最佳实践（可选）

获取API Key后，建议通过环境变量方式存储，避免密钥硬编码带来的安全风险：

# Linux / macOS
export DEEPSEEK_API_KEY="your_deepseek_key_here"
export GLM_API_KEY="your_glm_key_here"

# Windows PowerShell
$env:DEEPSEEK_API_KEY="your_deepseek_key_here"
$env:GLM_API_KEY="your_glm_key_here"

也可以创建 .env 配置文件（记得将 .env 加入 .gitignore）：

DEEPSEEK_API_KEY=your_deepseek_key_here
GLM_API_KEY=your_glm_key_here

三、模型定价概览

3.1 DeepSeek API 定价

DeepSeek API采用按量计费模式，具体定价以官方页面 platform.deepseek.com/usage 公示为准。

3.1.1 DeepSeek V4系列定价（截至2026年4月）

模型版本	场景	单价（元/百万tokens）
V4-Flash	缓存命中	0.02
V4-Flash	缓存未命中（输入）	1
V4-Flash	输出	2
V4-Pro	缓存命中（原价）	0.1
V4-Pro	缓存命中（限时折扣后）	0.025
V4-Pro	缓存未命中（输入）	3
V4-Pro	缓存未命中（输出）	6

限时优惠说明：2026年4月25日，DeepSeek宣布Pro模型启动2.5折限时优惠活动；4月26日进一步宣布全系列API输入缓存命中价格降至首发价的1/10。Pro模型在2026年5月5日前可叠加2.5折优惠，后续优惠延长至5月31日。

模型定位：

V4-Flash：总参数2840亿，激活参数130亿，主打低成本和高吞吐，适合中小开发者与轻量应用调用场景
V4-Pro：总参数1.6万亿，激活参数490亿，定位高性能旗舰任务，在Agentic Coding评测中代码交付质量接近Claude Opus 4.6非思考模式

3.2 智谱AI（GLM）定价

智谱AI开放平台采用按量计费模式，价格因模型版本和上下文长度而异。以下信息来源于 open.bigmodel.cn/pricing 官方定价页。

3.2.1 旗舰模型

模型名称	输入长度（千tokens）	输入单价（元/百万tokens）	输出单价（元/百万tokens）	缓存命中（元/百万tokens）
GLM-5.1 🆕	[0, 32)	6	24	1.3
	[32+)	8	28	2
GLM-5-Turbo	[0, 32)	5	22	1.2
	[32+)	7	26	1.8
GLM-5	[0, 32)	4	18	1
	[32+)	6	22	1.5
GLM-4.7	[0, 32)，输出[0, 0.2)	2	8	0.4
	[0, 32)，输出[0.2+)	3	14	0.6
	[32, 200)	4	16	0.8
GLM-4.5-Air	[0, 32)，输出[0, 0.2)	0.8	2	0.16
	[0, 32)，输出[0.2+)	0.8	6	0.16
	[32, 128)	1.2	8	0.24
GLM-4.7-FlashX	200K	0.5	3	0.1
GLM-4.7-Flash	200K	免费	免费	免费

缓存存储：当前所有旗舰模型缓存存储均为限时免费。

📌 GLM-5.1 是智谱推出的最新旗舰模型，面向长程任务（Long Horizon Task）设计，能够在一次任务中独立、持续工作长达8小时，期间自主规划、执行、自我进化，最终交付完整的工程级成果。

3.2.2 多模态模型

模型名称	输入长度（千tokens）	输入单价（元/百万tokens）	输出单价（元/百万tokens）	缓存命中（元/百万tokens）	支持模态
GLM-5V-Turbo 🆕	[0, 32)	5	22	1.2	图片、视频、文件、文本
	[32+)	7	26	1.8	图片、视频、文件、文本
GLM-4.6V	[0, 32)	1	3	0.2	图片、视频、文件、文本
	[32, 128)	2	6	0.4	图片、视频、文件、文本
GLM-4.6V-FlashX	[0, 32)	0.15	1.5	0.03	图片、视频、文件、文本
	[32, 128)	0.3	3	0.03	图片、视频、文件、文本
GLM-4.6V-Flash	/	免费	免费	免费	图片、视频、文件、文本

📌 GLM-5V-Turbo 是智谱首个多模态Agent基座模型，面向视觉编程与复杂任务场景深度优化，支持“环境感知 → 任务规划 → 执行落地”的完整闭环，让多模态能力从“能看懂”走向“能行动”。

3.3 缓存命中对成本的实操影响

合理利用缓存机制可大幅降低API使用成本。结合当前主流平台的定价情况，不同场景下的成本对比示例如下：

场景	DeepSeek V4-Flash	DeepSeek V4-Pro（折扣后）	GLM-4.7	GLM-5.1
缓存命中	0.02元/百万tokens	0.025元/百万tokens	0.4~0.8元	1.3~2元
缓存未命中（输入）	1元/百万tokens	3元/百万tokens	2~4元	6~8元
命中/未命中比	1:50	1:120	约1:5	约1:5

💡 关键结论：

DeepSeek平台的缓存命中价格极低（Flash仅0.02元/百万tokens），与缓存未命中价格相差50~120倍，合理利用缓存可极大降低成本

GLM平台缓存命中价格约为标准输入价格的20%，同样具有明显的成本优势

实战技巧：在Claude Code、Trae等编程工具中，尽量保持系统提示词（System Prompt）不变、复用对话历史，可显著提升缓存命中率，降低实际支出

四、接入编程工具详细配置

本章节详细描述将已购买的API接入Trae和Claude Code（VS Code扩展）的完整步骤、常见问题与最佳实践。

4.1 接入Trae（AI原生IDE）

Trae是一款AI原生IDE，集成了对话式编程、代码补全与Agent能力。它支持添加第三方模型提供商，可直接使用DeepSeek或智谱GLM的API Key。

4.1.1 准备工作

下载并安装最新版Trae：https://www.trae.ai
确保已从DeepSeek或智谱开放平台获取有效的API Key（参见第二章）
如使用智谱GLM Coding Plan，请确认订阅状态已生效，模型权限已开启

4.1.2 添加智谱GLM模型

打开Trae，点击左侧活动栏的「AI对话」图标（或使用快捷键唤出）
在对话输入框的右下角，点击当前显示的模型名称（如“Kimi 2.6”）
在弹出的模型选择面板底部，点击「添加模型」或「自定义模型」按钮
在“提供商”下拉菜单中，选择「智谱AI」或「Zhipu AI」。如果列表中没有该选项，可以选择「Generic OpenAI」或「自定义」并手动填写信息
填写模型信息：
- 模型名称：输入模型ID，例如 GLM-5.1、GLM-4.7、GLM-4.7-Flash 等（注意大小写，建议严格参照智谱官方模型列表）
- API Key：粘贴已获取的智谱API Key（以sk-开头的字符串）
- Base URL（如为自定义提供商）：https://open.bigmodel.cn/api/paas/v4（智谱API的OpenAI兼容端点，自行查看该博客后半部分有claude的URL）
点击「保存」或「添加」按钮。成功保存后，模型列表中会出现刚才添加的模型
在AI对话面板中，点击模型名称，从列表中选择刚添加的GLM模型，即可开始使用

🔧 手动校准说明：如果Trae默认的智谱提供商配置无法连接，可以选择“Generic OpenAI”类型，并手动填入：

Base URL：https://open.bigmodel.cn/api/paas/v4/chat/completions

API Key：智谱API Key

模型ID：根据实际需求填写（如 GLM-4.7）

4.1.3 添加DeepSeek模型

同样在Trae的模型选择面板中，点击「添加模型」
在“提供商”下拉菜单中选择「DeepSeek」。若无则选择「Generic OpenAI」或「自定义」
填写模型信息：
- 模型名称：deepseek-chat（对应V4系列对话模型）或 deepseek-reasoner（推理模型）
- API Key：粘贴DeepSeek API Key
- Base URL（自定义时）：https://api.deepseek.com/v1
保存并切换到该模型即可使用

4.1.4 Trae Agent模式配置

Trae的Agent模式（如“Builder模式”）可自动规划并执行任务，推荐配置高性能模型以获得更好体验：

在「设置」→「Agent」或「Builder」选项卡中，将默认模型切换为 GLM-5.1 或 DeepSeek V4-Pro
确保模型名称和API Key配置正确
首次使用Agent时，Trae可能会要求安装额外的依赖（如MCP协议支持），请根据提示操作

4.1.5 Trae常见问题与排查

问题现象	可能原因	解决方案
模型列表中找不到已添加的模型	1. 保存未成功 2. UI缓存未刷新	重启Trae，或进入「设置」→「模型管理」检查已保存的模型列表
对话返回3003错误	1. 上游API返回429（频率/并发限制）或500（服务器错误） 2. 向不支持图片的模型发送了图片	1. 检查API Key余额和配额 2. 移除图片消息，确保模型支持多模态
响应缓慢或中断	1. 上下文过长导致超时 2. 模型输出长度达到限制	1. 尝试开启“长上下文模式”或清理对话历史 2. 在提示中要求模型分段输出
图片理解无效	模型本身不支持视觉（如GLM-5.1仅文本）	更换为GLM-5V-Turbo或GLM-4.6V系列模型
调用时报“无效模型名称”	模型ID拼写错误或大小写不匹配	检查模型名称与官方文档一致，注意大小写

4.2 接入Claude Code（VS Code扩展）

Claude Code现已提供官方VS Code扩展，可在IDE内部直接通过聊天面板进行交互。由于网络环境的限制，中国大陆用户可能需要配置网络代理才能正常使用。

4.2.1 环境准备与安装

确保VS Code版本≥1.98.0
打开VS Code，按 Ctrl+Shift+X（Windows/Linux）或 Cmd+Shift+X（Mac）打开扩展市场
搜索 “Claude Code”，找到由 Anthropic 发布的官方扩展并安装
安装完成后重启VS Code，工具栏右上角会出现Claude Code图标

4.2.2 配置Claude Code扩展（接入第三方模型）

安装完成后，需要先为扩展配置环境变量，确保网络连通性。以下是两种经过验证的配置方式。

方式一：直接配置DeepSeek端点（适合DeepSeek用户，推荐该方式，其余大模型同理）

DeepSeek开放平台已原生支持 /anthropic 端点（即 https://api.deepseek.com/anthropic），可直接作为Anthropic API的替代品供Claude Code使用。在VS Code的settings.json中进行如下配置：

{
  "editor.fontSize": 16,
  "[csharp]": {
    "editor.defaultFormatter": "ms-dotnettools.csharp"
  },
  "editor.defaultFormatter": "esbenp.prettier-vscode",
  "security.workspace.trust.enabled": false,
  "[c]": {
    "editor.defaultFormatter": "ms-vscode.cpptools"
  },
  "[cpp]": {
    "editor.defaultFormatter": "ms-vscode.cpptools"
  },
  "workbench.colorTheme": "Light Modern",
  "editor.unicodeHighlight.allowedCharacters": {
    " ": true
  },
  "claudeCode.selectedModel": "deepseek-chat",
  "claudeCode.environmentVariables": [
  


    
        {
            "name": "ANTHROPIC_BASE_URL",
            "value": "https://api.deepseek.com/anthropic"
        },
        {
            "name": "ANTHROPIC_AUTH_TOKEN",
            "value": "你自己的API"
        },
        {
            "name": "API_TIMEOUT_MS",
            "value": "600000"
        },
        {
            "name": "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC",
            "value": "1"
        },
        {
            "name": "ANTHROPIC_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_SMALL_FAST_MODEL",
            "value": "deepseek-v4-flash"
        },
        {
            "name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
            "value": "deepseek-v4-pro"
        },
        {
            "name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
            "value": "deepseek-v4-flash"
        }
  ],
  "claudeCode.preferredLocation": "panel",
  "explorer.confirmDelete": false
}

配置项说明：

配置项	说明
`claudeCode.selectedModel`	指定对话模型为 `deepseek-v4-pro`（主模型）
`ANTHROPIC_BASE_URL`	DeepSeek的Anthropic兼容端点
`ANTHROPIC_AUTH_TOKEN`	DeepSeek API Key
`ANTHROPIC_MODEL`	主推理模型，设为 `deepseek-v4-pro`（V4系列旗舰）
`ANTHROPIC_SMALL_FAST_MODEL`	轻量任务模型，设为 `deepseek-v4-flash`（低成本高吞吐）
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Sonnet层级模型映射为 `deepseek-v4-pro`
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Opus层级模型映射为 `deepseek-v4-pro`
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Haiku层级模型映射为 `deepseek-v4-flash`
`API_TIMEOUT_MS`	超时时间设为600秒（10分钟），避免长任务中断
`CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC`	禁用非必要网络流量，减少额外请求

模型分层逻辑：重量级任务（复杂代码生成、深度推理、架构设计）走 deepseek-v4-pro，轻量任务（工具调用、文件读写、快速问答）走 deepseek-v4-flash。两档模型分工明确，既保住能力上限，又控制成本。

方式二：通过OpenRouter代理接入（适合多模型切换用户）

OpenRouter作为模型聚合平台，可将多种模型（包括DeepSeek）统一转换为Anthropic兼容格式。

步骤一：注册OpenRouter账号，访问 https://openrouter.ai/keys 获取API Key。

步骤二：在VS Code的settings.json中配置：

{
  "claudeCode.selectedModel": "deepseek/deepseek-chat",
  "claudeCode.environmentVariables": [
    {
      "name": "ANTHROPIC_BASE_URL",
      "value": "https://openrouter.ai/api/anthropic"
    },
    {
      "name": "ANTHROPIC_AUTH_TOKEN",
      "value": "替换成OpenRouter API Key"
    },
    {
      "name": "ANTHROPIC_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_SMALL_FAST_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_SONNET_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_OPUS_MODEL",
      "value": "deepseek/deepseek-chat"
    },
    {
      "name": "ANTHROPIC_DEFAULT_HAIKU_MODEL",
      "value": "deepseek/deepseek-chat"
    }
  ],
  "claudeCode.preferredLocation": "panel"
}

配置项说明：OpenRouter通过 /api/anthropic 端点提供Anthropic兼容格式，模型名称需使用OpenRouter格式（如 deepseek/deepseek-chat）。除了DeepSeek外，OpenRouter还聚合了多种免费或低成本模型，可实现更灵活的模型路由。

方式对比速查

对比维度	方式一：直接配置	方式二：OpenRouter代理
配置复杂度	⭐ 简单，直接配置DeepSeek端点	⭐⭐ 中等，需额外注册OpenRouter
适用场景	仅使用DeepSeek模型	需要灵活切换多种模型
Base URL	`https://api.deepseek.com/anthropic`	`https://openrouter.ai/api/anthropic`
API Key	DeepSeek API Key	OpenRouter API Key
模型名称格式	`deepseek-v4-pro`	`deepseek/deepseek-chat`

以下是整合后的 4.2.3 Claude Code界面汉化 章节，将您提供的 VS Code 汉化包内容和 Claude Code CLI 中文增强方案合并在一起，适合放在技术文档或部署手册中：

4.2.3 Claude Code界面汉化（推荐中文用户）

Claude Code 原生界面为英文，中文开发者可通过以下两种方式获得更好的中文使用体验，根据使用环境选择对应方案。

方案一：VS Code 扩展汉化包（适用于 VS Code 环境）

在 VS Code 扩展市场搜索 [非官方] Claude Code for VS Code 简体中文汉化包（发布者：zstings），点击安装即可。

汉化包核心功能：

✅ 自动汉化：VS Code 启动时自动应用汉化，无需手动操作
✅ 三阶段汉化：支持前置规则 → 内置规则 → 后置规则，灵活控制翻译顺序
✅ 自定义规则：可通过配置添加自己的翻译规则（如将特定术语翻译为团队习惯用语）
✅ 自动备份：修改前自动创建备份文件，支持一键还原到原版
✅ 更新检测：Claude Code 扩展更新后自动重新应用汉化，无需手动维护

使用命令：
按 Ctrl+Shift+P（Windows/Linux）或 Cmd+Shift+P（macOS）打开命令面板，输入以下命令：

Claude Code 汉化: 应用汉化 — 手动应用汉化
Claude Code 汉化: 还原原版 — 还原到英文原版
Claude Code 汉化: 打开配置 — 打开汉化配置页面

自定义翻译示例：

{
  "claudeCodeZhCn.postTranslationRules": [
    {
      "original": "Ask before edits",
      "chinese": "编辑前询问",
      "regex": false
    },
    {
      "original": "\\bfile\\b",
      "chinese": "文件",
      "regex": true,
      "flags": "gi"
    }
  ]
}

⚠️ 注意事项：本项目为社区开发，与 Anthropic 官方无关。在某些系统上可能需要管理员权限修改扩展文件。如遇到 Claude Code 扩展更新后汉化失效，等待汉化包自动检测更新后重新应用即可。

方案二：CLI 中文增强包（适用于终端/命令行环境）

若您使用 Claude Code CLI 版本（终端环境），可通过 claudezh 包获得全中文交互体验。

安装步骤：

# 1. 全局安装 claudezh
npm install -g claudezh

# 2. 以插件模式安装到 Claude Code 中（推荐）
npx claudezh --install-plugin

使用方法：

安装完成后，正常启动 Claude Code：

claude

在 Claude Code 对话中输入以下命令切换语言：

命令	说明
`/zh`	切换到简体中文模式
`/zht`	切换到繁体中文模式
`/en`	切换回英文模式
`/review-zh`	中文代码审查
`/explain-zh`	中文代码解释
`/test-zh`	中文生成测试
`/fix-zh`	中文修复 Bug

若希望独立启动全中文版 CLI，可直接运行：

claudezh

特点：

✅ 无需修改 VS Code 配置，纯终端使用
✅ 支持 DeepSeek、Kimi 等第三方 API（配合环境变量使用）
✅ 轻量级，无额外依赖

方案对比与建议

使用场景	推荐方案	说明
VS Code 用户	方案一（汉化包）	自动汉化 + 自定义规则，与编辑器深度集成
终端/CLI 用户	方案二（claudezh）	纯命令行环境，支持中文命令和第三方 API
两者混用	同时配置	两种方案互不冲突，可同时安装

💡 提示：无论使用哪种方案，若您已配置 DeepSeek 等第三方 API，请确保环境变量（如 ANTHROPIC_AUTH_TOKEN、ANTHROPIC_BASE_URL）已正确设置，以便 Claude Code 正常工作。

4.2.4 Claude Code纯中文输出配置

如果你不仅希望界面是中文，还希望Claude Code的输出内容全部使用中文（无中英混杂）。
可以通过以下方式实现：同时可以采用前文提到的CLI 中文增强包，下载过，cli以及vscode版本下的claude code都可以使用，然后输入 /zh 即可转化为中文对话。

方法一：对话即时约束（零门槛）：在Claude Code对话中直接输入：

从现在开始，请始终使用简体中文回答我的所有问题。不要使用英文单词，除非是代码语法本身。

Claude Code具有极强的上下文记忆能力，接收到这条“系统级”指令后，在当前会话中会严格遵守中文输出。

方法二：持久化记忆存储（一劳永逸）：输入 Always reply in Chinese.，当系统提示是否保存到记忆时，选择 User memory。这样无论打开哪个项目，都会默认使用中文交流。

方法三：项目级锁定（团队协作推荐）：在项目根目录创建 .claude/CLAUDE.md 文件，Claude Code会自动读取作为项目指令：

# 项目语言规范
请严格遵守以下规则：
1. 所有对话、解释、建议必须使用**简体中文**
2. 代码注释必须使用中文
3. 生成的 Commit Message 必须使用中文
4. 严禁出现大段未翻译的英文技术名词（保留专业术语如 API、SDK 除外）

进阶方案：国产模型“换芯”：如果基础指令不生效，或Claude Code依然在输出报错信息时使用英文，可通过配置环境变量强制干预。找到 ~/.claude/settings.json 文件，添加语言预设：

{
  "custom_instructions": {
    "language": "Always respond in Simplified Chinese. You must not output English explanations or mixed language."
  }
}

💡 最彻底的汉化方案：通过接入DeepSeek、智谱GLM等国产模型，这些模型原生就是中文思维，输出内容完全符合中文习惯，无需额外配置。具体接入方法参见4.2.2节。

4.2.5 配置网络代理（中国大陆用户需知）

由于网络可达性原因，中国大陆用户可能无法直接访问Anthropic服务，需要通过HTTP代理进行连接。请在 shell 配置文件中设置环境变量（以 macOS zsh 为例）：

echo 'export HTTPS_PROXY="http://127.0.0.1:7890"' >> ~/.zshrc
source ~/.zshrc

代理端口 7890 是常见代理客户端的默认HTTP端口，请以你实际使用的工具设置为准。

⚠️ 关键提醒：必须从终端启动 VS Code（使用 code . 命令），才能使 VS Code 及其扩展进程继承 shell 中的 HTTPS_PROXY 环境变量。从 Dock 或 Finder 直接启动 VS Code，Claude Code 扩展将无法读取代理设置。

4.2.6 不同提供商的Base URL速查

提供商	Base URL	备注
DeepSeek（原生）	`https://api.deepseek.com/anthropic`	直接支持Anthropic兼容端点
智谱GLM（Z.AI）	`https://open.bigmodel.cn/api/anthropic`	直接支持Anthropic兼容端点
小米MIMO	https://token-plan-cn.xiaomimimo.com/anthropic	兼容
OpenRouter	`https://openrouter.ai/api/anthropic`	需在OpenRouter后台选定模型
自定义中转API	询问服务商是否提供 `/v1/messages` 端点	需确认兼容性

4.2.7 验证连接

完成上述配置后，点击 VS Code 右上角的 Claude Code 图标打开聊天面板，发送简单提示（如“hello”或“你当前使用的是什么模型？”），若能正常回复且返回的模型名称正确，则配置成功。

4.2.8 模型使用限制说明

模型	接入方式	兼容性说明
DeepSeek V4-Pro / Flash	原生Anthropic端点 / OpenRouter	工具调用、Agent能力完整支持
GLM-4.7 / GLM-5.1	Z.AI原生Anthropic端点	工具调用、Agent能力完整支持，编码表现优秀
Claude官方模型	原生Anthropic API	无需额外配置，工具链优化最佳

⚠️ Claude Code是为Claude原生模型深度优化的工具，第三方模型在复杂的多步骤工具调用、结构化diff生成等场景中，表现可能不如原版Claude。推荐策略：使用GLM-5.1或GPT-5.4进行高层架构讨论与规划，使用Claude Code执行具体代码实现。

4.2.9 故障排除速查表

错误信息	常见原因	解决方法
`401 Unauthorized`	API Key无效或格式错误	重新生成API Key，确认粘贴完整且无多余字符
`404 Not Found`	Base URL路径错误	检查URL是否包含完整路径（如 `/anthropic`）
`Connection refused`	网络不通或代理未配置	检查网络连接，必要时设置 `HTTPS_PROXY`
`Model not found`	模型名称错误	检查模型名称（如 `deepseek-v4-pro` vs `deepseek/deepseek-chat`）
`429 Too Many Requests`	调用频率或额度超限	在平台控制台检查配额，或等待后重试

4.3 VS Code无法登录Claude的解决方案

如果你在VS Code中使用Claude Code扩展时遇到 403、OAuth error、Failed to connect 等错误，根本原因是网络限制导致无法直接访问Anthropic服务，而 VS Code 扩展可能无法正确使用代理。

4.3.1 问题确认

常见报错信息：

OAuth error: Failed to fetch user roles: Request failed with status code 403
Unable to connect to Anthropic services
Failed to connect to api.anthropic.com: ERR_BAD_REQUEST
Note: Claude Code might not be available in your country.

快速测试：在终端中运行 curl -I https://api.anthropic.com，如果返回 HTTP/2 403 说明无法直接访问，若超时则可能是 DNS 或防火墙问题。

4.3.2 常见误区（这些方法无效）

❌ 无效操作	原因
反复重新登录	访问限制是基于网络环境的，与账号无关
仅设置 VS Code 的 `http.proxy`	Claude Code 扩展不读取 VS Code 的代理设置
从 Dock/Finder 启动 VS Code	macOS GUI 应用不会继承 shell 环境变量，即使 `~/.zshrc` 中已设置 `HTTPS_PROXY` 也无效

4.3.3 正确解决方案

第一步：配置代理

确保本地代理工具已正常运行，并确认 HTTP 代理端口，不同的代理软件端口不同，下图是我使用的工具端口，其他的工具端口查看可以进行Baidu。验证代理可用性：
在这里插入图片描述

curl -I --proxy http://127.0.0.1:7897 https://api.anthropic.com

看到 HTTP/1.1 200 Connection established 后跟非 403 的响应（404 也算正常，说明请求到达了 Anthropic 的服务器）即为成功。

第二步：设置 HTTPS_PROXY 环境变量

macOS (zsh)：

echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.zshrc
source ~/.zshrc

Linux (bash)：

echo 'export HTTPS_PROXY="http://127.0.0.1:7897"' >> ~/.bashrc
source ~/.bashrc

Windows：

控制面板 → 系统 → 高级系统设置 → 环境变量
在用户变量中新建 HTTPS_PROXY，值为 http://127.0.0.1:7897（替换为你的代理端口）
确定保存后，必须通过 code . 命令从终端启动 VS Code

第三步：从终端启动 VS Code

这是最关键的一步——必须从终端启动 VS Code，扩展进程才能继承代理环境变量：

macOS：

# 如果 code 命令被映射到其他编辑器，使用：
open -a "Visual Studio Code" .

# 可设别名方便使用：
echo 'alias vscode="open -a \"Visual Studio Code\""' >> ~/.zshrc
source ~/.zshrc
# 之后直接：
vscode .

Windows：

code .

第四步：如果之前登录失败过，先清除登录状态

macOS/Linux：

claude /logout
claude /login

OAuth 流程正常完成后，roles 接口不再 403，因为流量已走代理。

补充说明：对于 Windows 用户，除了通过控制面板设置系统环境变量，也可以在 PowerShell 中临时设置：
$env:HTTPS_PROXY="http://127.0.0.1:7890"
但务必通过 code . 命令从该终端窗口启动 VS Code，否则环境变量不会被扩展进程继承。

4.3.4 Remote SSH场景

如果你通过 VS Code SSH 连接到远程机器，Claude Code 扩展运行在远程端，因此远程机器也需要设置 HTTPS_PROXY。

例如，Mac 的桥接网卡 IP 为 192.168.2.1，在远程虚拟机中执行：

echo 'export HTTPS_PROXY="http://192.168.2.1:7897"' >> ~/.bashrc
source ~/.bashrc

同时确保代理工具开启了“允许局域网连接”选项。

4.3.5 故障排除速查表

错误信息	常见原因	解决方法
`401 Unauthorized`	API Key 无效或格式错误	重新生成 API Key，确认粘贴完整且无多余字符
`404 Not Found`	Base URL 路径错误	检查 URL 是否包含完整路径（如 `/api/anthropic`）
`Connection refused`	网络不通或代理未配置	检查网络连接，必要时设置 `HTTPS_PROXY`
`Model not found`	模型名称错误或未在代理配置中选择	对于 OpenRouter 检查模型映射；对于智谱确认模型已启用
`429 Too Many Requests`	调用频率或额度超限	在平台控制台检查配额，或等待后重试
Claude Code 面板连接正常，但部分功能仍报 403	某些功能使用了不同的网络协议栈，标准HTTP代理未生效	可尝试在代理工具中开启透明代理模式，创建虚拟网络接口以捕获所有流量

📌 总结：问题的本质是网络可达性限制，而 macOS GUI 应用不继承 shell 环境变量。配置好代理并从终端启动 VS Code，即可解决绝大多数连接问题。

五、成本优化建议

5.1 最大化缓存命中率

保持System Prompt不变：在编程工具中，尽量使用固定的系统提示词，避免频繁修改
复用对话历史：在同一会话中连续对话，历史上下文会被缓存复用
合理设计请求顺序：让每次API调用的消息数组公共前缀部分保持一致

5.2 选择合适的模型

使用场景	推荐模型	理由
日常轻量编程	DeepSeek V4-Flash / GLM-4.7-Flash	免费或极低成本
高性能编程	GLM-5.1 / DeepSeek V4-Pro	旗舰模型，编程能力强
长程复杂任务	GLM-5.1	支持8小时持续工作
多模态编程	GLM-5V-Turbo	支持图片、视频输入
极低成本测试	DeepSeek V4-Flash + 缓存命中	缓存命中仅0.02元/百万tokens

5.3 其他省钱技巧

关注限时优惠：DeepSeek Pro模型当前有2.5折优惠（至2026年5月31日）
利用免费模型：GLM-4.7-Flash和GLM-4.6V-Flash完全免费，适合学习和原型开发
拼团订阅Coding Plan：智谱Coding Plan按季或按年订阅更优惠，同时保留存量用户原有价格
选择计费区间：编程工具调用通常属于短上下文场景（低于32K tokens），处于低单价区间；对于需要处理长上下文的场景，务必注意长度增长可能带来的阶梯定价影响
设置用量告警：在DeepSeek和智谱控制台设置每日/每月调用量上限和余额告警，防止意外超额消费

六、后续扩展计划

📌 本文档将根据平台更新持续维护，后续计划扩展以下内容：

GPT系列模型（OpenAI）的API购买与接入Trae/Claude Code配置

更多第三方中转API服务商的接入方案

多模型负载均衡与自动切换策略

企业级团队管理与配额分配方案

成本监控仪表板搭建指南

最后更新时间：2026年5月
免责声明：本文档中的定价信息可能随时间变化，请以各平台官方页面为准。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

从0到1：企业级AI项目迭代日记 Vol.34｜知识图谱接进来、异步嵌套修掉、依赖往回收——藏在修复里的三层架构演进

AtomGit开源社区

llama.cpp 模型使用指南-本地大语言模型部署实践与长上下文内存估算参考手册

硬件平台NVIDIA RTX 3080 Ti 12GB涵盖模型Qwen3 系列 / Gemma 4 系列。

AtomGit开源社区

在K8s上跑AI Agent？Kubernetes社区搞了个Agent Sandbox，这事终于有正经解法了

Kubernetes社区推出Agent Sandbox项目，专门解决AI Agent在集群中的运行问题。该项目提供声明式API管理隔离的、有状态的单实例工作负载，通过Sandbox CRD实现稳定hostname、持久存储和生命周期管理。核心创新包括模板复用(SandboxTemplate)、资源解耦(SandboxClaim)和预热池(SandboxWarmPool)，显著降低冷启动延迟。安全隔

AtomGit开源社区

所有评论(0)

查看更多评论

无宜

@qq_56908984

已为社区贡献23条内容

各类AI模型API购买与编程工具接入配置指南

无宜

各类AI模型API购买与编程工具接入配置指南

一、核心概念速览

1.1 Token（词元）

1.2 上下文（Context）

1.3 缓存命中（Cache Hit）

1.4 缓存存储（Cache Storage）

二、平台注册与API Key获取

2.1 DeepSeek API

2.1.1 注册账号

2.1.2 获取API Key

2.1.3 充值计费

2.2 智谱AI（GLM）API

2.2.1 注册账号

2.2.2 获取API Key

2.2.3 订阅GLM Coding Plan

2.3 企业级认证（可选，推荐企业用户）

2.4 环境变量配置最佳实践（可选）

三、模型定价概览

3.1 DeepSeek API 定价

3.1.1 DeepSeek V4系列定价（截至2026年4月）

3.2 智谱AI（GLM）定价

3.2.1 旗舰模型

3.2.2 多模态模型

3.3 缓存命中对成本的实操影响

四、接入编程工具详细配置

4.1 接入Trae（AI原生IDE）

4.1.1 准备工作

4.1.2 添加智谱GLM模型

4.1.3 添加DeepSeek模型

4.1.4 Trae Agent模式配置

4.1.5 Trae常见问题与排查

4.2 接入Claude Code（VS Code扩展）

4.2.1 环境准备与安装

4.2.2 配置Claude Code扩展（接入第三方模型）

方式一：直接配置DeepSeek端点（适合DeepSeek用户，推荐该方式，其余大模型同理）

方式二：通过OpenRouter代理接入（适合多模型切换用户）

方式对比速查

4.2.3 Claude Code界面汉化（推荐中文用户）

方案一：VS Code 扩展汉化包（适用于 VS Code 环境）

方案二：CLI 中文增强包（适用于终端/命令行环境）

方案对比与建议

4.2.4 Claude Code纯中文输出配置

4.2.5 配置网络代理（中国大陆用户需知）

4.2.6 不同提供商的Base URL速查

4.2.7 验证连接

4.2.8 模型使用限制说明

4.2.9 故障排除速查表

4.3 VS Code无法登录Claude的解决方案

4.3.1 问题确认

4.3.2 常见误区（这些方法无效）

4.3.3 正确解决方案

4.3.4 Remote SSH场景

4.3.5 故障排除速查表

五、成本优化建议

5.1 最大化缓存命中率

5.2 选择合适的模型

5.3 其他省钱技巧

六、后续扩展计划

所有评论(0)

温馨提示：您尚未绑定手机号

无宜