总结先行

  • 如果后期想用收费模型,首推硅基流动,活动多模型全。
  • 如果想用国外模型,网络不是问题,推荐OpenRouter。
  • 如果想完全白嫖,使用频率不是很高,并且能忍受有时候会请求超限,推荐七牛云(qwen3.5-35b-a3b)、longcat(美团)。
  • 如果对自建知识库有兴趣,推荐模力方舟的向量和排序模型(需要先充10块钱)

pinchbench排行榜

https://pinchbench.com/

硅基流动

https://cloud.siliconflow.cn/i/lduUVPFV

  • 特点:活动多模型全,速率限制清晰。
  • 优势:范围广,免费模型多,模型上新速度快。
  • 速率限制:每个模型不同,模型广场可查看,顶级模型基本在500/2000000(RPM/TPM)
  • 免费模型:上新nex-agi/Nex-N2-Pro
  • 便宜推荐模型:deepseek-ai/DeepSeek-V4-Pro,deepseek-ai/DeepSeek-V4-Flash,Qwen/Qwen3.6-27B(最便宜),stepfun-ai/Step-3.5-Flash
  • 备注:tencent/Hunyuan-MT-7B用来翻译不错,Kwai-Kolors/Kolors免费生图模型
  • API端点:https://api.siliconflow.cn/v1

七牛云

https://www.qiniu.com/ai/promotion/invited?cps_key=1hbic8ii6uqtu

  • 特点:注册即送token,token是按倍率计算
  • 优势:推广链接注册,可送1300W token,可惜原来免费的step-3.5-flash没了,新免费的qwen3.5-35b-a3b也还行,日志查看不错
  • 推荐免费模型:qwen/qwen3.5-35b-a3b
  • 速率限制:未知,实测agent任务会触发429,有时候会502
  • 备注:平台模型和官方可能会有区别,有些原生支持工具、思考等这里可能不支持,模型广场卡片可以看到每个模型详情
  • API端点:https://api.qnaigc.com/v1
  • API端点(海外):https://openai.sufy.com/v1

OpenRouter

https://openrouter.ai

  • 特点:模型最全,国内外定级模型都有
  • 优点:免费模型多,openrouter/free有自动路由免费模型功能
  • 速率限制:未充值账户20 RPM,10美元以下50 RPM,10美元以上1000 RPM,会有8%手续费,支持微信支付
  • 推荐免费模型:nvidia/nemotron-3-super-120b-a12b:free、poolside/laguna-m.1:free、nousresearch/hermes-3-llama-3.1-405b:free、openrouter/free(自动路由)
  • 备注:有些地区可能网络访问有问题
  • API端点:https://openrouter.ai/api/v1

模力方舟

https://ai.gitee.com/serverless-api

  • 特点:国产算力部署
  • 优势:免费模型范围广,向量模型,排序模型,ASR,TTS模型均有免费可选
  • 请求速率限制:未知
  • 推荐免费模型:GLM-4.7-Flash
  • 备注:需要充10块钱才能使用
  • API端点:https://ai.gitee.com/v1

Longcat(美团)

https://longcat.chat/platform

  • 特点:完全免费(需要卡点申请开通)
  • 优点:多模态模型,量大管饱,每天500万 token(需要发下申请,默认是50万)
  • 速率限制:未知
  • 推荐模型:LongCat-2.0-Preview
  • 备注:用来做翻译效果不错。
  • API端点:https://api.longcat.chat/openai/v1

商汤日日新

https://www.sensenova.cn/token-plan

  • 特点:目前公测期间完全免费
  • 优点:能用多模态模型、生图模型和deepseek,商汤也是做视觉老牌的企业了
  • 速率限制:每模型 1,500 次调用 / 5 小时还是很有诚意的吧
  • 可用模型:sensenova-6.7-flash-lite、sensenova-u1-fast、deepseek-v4-flash
  • API端点:https://token.sensenova.cn/v1

Agnes AI

https://platform.agnes-ai.com

  • 特点:最近比较火,目前完全免费
  • 优点:文本模型、生图模型、视频模型一应俱全,视频模型免费的确实极少吧
  • 速率限制:未知
  • 可用模型:agnes-2.0-flash、agnes-image-2.1-flash、agnes-video-v2.0
  • API端点:https://apihub.agnes-ai.com/v1

Modelscope

https://www.modelscope.cn

  • 可以调用Qwen,kimi,minimax,但是大型模型调用次数一天可能就100次,共计2000次一天。
  • API端点:https://api-inference.modelscope.cn/v1

ModelScope 模型限额测试报告

序号 模型 状态 用户总限额 模型限额
1 stepfun-ai/Step-3.5-Flash ✅ 成功 2000 500
2 Qwen/Qwen3.5-27B ✅ 成功 2000 200
3 Qwen/Qwen3-32B ✅ 成功 2000 200
4 Qwen/Qwen3-30B-A3B ✅ 成功 2000 200
5 Qwen/Qwen3-14B ✅ 成功 2000 200
6 Qwen/Qwen3-8B ✅ 成功 2000 200
7 Qwen/Qwen3-4B ✅ 成功 2000 200
8 Qwen/Qwen3-1.7B ✅ 成功 2000 200
9 Qwen/Qwen3-0.6B ✅ 成功 2000 200
10 inclusionAI/Ling-2.6-1T ✅ 成功 2000 200
11 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B ✅ 成功 2000 200
12 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B ✅ 成功 2000 200
13 Qwen/Qwen3.5-397B-A17B ✅ 成功 2000 100
14 inclusionAI/Ring-2.6-1T ✅ 成功 2000 100
15 Qwen/Qwen3.5-35B-A3B ✅ 成功 2000 100
16 Qwen/Qwen3.5-122B-A10B ✅ 成功 2000 100
17 ZhipuAI/GLM-4.7-Flash ✅ 成功 2000 100
18 stepfun-ai/Step-3.7-Flash ✅ 成功 2000 50
19 Qwen/Qwen3-235B-A22B ✅ 成功 2000 50
20 moonshotai/Kimi-K2.5 ✅ 成功 2000 50
21 deepseek-ai/DeepSeek-V4-Pro ✅ 成功 2000 50
22 deepseek-ai/DeepSeek-V4-Flash ✅ 成功 2000 50
23 ZhipuAI/GLM-5 ✅ 成功 2000 50
24 ZhipuAI/GLM-5.1 ✅ 成功 2000 50
25 MiniMax/MiniMax-M2.5 ✅ 成功 2000 50
26 deepseek-ai/DeepSeek-V3.2 ✅ 成功 2000 20
27 deepseek-ai/DeepSeek-R1-0528 ✅ 成功 2000 20
28 nex-agi/Nex-N2-Pro ✅ 成功 2000 100
29 PaddlePaddle/ERNIE-4.5-VL-28B-A3B-PT ✅ 成功 2000 200
30 Shanghai_AI_Laboratory/Intern-S2-Preview ✅ 成功 2000 200
31 Shanghai_AI_Laboratory/Intern-S1 ✅ 成功 2000 200
32 Shanghai_AI_Laboratory/Intern-S1-mini ✅ 成功 2000 200
33 Shanghai_AI_Laboratory/Intern-S1-Pro ✅ 成功 2000 200

阿里百炼

https://bailian.console.aliyun.com

  • 注册有免费额度,每个模型基本上是100万,但是容易超出了被反薅。
  • API端点:https://dashscope.aliyuncs.com/compatible-mode/v1

高级技巧

通过部署LiteLLM或者Bifrost或者Higress实现模型智能路由,整合资源,实现根据报错、token超限等条件自动切换。有兴趣后面可以写写。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐