Hermes 免费大模型调用推荐-6月更新
·
总结先行
- 如果后期想用收费模型,首推硅基流动,活动多模型全。
- 如果想用国外模型,网络不是问题,推荐OpenRouter。
- 如果想完全白嫖,使用频率不是很高,并且能忍受有时候会请求超限,推荐七牛云(qwen3.5-35b-a3b)、longcat(美团)。
- 如果对自建知识库有兴趣,推荐模力方舟的向量和排序模型(需要先充10块钱)
pinchbench排行榜
https://pinchbench.com/
硅基流动
https://cloud.siliconflow.cn/i/lduUVPFV
- 特点:活动多模型全,速率限制清晰。
- 优势:范围广,免费模型多,模型上新速度快。
- 速率限制:每个模型不同,模型广场可查看,顶级模型基本在500/2000000(RPM/TPM)
- 免费模型:上新nex-agi/Nex-N2-Pro
- 便宜推荐模型:deepseek-ai/DeepSeek-V4-Pro,deepseek-ai/DeepSeek-V4-Flash,Qwen/Qwen3.6-27B(最便宜),stepfun-ai/Step-3.5-Flash
- 备注:tencent/Hunyuan-MT-7B用来翻译不错,Kwai-Kolors/Kolors免费生图模型
- API端点:
https://api.siliconflow.cn/v1
七牛云
https://www.qiniu.com/ai/promotion/invited?cps_key=1hbic8ii6uqtu
- 特点:注册即送token,token是按倍率计算
- 优势:推广链接注册,可送1300W token,可惜原来免费的step-3.5-flash没了,新免费的qwen3.5-35b-a3b也还行,日志查看不错
- 推荐免费模型:qwen/qwen3.5-35b-a3b
- 速率限制:未知,实测agent任务会触发429,有时候会502
- 备注:平台模型和官方可能会有区别,有些原生支持工具、思考等这里可能不支持,模型广场卡片可以看到每个模型详情
- API端点:
https://api.qnaigc.com/v1 - API端点(海外):
https://openai.sufy.com/v1
OpenRouter
https://openrouter.ai
- 特点:模型最全,国内外定级模型都有
- 优点:免费模型多,openrouter/free有自动路由免费模型功能
- 速率限制:未充值账户20 RPM,10美元以下50 RPM,10美元以上1000 RPM,会有8%手续费,支持微信支付
- 推荐免费模型:nvidia/nemotron-3-super-120b-a12b:free、poolside/laguna-m.1:free、nousresearch/hermes-3-llama-3.1-405b:free、openrouter/free(自动路由)
- 备注:有些地区可能网络访问有问题
- API端点:
https://openrouter.ai/api/v1
模力方舟
https://ai.gitee.com/serverless-api
- 特点:国产算力部署
- 优势:免费模型范围广,向量模型,排序模型,ASR,TTS模型均有免费可选
- 请求速率限制:未知
- 推荐免费模型:GLM-4.7-Flash
- 备注:需要充10块钱才能使用
- API端点:
https://ai.gitee.com/v1
Longcat(美团)
https://longcat.chat/platform
- 特点:完全免费(需要卡点申请开通)
- 优点:多模态模型,量大管饱,每天500万 token(需要发下申请,默认是50万)
- 速率限制:未知
- 推荐模型:LongCat-2.0-Preview
- 备注:用来做翻译效果不错。
- API端点:
https://api.longcat.chat/openai/v1
商汤日日新
https://www.sensenova.cn/token-plan
- 特点:目前公测期间完全免费
- 优点:能用多模态模型、生图模型和deepseek,商汤也是做视觉老牌的企业了
- 速率限制:每模型 1,500 次调用 / 5 小时还是很有诚意的吧
- 可用模型:sensenova-6.7-flash-lite、sensenova-u1-fast、deepseek-v4-flash
- API端点:
https://token.sensenova.cn/v1
Agnes AI
https://platform.agnes-ai.com
- 特点:最近比较火,目前完全免费
- 优点:文本模型、生图模型、视频模型一应俱全,视频模型免费的确实极少吧
- 速率限制:未知
- 可用模型:agnes-2.0-flash、agnes-image-2.1-flash、agnes-video-v2.0
- API端点:
https://apihub.agnes-ai.com/v1
Modelscope
https://www.modelscope.cn
- 可以调用Qwen,kimi,minimax,但是大型模型调用次数一天可能就100次,共计2000次一天。
- API端点:
https://api-inference.modelscope.cn/v1
ModelScope 模型限额测试报告
| 序号 | 模型 | 状态 | 用户总限额 | 模型限额 |
|---|---|---|---|---|
| 1 | stepfun-ai/Step-3.5-Flash | ✅ 成功 | 2000 | 500 |
| 2 | Qwen/Qwen3.5-27B | ✅ 成功 | 2000 | 200 |
| 3 | Qwen/Qwen3-32B | ✅ 成功 | 2000 | 200 |
| 4 | Qwen/Qwen3-30B-A3B | ✅ 成功 | 2000 | 200 |
| 5 | Qwen/Qwen3-14B | ✅ 成功 | 2000 | 200 |
| 6 | Qwen/Qwen3-8B | ✅ 成功 | 2000 | 200 |
| 7 | Qwen/Qwen3-4B | ✅ 成功 | 2000 | 200 |
| 8 | Qwen/Qwen3-1.7B | ✅ 成功 | 2000 | 200 |
| 9 | Qwen/Qwen3-0.6B | ✅ 成功 | 2000 | 200 |
| 10 | inclusionAI/Ling-2.6-1T | ✅ 成功 | 2000 | 200 |
| 11 | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B | ✅ 成功 | 2000 | 200 |
| 12 | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | ✅ 成功 | 2000 | 200 |
| 13 | Qwen/Qwen3.5-397B-A17B | ✅ 成功 | 2000 | 100 |
| 14 | inclusionAI/Ring-2.6-1T | ✅ 成功 | 2000 | 100 |
| 15 | Qwen/Qwen3.5-35B-A3B | ✅ 成功 | 2000 | 100 |
| 16 | Qwen/Qwen3.5-122B-A10B | ✅ 成功 | 2000 | 100 |
| 17 | ZhipuAI/GLM-4.7-Flash | ✅ 成功 | 2000 | 100 |
| 18 | stepfun-ai/Step-3.7-Flash | ✅ 成功 | 2000 | 50 |
| 19 | Qwen/Qwen3-235B-A22B | ✅ 成功 | 2000 | 50 |
| 20 | moonshotai/Kimi-K2.5 | ✅ 成功 | 2000 | 50 |
| 21 | deepseek-ai/DeepSeek-V4-Pro | ✅ 成功 | 2000 | 50 |
| 22 | deepseek-ai/DeepSeek-V4-Flash | ✅ 成功 | 2000 | 50 |
| 23 | ZhipuAI/GLM-5 | ✅ 成功 | 2000 | 50 |
| 24 | ZhipuAI/GLM-5.1 | ✅ 成功 | 2000 | 50 |
| 25 | MiniMax/MiniMax-M2.5 | ✅ 成功 | 2000 | 50 |
| 26 | deepseek-ai/DeepSeek-V3.2 | ✅ 成功 | 2000 | 20 |
| 27 | deepseek-ai/DeepSeek-R1-0528 | ✅ 成功 | 2000 | 20 |
| 28 | nex-agi/Nex-N2-Pro | ✅ 成功 | 2000 | 100 |
| 29 | PaddlePaddle/ERNIE-4.5-VL-28B-A3B-PT | ✅ 成功 | 2000 | 200 |
| 30 | Shanghai_AI_Laboratory/Intern-S2-Preview | ✅ 成功 | 2000 | 200 |
| 31 | Shanghai_AI_Laboratory/Intern-S1 | ✅ 成功 | 2000 | 200 |
| 32 | Shanghai_AI_Laboratory/Intern-S1-mini | ✅ 成功 | 2000 | 200 |
| 33 | Shanghai_AI_Laboratory/Intern-S1-Pro | ✅ 成功 | 2000 | 200 |
阿里百炼
https://bailian.console.aliyun.com
- 注册有免费额度,每个模型基本上是100万,但是容易超出了被反薅。
- API端点:
https://dashscope.aliyuncs.com/compatible-mode/v1
高级技巧
通过部署LiteLLM或者Bifrost或者Higress实现模型智能路由,整合资源,实现根据报错、token超限等条件自动切换。有兴趣后面可以写写。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)