重生之我用Modal白嫖了GLM-5.1模型
文章目录
还在为每月Token费而烦恼?有没有免费、好用,哪怕响应速度相对可接受的模型可以白嫖呢?博主今天就给大家安利一波福利。
1. 为什么Modal真香
- 不限 Token 总量,只限 QPS(单账号 3-5 QPS)—— 一个人挂一整天够用
- OpenAI 协议兼容 —— 绝大多数 AI 编码工具和
Harness能直接接,当然也支持中间需要一个协议转换网关,如转成Anthropic - 零信用卡零额度 —— 注册完直接拿
Key,免费,免费,免费
缺点:确实有一丢丢慢,但是相对能接受吧,这个最终看个人选择,以下是博主测试的响应时间;

2. Modal能不能信任
2.1 什么是Modal
官方定义: Modal is an AI infrastructure platform that lets you:
- Run low latency inference with sub-second cold starts, using open weights or custom models
- Scale out batch jobs to run massively in parallel
- Train or fine-tune open weights or custom models on the latest GPUs
- Spin up thousands of isolated and secure Sandboxes to execute AI generated code
- Launch GPU-backed Notebooks in seconds and collaborate with your colleagues in real-time
You get full serverless execution and pricing because we host everything and charge per second of usage.
Notably, there’s zero configuration in Modal - everything, including container environments and GPU specification, is code. Take a breath of fresh air and feel how good it tastes with no YAML in it.
翻译翻译就是:Modal 是一种推理延迟低,支持大规模并行,支持在对顶级的GPU上训练或微调开源模型,支持数千个沙箱隔离执行AI生成的代码和指令,支持云端GPU Notebook协助同事们实时协助的 Serverless(无服务器)AI 基础设施平台。
最特别的是,Modal 实现了“零配置”——包括容器环境和 GPU 规格在内的一切皆Python代码。深吸一口新鲜空气吧,感受一下没有 YAML 的世界是多么甜美。
但是该平台毕竟是云平台,自己隐私性质很高的内容和数据,还是要保护好的,不要轻易给到大模型和Harness,不要无脑使用哟。
2.2 为什么Modal要部署GLM-5.1
Update 2026-04-07: Today, Z.ai released GLM-5.1, once again setting the state-of-the-art for open weights intelligence. Our free endpoint has been upgraded to serve this new version.
Today Z.ai released GLM-5, a frontier open weights foundation language model designed for long-horizon agents and systems engineering.
The Modal Research team partnered with Z.ai ahead of public launch so we could test drive the model on our infrastructure. It’s delightful, smart, and fast. Internally, we’ve added it to our favorite AI frontends: the Vercel AI SDK, Claude Code, OpenCode, and OpenClaw.
翻译翻译:Modal想宣传自己的产品,顺便做点好事,于是给你部署一个可以免费试用的GLM-5.1,帮助你养虾,玩CC(Claude Code)等。
3. 一分钟——有手就行的拿走你的专属key
-
打开 https://modal.com,可以选择
GitHub / Google等账号注册; -
左侧点 Create token,起个名字,Key 只弹一次,立刻存好;同时记下
Example usage里的baseUrl和模型 ID; -
- 端点:
https://api.us-west-2.modal.direct/v1/chat/completions - 模型名称 :
openai:zai-org/GLM-5.1-FP8 - 模型ID:
glm-5-endpoint
- 端点:
4. 应用
参考文档:https://modal.com/blog/try-glm-5
4.1 配置到.env文件给到LangChain等开发框架试用
MODAL_MODEL="openai:zai-org/GLM-5.1-FP8"
OPENAI_API_KEY="modalresearch_XXX"
OPENAI_BASE_URL="https://api.us-west-2.modal.direct/v1"
效果如下:

4.2 OpenClaw / OpenCode
这两兄弟本身就走 OpenAI协议,直接配置文件就行:
opencode
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"modal": {
"npm": "@ai-sdk/openai-compatible",
"name": "Modal",
"options": {
"baseURL": "https://api.us-west-2.modal.direct/v1",
"apiKey": "{env:LLM_BACKEND_API_KEY}" # or copy-paste directly
},
"models": {
"zai-org/GLM-5-FP8": {
"name": "GLM-5"
}
}
}
},
"model": "modal/zai-org/GLM-5-FP8"
}
openclaw
{
"models": {
"mode": "merge",
"providers": {
"modal": {
"baseUrl": "https://api.us-west-2.modal.direct/v1",
"apiKey": "${LLM_BACKEND_API_KEY}",
"api": "openai-completions",
"models": [
{
"id": "zai-org/GLM-5-FP8",
"name": "GLM-5",
"reasoning": true,
"input": [
"text"
],
"cost": {
"input": 0,
"output": 0,
"cacheRead": 0,
"cacheWrite": 0
},
"contextWindow": 192000,
"maxTokens": 8192
}
]
}
}
}
}
4.3 如何将Modal的openai协议转成Anthropic
Modal的openai:zai-org/GLM-5.1-FP8默认是OpenAI协议,如果你想试用Claude Code 而且一定要走 Anthropic 协议(Claude Code 本身支持OpenAI协议),中间需要一个协议转换网关。Modal 官方已经写好了:modal-jazz。
git clone https://github.com/modal-projects/modal-jazz.git
cd modal-jazz/frontends/claude
pip install -r requirements.txt
export MODAL_API_KEY="你的 key"
python app.py # 监听 127.0.0.1:8000
然后给 Claude Code 配环境变量:
export ANTHROPIC_BASE_URL="http://127.0.0.1:8000"
export ANTHROPIC_AUTH_TOKEN="任意字符串"
export ANTHROPIC_MODEL="glm-5-endpoint"
重启终端跑一次 claude,Modal 控制台能看到请求就是通了。
以上就是如何用Modal白嫖了GLM-5.1的教程,除了慢一点,其他的都是挺好的,最好的就是他免费呀,你说是不是?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)