OpenClaw实操指南31|不会设计也能出图:3步搭建你的AI视觉技能包
装完 OpenClaw 之后,很多人第一个卡点不是写作,而是配图。
写完一篇公众号文章,封面图要去找素材,信息卡片要手动排版,小红书配图要反复调整——这些事情加起来,往往比写正文还费时间。
这篇讲的就是怎么用 OpenClaw 把视觉生产这条线打通。不需要你会 PS,不需要懂设计,核心是把“需求拆解 → 提示词 → 版式复用”这三件事固化成可重复执行的流程。

核心概要
视觉生产卡顿的根本原因不是“不会设计”,而是每次都从零开始。
解决思路是:
-
把常用场景的视觉规格固化(尺寸、风格、色调)
-
用 AI 生图技能批量出草图
-
用配色和排版技能做统一化
-
沉淀成可复用的 Prompt 模板库
这套流程跑通之后,出一张封面图从“30分钟找素材+调整”变成“5分钟出3版选一张”。
分步操作
Step 1:安装视觉技能
OpenClaw 本身不带生图能力,但可以通过安装“技能”来获得。就像给手机装 App 一样,在 OpenClaw 对话框里直接告诉它就行。
1. 确认 OpenClaw 已运行
确保你已经启动了 OpenClaw(桌面端或命令行界面都可以)。
2. 安装核心视觉技能
直接在 OpenClaw 的输入框中发送下面这句话:
帮我安装 image-gen 技能
OpenClaw 会自动调用 npx clawhub@latest install image-gen 完成安装。你会看到类似这样的输出:
✔ Installing skill: image-gen
✔ Skill installed successfully
同样的方式,继续安装配色和排版辅助技能:
帮我安装 color-palette 技能
帮我安装 layout-assistant 技能
3. (可选)安装封面图专项技能
如果你需要生成小红书风格封面或带文字排版的图片,可以额外安装:
帮我安装 nano-banana-pro 技能
nano-banana-pro 需要 Gemini API Key,获取地址:https://aistudio.google.com/apikey
安装成功后,在 OpenClaw 的~/.openclaw/openclaw.json中填入你的GEMINI_API_KEY即可。
4. 验证安装是否成功
在对话框中输入以下指令测试生图能力:
生成一张测试图片,内容:一只可爱的橘猫坐在办公桌前
如果能正常返回图片,说明技能安装成功。如果提示找不到相关指令,可以尝试重启 OpenClaw 再试。
Step 2:配置生图模型
OpenClaw 安装的 image-gen 技能需要对接一个真实的生图模型。这里以豆包 Seedream 4.5为例——这是字节跳动旗下火山引擎发布的图像创作模型,支持 4K 多模态生图、多图融合创作、参考图生图等能力,新用户通常有免费试用额度。
第1步:登录火山引擎
打开 https://console.volcengine.com/auth/login ,用手机号或邮箱注册/登录。
第2步:开通 Seedream 模型
访问 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement
找到 Doubao-Seedream-4.5,点击“开通”。
新用户通常有免费额度,足够你测试几十张图。
第3步:创建 API Key(⚠️ 注意这里容易出错)
访问 https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
点击“创建 API Key”,起一个名字(比如 openclaw-image),然后完整复制生成的 Key(格式像这样:c6d4e8f0-xxxx-xxxx-xxxx-xxxxxxxxxxxx)。
⚠️ 关键坑:不要使用火山引擎的 IAM Access Key / Secret Key(AK/SK),那种格式不支持 OpenAI 兼容接口的 Bearer 认证,会直接报 401。必须创建“方舟专属 API Key”,它是一串 UUID 格式。
第4步:获取接入点 ID(模型 ID)
在火山方舟的“模型广场”找到 Doubao-Seedream-4.5,点击“部署”。
部署成功后,你会得到一个以 ep- 开头的接入点 ID,例如 ep-m-20250123123456-abcde。
这个就是调用时需要填的模型 ID——不是 doubao-seedream-4.5-251128 这种版本名。
第5步:在 OpenClaw 中配置
回到 OpenClaw 对话框,告诉它:
创建一个豆包生成图片的技能配置
API KEY:c6d4e8f0-xxxx-xxxx-xxxx-xxxxxxxxxxxx
接入点 ID:ep-m-20250123123456-abcde
接口地址:POST https://ark.cn-beijing.volces.com/api/v3/images/generations
OpenClaw 会自动为你生成配置文件,保存在 ~/.openclaw/skills/image-gen/config.json。
你也可以手动检查或修改这个文件,确保 api_key 和 model 字段填写正确。
第6步:测试生图
配置完成后,发一条指令测试:
生成一张图片:一个极简风格的机器人图标,浅灰色背景,居中构图
如果几秒后返回了图片,恭喜你——视觉技能包已经跑通了。
Step 3:建立视觉规格表
这一步是把“每次都要想的视觉决策”变成“一次定义、反复使用”的标准化配置。
在飞书、Notion 或本地新建一个文档,按下面的格式记录你常用的场景:
| 场景 | 尺寸 | 风格 | 主色调 | 禁忌 |
|---|---|---|---|---|
| 公众号封面 | 900×383px | 科技感/简洁 | 深蓝+金色 | 真实人脸 |
| 小红书配图 | 1080×1350px | 温暖/生活感 | 暖白+橙色 | 文字过多 |
| 信息卡片 | 800×800px | 扁平/数据感 | 白底+品牌色 | 复杂背景 |
规格表的核心价值:以后每次让 AI 出图,你不需要重新想“尺寸是多少”“什么风格”“什么颜色”,直接告诉它“按我的视觉规格表,公众号封面规格”就行。
建议把这个规格表存入 OpenClaw 的记忆系统:
把这个视觉规格表保存到我的记忆里,以后我提到“公众号封面规格”就自动调用
Step 4:写你的第一个 Prompt 模板
很多人用 AI 生图失败,不是因为模型不行,而是提示词太抽象。
❌ 错误示范:
科技感,深蓝背景,金色文字
AI 不知道“科技感”具体是什么——是《银翼杀手》的赛博朋克?还是苹果发布会的极简风格?
✅ 正确写法(结构:场景 + 主体 + 环境 + 风格 + 色调 + 文字 + 禁忌):
生成一张公众号封面图,尺寸900×383px。
主体:一个全神贯注的程序员正坐在办公桌前编写代码,面前的屏幕上显示着数据流。
环境:现代简约的工作室,左侧有一盏柔和台灯,背景微弱的冷光反射在墙面上。
风格:科技感鲜明的现代数字插画,干净利落的线条,类似科技杂志封面质感。
色调:深蓝(#0a1628)背景,人物深灰色服装,左侧冷白光照亮人脸,金色(#FFD700)数据流高光点缀。
文字:画面左上角预留标题区域为深色半透明底纹,标题文字必须使用金色,副文本使用白色。
构图:人物和电脑居中偏右,左侧预留约1/3空白作为文字排布空间。
禁忌:不要真实人脸特写,不要具体公司Logo,不要水印。
把这个模板保存下来:
把这个 Prompt 模板保存到 ~/.openclaw/workspace/memory/visual-prompts.md
以后我写“公众号封面模板”就调用这个。
实战场景
场景1:公众号日更配图流水线
在 OpenClaw 对话框里直接说:
帮我给今天这篇文章《AI 时代的运营新思路》生成封面图和 3 张正文配图。
封面图用公众号规格,正文配图用信息卡片规格。
参考我的视觉规格表。
OpenClaw 会:
-
读取你的视觉规格表
-
提取文章关键词
-
调用
image-gen技能生成图片 -
返回图片链接供你选择
进阶技巧:可以先让 AI 理解文章内容再出图。比如:
先总结这篇文章的核心关键词和视觉意象,然后基于这些生成配图的 Prompt。
场景2:批量生成系列封面
如果你有一个系列文章(比如 10 篇),需要风格统一的封面:
帮我为这个系列的 10 篇文章批量生成封面图。
标题分别是:
1. OpenClaw 入门
2. 提示词工程实战
3. 视觉技能包搭建
...
保持统一的视觉风格:深蓝背景 + 金色标题,每篇标题不同,其他元素保持一致。
OpenClaw 会逐个生成,你只需要确认或微调。
场景3:多尺寸适配
一张图要同时用于公众号封面、小红书、朋友圈?可以让 OpenClaw 帮你扩展:
把这张封面图分别导出为公众号封面(900×383)、小红书配图(1080×1350)、信息卡片(800×800)三个版本,保持主体内容不变,自动调整构图。
个人体感
这套流程我跑了大概两个月,最大的收益不是“AI 帮我画图”,而是把视觉决策从每次都要想变成了执行规格。
以前做一张课程海报:找背景图 10 分钟,找素材 10 分钟,排版 20 分钟,调色 10 分钟——50 分钟起步。现在:告诉 AI“按课程海报规格生成,主题是《AI 写作实战》”,3 分钟出 3 版,我选一版微调,总时长不超过 10 分钟。
一个关键心得:提示词里一定要给“反例”。比如“不要真人脸”“不要文字过多”“不要复杂背景”——这些约束比正面描述更能稳定输出质量。
关于成本:豆包 Seedream 新用户有免费额度,之后大约 0.1 元/张。即使每天出 20 张配图,一个月成本也就 60 元左右,远低于设计师时薪。
常见错误与排查
| 错误现象 | 原因 | 解决方法 |
|---|---|---|
| 生图API报错401 | API Key 配置错误 | 确认使用的是火山方舟的专属 API Key(UUID格式),不是 IAM 的 AK/SK |
| 模型不存在报错404 | 填了模型版本名而非接入点ID | 在火山方舟控制台找到部署后的 ep- 开头的接入点ID |
| 安装技能后仍然无法生图 | 技能未生效 | 重启 OpenClaw,或在对话框中输入 /skills 检查已安装技能列表 |
| 图片风格不稳定 | Prompt 太抽象 | 补充具体的主体、环境、色调描述,用完整句子替代关键词堆砌 |
| 尺寸不对 | 未在 Prompt 中指定尺寸 | 在 Prompt 开头明确写出 尺寸:900×383px |
| 图片内文字乱码 | 需要生成的文字未放在双引号内 | 把标题文案放在双引号里,例如 标题"AI时代的新技能" |
| 生成的图有水印 | 使用了免费试用额度限制版本 | 检查模型配置,确认使用的是正式版接入点,或已完成付费开通 |
| 配图与文章主题不符 | AI 没有理解文章内容 | 先让 AI 提取文章关键词,再生成配图 Prompt |
下篇预告
下一篇进入《OpenClaw实操指南32|增长卡住时,先用这套AI技能包做SEO和转化》,把 AI 能力接入业务增长链路。
记得把这篇的 Prompt 模板和规格表保存好,下一篇我们会用到其中的视觉资产做 A/B 测试素材。
获取更多 AI 咨询、一人公司、创业读书笔记、Openclaw、Claude Code 实战干货,欢迎关注我
关键词:AI生图,豆包Seedream,视觉技能包,Prompt模板,公众号配图,nano-banana-pro,OpenClaw
相关阅读:OpenClaw实操指南30|文档处理技能包:PDF/PPT/Word/Excel,AI帮你搞定一切文件
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)