OpenClaw实操指南31｜不会设计也能出图：3步搭建你的AI视觉技能包

Rubin智造社

657人浏览 · 2026-05-03 22:00:44

Rubin智造社 · 2026-05-03 22:00:44 发布

装完 OpenClaw 之后，很多人第一个卡点不是写作，而是配图。

写完一篇公众号文章，封面图要去找素材，信息卡片要手动排版，小红书配图要反复调整——这些事情加起来，往往比写正文还费时间。

这篇讲的就是怎么用 OpenClaw 把视觉生产这条线打通。不需要你会 PS，不需要懂设计，核心是把“需求拆解 → 提示词 → 版式复用”这三件事固化成可重复执行的流程。

核心概要

视觉生产卡顿的根本原因不是“不会设计”，而是每次都从零开始。

解决思路是：

把常用场景的视觉规格固化（尺寸、风格、色调）
用 AI 生图技能批量出草图
用配色和排版技能做统一化
沉淀成可复用的 Prompt 模板库

这套流程跑通之后，出一张封面图从“30分钟找素材+调整”变成“5分钟出3版选一张”。

分步操作

Step 1：安装视觉技能

OpenClaw 本身不带生图能力，但可以通过安装“技能”来获得。就像给手机装 App 一样，在 OpenClaw 对话框里直接告诉它就行。

1. 确认 OpenClaw 已运行

确保你已经启动了 OpenClaw（桌面端或命令行界面都可以）。

2. 安装核心视觉技能

直接在 OpenClaw 的输入框中发送下面这句话：

帮我安装 image-gen 技能

OpenClaw 会自动调用 npx clawhub@latest install image-gen 完成安装。你会看到类似这样的输出：

✔ Installing skill: image-gen
✔ Skill installed successfully

同样的方式，继续安装配色和排版辅助技能：

帮我安装 color-palette 技能

帮我安装 layout-assistant 技能

3. （可选）安装封面图专项技能

如果你需要生成小红书风格封面或带文字排版的图片，可以额外安装：

帮我安装 nano-banana-pro 技能

nano-banana-pro 需要 Gemini API Key，获取地址：https://aistudio.google.com/apikey
安装成功后，在 OpenClaw 的 ~/.openclaw/openclaw.json 中填入你的 GEMINI_API_KEY 即可。

4. 验证安装是否成功

在对话框中输入以下指令测试生图能力：

生成一张测试图片，内容：一只可爱的橘猫坐在办公桌前

如果能正常返回图片，说明技能安装成功。如果提示找不到相关指令，可以尝试重启 OpenClaw 再试。

Step 2：配置生图模型

OpenClaw 安装的 image-gen 技能需要对接一个真实的生图模型。这里以豆包 Seedream 4.5为例——这是字节跳动旗下火山引擎发布的图像创作模型，支持 4K 多模态生图、多图融合创作、参考图生图等能力，新用户通常有免费试用额度。

第1步：登录火山引擎

打开 https://console.volcengine.com/auth/login ，用手机号或邮箱注册/登录。

第2步：开通 Seedream 模型

访问 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement

找到 Doubao-Seedream-4.5，点击“开通”。

新用户通常有免费额度，足够你测试几十张图。

第3步：创建 API Key（⚠️ 注意这里容易出错）

访问 https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey

点击“创建 API Key”，起一个名字（比如 openclaw-image），然后完整复制生成的 Key（格式像这样：c6d4e8f0-xxxx-xxxx-xxxx-xxxxxxxxxxxx）。

⚠️ 关键坑：不要使用火山引擎的 IAM Access Key / Secret Key（AK/SK），那种格式不支持 OpenAI 兼容接口的 Bearer 认证，会直接报 401。必须创建“方舟专属 API Key”，它是一串 UUID 格式。

第4步：获取接入点 ID（模型 ID）

在火山方舟的“模型广场”找到 Doubao-Seedream-4.5，点击“部署”。
部署成功后，你会得到一个以 ep- 开头的接入点 ID，例如 ep-m-20250123123456-abcde。
这个就是调用时需要填的模型 ID——不是 doubao-seedream-4.5-251128 这种版本名。

第5步：在 OpenClaw 中配置

回到 OpenClaw 对话框，告诉它：

创建一个豆包生成图片的技能配置
API KEY：c6d4e8f0-xxxx-xxxx-xxxx-xxxxxxxxxxxx
接入点 ID：ep-m-20250123123456-abcde
接口地址：POST https://ark.cn-beijing.volces.com/api/v3/images/generations

OpenClaw 会自动为你生成配置文件，保存在 ~/.openclaw/skills/image-gen/config.json。
你也可以手动检查或修改这个文件，确保 api_key 和 model 字段填写正确。

第6步：测试生图

配置完成后，发一条指令测试：

生成一张图片：一个极简风格的机器人图标，浅灰色背景，居中构图

如果几秒后返回了图片，恭喜你——视觉技能包已经跑通了。

Step 3：建立视觉规格表

这一步是把“每次都要想的视觉决策”变成“一次定义、反复使用”的标准化配置。

在飞书、Notion 或本地新建一个文档，按下面的格式记录你常用的场景：

场景	尺寸	风格	主色调	禁忌
公众号封面	900×383px	科技感/简洁	深蓝+金色	真实人脸
小红书配图	1080×1350px	温暖/生活感	暖白+橙色	文字过多
信息卡片	800×800px	扁平/数据感	白底+品牌色	复杂背景

规格表的核心价值：以后每次让 AI 出图，你不需要重新想“尺寸是多少”“什么风格”“什么颜色”，直接告诉它“按我的视觉规格表，公众号封面规格”就行。

建议把这个规格表存入 OpenClaw 的记忆系统：

把这个视觉规格表保存到我的记忆里，以后我提到“公众号封面规格”就自动调用

Step 4：写你的第一个 Prompt 模板

很多人用 AI 生图失败，不是因为模型不行，而是提示词太抽象。

❌ 错误示范：

科技感，深蓝背景，金色文字

AI 不知道“科技感”具体是什么——是《银翼杀手》的赛博朋克？还是苹果发布会的极简风格？

✅ 正确写法（结构：场景 + 主体 + 环境 + 风格 + 色调 + 文字 + 禁忌）：

生成一张公众号封面图，尺寸900×383px。

主体：一个全神贯注的程序员正坐在办公桌前编写代码，面前的屏幕上显示着数据流。

环境：现代简约的工作室，左侧有一盏柔和台灯，背景微弱的冷光反射在墙面上。

风格：科技感鲜明的现代数字插画，干净利落的线条，类似科技杂志封面质感。

色调：深蓝(#0a1628)背景，人物深灰色服装，左侧冷白光照亮人脸，金色(#FFD700)数据流高光点缀。

文字：画面左上角预留标题区域为深色半透明底纹，标题文字必须使用金色，副文本使用白色。

构图：人物和电脑居中偏右，左侧预留约1/3空白作为文字排布空间。

禁忌：不要真实人脸特写，不要具体公司Logo，不要水印。

把这个模板保存下来：

把这个 Prompt 模板保存到 ~/.openclaw/workspace/memory/visual-prompts.md
以后我写“公众号封面模板”就调用这个。

实战场景

场景1：公众号日更配图流水线

在 OpenClaw 对话框里直接说：

帮我给今天这篇文章《AI 时代的运营新思路》生成封面图和 3 张正文配图。
封面图用公众号规格，正文配图用信息卡片规格。
参考我的视觉规格表。

OpenClaw 会：

读取你的视觉规格表
提取文章关键词
调用 image-gen 技能生成图片
返回图片链接供你选择

进阶技巧：可以先让 AI 理解文章内容再出图。比如：

先总结这篇文章的核心关键词和视觉意象，然后基于这些生成配图的 Prompt。

场景2：批量生成系列封面

如果你有一个系列文章（比如 10 篇），需要风格统一的封面：

帮我为这个系列的 10 篇文章批量生成封面图。
标题分别是：
1. OpenClaw 入门
2. 提示词工程实战
3. 视觉技能包搭建
...
保持统一的视觉风格：深蓝背景 + 金色标题，每篇标题不同，其他元素保持一致。

OpenClaw 会逐个生成，你只需要确认或微调。

场景3：多尺寸适配

一张图要同时用于公众号封面、小红书、朋友圈？可以让 OpenClaw 帮你扩展：

把这张封面图分别导出为公众号封面(900×383)、小红书配图(1080×1350)、信息卡片(800×800)三个版本，保持主体内容不变，自动调整构图。

个人体感

这套流程我跑了大概两个月，最大的收益不是“AI 帮我画图”，而是把视觉决策从每次都要想变成了执行规格。

以前做一张课程海报：找背景图 10 分钟，找素材 10 分钟，排版 20 分钟，调色 10 分钟——50 分钟起步。现在：告诉 AI“按课程海报规格生成，主题是《AI 写作实战》”，3 分钟出 3 版，我选一版微调，总时长不超过 10 分钟。

一个关键心得：提示词里一定要给“反例”。比如“不要真人脸”“不要文字过多”“不要复杂背景”——这些约束比正面描述更能稳定输出质量。

关于成本：豆包 Seedream 新用户有免费额度，之后大约 0.1 元/张。即使每天出 20 张配图，一个月成本也就 60 元左右，远低于设计师时薪。

常见错误与排查

错误现象	原因	解决方法
生图API报错401	API Key 配置错误	确认使用的是火山方舟的专属 API Key（UUID格式），不是 IAM 的 AK/SK
模型不存在报错404	填了模型版本名而非接入点ID	在火山方舟控制台找到部署后的 `ep-` 开头的接入点ID
安装技能后仍然无法生图	技能未生效	重启 OpenClaw，或在对话框中输入 `/skills` 检查已安装技能列表
图片风格不稳定	Prompt 太抽象	补充具体的主体、环境、色调描述，用完整句子替代关键词堆砌
尺寸不对	未在 Prompt 中指定尺寸	在 Prompt 开头明确写出 `尺寸：900×383px`
图片内文字乱码	需要生成的文字未放在双引号内	把标题文案放在双引号里，例如 `标题"AI时代的新技能"`
生成的图有水印	使用了免费试用额度限制版本	检查模型配置，确认使用的是正式版接入点，或已完成付费开通
配图与文章主题不符	AI 没有理解文章内容	先让 AI 提取文章关键词，再生成配图 Prompt