商汤 SenseNova 大模型平台目前处于免费公测阶段,提供多模态对话、专业图像生成、文本对话三大高性能模型,调用额度充足、协议兼容主流AI框架。本文手把手带你在 OpenClaw 中接入 SenseNova 模型,搭配官方 Skill 插件,从零搭建一款支持图像理解、智能对话、专业信息图生成、办公自动化的个人全能AI助手。

一、SenseNova 平台与核心模型介绍

SenseNova 是商汤科技推出的标准化大模型 API 服务平台,适配 OpenAI 兼容协议,可无缝接入各类AI客户端与框架。平台公测福利丰厚,单模型每5小时可调用1500次,三款模型独立计算额度,合计最高4500次/5小时,完全满足个人学习、日常办公、轻量创作需求。

平台核心开放三款模型,各司其职、互补协同,本文重点使用前两款实现全场景能力:

模型ID 模型类型 核心能力 上下文窗口 适用场景
sensenova-6.7-flash-lite 多模态对话模型 支持文字+图片输入、文字输出,具备深度图像理解、逻辑推理、Prompt优化能力 256K 识图解析、智能问答、需求拆解、提示词优化
sensenova-u1-fast 专业图像生成模型 专精信息图、海报、绘本生成,支持高精度文字渲染、规整排版 - 可视化创作、信息图制作、系列插画生成
deepseek-v4-flash 纯文本对话模型 长文本处理、工具调用、结构化输出 256K 文案创作、长文总结、代码编写

平台官方地址:https://platform.sensenova.cn

二、环境准备与API基础配置

本节完成账号注册、密钥获取、接口连通校验和OpenClaw基础安装,为后续模型接入打好基础。

2.1 注册账号并获取API Key

  1. 访问SenseNova官网,完成账号注册与手机号验证;
  2. 进入控制台,找到「API Key管理」,创建全新密钥(sk-开头);
  3. 本地保存密钥,配置环境变量:
export SENSENOVA_API_KEY="sk-your-api-key-here"

2.2 校验API接口连通性

执行以下命令,验证密钥与接口是否正常可用,成功会返回平台所有可用模型列表:

curl -s "https://token.sensenova.cn/v1/models" \
  -H "Authorization: Bearer $SENSENOVA_API_KEY" | python3 -m json.tool

返回结果中包含sensenova-6.7-flash-litesensenova-u1-fast 即代表校验通过。
【OpenAI】获取OpenAI API Key的多种方式全攻略:从入门到精通,再到详解教程!

2.3 安装OpenClaw客户端

OpenClaw是开源AI智能体框架,完美兼容SenseNova OpenAI协议,支持插件拓展、自动化任务调度。安装前需确保本地安装 Node.js 22.16+ 或 24+ 版本。

# 全局安装OpenClaw最新版
npm install -g openclaw@latest

# 初始化配置,安装核心服务
openclaw onboard --install-daemon

2.4 接入SenseNova模型核心配置

初始化过程会弹出交互配置窗口,严格按照以下参数填写(重点注意接口域名):

配置项 填写值 配置说明
Model/auth provider Custom Provider 自定义模型服务商
API Base URL https://token.sensenova.cn/v1 核心易错点!禁止使用api子域名
Authentication Paste API key now 手动粘贴密钥
API Key sk-xxx(个人密钥) SenseNova后台创建的密钥
Endpoint compatibility OpenAI-compatible 协议兼容适配
Model ID sensenova-6.7-flash-lite 默认多模态对话模型
Endpoint ID sensenova 自定义内部索引标识
Support image input Yes 开启图像输入能力

配置完成后,选择 Restart 重启服务,所有配置即可生效,最后在OpenClaw网页端发送提问,验证对话连通正常。

三、核心模型能力深度解析

两款核心模型分工明确:6.7 Flash-Lite 负责「理解与思考」,U1 Fast 负责「创作与生成」,组合实现完整多模态能力。

3.1 6.7 Flash-Lite:高精度多模态识图理解

该模型是免费公测模型中的第一梯队选手,并非简单的“看图说话”,具备深度场景理解和语义解读能力,三大核心亮点:

  • 文化场景深度解读:可结合传统文化、民俗寓意解析画面,如识别寺庙景观并解读祈福寓意,理解场景背后的人文内涵;
  • 微观细节精准捕捉:能识别画面中人物动作、场景细节,区分人群行为状态,拒绝笼统模糊的画面描述;
  • 复杂场景逻辑辨析:面对密集人群、相似人物、复杂背景等高难度场景,可精准区分主体、梳理逻辑,不出现认知混淆。

3.2 U1 Fast:专业级信息图生成模型

区别于通用绘图模型,SenseNova U1 是原生图文统一生成模型,主打高密度信息图、商用海报、结构化图文创作,彻底解决普通模型排版混乱、文字模糊、布局无序的问题。

3.2.1 核心架构优势:NEO-Unify 端到端建模

传统多模态模型采用「视觉编码器+适配器+解码器」拼接架构,信息多次中转损耗严重;而 U1 采用全新 NEO-Unify 原生统一架构:

  • 去除独立视觉编码器、VAE解码器,像素与文本在同一表征空间交互;
  • 基于MoT混合Transformer骨干网络,理解、生成双流程协同联动;
  • 全程端到端建模,信息零损耗,排版精度、文字清晰度远超同类模型。
3.2.2 主流图像模型横向对比
对比维度 SenseNova U1 DALL-E 3 Midjourney
信息图排版能力 ⭐⭐⭐⭐⭐ 专精商用排版 ⭐⭐⭐⭐ 能力优秀 ⭐⭐ 偏重艺术、排版薄弱
文字渲染精度 商业级零错误 行业顶尖 极易出现文字错乱
开源部署 ✅ Apache2.0 完全开源 ❌ 闭源 ❌ 闭源
使用成本 公测免费 付费使用 付费使用
3.2.3 支持分辨率与Prompt最佳实践

固定分辨率:U1 Fast 仅支持11种官方2K级固定尺寸,默认 2752×1536(16:9宽屏海报),涵盖正方形、竖版手机海报、超宽横幅、长图等全场景比例,不支持自定义尺寸。

Prompt 编写规范:U1 对结构化提示词高度敏感,拒绝笼统描述,标准公式:主题 + 全局风格配色 + 固定排版布局 + 逐区块细节内容。

  • 反面案例:模糊口语化描述,出图排版混乱、信息零散;
  • 正面案例:明确网格布局、边框约束、字体层级、图标样式、分区内容,实现“所想即所得”;
  • 进阶技巧:先用6.7 Flash-Lite 优化精简Prompt,再送入U1生成,大幅提升出图质量。

四、接入官方SenseNova-Skills插件套件

商汤官方开源适配OpenClaw的Skill插件套件,无需手动封装代码,一键安装即可解锁信息图生成、PPT自动化制作、Excel数据分析、深度行业调研四大办公能力。

4.1 插件核心能力矩阵

能力分类 核心插件 功能说明
图像可视化 sn-infographic、sn-image-base 图像识别、Prompt智能增强、商用信息图一键生成
PPT自动化 sn-ppt-entry、sn-ppt-standard 从需求Brief自动生成完整结构化PPT文档
数据分析师 sn-da-excel-workflow 多文件Excel清洗、数据聚合、可视化导出
深度研究 sn-deep-research 自动规划调研方案、全网取证、生成专业报告

4.2 一键安装与环境配置

# 克隆官方插件仓库
git clone https://github.com/OpenSenseNova/SenseNova-Skills.git --depth=1

# 移入OpenClaw插件目录
mkdir -p ~/.openclaw/skills
cp -r SenseNova-Skills/skills/* ~/.openclaw/skills/

# 重启服务生效
openclaw gateway restart

# 验证插件安装成功
openclaw skills list

4.3 配置全局环境变量

编辑OpenClaw配置目录下的.env文件,填入平台接口信息,让插件自动调用模型:

SN_BASE_URL="https://token.sensenova.cn/v1"
SN_API_KEY="sk-你的个人密钥"

配置完成后,直接在对话框发送自然语言指令,插件即可自动接管任务,完成全流程创作。

五、实战案例:统一风格绘本组图生成

借助 OpenClaw 多任务调度 + U1 生成能力,可实现一次指令、自动分镜、统一画风、批量出图,完美适配绘本、教程、系列海报等场景。

5.1 实操指令

在OpenClaw对话框直接输入:
请帮我生成一个图文绘本故事,主角是一只可爱的兔子,故事讲述它经历四季变化。

5.2 自动执行流程

  1. AI自动拆解需求,拆分春、夏、秋、冬四个分镜脚本;
  2. 6.7 Flash-Lite 自动优化每帧Prompt,统一画风、色调、人物特征;
  3. 调度U1模型批量生成图片,全程保持角色、画风连贯统一;
  4. 输出完整四季绘本组图,四季氛围差异化明显,整体风格高度一致。

该实战充分体现整套方案的优势:无需手动写Prompt、无需逐张生成,一句话完成复杂多模态创作。

六、高频报错避坑指南

整理接入与使用过程中90%用户会遇到的问题,快速排查故障:

  • 404模型不存在:接口混用报错!对话模型(6.7/DeepSeek)使用/v1/chat/completions,图像模型(U1 Fast)必须使用 /v1/images/generations
  • 尺寸参数非法:U1 Fast 不支持自定义分辨率,仅可使用官方11种固定尺寸;
  • 模型返回内容为空:max_tokens 参数设置过小,推理模式会消耗额外token,建议设置为2048以上;
  • 接口连接失败:域名错误!务必使用 token.sensenova.cn,禁止使用 api.sensenova.cn
  • 插件不生效:安装插件后必须重启OpenClaw网关,且.env文件密钥、接口地址需准确无误。

七、全文总结

本文搭建的 SenseNova + OpenClaw 方案,是一套零成本、高性能、易拓展的个人AI助手解决方案,核心优势可总结为三点:

  1. 模型分工极致高效:6.7 Flash-Lite 负责视觉理解、需求拆解、Prompt优化,U1 Fast 专注专业图像生成,各司其职,完美覆盖“看图-思考-创作”全流程;
  2. 能力强且成本极低:公测免费额度充足,碾压多数付费模型的信息图排版、文字渲染能力,同时底层模型开源,支持本地二次部署与定制开发;
  3. 生态完善开箱即用:官方SenseNova-Skills插件覆盖全办公场景,无需代码开发,自然语言即可驱动AI完成绘图、数据分析、PPT制作、行业调研等复杂任务。

无论是个人日常娱乐、图文创作,还是职场办公自动化,这套方案都能满足绝大多数需求,是目前性价比最高的免费多模态AI解决方案之一。
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐