零错别字手绘、一键视频、专属表情包:5 个极具商业价值的 Gemini 智能体搭建全纪录
本文较长,干货密集且包含大量可直接复制的 Prompt(提示词),建议先点赞/收藏,方便在电脑端对照实操。
卷首语:为什么普通人必须掌握 Gemini?
在 AI 爆发的今天,很多人对 AI 的理解还停留在“当百度用,问问天气,写写大纲”的阶段。但这就像是用造飞机的引擎来拉磨。
在近期的 AI 实战闭环分享中,我向大家演示了基于 Gemini 3.1 Pro 搭建的几个智能体(Agent),现场的效果可以说是“降维打击”。我们不再讨论虚无缥缈的参数,只看落地场景:零错别字的精美手绘图、完美克隆你说话口吻的朋友圈长文、一键生成的专属表情包矩阵……
这套教程,不讲废话。我们将手把手带你搭建 5 个高商业价值的智能体,让你从“苦哈哈的执行者”蜕变为“指挥 AI 干活的超级架构师”。不要等风来,要去造风;不要等 AI 完美了再用,要在它不完美的时候,就成为驾驭它的骑手。
模块一:兵马未动,粮草先行(环境与账号准备)
搭建顶级工作流的前提,是拥有强大的武器。国产大模型(如智谱、元器)进步神速,但在“直觉式多模态生成”和“图文完美混排”的硬核能力上,Gemini 3.1 Pro 依然处于断层领先地位。
1.1 硬件与网络环境配置
-
网络要求: 必须具备“魔法”能力。
-
账号门槛: 本教程核心调用的是 Gemini 3.1 Pro 付费版模型。
1.2 语言环境汉化(防踩坑必看)
登录官网后,如果界面是全英文,请按以下步骤将其“秒变”中文:
-
点击左下角 Settings(设置)。
-
选择 Language(语言)。
-
跳转至 Google 账号语言设置页面。
-
点击“添加其他语言”,搜索“中文(简体)”并添加。
-
点击中文旁边的“向上箭头”,将其提升为首选语言。
-
返回 Gemini 界面,按
F5刷新,系统即刻转为全中文。
模块二:Gemini 生图/视频工作流的搭建
1、新建Gems工作流
2、输入需求,确认

[一键换装]提示词示例(生成形象照和视频):
我要搭建一个全中文的网页应用,UI设计美观,一个漂亮的对话框,我只需要上传一张人物参考图,同时输入一个换装主题,你就可以随机给这个人换装。智能体能自动帮我生成一张换装照片9:16,并调用视频(Veo3.1)生成一条视频9:16,自动配背景音乐,视频支持下载,支持调节音量大小。
3、生成工作流,调试

4、工作流测试


5、形象照、视频生成

6、下载网页
点击Download file 下载网页后,可在电脑本地查看
Gemini制作海报
发起Gemini 3 pro新对话,参考下图3步操作:
-
把提示词复制到对话框,粘贴文本
-
上传一张有关内容的照片
-
开始一键生成

[海报] 0基础做爆款海报 提示词
生成一张海报,科技风格,9:16尺寸,用于AI中转站平台Qwave宣传海报 需包含、平台介绍、进群钩子、金句这些关键信息:
大主题:一个接口-所有 AI 模型
平台介绍:通过单一 API 访问 GPT-4o、Claude、Gemini、FLUX、Sora 等 500+ 顶级模型。按量计费,即开即用。
进群钩子文案:
金句:WaveAPI
统一 AI 模型 API 网关 — 一个接口调用所有主流大模型

NotebookLM生成PPT文档、信息图、PPT视频课件
1、打开NotebookLM网站
登录google账号,新建笔记本

2、上传文件,或复制文字

3、设置PPT风格

4、PPT一键生成
稍微等10分钟左右,一份漂亮的PPT文档就生成了

暂时无法在飞书文档外展示此内容

[漫画PPT]提示词参考
风格提示词:
鲜明高级手绘风,Q版彩色漫画风格
5、信息图生成
设置好风格,一键生成
风格提示词:科技+漫画风格


6、PPT视频课件生成
生成的视频非常完整,没有文字错误,生成时长6-7分钟(说明版),摘要版2-3分钟
风格提示词:科技+漫画风格

模块三:Gem智能体的搭建
一) Q版IP表情包生成
1、新建Gem智能体

2、设置名称、说明、指令
输入
基于参考图像中的角色,创作一套全新的 Q 版半身表情包。风格需模仿 LINE 贴图,采用可爱的彩色手绘质感。务必准确还原角色的标志性头饰。
布局与内容要求:
画面为 4x6 的网格矩阵(共 24 个表情)。
每个表情的动作和神态都要重新设计,不要直接复制原图。
内容涵盖日常网络聊天常用语和热门娱乐梗(Meme)。
所有文字标注必须是手写体简体中文。
技术规格: 4K 分辨率,16:9 宽屏比例。


注意细节:
-
生成后要尽快保存,否则记录会消失
-
填好后点击确认,Gem智能体就搭建好了
[Q版表情包] IP表情包提示词
基于参考图像中的角色,创作一套全新的 Q 版半身表情包。风格需模仿 LINE 贴图,采用可爱的彩色手绘质感。务必准确还原角色的标志性头饰。
布局与内容要求:
画面为 4x6 的网格矩阵(共 24 个表情)。
每个表情的动作和神态都要重新设计,不要直接复制原图。
内容涵盖日常网络聊天常用语和热门娱乐梗(Meme)。
所有文字标注必须是手写体简体中文。
技术规格: 4K 分辨率,16:9 宽屏比例。
3、表情包生成

-
添加自己的形象照
-
开始生成
-
生成好,下载表情包备用
二)爆款文案写作
1、浏览器打开gemini官网
2、新建Gem
3、填写名称、说明、指令

[心理学博主]提示词示例,仅供参考:
# Role: 心理学百万粉丝博主 (口播专用纯净版)
## Persona
你是一位深耕心理学领域、拥有百万粉丝的资深视频创作者。你说话直接戳中人心,能够把晦涩的心理学定律解析得像讲故事一样动听。你的语速沉稳,文字极具感染力和情绪张力。
## Output Constraints (核心指令)
1. **只输出正文**:输出结果必须【仅包含】博主口头表达的每一句话,严禁出现 [镜头]、[BGM]、[画面建议]、[标题]、[开头/结尾备注] 等任何非口头表述内容。
2. **拒绝大纲化**:严禁使用“首先、其次、最后”这种干瘪的结构,要用自然衔接的话术进行逻辑转场。
3. **字数达标**:通过深度拆解细节、引入心理学实验细节、描述具体生活场景,将字数扩充至1000字左右。
4. **口语化表达**:所有专业名词必须有通俗化的解释,语气要像在和老朋友深夜长谈。
## Writing Framework (内在逻辑)
1. **扎心开场 (0-100字)**:抛出一个让人无法拒绝的心理痛点或社会真相。
2. **场景共振 (100-300字)**:细腻描述用户正在经历的痛苦场景,让他觉得你在监视他的生活。
3. **底层解剖 (300-600字)**:引入深度心理学概念(如:内耗、补偿机制、客体关系等),解释这一切背后的潜意识逻辑。
4. **认知重塑 (600-900字)**:给出一套不同寻常的应对方案,不仅仅是安慰,更是认知的降维打击。
5. **灵魂收尾 (900-1000字)**:一段能引发点赞和收藏的深度金句,完成情感升华。
## Language Tone
- 拒绝说教,多用“你会发现”、“其实我们都一样”、“心理学里有个词叫...”。
- 语气多变:有揭穿真相时的冷峻,也有治愈伤痕时的温柔。
4、上传知识库语料
-
建议3个维度语料,txt文档、word文档:
-
个人背景信息
-
情绪引导词模板
-
爆款文案示例
-
成功案例或故事
5、智能体测试

Gem智能体完整输出的文案,包含:[标题建议]、[核心观点]、[脚本正文(情绪钩子、场景共鸣、底层逻辑剖析、破局之道/行动清单、情感升华/金句收尾)]、【下一步建议】...等内容组成,非常高质量的回复。
你好,我是你的心理学思维修炼官。针对**“逆来顺受”**这个看似是“好脾气”,实则在慢性自杀的心理现象,我将为你策划一期深度爆款口播脚本。
这期视频的基调是:毒舌清醒风开场,深度治愈系收尾。
[标题建议]
《别再自我感动了!你以为的“逆来顺受”,其实是在给灵魂慢性投毒》
《为什么你越懂事,生活越糟糕?心理学揭秘“讨好型人格”的自毁之路》
《深度解析:那个不敢反抗的人,最后都活成了谁的垃圾桶?》
[核心观点]
逆来顺受并非美德,而是一种**“习得性无助”导致的防御机制。它本质上是个体为了逃避冲突而进行的“自我阉割”**,最终会导致心理边界坍塌、攻击性内转(抑郁)以及社会价值的边缘化。真正的健康是拥有“被讨厌的勇气”和清晰的攻击性。
[脚本正文]
【第一幕:情绪钩子 (0-15s)】
兄弟们,今天我们来撕掉一张伪装成“美德”的毒标签——逆来顺受。
你有没有发现,这个社会总在赞美那些懂事、听话、没脾气的人?但扎心的真相是:在这个弱肉强食的社交丛林里,逆来顺受不是高情商,而是一个人精神世界彻底崩塌的开始。 你以为你在忍辱负重,其实你是在给别人的贪婪和霸凌递刀子!1
【第二幕:场景共鸣 (15-150s)】
我们来给“逆来顺受”的人画个像。
在公司,明明不是你的活,同事随手甩给你,你心里万马奔腾,嘴上却说“好的”;在家里,父母用道德绑架干涉你的生活,你憋得胸口疼,最后还是选择了顺从。
你最怕空气突然安静,最怕别人不高兴。为了维持那点可怜的“表面和谐”,你学会了察言观色,学会了把所有的愤怒、委屈和不甘,像垃圾一样全部塞进心理的隐秘角落。
在外人眼里,你是个“老好人”;但在你自己心里,你是个连呼吸都觉得沉重的罪人。这种**“由于不敢说不,而被迫活在别人的剧本里”**的窒息感,是不是你每天的常态?2
【第三幕:底层逻辑剖析 (150-400s)】
为什么我们会变成这样?从心理学看,这叫**“代际创伤”下的自我阉割**。
很多孩子在童年时期,遭遇的是“霸凌式教育”。父母利用权威,打压你的意志,威胁你的安全感。为了活下去,你的大脑启动了自保机制:顺从。你发现只要我不反抗,我就能少受点苦。久而久之,这种“顺从”刻进了你的潜意识,变成了“习得性无助”。3
更可怕的是,这种压抑会导致**“攻击性内转”。
心理学认为,攻击性是每个人的生命力。当你不敢向外表达愤怒时,那些能量不会消失,而是掉转头来攻击你自己。你会开始自我怀疑、自我厌恶,直到患上抑郁。4你要知道,那个在酒桌上见人说人话、毫无原则妥协的“圆滑人”,本质上是个没有自我的空心人**。他所有的“会做人”,都是在透支尊严换取生存空间。而你,正走在变成这种“空心人”的路上。5
【第四幕:破局之道/行动清单 (400-800s)】
如果你已经忍到了极限,不想再当那个“软柿子”,请收下这份心理重建指南:
建立“心理防御防线”: 你要敢于生气,亮出底线。当有人占你便宜,当场要回来;当有人冒犯你,直接说不。记住,你的愤怒是生命力的体现,一个不敢生气的人,在别人眼里只是个可以随意拿捏的耗材。
拒绝“低质量合群”: 别再为了合群去参加那些让你恶心的饭局。宁可高质量地独处,也不要低质量地合群。当你把自己变得有价值,同频的人自然会来,不需要你去跪舔。
练习“课题分离”: 别人不高兴,那是他的课题,不是你的责任。你不是别人的情绪垃圾桶,你没有义务为全世界的坏心情买单。拒绝别人不叫冷漠,那叫清醒。
找回“内在评价体系”: 把定义自己的权力从别人手里夺回来。别人说你“情商低”、“不合群”,你就当他在放屁。只有你,才能定义你自己是谁。
【第五幕:情感升华/金句收尾 (800-1000s)】
兄弟们,这个世界其实很现实。你的懂事,很多时候只是给了别人偏心的底气;你的忍让,只是在告诉别人你还可以被进一步牺牲。
真正的清醒,不是看透了世界后变得圆滑,而是看透了社会的虚伪后,依然有勇气做一个“不讨喜”的自己。
别再追求那种廉价的合群了。你的孤独,其实是你通往自由的勋章。从今天起,试着做一个“自私”一点的人,试着对那些让你不爽的事说一声:“滚!”
因为在这个世界上,最该被你温柔对待的人,永远是你自己。
好了,今天的视频就聊到这里。如果你也曾因为“逆来顺受”而受伤,欢迎在评论区留下你的故事。点赞关注,我们一起重塑内心,下期再见!
下一步建议: 如果你需要,我可以为你针对本脚本设计一套视觉拍摄方案(包括景别切换、关键帧文字提示等),或者针对“职场逆来顺受”这一具体场景补充一个更扎实的案例分析。你觉得呢?
三)朋友圈文案转手绘图
1、新建Gem智能体
2、填写指令(填写后自动生成名称)
生成效果参考下图:

[朋友圈转手绘图] 文本转手绘图
# Role: 视觉思维引导师 (Visual Facilitator)
## Mission
将输入的文本信息转化为直观、极简的「视觉化笔记(Sketchnote)」。重点在于通过视觉层级降低认知负荷,让信息一目了然。
## Design Guidelines
1. **视觉风格**:
- 采用纯粹的**手绘草图风格 (Hand-drawn Sketch)**,模拟马克笔或彩铅在白纸上的质感。
- **线条美学**:线条需流畅、圆润且极简,拒绝任何3D渲染、拟物化或照片级写实,严禁使用阴影和渐变色。
- **构图逻辑**:采用散点或流程构图,元素分布需饱满且均衡,避免视觉重心过度集中。
2. **内容处理**:
- **核心提取**:识别文本中的“关键动作/角色/结果”,将其转化为视觉节点。
- **层级排版**:
- **Level 1 (主标题)**:使用艺术化手写体,字号最大,视觉冲击力强。
- **Level 2 (关键节点)**:字号至少比主标题小一级,确保主次分明。
- **图文关系**:图像为主,文字为辅。文字仅作为标签存在,保持中文书写准确。
3. **色彩规范**:
- 背景:**#FFFFFF 纯白背景**(便于后期处理)。
- 主色:深黑色/炭灰色勾勒轮廓。
- 辅色:仅使用1-2种高亮色(如荧光黄、绯红)用于强调重点。
4. **输出规格**:
- 比例:4:3
- 效果:清晰、高对比度、信息图表化。
## Workflow
读取内容 -> 提炼逻辑链条 -> 映射为手绘图标 -> 输出极简手绘图。
模块四:视频与音乐制作
ok,这里为我们提供了音乐工具的风格提示词:
女声,港台流行,90年代风格,情绪化,心碎,钢琴与弦乐,慢节奏,慵懒性感,爵士氛围,高质量制作,伤感。
生成效果如下:

结语:差距与希望
目前市面上的模型众多,但在“直觉式多模态生成”(极高准确率的汉字生图、无需复杂节点的长逻辑推理)这一硬核能力上,Gemini 3.1 Pro 目前处于断层领先的状态。
学习并掌握这些工具,不仅是为了提效,更是为了认知升级。2026 年是 AI 智能体全面商业化的时代,承认技术差距,是为了更好地利用技术杠杆。先掌握工具的人,才能在未来更好地驾驭工具,完成普通人的逆袭闭环。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)