数字人工作流教程,在之前就出过一期了。

但那一期,很多人找我说,不够保姆级教程,就连评论区的也有人这么说。

Image

Image

Image

Image

因此,我想出一期保姆级的教程,这也是我答应了兄弟们的,先说声抱歉,之前由于工作的关系,导致这篇文章迟来了两个月。

顺便吐槽一下,现在的工作真的牛马,不是加班,就是在加班的路上,干的心很累,而且某些行业已经在走下坡路了,懂得都懂。

所以兄弟们多看看 AI 吧,AI 具备很强的生产能力,很强的调用能力,以及很强的结构化能力。

它能在几秒调用过去互联网几十年的资料,然后采用结构化的能力,迅速生成一篇文章。

如果说兄弟们运营得当,比如说找到需要生产文章的应用场景,当然这个场景可商业化,那么采用 AI 的能力,满足这个场景的需要,是可以不断给兄弟们带来收益的,毕竟百倍提速呢。

好了,废话不多说,我们开始今天的教程吧。

需求分析

需求一:数字人可以减少运营的成本,它不需要去考虑真人形象的维护,比如说服装,化妆,场地租赁等等。

需求二:它可以作为客户等服务接待,全天候工作,不用休息,直接 7x24小时不间断。

需求三:降低本人出境,表现力不够的压力,有些人面对镜头说话就容易磕磕巴巴,但数字人不会这样。

整体流程分析

整体事件流程分析如下。

Image

整体 Coze 工作流程如下。

Image

生成数字人形象

方案一:本人出镜的话,我们直接在飞影数字人平台进行创建就可以了,进入工作流搭建教程。

Image

方案二:采用飞影数字人平台中的数字人,包括真人和 3D 人物形象。

Image

方案三:自己不敢/不好意思出境,但也不想用平台的数字人,想通过 AI 生成美美的数字人形象,可以参考以下这个方案

第一步,我们先打开即梦,点击生成,输入提示词,然后生成对应的数字人图片。

Image

我的提示词如下:

一位男性戴着黑框眼镜,发型利落,发色偏深,面部轮廓清晰,下颌线条分明。神情专注自信,目光正视镜头,呈现讲解或分享的状态。 
**服装特点:** 身穿高领黑色毛衣,版型挺括,左胸位置有一个简约的金属圆形徽章。整体着装保持简约正式的商务感。 
**背景:** 温暖的室内环境,右侧可见暖黄色墙壁,墙上隐约有抽象几何装饰画;左后方是玻璃窗,反射室内柔和光线。 
**灯光:** 顶部圆形吸顶灯散发暖黄光,均匀照亮面部与背景,避免强硬阴影。 
**氛围:** 突出专业、沉稳的质感,光线温馨不刺眼,人物与背景层次分明,传递知识分享或商务沟通的正式感。

第二步,把图片下载下来,然后在灵感处选择数字人,选择音频,然后点击生成数字人视频。

Image

注意:这里也可以生成那种 3D 卡通动漫, Q版,动漫,动画的图片,然后生成数字人的,大家可以自由发挥。

Image

第三步,在飞影数字人平台上面进行上传。

Image

保姆级工作流教程

第零步,工作流建立准备

注册登录什么的我就不讲了,这里直接从注册完账号开始将。

这一步我们首先进入工作空间,选择资源库,然后点击资源,选择工作流,输入工作流名称与工作流描述,创建工作流。

工作流名称和工作流描述大家可以根据自己的情况进行填写。

Image

第一步,开始

开始节点一共有四个参数,hifly_id (飞影数字人的 token),speaker_id(声音克隆ID),digital_human_id(克隆数字人的 ID),topic(视频内容的主题),这里我先解释一下这个四个参数的意思是什么,同时告诉你哪里获得这四个参数。

Image

hifly_id :飞影数字人的 token 。

Image

speaker_id : 声音克隆 ID,声音克隆可以自己上传。

Image

也可以直接使用飞影数字人平台的声音,我们只需要点击公告声音库,找一个自己喜欢的,然后复制它的声音 ID 就是 speaker_id 的值了。

Image

digital_human_id :克隆数字人的 ID

Image

第二步,生成文案(大模型节点)

这里的话我们直接采用大模型生成视频内容的主题,我这里的提示词是让大模型扮演商业认知的专家,输出商业认知的文案,大家可以根据自己情况更改。

这里我们设置输入参数 input,数据来源为开始节点的 topic ,设置输出参数为 output 为大模型输出的主题内容,选择 deepseek v3 模型。

值得注意的是:如果说你不想用 AI 生成的文案,你可以不用这一步,直接在开始节点设置一个参数就行了。

Image

该节点的系统提示词:
# 角色
你是一位资深的商业认知专家,凭借深厚的行业经验和敏锐的洞察力,为用户分享硬核商业知识、实用干货以及经典案例。

## 技能
### 技能 1: 分享商业知识
1. 当用户提出对商业知识的需求时,需明确用户想了解的具体领域,例如市场营销、财务管理、人力资源等。如果已经知晓用户需求领域,可跳过此步骤。
2. 运用丰富的专业知识储备,为用户详细阐述该领域的核心概念、理论和发展趋势。

### 技能 2: 分享商业干货
1. 了解用户在商业实践中遇到的具体问题或场景,比如如何提高销售业绩、怎样进行有效的成本控制等。
2. 根据用户问题,分享针对性的实用技巧、策略和方法,助力用户解决实际商业问题。

### 技能 3: 分享商业案例
1. 确认用户希望了解的案例类型,如成功案例、失败案例或特定行业案例等。若已掌握用户需求,无需重复询问。
2. 从众多商业案例中挑选具有代表性和启发性的案例进行分享,详细描述案例背景、面临的挑战、采取的解决方案以及最终成果,为用户提供可借鉴的经验和教训。

## 限制:
- 只讨论与商业认知相关的内容,拒绝回答与商业无关的话题。
- 所输出的内容需条理清晰、逻辑连贯,尽量简洁明了地表达关键信息。
- 确保分享的知识、干货和案例内容准确、客观,符合商业实际情况。 
该节点的用户提示词:
根据{{input}}生成口播文案

第三步,生成口播数字人(飞影数字人)

这个节点的叫飞影数字人,我们在添加插件处,直接搜索添加进去就行。

Image

这里我们设置该节点的几个参数,digital_human_id(克隆数字人的 ID),speaker_id(声音克隆ID),hifly_id (飞影数字人的 token),text(视频内容文本),他们的数据来源为开始节点,以及大模型的输出节点。

Image

第四步,循环

整个循环的作用,就是不断的查询数字人视频生成的一个状态是处于一个什么样的情况。

这里我们设置循环类型为无限循环。设置输出参数为 output,数据来源为 inspect_video_creation_status 节点的 video_Url,表示生成的视频链接。

Image

循环体:查询视频作品状态(飞影数字人)

这个节点是飞影数字人的 inspect_video_creation_status ,它的主要作用是查询生成数字人口播视频的状态。

这里我们设置两个参数,job_id,hifly_id,数据来源为 create_lipsync_video2 节点的 job_id,以及开始节点的 hifly_id。

Image

循环体:选择器

选择器的作用就是判断视频生成的一个状态是怎么样的。

如果 inspect video_creation status-status = 2,证明视频还没生成出来,等 10s 后再次进行循环检查视频的生成情况。

否则证明它已经视频作品,这个时候进入终止循环。

Image

循环体:定时器

定时器的作用就是当我们去检查视频作品的状态,它还没生成的时候,我们设置定时 10s 再次进行检查。

如果中间间隔的时间太多,一方面多次查询会浪费资源点,另一方面就是可能出现 bug。

Image

循环体:终止循环

当我们生成数字人视频了之后,我们就不再需要检查它的生成状态了,此时我们终止循环。

Image

第五步,结束

循环节点输出的内容为视频的链接,这里我们采用结束节点来获取这个链接。

Image

工作流运行成功后,我们可以在飞影数字人平台的“作品管理”中查看我们生成的数字人视频。

Image

总结

从需求分析到即梦生成图片,生成数字人视频,再到工作流的搭建,整个过程都有清晰的步骤。

如果说你跟着步骤还是出现搭建失败的情况,可以在评论区留言,我都会进行答疑的。

本期的内容就到这里了,感谢你的耐心。

如果看完喜欢,请帮忙转发分享一下,你的点赞转发,就是我更新下去的动力!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐