Agent Skill 开发实战:跟着口播剪辑学习 AI 工具开发

在这里插入图片描述
开源地址 :https://github.com/threelab/claude-mate-skills

先聊聊:这个课程能帮你做什么?

想象一下:你是一个口播博主,录完视频发现里面有好多"嗯、啊、那个、然后…",还有好几处说错了又重说的。如果手动剪辑,10分钟的视频可能要花20分钟去听、去找、去剪。

但如果有个工具能自动帮你做这些事呢?比如:

  1. 自动提取音频 - 从视频里把声音扒出来
  2. 语音转文字 - 告诉你每个字在第几秒说的
  3. 标记"废话" - 把语气词、停顿、重复的地方标出来
  4. 帮你预览 - 给你一个界面,让你看着文字来选择删什么
  5. 自动剪辑 - 根据你的选择生成新视频

这就是这个课程要带你做的事——开发一个智能的口播视频剪辑工具

更重要的是,你会学会如何把这些能力打包成一个 Agent Skill(智能技能包),让 AI 能理解你的需求并自动完成任务。


这个课程适合谁?

情况 能不能学
编程小白,从零开始 ✅ 完全可以,跟着做就行
只会一点点 JavaScript ✅ 够用了
录口播视频想提高效率 ✅ 最适合你
想学 AI 工具开发 ✅ 这是个很好的起点

你会学到什么?

通过做这个口播剪辑工具,你会掌握:

技术层面:

  • 怎么让电脑听懂人话(调用语音识别 API)
  • 怎么让电脑处理视频(FFmpeg 工具)
  • 怎么做一个网页界面(前端开发)
  • 怎么让网页和服务器对话(前后端交互)

思维层面:

  • 怎么把一个复杂问题拆成小步骤
  • 怎么设计让用户容易理解的界面
  • 怎么定义"规则"让 AI 帮你做决策

课程怎么安排的?

这个项目分成 5 个步骤,每个步骤都是独立的,但又一环扣一环:

第1步:搭建项目框架

就像装修房子前先搞清楚户型图。

  • 你想让这个工具做什么?(帮我剪口播视频)
  • 需要哪些"房间"?(配置区、工具区、界面区)
  • 每个"房间"放什么东西?

这一步不写太多代码,主要是搞清楚:我们要做什么、怎么分工


第2步:定规则和配置

就像开店前先定好"店规"。

  • 什么内容该删?(语气词、长停顿)
  • 什么内容不能删?(关键信息、完整句子)
  • 用户喜欢什么风格?(保守一点还是大胆一点?)

这一步很重要,因为规则定好了,AI 才有判断的依据

就像你招聘一个剪辑助理,得先告诉他:

"嗯、啊、那个"这样的词可以删;中间停顿超过2秒可以删;但是如果是口误后纠正了,保留后面那句就行。


第3步:让工具干活

就像招聘员工,给他们分配任务。

现在你需要两个"员工":

“员工” 做什么 现实中的类比
语音识别 API 听音频,告诉你每句话在第几秒 一个超快的速记员
FFmpeg 处理视频和音频文件 一个专业视频剪辑师

这一步我们会学习:

  • 怎么"雇佣"这些员工(申请 API Key、配置工具)
  • 怎么给他们发指令(写代码调用)
  • 他们出错了怎么办(错误处理)

第4步:做一个好用的界面

就像开实体店,得有个柜台让顾客来办事。

现在工具都准备好了,但用户怎么用呢?需要一个界面:

  • 用户能选择视频文件
  • 用户能看到处理进度
  • 用户能看到结果

这一步我们会做一个网页界面,就像你用过的那些在线工具一样。

你会学会:

  • 怎么让网页和电脑"说话"(前后端通信)
  • 怎么显示"正在处理中…"(状态管理)
  • 怎么处理"我想跳过这一步"(流程控制)

第5步:审核页面和发布

就像产品完工,再加点高级功能,然后摆上货架。

最后一步我们要做两个事:

  1. 做一个"审核页面" - 让用户看着每一句话,选择删哪些。就像你在 Word 里编辑文章一样,但它还能同步播放视频。
  2. 把项目打包好 - 让别人也能用你的工具,或者自己以后方便调用。

你会学会:

  • 怎么让文字和视频同步播放
  • 怎么做"选中/取消"的交互
  • 怎么把项目整理好,方便上传分享

用生活中的例子理解整个流程

假设你是一个小饭馆老板(这就是你的角色):

阶段 你在做什么 对应我们的项目
规划 我想开一家卖什么菜的店? 第1步:定义项目目标
定规则 客人点单后多久上菜?菜怎么做? 第2步:配置和原则
雇人 招聘厨师、服务员、收银员 第3步:集成工具和 API
店面 装修店铺、设收银台、菜单 第4步:做用户界面
优化 增加特色菜、搞好卫生 第5步:高级功能和发布

我们的"口播剪辑工具"就是这个饭馆:

  • 厨师 = FFmpeg(处理视频)
  • 速记员 = 火山引擎 API(转写文字)
  • 服务员 = 前端界面(和用户交互)
  • 厨师长 = 后端服务器(调度一切)
  • 菜谱 = 配置文件(规则和偏好)

这样是不是就好理解了?


学习建议

学这个课程的心态:

  1. 不要死记硬背 - 理解思路比记住代码重要
  2. 跟着做 - 看完一步就去实践一步
  3. 不懂就问 - 遇到问题是正常的
  4. 先跑起来再优化 - 先让工具能用,再想怎么用好

推荐学习顺序:

  1. 完整看一遍第1-2步(搞清楚"做什么"和"为什么")
  2. 边看第3-4步边跟着写代码
  3. 第5步独立完成,检验学习成果
  4. 用真实的口播视频测试一下你的工具!

准备好了吗?

如果你是一个:

  • 想提高剪辑效率的口播博主
  • 对 AI 工具开发感兴趣的学习者
  • 想从零开始做一个完整项目的开发者

那么…

👉 开始第1步:搭建项目框架

版权声明:http://mowanyan.com/

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐