摘要:PPT Master 是一个开源工具,能把 PDF、网页、Word 等任意文档转换成原生可编辑的 PowerPoint 文件。不是图片,是真正的形状、文本框、图表。本文深度拆解它的技术路线、使用方法,以及它到底值不值得你花 15 分钟配置。


我被 AI PPT 工具"坑"过

说一个真实场景:你花 30 秒把一份 PDF 丢进某款 AI PPT 工具,10 秒后拿到了一份颜值不错的演示文稿。

如果你想打开 PowerPoint,改一行字。

你会发现,点不进去。那不是文字,是图片。

这个问题几乎所有主流 AI PPT 工具都有。

Gamma 生成的是网页渲染;Canva AI 导出的是图片嵌套;用 ChatGPT 生成 python-pptx 代码,布局是枯燥的文本框堆叠;NanoBanana 和 GPT-Image-2 虽然生成的PPT样式好看,但终究也只是图片。颜值和可编辑性,好像永远只能二选一。

直到我看到 PPT Master 这个项目。


这是什么?

PPT Master 是一个开源项目,GitHub 地址 hugohe3/ppt-master,目前已有 10600+ Star,MIT 开源协议。

一句话描述:丢进一份文档(PDF、DOCX、URL、Markdown),AI 生成一份能在 PowerPoint 里直接点击编辑的 .pptx 文件。

"能编辑"这三个字,这个项目是认真的——每个形状、文本框、渐变、阴影都是 DrawingML 原生对象,不是嵌入的图片,不需要"转换为形状",点哪改哪。

它的作者叫 Hugo He(何雨果),是一位金融从业者(CPA + 投融资咨询工程师)。他自述道:

"我每天都在做 PPT。现有的 AI 工具导出的是图片,作为每天要审阅、修改几十份演示文稿的人,这是不可接受的。我想要真正的 DrawingML——点任何元素,直接修改,就像手工做的一样。"

一个用业务痛点驱动的开源项目,通常比"技术驱动"的项目更知道用户要什么。


核心技术路线:为什么别人做不到,它做到了

这里值得展开说,因为技术路线决定了为什么这个工具的输出质量能这么高。

市面上主流 AI PPT 工具的三条路

路线一:贴图片把每页渲染成图片嵌进 PPTX。看起来精美,但文字不可选,颜色不可改,缩放模糊——本质是截图。

路线二:HTML/CSS 渲染Gamma、Tome 这类工具在浏览器里效果很好,但 HTML 是文档流,PPTX 是画布,导出时布局走样、字体丢失、元素被压扁是家常便饭。

路线三:python-pptx 直接生成ChatGPT 之类用代码构建 PPTX,元素可编辑,但 AI 缺乏生成复杂设计的"训练数据",只能做基础文本框+列表,颜值惨不忍睹。

PPT Master 走的第四条路:AI 生成 SVG → 脚本转 DrawingML

这条路能走通的核心洞察是:SVG 和 DrawingML 本质上是同一类东西。

两者都是基于绝对坐标的 2D 矢量格式,矩形、路径、渐变、阴影的概念一一对应。把 SVG 转成 DrawingML 是"方言翻译",不是格式跨越。

整个工作流大致如下:

输入文档(PDF/DOCX/URL)
    ↓
[预处理] 文档转 Markdown
    ↓
[内容分析] AI 提取结构、要点、数据
    ↓
[视觉生成] AI 逐页生成 SVG(这是设计稿)
    ↓
[后处理] Python 脚本将 SVG 转换为 DrawingML
    ↓
输出:原生可编辑 .pptx(+ SVG 参考版)

AI 负责设计(它很擅长生成 SVG),Python 脚本负责工程化转换(精确可靠)。两者各司其职,组合出这个效果。


它是怎么工作的?——不是一个独立 App

这里有个关键点要说清楚:PPT Master 不是一个独立应用程序,而是一个在 AI IDE 里运行的"工作流"(Skill)。

你在 Claude Code、Cursor、VS Code + Copilot 等工具的对话框里告诉 AI:"帮我把这个 PDF 做成 PPT",AI 就会按照 PPT Master 定义的工作流执行,在你本地生成文件。

这个设计决定了几件事:

  • 数据本地化:你的文件不离开你的电脑,唯一的外部通信是你和 AI 编辑器之间的对话

  • 不绑定模型:Claude 系列效果最好(原生支持 Opus),但 GPT、Gemini、Kimi、MiniMax 同样可以驱动

  • 成本透明:PPT Master 本身免费,只花 AI 编辑器的费用。用 VS Code Copilot 最低 $0.08/份 PPT,即使用 Claude API 直接调用也大约 $5 左右一份


快速上手:15 分钟从零到一份 PPT

第一步:安装 Python 环境

# 克隆仓库
git clone https://github.com/hugohe3/ppt-master.git
cd ppt-master

# 安装依赖
pip install -r requirements.txt

Windows 用户注意:官方提供了专门的 Windows 安装指南,主要是 PATH 配置和执行策略的设置,跟着走大概 10 分钟搞定。

安装指南地址:https://github.com/hugohe3/ppt-master/blob/main/docs/windows-installation.md

第二步:选择 AI 编辑器

工具

推荐程度

备注

Claude Code

⭐⭐⭐

最佳效果,原生 Opus,上下文最大

Cursor / VS Code Copilot

⭐⭐

效果不错,成本更低

Codebuddy IDE

⭐⭐

国产模型(Kimi、MiniMax)首选

第三步:丢进去,聊出来

把你的素材(PDF、DOCX、图片等)放进 projects/ 目录,然后在 AI 对话框里说:

帮我把 projects/q3-report/report.pdf 做成一份 PPT

AI 会先确认设计规格:

好的,确认一下设计方案:
[模板] 自由设计
[格式] PPT 16:9
[页数] 8-10 页
...

然后它会自行处理:内容分析 → 视觉设计 → SVG 生成 → PPTX 导出。

最终在 exports/ 目录下生成两个文件:

  • presentation.pptx:原生可编辑版(推荐)

  • presentation_svg.pptx:SVG 参考版(视觉对比用)


能输入什么格式?

几乎什么都能喂:

  • 文档:PDF、DOCX、PPTX、EPUB

  • 网页:任意 URL、微信公众号文章链接

  • 标记语言:Markdown、HTML、LaTeX、RST

  • 直接粘贴:把文本内容直接贴到对话窗口里

这对有大量存量文档的用户来说很实用——季报、研究报告、技术文档,直接扔进去。


实际效果怎么样?

官方提供了 15 个项目,229 页示例,涵盖的风格包括:

  • 杂志风(暖色调,图片丰富)

  • 学术报告风(结构化,数据驱动)

  • 暗色艺术风(暗色背景,高对比)

  • 自然纪录片风(沉浸式摄影,极简 UI)

  • SaaS 产品风(白色卡片,定价表)

  • 产品发布风(高对比,规格高亮)

作者在 README 里展示了一个具体案例:用一篇微信公众号文章 URL 作为输入,通过 Claude Opus 4.7,端到端生成了一份 12 页的完全可编辑演示文稿——每个形状、文本框、图表都可以直接在 PowerPoint 里点击修改。


不藏着掖着:它的局限在哪里

这个项目的作者在文档里非常坦诚地列出了短板,我觉得这点值得尊重:

短板

实际影响

需要配置

安装 Python + 配置 AI IDE,大约 15 分钟,有一定门槛

生成较慢

10 页大概需要 10-20 分钟,串行生成保证跨页一致性

无可视化界面

全部通过 AI 对话操作,没有拖拽画布

无实时协作

本地文件,无分享链接,无多人共编

图表非数据绑定

图表是矢量形状,不是 Excel 关联对象,无法动态更新数据

如果你要零配置、浏览器里秒出幻灯片,那么 Gamma 和 Canva 是你更好的选择。

但如果你要原生可编辑、成本可控、数据本地化、不被平台锁定——这就是 PPT Master 解决的问题。


我的判断:适合谁用

强烈推荐的场景:

  • 投融资、咨询、法律等需要频繁把长文档转成高质量演示文稿的从业者

  • 有大量存量 PDF/报告,需要批量制作可编辑 PPT 的团队

  • 对数据隐私敏感,不希望文件上传到第三方服务器的用户

  • 已经在用 Claude Code / Cursor 的开发者(几乎零额外学习成本)

  • 想要最低成本($0.08/份)生成专业演示文稿的个人

可能不适合的场景:

  • 需要立刻出稿,不想等 10-20 分钟的急用场景

  • 需要团队实时协作的场景

  • 不熟悉命令行、不想装 Python 的用户


最后说几句

PPT Master 让我觉得有意思的地方,不只是技术方案本身,而是它出现的背景。

AI PPT 工具这个赛道并不缺玩家,国内外都有,有大厂的、有融了几千万的、有免费的、有按月订阅的。但它们大多数选择了"快速出图"的路线,因为这条路短期内产品体验更好,毕竟几秒钟出结果,比十几分钟更有"哇塞"效果。

PPT Master 选择了一条更硬的路:做真正可编辑的 PowerPoint。这条路更难,慢,也没有那么酷炫的演示效果,但它解决的是一个真实的专业痛点。

一个每天做 PPT 的金融从业者,因为受不了现有工具的局限,花时间打磨出了一个开源方案。

这本身就是一个很好的开源故事。

GitHub:https://github.com/hugohe3/ppt-master

在线示例:https://hugohe3.github.io/ppt-master/

你试过 AI 生成 PPT 吗?遇到过哪些问题?欢迎评论区聊聊。

我是顾北,关注我,获取更多好玩有趣的AI制作PPT技巧!

谢谢你阅读我的文章~

我们下期再见!

PS:本文部分内容由AI辅助创作

推荐阅读

上篇的续集来了!6个更炸裂的AI生成PPT提示词,附NoteBookLM隐藏玩法(二)

做PPT做到想哭?7种爆款PPT风格提示词,让你5分钟出大厂级效果,全部免费用!(一)

谷歌NotebookLM最强平替?国产这波杀疯了,免费一键生成PPT太香了!

别再熬夜做PPT了!谷歌NoteBookLM + Lovart,全自动生成各种交付级PPT(附保姆级教程)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐