一、引言

做PPT是每个职场人和学生的必修课。如果老板突然说明天开会要汇报,不少人只能对着空白幻灯片坐上三个小时,光排版就让人头疼不已。好不容易做完主体,想改个配色、调个布局,又得从头过一遍。市面上的AI PPT工具要么需要付费订阅,要么生成出来的东西“死板”——想微调一下甚至比重新做还麻烦。

Oh My PPT的出现正在改变这一局面。这是一款基于Electron+HTML技术构建的开源AI幻灯片生成与编辑工具,主打本地优先(Local-first)策略,所有AI生成与推理过程均在用户本地电脑运行,无需注册且完全保障数据隐私。项目由开发者arcsin1维护,在V2EX技术社区首发后迅速引发关注,目前已完全开源(无未开源组件),GitHub仓库地址为https://github.com/arcsin1/oh-my-ppt

Oh My PPT的在线交互式幻灯片带来了更现代化的演示方式,它不再限于静态的“下一页/上一页”切换,而是像网页一样支持滚动和鼠标悬停交互,让信息传递更直观更连贯。

二、项目概况与技术栈

Oh My PPT的技术架构由Electron桌面框架、Vue前端渲染和LLM(大语言模型)驱动三大部分构成。其核心技术参数如下:

技术维度 详情
桌面框架 Electron(跨平台桌面应用)
前端渲染 HTML/Vue,基于PPTist项目构建
LLM集成 支持OpenAI/Claude兼容协议(DeepSeek等)及本地模型(Ollama)
布局引擎 固定16:9画布 + 内容高度预算算法
开源协议 AGPL-3.0(强制衍生作品开源)
分发形式 桌面App + 在线HTML版本
内容生成 AI自动规划大纲、配色、排版,逐页渲染完整幻灯片
跨平台 Windows/macOS/Linux

在LLM集成方面,Oh My PPT采用了灵活的兼容层设计,支持两种AI模型连接方式:通过OpenAI/Claude兼容协议连接云端AI(如DeepSeek、通义千问等),或通过Ollama连接本地部署的开源模型,实现完全离线的本地AI生成。

三、产品定位:从“AI替代创作”到“人机协同”

Oh My PPT的产品逻辑并非简单用AI“替代”人类做PPT,而是将大模型定位为“智能设计师+高效排版工程师”,与用户形成协同创作的交互关系。AI完成从零到一的体力活,人类专注于修改和决策——这种“人机协同”模式正是当前AI创作工具最被认可的设计方向。

这一设计哲学的核心在于:“生成不是终点,改才是”

四、核心功能技术拆解

4.1 AI驱动的幻灯片生成

用户打开软件后选择“快速创建”,输入主题和需求(如“产品季度汇报,5页,数据驱动风格”),AI自动完成以下步骤:

  1. 大纲规划:根据主题和页数要求,生成逻辑清晰的演示结构

  2. 配色与排版:从内置风格库中选择或自动匹配最适合的视觉方案

  3. 逐页内容渲染:按大纲逐页生成包含标题、正文、图表、图片等元素的完整幻灯片

对于已有文档素材的场景,Oh My PPT支持上传txt、md、csv、docx等多种文档格式(单个文件不超过80MB),软件自动提取文档内的主题和关键内容,按原文档的思路生成PPT。

4.2 可视化拖拽编辑器

Oh My PPT的编辑器并非传统PPTX格式的简化版,而是基于HTML技术构建的Web原生编辑器。幻灯片页面上所有元素——文字、图片、图表、卡片——全部支持可视化拖拽:用户可以直接用鼠标拖拽移动位置、缩放大小,完全无需了解任何代码。

4.3 对话式修改机制

对话式修改是Oh My PPT最具差异化的交互特性。用户可以选中某一页,直接对AI说“标题换个颜色”或者“加个数据图表”,AI能够精准理解修改意图并在保持整体布局不变的前提下完成修改。在技术实现上,对话式修改采用上下文感知机制:用户选中的页面元素会被作为修改上下文发送给LLM,LLM根据上下文和用户指令生成精确的修改操作,而非重新生成整页内容。

4.4 30+内置风格与设计稿识别

软件内置了30多种PPT风格模板,覆盖极简白、赛博霓虹、包豪斯、日式简约、小红书风等主流风格。如果现有风格无法满足需求,用户还可以上传一张设计稿截图,AI会自动提取配色、字体、版式等视觉特征,生成专属风格。

这一功能需要支持多模态模型的AI才能实现,包括视觉编码器提取视觉特征和LLM生成结构化设计规范两个步骤。

4.5 固定画布与布局可靠性

Oh My PPT采用固定16:9画布配合内容高度预算算法,确保生成的幻灯片在各类设备上保持一致的视觉效果。这一机制有效减少了内容溢出问题,解决了传统AI幻灯片工具“内容超出画面”或“排版松散”的痛点。固定画布还支持响应式幻灯片效果,在不同屏幕比例下自动调整内容大小与排列方式。

五、技术架构深度剖析

5.1 Electron桌面应用架构

Oh My PPT采用Electron框架构建跨平台桌面应用,基于Chromium + Node.js的双进程架构:

  • 主进程(Main Process) :负责窗口管理、系统托盘、文件系统访问、LLM推理调用等底层操作

  • 渲染进程(Renderer Process) :负责Vue驱动的UI界面、拖拽编辑器、幻灯片预览等交互层

  • 进程间通信(IPC) :主进程与渲染进程通过Electron IPC机制进行消息传递,实现AI生成结果从推理层向交互层的实时同步

5.2 HTML幻灯片的Web化能力

与传统的PPTX格式文件不同,Oh My PPT基于HTML技术构建幻灯片,这意味着它能够利用Web生态的全部能力——CSS动画、JavaScript交互、SVG矢量图形、Web字体等——为幻灯片赋予更丰富的视觉表现力。

从技术架构来看,Oh My PPT是对PPTist(一个开源的Vue PPT编辑器)的二次开发,在其基础上集成了LLM调用能力和AI驱动的布局生成模块。

5.3 本地优先的隐私策略

所有AI生成与推理过程均在用户本地电脑运行,无需注册账号,也无需将数据上传到任何云端服务器。开发者明确表示该项目已完全开源,无未开源组件,供社区监督与使用。这一策略对于处理商业机密、企业内部数据等敏感内容的用户群体尤为重要。

5.4 内容高度预算算法

内容高度预算算法在生成前预先计算每个元素在16:9画布中所占的空间比例,通过动态调整字体大小、图片尺寸和间距来确保所有内容严格适配幻灯片边界,解决了传统AI PPT工具“内容溢出”或“排版松散”的痛点。

六、与同类工具对比分析

对比维度 Oh My PPT Gamma Beautiful.ai 传统AI PPT工具
运行方式 本地优先 纯云端 纯云端 云端为主
数据隐私 数据不出本机 需上传云端 需上传云端 需上传云端
编辑器 拖拽+对话式修改 模板化 自动排版 模板化或半自动
AI连接 支持本地模型(Ollama) 自有模型 自有模型 自有模型
风格数量 30+,支持自定义 多模板 自动生成 固定模板
导出格式 HTML/PDF PDF/PPTX PPTX/PDF PPTX
价格 完全免费开源 付费 付费 付费/免费额度
开源情况 ✅ AGPL-3.0开源 ❌ 闭源 ❌ 闭源 ❌ 闭源

Oh My PPT的“纯本地运行”策略,在数据隐私和成本控制方面具有显著优势,尤其适合对数据安全有严格要求的商业场景。

七、总结

Oh My PPT在产品设计上最值得关注的一点在于:它没有试图用AI“替代”用户的创作过程,而是将AI定位为“排版工人”和“设计助手”——AI完成从零到一的体力活,用户通过拖拽和对话完成修改和决策。

这一设计哲学解决了当前AI PPT工具的两个核心痛点:

  1. 生成后无法灵活修改:对话式修改和可视化拖拽编辑器赋予用户充分的控制权,而非只能“接受或重来”

  2. 模板化导致千篇一律:30+风格与自定义设计稿识别,让每个用户都能找到自己需要的个性化视觉方案

从技术架构上看,Electron + Vue + LLM的组合为同类工具的研发提供了一个值得参考的实践样本。而对于普通用户来说,无论你是做汇报、做路演、做课件还是做简历,这款完全免费、纯本地运行的开源工具都值得一试。

🎁 配套资源

为了方便各位开发者快速上手,笔者已将Oh My PPT的官方下载指引整理打包:

夸克:https://pan.quark.cn/s/a440237b2ba6
百度:https://pan.baidu.com/s/19r070XgQTNQmFxOQ2ydA1w?pwd=8888

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐