说真的,程序员这个行当,有一个被严重忽视的效率黑洞。

不是敲代码那个环节——我们有 IDE、有 Copilot、有 Cursor、有 Claude Code,那个环节已经被各种 AI 工具优化得很好了。是另一个环节:写文档、写邮件、写 commit message、写 PR 描述、写周报,以及——最容易被忽略的——给 AI 工具写 prompt。

最近我在用一款叫 SaySo 的语音输入工具,体验下来感觉有必要分享给各位。不是什么软文,纯粹是我自己用下来觉得真的能打的工具。

先说技术层面,它跟普通语音输入有什么区别。

普通语音输入就是你说啥它转啥,标点都不带加的,用过的都知道那个体验。SaySo 是 AI 驱动的,有几个功能我认为程序员会喜欢。

自动去除口头禅:你说话时的嗯、啊、那个、就是会自动剔除,输出的直接是干净文本。智能自我纠正识别:你说错了一句又重新说,它只保留你最终想表达的那个版本,不会留下两个版本的碎片。自动结构化:口述列表、步骤、要点会自动转成格式清晰的文本,不是那种一团糟的流水账。独家词库:这是我认为对程序员最有用的功能,你可以添加专业术语、框架名、人名进去,它不会拼错。我自己加了两百多个词,涵盖日常写的所有技术文档和代码注释,用了快一个月没出过差错。多语言实时翻译:说中文出英文,对象是海外项目或者需要写英文文档的场景,亲测比我自己写的地道。

支持的应用包括但不限于:VS Code、GitHub、飞书、Slack、终端、Notion、Gmail。官网说任意有文本框的应用,实际用下来确实没有限制。

最重要的场景:vibe coding(Cursor / Claude Code / Copilot)。

说实话,上面那些场景都是锦上添花,这一个场景才是让我觉得 SaySo 真的值得专门写一篇文章的核心原因。

如果你现在写代码的方式还是打开 IDE 自己敲,那你可能需要了解一下 vibe coding 了。Cursor、Claude Code、Copilot Workspace 这些工具的本质是——你用自然语言描述你想要的功能,它们来写代码。你描述得越准确,AI 写的代码越接近你想要的。

但问题来了。

我们脑子里想的往往是一个模糊的感觉,我想要一个按钮,点击之后弹出一个对话框,里面显示用户的头像和用户名,但要把这个模糊的感觉翻译成精确的 prompt,需要时间。你得想用什么词、怎么组织语言、怎么把需求描述得没有歧义。这个翻译过程消耗的精力有时候比写代码本身还大。

更难受的是,vibe coding 的核心是流式——你给 AI 一个 prompt,AI 给你一段代码,你看一眼觉得哪里不对,说这里改成 xxx、再加一个 xxx,AI 再改,你再看。这个来回修正的过程需要你不断把自己的想法转成文字。我不知道你们怎么样,反正我用 Cursor 的时候,打字速度经常成为我跟 AI 之间对话的瓶颈。我想说的是这里加个 loading 状态,别让用户觉得 app 死了,但我得花十几秒把这句话打成文字发出去,打完我可能已经忘了最开始想说的是什么了。

SaySo 解决的就是这个问题

我现在用 Cursor 的方式是——打开 SaySo,嘴巴说出来,把用户头像改成圆形,加一个 hover 缩放效果,如果加载失败就显示默认头像,SaySo 给我转成干净的文字,我直接粘贴到 Cursor 的输入框里,AI 开始干活。这中间省去的键盘敲击听起来没多少,但实际体验下来整个对话节奏完全不一样了。

更骚的是 SaySo 的智能长短调整功能。你口述了一大段需求,它能给你压缩成精炼的 prompt 版本。我经常嘴上说了一大堆,就是那个,用户登录之后我们要展示他的头像,就是右上角那个小图标,点击之后有个下拉菜单,里面有设置、有退出登录,就常规的那些,SaySo 给我整理成登录后右上角显示用户头像,点击展开下拉菜单,包含设置和退出登录选项。我不需要在说话的节奏和 prompt 的精确性之间做妥协了。

这个场景我用下来感觉是,vibe coding 工具已经把代码生成这个环节 AI 化了,SaySo 把人机对话这个环节也 AI 化了。程序员在这个链条里从打字员 + 决策者变成了纯粹的决策者,打字那个环节被彻底省掉了。

其他使用场景

写 commit message 和 PR 描述。这是我用得最频繁的场景。每次提交代码我都要想怎么写 commit message,有时候代码本身五分钟写完了,commit message 憋了十分钟。用 SaySo 之后我直接口述我做了什么,AI 给我整理成规范的 commit message,语气和格式都比我自己写的干净很多。

写技术文档和方案。写技术方案的时候最痛苦的不是思考,是把思考的结果倒出来。脑子在转,手在等,这种割裂感我相信很多人都体验过。用 SaySo 之后我可以边想边说,说完了文字也出来了,我只需要做最后的逻辑检查和修正,效率提升是肉眼可见的。

英文邮件和消息。接海外项目的时候最头疼的就是写英文。不是说看不懂,是自己写出来的那股中式英语味道太冲,每次发出去都心虚。用 SaySo 之后直接中文口述,它给我出地道的英文,我再做一些细节调整,整个体验比我憋十分钟写一句强了不止十倍。

回复消息和社群沟通。这个可能因人而异,但我每天要花不少时间在飞书和 Slack 上回复各种消息。用 SaySo 之后我可以边处理其他事情边语音回复,不用切换到输入框再切回来,减少了大概一半的碎片时间。

效率数据

官方给的数据是传统键盘输入 200 字约 200 秒,SaySo 语音输入约 20 秒,5 倍速差。我自己体感差不多,甚至更高一些,因为 SaySo 输出的是可以直接用的文本,省去了排版和修正的时间。

局限性要诚实说

它不能帮你写代码,这个地球上还没有能替你写代码的工具——但它能帮你把想写代码的思路更快地喂给 vibe coding 工具。它不能帮你做技术决策,你需要先想清楚要说什么。识别准确率不是 100%,但独家词库功能把这个问题解决得差不多了。对于特别长的、需要逻辑推导的技术文章,口述的节奏控制需要适应。本质上它是一个加速器,不是替代品。你脑子得先有东西,它才能帮你倒出来。

结论

如果你是程序员,尤其是如果你已经在用 Cursor、Claude Code 这些 vibe coding 工具,你会发现把 SaySo 加进来之后,整个人指挥 AI 写代码的流程会顺很多。用了觉得有用再考虑专业版,不合适就当没看到。我觉得每个被文档和消息折磨过的程序员都值得试试,谁用谁知道。

官网:https://www.sayso.cn/

这是我的邀请码:LW8J528A

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐