VibeCoding 是近两年兴起的概念,最早由 Andrej Karpathy 提出。它描述的是这样一种编程状态:你用自然语言描述需求,AI 帮你生成代码,你的角色从「打字员」变成了「指挥官」。

这个概念的背景是:大模型代码生成能力已经足够强,Claude Code、Copilot 这类工具已经能听懂人话并写出可用代码。编程的瓶颈从「会不会写」变成了「能不能快速把想法说出来」。

SaySo 在这个场景里解决的是什么

SaySo 是一款 Mac/Windows 上的 AI 语音输入法,核心能力是自然语音实时转写加 AI 自动编辑。它在 VibeCoding 场景下的用法是这样的:

你在 Claude Code、Copilot Chat 这类 AI 编程工具的对话框里,用语音输入自然语言需求,SaySo 把你说的转成文字填进对话框,AI 收到完整指令开始写代码。

也就是说,SaySo 在这里扮演的是**语音输入法**的角色,不是代码生成器。它解决的不是「AI 能不能写出好代码」的问题,而是「你能不能快速把需求说给 AI 听」的问题。

我之前的输入方式有什么问题

在 Claude Code 这类工具里,你需要在对话框中输入自然语言描述需求。传统的做法是键盘打字,但这里有一个很实际的痛点:

你脑子里想的和你打出来的之间有个速度差。你一边组织语言一边打字,手指头的动作总是在拖大脑的后腿。这个速度差带来的结果是,你打字的会偷懒,指令描述得不够完整,AI 收到的信息不完整,写出来的东西就要来回改。

还有一个割裂的问题是,Claude Code 自带语音输入也可以用,但它的语音模式是独立于编辑器工作的。你用语音让 AI 写了一个函数,它写完了,你要切换到编辑器去看代码在哪里,这个切换是很打断思路的。

SaySo 的用法是,它作为一个全局的语音输入法,在任何应用里都能把语音转成文字填进去。你在 Claude Code 的对话框里用它,在终端里用它,在飞书文档里用它,一个工具多个场景通用,不需要改变任何使用习惯。

实际效果对比

场景一:函数级别的需求描述

这是我目前用得最多的场景。

键盘输入的情况:

我打开 Claude Code 的对话框,开始敲字「write a function that takes a file object and validates if it's an image format...」,打了三分钟才把需求描述完,AI 开始写代码,我再花两分钟调整细节。总耗时五分钟以上。

语音输入的情况:

我打开 SaySo,打开 Claude Code,直接说「写一个函数,接收一个文件对象,验证是否是图片格式,如果是的话就保存到 uploads 目录,返回文件路径,如果验证失败就抛出一个类型错误的异常」。说完 AI 立刻开始写,我看了下结果,基本一次过,总耗时不到两分钟。

这个差距不是打字速度的差距,是**指令质量**的差距。语音输入的时候你想怎么说就怎么说,指令描述得完整清晰,AI 收到的是完整信息,不需要来回纠正。

场景二:代码评审

代码评审的时候,你脑子里想的是「这个地方有什么问题」,但你同时还要想「这个问题我应该怎么措辞」。

语音输入把这两件事解耦了。你直接对着电脑说评审意见,SaySo 帮你转写成规范的评审文本,你直接复制粘贴到 GitHub PR 评论里:

语音输入:第一个问题,这个函数的命名不规范,应该用小驼峰。第二个问题,缺少参数校验,如果传入空值会报错。

转写结果:1. 命名不规范:应使用小驼峰命名法。2. 缺少参数校验:建议增加参数校验逻辑。

场景三:调试时的即兴分析

调试的时候你一边想一边说,AI 帮你分析可能的原因。比如你对 Claude Code 说「这个变量为什么会是 undefined,它在上一个函数里明明赋值了」,SaySo 转写进去,Claude Code 帮你分析作用域问题。这种即兴的思考过程,用语音输入比打字自然得多。

准确率和解决方案

语音输入代码需求的准确率不是 100%,有以下几个实际的挑战。

挑战一是中英混搭。Claude Code 是英文界面,但我说需求的时候是中文为主偶尔夹杂英文术语,比如「写一个 function 叫 calculateSimilarity」。SaySo 对中英混搭的识别有时候会跳。解决方案是编程术语尽量说英文,或者把术语加到独家词库里。

挑战二是长指令。超过一分钟的指令不适合一口气说完,说久了会口干,而且 AI 收到超长指令有时候会理解偏差。超过一分钟的需求我会拆成几条,分开说。

挑战三是环境噪音。这个是物理限制,不展开说了。

什么场景不适合

第一个是超长需求。一口气要说五分钟那种,打字或者拆成几条分开说。

第二个是精确数值描述。「把第 23 行的 i 改成 j」这种精确信息,语音输入不如打字。

第三个是公开场合。周围有人的时候对着电脑说五分钟代码需求,还是挺尴尬的。

工具组合推荐

目前我的 VibeCoding 工具链是这样的:

SaySo 作为语音输入法,负责把需求从语音转成文字,填进 AI 编程工具的对话框里。

Claude Code 或 Copilot Chat 作为 AI 编程引擎,收到完整指令后生成代码。

VS Code 作为主战场,处理日常开发和代码管理。

这个组合的核心逻辑是:你的嘴巴对接 AI 的大脑,SaySo 负责中间的转译工作,你来当决策者和审核者。

总结

VibeCoding 的本质是让 AI 处理代码执行层的事情,人来把控方向和审美。SaySo 在这个体系里扮演的角色,是让你「动口不动手」这件事变得完整——你不需要拿起键盘来跟 AI 说话,你直接说,AI 直接听。

打字是输入环节的瓶颈。如果你在 VibeCoding 过程中感觉表达速度跟不上思维速度,试试语音输入这个解法。

官网:https://www.sayso.cn/

我的邀请码:LW8J528A

希望能对大家有帮助!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐