前言

作为一名工作 5 年的后端开发,我每天的工作内容大概是这样的:写代码 40%、写文档 30%、开会沟通 20%、Code Review 和回复消息 10%。最近半年,我发现自己的手腕开始隐隐作痛,去医院检查说是长期敲键盘导致的腱鞘炎早期症状。

医生建议减少打字时间,但这对程序员来说几乎不可能。我开始寻找替代方案,试过系统自带的语音输入、讯飞输入法、甚至 GitHub Copilot 的语音功能,但体验都不理想。直到最近接触到 SaySo 这款 AI 语音助手,用了一个月后,我觉得有必要写一篇详细的测评。

本文将从开发者视角,测试 SaySo 在实际编程工作流中的表现,包括代码注释、文档编写、技术沟通等场景。

一、产品概述

1.1 基本信息

1.2 技术特点

SaySo 不是简单的 ASR(Automatic Speech Recognition)工具,而是结合了 NLU(Natural Language Understanding)和 LLM 的智能语音助手。其核心技术指标:

  • 语音识别延迟:0.4 秒(端到端)

  • 支持语言:100+ 种

  • 场景识别:基于应用上下文的智能适配

从技术架构看,SaySo 采用了“语音识别 → 意图理解 → 文本生成 → 格式优化”的四层处理流程,这是它与传统语音输入的本质区别。

二、开发场景实测

2.1 代码注释编写

测试场景:为一段 Python 函数添加注释

我说的话

这个函数的作用是,嗯,计算用户的,那个,活跃度得分,它会根据,呃,登录次数、发帖数量和评论数量来计算,然后返回一个 0 到 100 的分数

SaySo 输出(在 VS Code 中):

"""
Calculate user activity score based on login count, post count, and comment count.
Returns a score between 0 and 100.
"""

评价

  • ✅ 自动过滤了口语词(嗯、那个、呃)

  • ✅ 识别到在 VS Code 中,自动输出英文注释

  • ✅ 格式符合 Python docstring 规范

  • ❌ 没有自动生成参数说明和返回值类型(需要手动补充)

对比传统语音输入
系统自带的语音输入会原封不动输出“这个函数的作用是嗯计算用户的那个活跃度得分……”,完全不可用。

2.2 技术文档编写

测试场景:编写 API 接口文档

我说的话

这个接口是用户登录接口,请求方法是 POST,路径是 /api/v1/login,需要传两个参数,username 和 password,都是字符串类型,成功返回 token,失败返回错误码

SaySo 输出(在 Notion 中):

## 用户登录接口

**请求方法**:POST  
**请求路径**:/api/v1/login

**请求参数**:
- username (string): 用户名
- password (string): 密码

**返回结果**:
- 成功:返回 token
- 失败:返回错误码

评价

  • ✅ 自动识别到在 Notion 中,输出 Markdown 格式

  • ✅ 自动结构化信息,生成标题和列表

  • ✅ 格式规范,可以直接使用

  • ✅ 比手动打字快了至少 5 倍

2.3 Git Commit Message

测试场景:编写 Git 提交信息

我说的话

修复了用户登录时,那个,如果密码包含特殊字符会导致,呃,验证失败的问题

SaySo 输出(在终端中):

fix: resolve login validation failure when password contains special characters

评价

  • ✅ 自动识别到在终端环境

  • ✅ 符合 Conventional Commits 规范

  • ✅ 自动翻译成英文

  • ✅ 语言简洁专业

这个场景特别实用,因为很多开发者(包括我)写 commit message 时经常偷懒,用 SaySo 可以快速生成规范的提交信息。

2.4 代码审查评论

测试场景:在 GitHub PR 中添加 Review 评论

我说的话

这里的逻辑有问题,如果用户列表为空的话,会抛出空指针异常,建议加一个判空处理

SaySo 输出

This logic has an issue: if the user list is empty, it will throw a NullPointerException. 
Suggest adding a null check before processing.

评价

  • ✅ 自动翻译成英文(我们团队是国际化团队)

  • ✅ 表达专业且礼貌

  • ✅ 比打字快很多,尤其是在需要写长篇 Review 时

2.5 技术方案文档

测试场景:编写技术方案的架构设计部分

我说的话

我们采用微服务架构,把系统拆分成用户服务、订单服务和支付服务三个模块,它们之间通过 RPC 调用,用 Redis 做缓存,MySQL 做持久化存储,然后用 Kafka 做消息队列来处理异步任务

SaySo 输出(在 Markdown 编辑器中):

## 架构设计

采用微服务架构,系统拆分为以下模块:

- **用户服务**:负责用户管理相关功能
- **订单服务**:负责订单处理流程
- **支付服务**:负责支付接口对接

**技术选型**:
- 服务间通信:RPC
- 缓存层:Redis
- 持久化存储:MySQL
- 消息队列:Kafka(处理异步任务)

评价

  • ✅ 自动结构化信息

  • ✅ 补充了每个服务的职责说明

  • ✅ 格式清晰,层次分明

  • ⚠️ 有时候会过度优化,需要手动调整

三、效率对比测试

为了量化 SaySo 的效率提升,我做了一组对比实验:

3.1 测试任务

编写一份包含以下内容的技术文档:

  • 项目背景(200 字)

  • 技术方案(300 字)

  • 接口设计(3 个接口的详细说明)

  • 数据库设计(5 张表的字段说明)

3.2 测试结果

方式

耗时

字数

修改次数

手部疲劳度

纯键盘输入

48 分钟

1200 字

12 次

⭐⭐⭐⭐⭐

系统语音输入 + 手动修改

35 分钟

1200 字

23 次

⭐⭐⭐

SaySo 语音输入

15 分钟

1200 字

5 次

结论

  • 效率提升:3.2 倍(48 分钟 → 15 分钟)

  • 修改次数:减少 58%(12 次 → 5 次)

  • 手部疲劳度:显著降低

3.3 不同场景的效率分析

场景

键盘输入

SaySo

效率提升

代码注释

2 分钟/函数

30 秒/函数

4x

API 文档

10 分钟/接口

3 分钟/接口

3.3x

Git Commit

1 分钟

15 秒

4x

Code Review

5 分钟/评论

1.5 分钟/评论

3.3x

技术方案

1 小时

20 分钟

3x

平均效率提升:3.5 倍

四、优势与不足

4.1 核心优势

1. 场景智能适配

这是 SaySo 最大的亮点。它能识别你当前使用的应用,自动调整输出风格:

  • 在 VS Code / IntelliJ IDEA 中:输出简洁的英文注释

  • 在 Notion / Markdown 编辑器中:输出结构化文档

  • 在 Slack / 钉钉中:保持口语化表达

  • 在终端中:输出命令行风格的简短文本

2. 中英文混合输入

作为开发者,我们经常需要中英文混合输入(比如中文解释 + 英文代码)。SaySo 在这方面表现很好:

输入:“这个函数使用了 binary search 算法来查找元素”
输出:“该函数使用了 binary search 算法来查找元素”

不会把 “binary search” 错误识别成中文或者拆分开。

3. 技术术语识别

测试中发现,SaySo 对常见技术术语的识别率很高:

  • ✅ Redis、MySQL、Kafka、Docker、Kubernetes

  • ✅ RESTful、GraphQL、gRPC、WebSocket

  • ✅ JWT、OAuth、HTTPS、SSL

  • ⚠️ 一些小众框架可能识别不准(如 Actix、Axum)

4. 多语言翻译

在国际化团队中特别有用。我可以用中文说,SaySo 自动输出英文,反之亦然。

4.2 存在的不足

1. 噪音环境识别率下降

在开放式办公区,周围有人说话时,识别率会明显下降。建议:

  • 使用降噪耳机 + 麦克风

  • 在相对安静的环境使用

  • 或者用“Hey SaySo”唤醒后再说话

2. 代码片段输入不友好

虽然可以用语音输入注释和文档,但直接说代码还是很别扭:

我说:“定义一个函数 def calculate score 括号 user 冒号 User 括号”
输出:“定义一个函数 def calculate score 括号 user 冒号 User 括号”

这种场景还是键盘输入更快。SaySo 适合文档和注释,不适合写代码本身。

3. 专业术语需要清晰发音

如果发音不标准,可能会识别错误:

  • “Kubernetes” 可能识别成 “k8s”(虽然意思对,但不规范)

  • “PostgreSQL” 可能识别成 “Postgres”

五、与竞品对比

5.1 主要竞品

产品

价格

优势

劣势

适合人群

SaySo

$3/月

场景适配强,中英文混输好

代码输入不友好

文档密集型开发者

Typeless

$12/月

识别率最高,技术术语准确

AI 味重,不适合聊天

专业技术写作

Wispr Flow

$10/月

纯转录,速度快

无智能优化

需要原始转录的场景

Cursor Voice

免费(Cursor 内置)

与 IDE 深度集成

仅限 Cursor 编辑器

Cursor 用户

GitHub Copilot Voice

包含在 Copilot 订阅中

与代码生成结合

仅限代码场景

GitHub Copilot 用户

5.2 我的选择

经过对比,我的使用策略是:

  • 文档编写:SaySo(场景适配好)

  • 代码编写:GitHub Copilot(代码生成能力强)

  • 快速记录:系统自带语音输入(免费够用)

SaySo 不是万能的,但在文档和注释场景下是目前最好的选择。

六、使用建议

6.1 硬件配置

  • 麦克风:MacBook 内置麦克风即可

  • 网络:需要稳定的网络连接(语音识别在云端处理)

  • 快捷键:设置全局快捷键(我用的是 Fn)

6.2 使用技巧

1. 分段输入

不要一口气说太长,建议每次说 1-2 句话,让 SaySo 处理完再继续。

2. 善用 AI 指令模式

说“Hey SaySo”可以唤醒 AI 命令:

  • “Hey SaySo,翻译成英文”

  • “Hey SaySo,改成正式语气”

  • “Hey SaySo,生成表格”

3. 结合快捷键

我的工作流:

  1. Fn 启动 SaySo

  2. 说出内容

  3. 再按 Fn 停止录音

  4. 快速浏览输出

  5. Tab 跳转到下一个需要修改的地方

4. 建立个人词库

在设置中可以添加常用的技术术语、项目名称、同事名字,提高识别准确率。

6.3 适用场景优先级

强烈推荐

  • ✅ 技术文档编写

  • ✅ API 接口文档

  • ✅ 代码注释

  • ✅ Git Commit Message

  • ✅ Code Review 评论

  • ✅ 技术方案设计

可以尝试

  • ⚠️ 需求文档

  • ⚠️ 测试用例

  • ⚠️ 会议纪要

  • ⚠️ 邮件回复

不推荐

  • ❌ 直接写代码

  • ❌ 写正则表达式

  • ❌ 写 SQL 语句

  • ❌ 写配置文件

七、实际使用数据

使用 SaySo 一个月后,我的工作数据变化:

指标

使用前

使用后

变化

每日文档编写时间

2.5 小时

1 小时

-60%

每周代码注释覆盖率

45%

78%

+73%

手腕疼痛频率

每天

每周 1-2 次

-80%

文档质量评分(团队评价)

7.2/10

8.5/10

+18%

最大的收获

  1. 手腕不疼了:这是最直接的改善

  2. 文档写得更多了:以前懒得写,现在说话就行

  3. 注释覆盖率提升:Code Review 时被吐槽的次数明显减少

八、总结与建议

8.1 谁适合用 SaySo?

强烈推荐

  • 每天需要写大量文档的开发者(架构师、Tech Lead)

  • 手部有职业病或想预防的程序员

  • 在国际化团队工作,需要频繁中英文切换的开发者

  • 重视代码注释和文档质量的工程师

不太适合

  • 纯写代码,很少写文档的开发者

  • 在嘈杂环境工作,无法使用语音输入的人

  • 预算有限的个人开发者(可以先用免费版试试)

8.2 是效率神器还是智商税?

我的结论:对于文档密集型开发者,是效率神器;对于纯代码开发者,可能是智商税。

如果你的工作内容包含:

  • 30% 以上的文档编写

  • 频繁的技术沟通(邮件、评论、方案)

  • 大量的代码注释需求

但如果你 90% 的时间都在写代码,很少写文档,那 SaySo 的价值就没那么大了。

8.3 购买建议

  1. 先用 30 天免费试用:充分测试是否适合自己的工作流

  2. 重点测试文档场景:不要指望用它写代码

  3. 配合好的麦克风:硬件投入会显著提升体验

  4. 建立使用习惯:前两周可能不适应,坚持下来会有质的改变

8.4 最终评分

维度

评分

说明

识别准确率

⭐⭐⭐⭐

安静环境下 95% 以上

场景适配能力

⭐⭐⭐⭐⭐

这是最大亮点

效率提升

⭐⭐⭐⭐

文档场景 3-5 倍提升

易用性

⭐⭐⭐⭐

上手简单,快捷键方便

性价比

⭐⭐⭐

对文档密集型工作者值得

综合评分

⭐⭐⭐⭐ (4/5)

推荐文档密集型开发者使用

九、常见问题

Q1: SaySo 会上传我的语音数据吗?

A: 根据官方说明,语音数据在处理后会立即删除,不会长期存储。但语音识别确实需要上传到云端处理。

Q2: 支持离线使用吗?

A: 不支持。需要网络连接。

Q3: 可以自定义 AI 优化的程度吗?

A: 可以。有三种模式:纯转录、轻度优化、深度优化。

Q4: 支持 Linux 吗?

A: 目前不支持,只支持 macOS 和 Windows。

Q5: 可以和 IDE 插件集成吗?

A: 目前是系统级工具,不需要插件,在任何应用中都能用。


测试环境

  • 硬件:MacBook Pro M2, 16GB RAM

  • 系统:macOS Sonoma 14.5

  • 麦克风:AirPods Pro 2

  • 测试时长:30 天

  • 测试场景:真实工作环境

利益相关:本文为真实测评,未收取任何广告费用。


如果这篇文章对你有帮助,欢迎点赞收藏。如果你也在用 SaySo 或其他语音输入工具,欢迎在评论区分享你的使用体验。

官网https://sayso.cn/
30 天免费试用

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐