前言

上一期,我们用 vibe coding 做了 FGOTI,一个 FGO 风格的 MBTI 人格测试,从设计到部署全套跑通,效果还不错。

但说实话,即便有 AI 辅助,「注册 GitHub → 提交 Git → 关联 Cloudflare → 配置 Pages」这一套下来,对完全没有技术背景的同学来说,依然有一定的门槛。

所以这期我们来探索一下更「一步到位」的方向:一键生成,即时可用,连部署链接都能直接出炉。

我找来了 7 款 AI 产品,用 2 段核心 prompt 来考验它们。谁能用最少的对话轮次,把一个完整的可访问页面交到我手里?这类号称「一句话做应用」工具,到底是真需求,还是 AI 时代的又一把噱头镰刀?

⚠️长文多图预警:太长不看可直接跳至结尾的总结,但会错过精彩锐评 = V =

一、参赛选手一览

注: Minimax 主打卖点不强调应用生成,本次测评用作基准对比参考。

工具 厂商 官方slogan 上线时间
秒哒 百度 一句话做应用 2024年11月
NoCode 美团 一句话,呈所想 2025年6月
Minimax Agent MiniMax 简单指令, 无限可能 2025年6月
灵光:闪应用 蚂蚁集团 重温灵感瞬间,让应用继续闪烁 2025年11月
扣子编程 字节跳到 全栈、全流程、全托管式 AI 编程平台 2026年1月
豆包 :应用生成 字节跳到 从灵感到应用 2026年初
秒悟Meoo 阿里 想到即做到 2026年4月

二、测评标准说明

从五个维度进行测评:

  • 对话轮数:几轮对话完成交付?
  • H5可用性:页面能否正常运行、交互是否完整、结果是否正确?
  • 设计美观:配色、排版、字体、视觉整体感受?
  • 新增需求:能否加个小功能不影响原功能?
  • 快捷部署:部署是否真的一键?链接是否真的可用?

核心 prompt-1:

模仿MBTI理念开发一个“KFCTI”单文件h5页面,用户做完一系列选择题后输出用户属于KFC的哪种餐品,部署后给我访问链接。先说明设计方案给我确认再开始做

核心 prompt-2:

在首页右下角增加一个调试按钮,点击后进入结果选择页,可不做题直接查看各类结果信息

三、「王下七武海」实战环节

1.秒哒:老资历的开门黑

输入 prompt-1 后,秒哒自动弹出「跳过对话,生成需求文档 → 生成应用」的选项,点击后等待超过半小时无结果。

查看工作空间,好家伙,它建了一个完整的 Vite 框架(而我的要求是单文件 H5),生成了一堆文件,然后…就没有然后了。

继续发了 3 次催促,它始终坚持自己只负责写需求文档,不会写代码。

啊…啊?

在这里插入图片描述
在这里插入图片描述

得,新开一个对话,把 Prompt-1 再发一遍,这次直接点击生成应用,成功!还以为最早上线的老资历一上来就要大失败呢…

部署阶段没有直接提供链接,需要手动点一下发布,也很快。

在这里插入图片描述

最终交付了 2 个链接,还附赠了一个小程序版,这点超乎预期,在微信生态里分享确实方便。

在这里插入图片描述
页面风格简约,KFC 味有了,做题有进度条,但没有返回上一题的选项,这点略有瑕疵。我主观推断,测试结果基本符合心理学预期,重新测试其他结果也正常。
在这里插入图片描述
继续 Prompt-2,右下角成功增加了调试按钮,进入后发现只有 4 个结果,偷懒了,模仿 MBTI 不应该是 16 个嘛。

不过整体流程算是跑通了。

在这里插入图片描述
测评小结(五星制,表现越好越多星):

  • 对话轮数⭐️⭐️⭐️
    不计自动提供选项供用户选择的交互情形,仅按用户主动输入,初次对话 4 轮,新开对话 2 轮。
  • H5可用性⭐️⭐️⭐️
    初次翻车,新开对话后基本可用,题量和结果类型较少。
  • 设计美观⭐️⭐️⭐️⭐️
    很有K记的风味。
  • 新增需求⭐️⭐️⭐️⭐️⭐️
    增加调试功能一次性成功,原测试功能正常。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    两种部署方式,发布按钮在右上角,比较醒目,部署操作简单。

2.NoCode:做不完的灵魂拷问

给美团 NoCode 来了个变体版 Prompt,把 KFC 换成了电商类目,看能不能触类旁通:

模仿MBTI理念开发一个“电商栏目TI”单文件h5页面,用户做完一系列选择题后输出用户属于电商栏目的哪一个(比如美食团购、宵夜外卖、超市生鲜、药房、日用品…),部署后给我访问链接。先说明设计方案给我确认再开始做

看起来有理有据,回复OK,直接开始开发。
在这里插入图片描述
然而一上来就踩雷,没有封面,直接第一题,用户连这个测试是干嘛的都不知道。整体样式也比较朴素,视觉上差点意思。

更离谱的是:20道题里存在大量重复,同一个意思换了种问法又来一遍。结果指向是否合理未知,我已经不想深究了。

在这里插入图片描述

重新测试时报错,点击AI修复,查看工作空间发现它也用了 Vite 的前端方案。
在这里插入图片描述
修完后继续 Prompt-2,调试页面也顺利加上了。
在这里插入图片描述

再给一次机会优化:

题目存在大量重复,结果指向是否合理?

改完后说有 jsx 文件更改,我是纯小白,你说这个谁懂啊?直接点保存。

在这里插入图片描述

复测仍然是大量重复的题目,放弃调优。

作为一句话应用体验者,大家都知道,哈基人没有耐心,AI一直给错误答案我就对它要哈气了。

最后,一键部署,链接访问没问题。

在这里插入图片描述

测评小结:

  • 对话轮数⭐️⭐️⭐️
    因prompt-1是要求确认方案再继续,所以主动回复OK不计,共 4 轮。
  • H5可用性⭐️⭐️
    相比 KFCTI ,电商栏目TI可能更加抽象,但我不管 。题目重复、结果指向不明,只能说能跑
  • 设计美观⭐️
    拉完了。
  • 新增需求⭐️⭐️⭐️⭐️
    调试功能实现尚可。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    一步到位,没毛病。

3.Minimax Agent:赢麻了

再换个主题,做个「美酒TI」。

Minimax 返回了精炼清晰的设计方案,篇幅适中,不多不少,直接回复 OK。
在这里插入图片描述
顺利输出单文件 html,没有醒目的发布按钮,但工作面板直接显示了部署链接,点击直达。
在这里插入图片描述

第一感觉就是:雅,太雅了。排版、配色美观,动效丝滑,视觉效果直接高出一个档次。

但最后的分享结果按钮是假的,点了没反应。

在这里插入图片描述

分享按钮 BUG 不改了,继续 prompt-2,这次 Minimax 直接把新部署链接一并发了回来。

在这里插入图片描述

调试页面功能正常。

在这里插入图片描述
这还说啥呀,用户体验拉满了,有 BUG 我都直接忽略了(不是),不愧是标杆产品。

测评小结:

  • 对话轮数⭐️⭐️⭐️⭐️⭐️
    共 2 轮(好的偏心了,改 BUG 再加 1 轮)。
  • H5可用性⭐️⭐️⭐️⭐️⭐️
    无需多言。
  • 设计美观⭐️⭐️⭐️⭐️
    夯。
  • 新增需求⭐️⭐️⭐️⭐️
    说加在右下角,却在左下角,扣一颗星。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    直接给链接,秒了。

4.灵光 - 闪应用:闪电五连鞭,快到没朋友

继续给新主题,大概是因为闪应用的定位就是「闪」,灵光没有给我确认方案就开肝了。
在这里插入图片描述

点击分享直接复制链接了,极致的一步到位。

在这里插入图片描述
然而 UI 丑得我差点当场去世。还有离谱的是,有一题直接问喜欢什么球,直击要害是吧。

但更震惊的是,居然自己给我加了【查看所有运动】的按钮,prompt-2 白给了属于是。
在这里插入图片描述

点击【返回结果】无效的BUG我都不修了,灵光是真的快如闪电。

测评小结(开始不正经):

  • 对话轮数⭐️⭐️⭐️⭐️⭐️⭐️
    1 轮秒杀好吧,还有谁?
  • H5可用性⭐️⭐️⭐️
    修完之后还是可以用的。
  • 设计美观⭐️
    一坨,啊不是,一颗星。
  • 新增需求⭐️⭐️⭐️
    还要什么自行车。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️⭐️
    一步到位,闪电本闪。

5.扣子编程:稳扎稳打的靠谱

感觉扣子编程会比较强,给个「三体TI」的主题试试。

扣子返回了方案,看起来可以,直接回复 OK。

在这里插入图片描述

输出单文件 html,还没等我点部署按钮,就已经提供了部署链接,但点击【开始测试】没反应,返工修复。

在这里插入图片描述

修复成功!匹敌 MiniMax 的丝滑动效,但也有着相同的BUG,最后加了个【分享结果】的无效按钮。

在这里插入图片描述
继续 prompt-2,成功。

在这里插入图片描述

测评小结:

  • 对话轮数⭐️⭐️⭐️⭐️⭐️
    共 3 轮,相当可以。
  • H5可用性⭐️⭐️⭐️⭐️⭐️
    是我会推荐朋友去玩的。
  • 设计美观⭐️⭐️⭐️⭐️
    谦虚一点。
  • 新增需求⭐️⭐️⭐️⭐️⭐️
    顺利完成。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    秒了。

6.豆包 - 应用生成:傻傻分不清

豆包有个独立的应用生成模块,点击后进入新页面,显示由 TRAE 提供技术支持,还可以上传参考图,或用画板拉框框、画原型。
在这里插入图片描述
本次测试「花语TI」,豆包返回了卡片式交互面板,可分不同模块编辑需求,点哪里改哪里,很直观。
在这里插入图片描述

这里还暴露了一个豆包本身的糟糕设计,「应用模式」和原「对话模式」并没有很好的隔离,在对话列表中仍会显示应用生成记录。

然而,在应用生成中基于 TRAE,在对话中基于豆包Agent,两者上下文共享混乱,工作空间不统一,编程能力甚至是对话模式更胜一筹。

如下图所示,左为应用模式,返回结果是在独立工作空间中的版本迭代;右为对话模式,返回结果是直接嵌入回答的 html。

应用模式 4 轮未修复的BUG,在对话中 1 轮解决。
在这里插入图片描述
部署分享也比较简单,一键完成。
在这里插入图片描述

交互设计比较离谱,选完选项还要再点下一题按钮,正常应该是选完自动跳转。

右上角的做题计时倒是其他 AI 没有的亮点。

在这里插入图片描述

结果页是设计最丰富的,花卉人格、优势、建议、花语诗句,还有与其他花卉的匹配度,诚意拉满。

在这里插入图片描述
调试页面,你,通过。
在这里插入图片描述
测评小结:

  • 对话轮数⭐️⭐️
    共 7 轮,小小的心累。
  • H5可用性⭐️⭐️⭐️⭐️
    最终成品尚可。
  • 设计美观⭐️⭐️⭐️⭐️
    相对不错。
  • 新增需求⭐️⭐️⭐️⭐️⭐️
    顺利完成。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    一键完成。

7.Meoo秒悟:改变不了只爱辣堡的事实

因为和百度的「秒哒」名字太像,而且与最早上线的秒哒相对,「秒悟」是最晚上线的,姑且统一标准,也用 KFCTI 来考验它。

大抵是我总喷阿里模型刷分第一名,产品化落地稀烂。Meoo 狠狠给了我当头一棒, 8 轮对话也没能改变它所有结果都是香辣鸡腿堡的现实。

Meoo,你就这么爱辣堡吗!

而后放弃,加调试功能,10 轮对话勉强走完测评流程。

在这里插入图片描述

既然给了秒哒新开对话的机会,对 Meoo 自然也是要一视同仁的。在新一轮任务中,2 回合顺利完成了测评页面 + 调试页面!

会赢的!胜者是秒悟!

完…完成了吗?为什么和预期的不一样…你,不通过。

在这里插入图片描述

和无技术背景的产品朋友交流,她的反馈是:Meoo 大概是可以在 5 轮内交付的,且成功制作了一个羽毛球等级测试。

可恶,我要哈气了!难不成 Meoo 不喜欢吃 KFC 吗!

在这里插入图片描述
在这里插入图片描述

测评小结:

  • 对话轮数⭐️
    10+ 轮,一刻也没有为香辣鸡腿堡哀悼。
  • H5可用性⭐️⭐️
    没能尽兴。
  • 设计美观⭐️⭐️⭐️
    初版风格像K记,第二版不知所谓但动效不错。
  • 新增需求⭐️⭐️⭐️
    不必再说,动手。
  • 快捷部署⭐️⭐️⭐️⭐️⭐️
    一键完成。

四、横评总结表

一句话总结:

  • 🥇 Minimax:六边形战士,设计和体验全场最佳,BUG 都能原谅它(总分其实是第2)
  • 🥈 扣子编程:稳扎稳打,丝滑交付,靠谱
  • 🥉 秒哒:首轮翻车但新对话可救,网页+小程序双版是意外惊喜
  • 豆包:应用模式和对话模式打架,建议用对话模式
  • 灵光:闪电般快,但 UI 巨丑
  • NoCode:题海战术 + 重复题目 + 朴素设计 = 电商栏目的天敌
  • 秒悟:香辣鸡腿堡狂热信徒,建议和 K记搞联名。

一图流总结:
在这里插入图片描述

五、写在最后:镰刀还是锤子?

1.这些工具的真正位置在哪里?

从测评结果来看,「一句话做应用」类平台的格局已经很清楚了:

本次基准组 Minimax Agent,不以「零代码应用生成」为主打卖点,实际表现却全方位超越所有专精产品。道理很简单,LLM 底座强,Agent 设计好,做什么都不会差。

此外,像 Kimi Agent、QoderWork、WorkBuddy 等全能工作台的表现都是很棒的。

而那些号称做应用的平台,反倒在产品化光环下暴露了底层能力的短板,做专精反而更不精,这不是一个讽刺,而是一个警示。

2.为什么说“一句话做应用”是伪需求?

你以为省力了,其实对话到崩溃

测评过程中,没有一个平台能在第一轮就交付完全符合需求的结果。最少的也要 1-2 轮调整,最多的(Meoo)10+ 轮还在出错。如果你有耐心调 10 轮,为什么不直接去用 Claude Code?

都是短程 Agent,复杂需求立刻露馅

KFCTI 这种简单到不能再简单的选择题页面,都几乎没有一个平台能一次过。状态管理、跨页面交互、结果算法的合理性…对不起,带着镣铐跳舞的模板填空,填不出真正的产品。

你想做的和它能做的永远有落差

这类平台替你定好了页面框架、交互范式、结果类型,你只能在框架内填空。一旦你有差异化需求,请绕路找专业程序员。


One More Thing

一切依然取决于底座 LLM 的智力、Agent ReAct 设计能力和 Harness Engineering 的精细程度。

希望这些产品线真的用心打磨产品,而不是天天靠自媒体宣传「颠覆世界」。

少一点资本叙事诡计,多一点诚实,世界更美好。

而有技巧地使用 AI IDE / CLI 工具进行长程 vibe coding,同样能取得生产级效果。

Claude Code、Cursor、CodeBuddy、Trae 这一类工具,能理解整个项目上下文,知道改了这里会影响那里,Agent 的规划链可以延伸到十几二十步。

更重要的是,你要知道自己做了什么,为什么这样做,而不是把命运交给一个黑箱。

另外,也为又爱又恨的阿里系找补一句:Qoder 做得不错,推荐使用。

这里是产品锐评委员会的Seon塞翁,我们下一篇见!~

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐