一个人从0到1做AI产品，我踩过的坑比写过的代码多

lanchifeiyang

502人浏览 · 2026-05-09 10:29:55

lanchifeiyang · 2026-05-09 10:29:55 发布

一个人从0到1做AI产品，我踩过的坑比写过的代码多

16年移动前端，第一次独立做AI产品。
从"想做论文摘要"到"做决策过滤器"，从画功能全景图到砍到只剩一个核心功能，从纯开发思维到被产品思维反复打脸。
这篇文章不推销产品，只复盘过程中的真实决策和踩坑。

一、起因：不是因为AI火，是因为自己痛

做 TLDR Scholar 之前，我做了16年移动前端开发。写代码没问题，但一直觉得自己缺一个东西——产品判断力。每次拿到需求文档就是"怎么做"，很少想"该不该做"。

今年开始往产品经理方向转型。学了理论，看了书，但纸上得来终觉浅。你需要一个真实的战场。

为什么选论文速读这个方向？

因为我自己的痛点太真实了。转型过程中需要大量阅读AI/ML方向的论文，每篇摘要读3-5分钟，经常读完发现跟自己要找的东西没关系。更惨的是精读了一篇觉得方法不错，花两天尝试复现，结果代码不开源、关键参数缺失——两天白费。

这种"读了半天发现不该读"的经历，一个月来好几次。

痛点够痛，方向够具体，一个人能做——三要素齐了，开干。

回头看，这个起点本身就有个坑： 我以为自己痛的就是用户痛的，但"我"的样本量是1。后面验证下来，大方向没错，但很多细节假设是错的。这是后话。

二、定位之痛：从"论文摘要"到"决策过滤器"，差点做了个没人用的东西

第一次方向：做一个"AI论文摘要工具"

这是最直觉的方向。市面上已经有不少AI摘要工具了——丢一篇论文进去，输出300-500字摘要，涵盖背景、方法、结果、结论。

我一开始就是这么想的。甚至画了个功能全景图：摘要、翻译、问答、笔记、知识图谱……功能列表拉出来，自己看着都吓人。

然后我停下来了。问了自己一个问题：300字AI摘要和400字原文摘要，对用户来说有什么本质区别？

读完400字原文2分钟，读300字AI摘要1.5分钟——省了30秒。但认知负荷没本质变化，你依然要从这段话里"提炼"关键信息。这不叫提效，这叫微调。

更关键的是：市面上已经有几十个AI摘要工具了，我做一个第31个，意义在哪？

第二次方向：做"一句话总结"

Semantic Scholar的TLDR功能给了我启发——他们用20个词总结一篇论文，不是为了让你"了解论文内容"，而是帮你"快速判断论文相不相关"。

20个词的总结和200个字的摘要，服务的是完全不同的目的。前者是决策过滤器，后者是论文缩写版。

我回过头看自己的痛点：我缺的不是"更短的摘要"，而是"帮我快速判断值不值得读"。

定位从"帮你读论文"变成了"帮你判断论文"。 一字之差，产品逻辑完全不同。

转向之后发生的事

定位一变，功能设计跟着全变了：

❌ 长摘要 → ✅ 一句话总结
❌ 全面覆盖 → ✅ 只输出决策相关信息
❌ 功能全景图 → ✅ 一个核心功能做到位

这个转向救了产品。如果还是做"AI论文摘要工具"，我大概率会淹没在同质化产品堆里，做出一个60分的东西，然后没人用。

踩坑总结： 很多独立开发者（包括我）的第一个直觉是"做一个大而全的东西"，觉得功能越多越有竞争力。但真相是——功能越多，每个功能越平庸，核心价值越模糊。一个人做产品，资源有限，砍功能比加功能重要100倍。

三、技术选型的取舍：前端人怎么做AI产品

先说我的技术背景：16年移动前端，React Native、Flutter、小程序都写过。后端不是完全不会，但不是强项。

做AI产品，技术选型要回答三个问题：

1. AI能力怎么做？

三个选项：

方案	优势	劣势
自己训练模型	完全可控	成本高、周期长、一个人搞不定
调用大模型API	快速验证、灵活	依赖第三方、token成本
开源模型本地部署	数据隐私好	硬件成本、维护成本

作为MVP验证阶段，我的选择很明确：调用大模型API。

这不是技术最优解，但这是时间最优解。一个人做产品，最贵的不是服务器钱，是你的时间。花三个月训模型 vs 花三天调API——后者让你一周内就能验证核心假设。

具体的Prompt工程是核心难点。论文解析不是简单的"帮我总结一下"，而是需要结构化输出——四个维度各自有严格的归纳标准。这花了我大量时间调优，从最初的自由生成到后来的结构化Prompt，反复迭代了很多版。

关键决策：不要试图让AI"自由发挥"，要给它明确的框架和约束。 自由生成的信息密度波动太大，无法稳定支撑决策。结构化Prompt + 严格输出格式，才能保证结果的可用性。

2. 前端怎么做？

前端是我的主场，选了React + 现代工具链。没什么纠结的。

但有个容易忽视的细节：论文上传体验。PDF解析是后端的事，但用户在上传阶段的感知全是前端的——文件大小提示、格式校验、拖拽上传、进度反馈、错误状态。这些"小东西"做好了用户觉得理所当然，做不好用户立刻走人。

作为前端出身的独立开发者，这是我能做到超出平均水平的地方。AI产品的核心是AI能力，但用户的体感很大程度上取决于前端交互。

3. 部署怎么搞？

一个人没有运维精力。选了云服务一站式方案，尽量不碰基础设施。

原则：所有非核心的事，都用现成方案。 你是一个人，你的精力必须花在"只有你能做的事"上——产品定义、Prompt调优、用户洞察。服务器配置、CI/CD、运维监控……能托管就托管，能用SaaS就用SaaS。

踩坑总结： 技术选型最大的陷阱不是"选错技术"，而是"在技术上花太多时间"。独立开发者的时间分配应该是：产品思考50% > 核心实现30% > 体验打磨15% > 技术基建5%。很多人反过来了。

四、产品设计的核心决策：为什么是这四个维度

定位确定了——做"决策过滤器"，帮用户判断论文值不值得精读。那下一个问题：判断依据是什么？

这是整个产品最核心的设计决策，也花了我最多时间。

第一版：让AI自由生成

最简单的方案：丢论文给AI，让它自己总结。

问题很明显——不可控。有时候输出"本文提出了一种新方法"你不知道新在哪，有时候"在XX数据集上取得了SOTA"你不知道方法是什么，有时候"研究了XX问题"你连学科领域都不确定。

自由生成的信息密度波动太大。作为"决策过滤器"，输出必须稳定、可预期、每个字段都有明确的决策价值。

第二版：参考学术论文的标准结构

Introduction → Method → Results → Discussion，按论文结构拆解。

比自由生成好，但问题是——这是"论文缩写版"的思路，不是"决策过滤器"的思路。 照搬论文结构，输出的是"论文各部分说了什么"，而不是"帮我做判断的信息"。

第三版：从决策路径反推

我换了个思路：不从论文结构出发，而是从我的决策路径出发。

我自己读论文时，做"要不要精读"的判断，本质上在问四个问题：

这是什么领域的？ → 先判断"跟我有没有关系"
用的什么研究方法？ → 再判断"方法能不能迁移到我的问题"
核心发现是什么？ → 知道"到底说了什么新东西"
能复现吗？ → 最后决定"以什么深度读"

四个维度，层层递进，每个直接对应一个决策节点。

这不是拍脑袋想出来的。我把自己读论文的决策过程拆解了很多遍，也找了几位在读研究生聊他们的判断逻辑，最终收敛到这四个维度。没有冗余——不是"能想到的都加上"，而是"做决策最少需要什么"。

其中"可重现指标"这个维度最不常规，但我觉得最关键。因为可复现性是精读决策的重要输入——花两天精读一篇论文结果发现不可复现，等于白读。如果筛选阶段就知道，完全可以只快速浏览方法思路，不投入精力精读实验细节。

踩坑总结： 产品设计最容易犯的错是"我觉得用户需要XX"。每一个功能点都是假设，必须验证。我验证的方式很原始——拿着几篇论文找人聊，但比"自己拍脑袋"靠谱得多。

五、上线即裸奔：一个人做产品的现实

产品上线了。然后呢？

没有用户

上线第一周，访问量：个位数。全是自己测试的。

没有人知道你的产品存在。这是独立开发者最残酷的现实——你花了无数心血做出来的东西，没有分发渠道，没有市场团队，连让目标用户"看到"都很难。

没有反馈

没有用户 = 没有反馈 = 不知道产品做得对不对。

MVP的核心是"快速验证假设"，但验证需要用户数据。没有用户的时候，你只能靠直觉继续迭代，而直觉可能是错的。这是个死循环。

没有退路

团队开发可以AB测试、可以并行、可以有人专门做增长。一个人，同一时间只能做一件事。做功能就没时间做推广，做推广就没时间修bug，修bug就没时间想方向。

怎么破？ 我现在的方法是：

内容驱动：写文章分享做产品的思考，产品自然引出。不是硬推，是让目标用户在阅读中自然接触到产品。你正在读的这篇文章就是这个策略的一部分。
精准渠道：CSDN、知乎学术区、研究生社群——痛点最集中的地方。不撒网，只去鱼多的地方。
把冷启动当产品问题而非营销问题：冷启动的本质不是"怎么获取用户"，而是"怎么让第一批用户觉得值"。产品本身的自传播力，比任何推广手段都重要。

一个人做产品的心理建设

说实话，这个过程比写代码难多了。写代码有明确的对错——跑通了对，报错了改。做产品面对的是不确定性——方向对不对？功能够不够？用户会不会来？这些没有标准答案。

最难的不是技术实现，而是在没有人告诉你对错的时候，依然能做决策并推进。这是开发者转产品最难跨越的一步。

六、那些我一开始没想清楚的事

复盘下来，有几个地方是后视镜里才看清的：

1. “我的痛点"≠"用户的痛点”

我因为复现论文踩过坑，所以觉得"可重现指标"很重要。但后来聊了几个用户，发现不做复现的人确实不太在意这个维度。

解决方案不是砍掉——因为做复现的人对它的需求非常强烈——而是在产品呈现上降低视觉权重，让不关心的人可以忽略，让关心的人一眼看到。

教训： 你的痛点只是假设的起点，不是假设本身。从"我觉得"到"验证过"之间，有很长一段路。

2. 一句话总结的质量是生命线

"决策过滤器"的价值完全取决于输出的质量。如果总结不准确，用户做了错误的筛选决策，比没有工具还糟糕——因为你会基于错误信息做出判断。

Prompt调优花了我远超预期的时间。从最初的"帮我总结这篇论文"到现在的结构化多轮Prompt，至少迭代了20+版。而且质量不是"60分就够"——对于决策工具，60分意味着40%的时候在误导用户，这是不可接受的。

教训： AI产品的核心不是"能不能用"，而是"能不能信"。信任建立很难，崩塌很容易。

3. 独立开发者的时间分配是个零和博弈

做功能 vs 做推广 vs 做内容 vs 优化体验——每一项都很重要，但同一时间只能做一项。我前期的分配有问题：花了太多时间在功能迭代上，推广几乎为零。

教训： 产品做到70分就应该开始推。等做到90分再推，可能已经没有力气推了，而且70分和90分对用户来说差别没那么大——能解决核心问题就行。

七、下一步：不急，但要清醒

TLDR Scholar 目前还在迭代。核心功能已上线：上传论文 → 输出四维度一句话总结，30秒出结果。

后续规划的方向有几个，但我不急：

批量处理：一次上传多篇论文，快速分类筛选——这是被用户问得最多的功能
个性化维度：不同研究方向关注的维度不同，允许自定义——需要更多用户数据才能做好
论文对比：同一方向多篇论文的核心发现横向对比——从"单篇决策"到"多篇决策"

但这些都还是假设，需要验证。我不会再犯"功能全景图"的错误了。

一个人做产品，最重要的能力不是"能做什么"，而是"不做什么"。

写在最后

从移动前端转型做AI产品，这条路不容易。16年的开发经验给了我执行力，但产品判断力是另一门课——只能在实战中学。

TLDR Scholar 不完美，但每一步决策都是认真想过的。做出来的不一定对，但至少不是拍脑袋的。

产品地址：https://www.tldrscholar.cn

如果你也在做独立开发，或者正在转型路上，欢迎交流。独立开发者最需要的不是鼓励，是真实反馈——哪怕是骂你的。

#独立开发 #AI产品 #从0到1 #产品复盘 #论文速读

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

基于模型预测控制的波浪能转换器（WEC）研究（Matlab代码实现）

本文模拟从波浪能转换器（WEC）中提取的能量，当受控移动窗口阻塞 MPC 时，单设备。它还比较了使用标准MPC和GPC控制时WEC提取的能量。摘要：海浪能是可再生能源最集中的来源之一。然而，到目前为止，它还没有达到商业化所需的经济可行性。为了提高波浪能转换器的效率，已经提出了几种先进的控制策略，包括模型预测控制（MPC）。然而，每个优化问题的计算负担都是传统（全自由度）MPC的缺点，这通常会

AtomGit开源社区

DPO梯度机制理论分析

AtomGit开源社区

GPT-5.5 vs Claude 4.7深度对比：在bblabu上如何根据场景选择最佳模型（2026选型指南）

80% 的时间用 GPT-5.5：日常编码、脚本生成、Agent 工作流、单元测试，1 倍率 + 快速生成 = 最优性价比；20% 的高难度任务切 Claude 4.7：重构、架构设计、复杂 Bug 排查、安全审查、长文档分析，多花 3 倍的钱换正确的结果；CC-Switch 一键切换，零摩擦：不用改任何工具配置，切换模型只需 1 秒；bblabu 控制台查看消耗，按需调整：日消耗、月消耗、分模型