LLM是大脑,但大脑不长腿


做Agent开发的人对LLM的理解基本分两个极端。

一种是觉得GPT-4什么都能干。写一个2000字的system prompt,把业务逻辑全塞进去,让模型又当裁判又当运动员。跑几次发现时灵时不灵,开始疯狂加"你必须"“请注意”“千万不要”。调了一周,成功率从60%到了75%,然后卡住了。

这不是prompt engineering,这是拿锤子拧螺丝。

另一种反过来,觉得LLM就是个会幻觉的文本生成器,不能信。于是核心逻辑全部硬编码,LLM只负责做格式转换之类的边角工作。花大价钱调API,干的活正则表达式就能搞定。

LLM真正厉害的就三件事:理解模糊意图(用户说了句含含糊糊的话,它能猜到意思,传统NLP做不到这个)、综合判断(给它三份互相矛盾的信息,它能给个合理结论,不需要你写规则引擎)、决策路由(这任务该调哪个工具、分几步做,它天生会规划)。

它不行的也是三件事:精确计算、实时信息、确定性输出。小数乘法都可能算错。不知道今天股价。同样输入每次输出不一样。

大脑负责想,不负责看、听、动手。你得给它配眼睛和手脚。


Skill不是prompt


很多人听到Skill第一反应是"写个好prompt"。

差远了。

去年我也这么想的。给LLM写了一段精心调教的投研分析prompt,效果时好时坏,好的时候我觉得自己是天才,坏的时候想砸键盘。后来花了大概两个月才想明白:prompt只是Skill的四分之一。

一个Skill至少包含四样东西:

组成部分 说明 举例
Prompt模板 告诉LLM怎么思考这类问题 投研分析的思考框架
工具权限 能调用什么,不能调用什么 允许读文件,禁止写文件
输入输出契约 格式明确约定 输入公司名 → 输出JSON分析报告
验证标准 怎么判断"成功了" 5个必填字段,数据源可追溯

Prompt和Skill的区别就俩字:边界,验证。

没有边界的prompt像让实习生"去把这事儿办了"。有边界有验证的Skill是给实习生一份SOP。他可能做得慢,但大概率不会做错。


为什么顺序必须是 Skill → Agent


大多数人做Agent的路径:先想一个宏大目标(“自动写研报的Agent”),然后选个框架(LangChain、CrewAI随便挑),定义几个角色,写几段prompt,串起来跑一下。

第一次跑居然有输出。质量一般但能跑通,很兴奋。

然后就开始了无尽的痛苦。Agent A输出传给Agent B格式对不上。Agent B理解错了意思输出一堆废话。Agent C拿废话继续跑,输出更离谱。去修B的prompt,改好了,A又出问题了。一个礼拜了还在调prompt。

这就好比你组了支乐队。演出曲目选好了,舞台动线排好了,指挥棒一挥——鼓手不会打鼓,吉他手只会三个和弦,主唱跑调。请问你的编排有意义吗?

Agent的质量上限等于它最弱的那个Skill。

这话我踩完坑才真正理解。一个不靠谱的Skill单独用成功率80%,听起来还行对吧?

串三个:0.8 x 0.8 x 0.8 = 51.2%。串五个?32.8%。三次里成功一次,这不是产品,这是碰运气。


一个真实的失败时间线


去年见过一个做AI尽职调查的团队。

第1周搭框架,选了CrewAI,定义5个Agent角色(文档解析、财务分析、风险评估、法律审查、报告撰写),架构图很漂亮。第2-3周写prompt,每个大概500-800字,跑了几次有输出,给投资人看了demo。

然后第4周到第12周,整整两个月,就在调。文档解析漏提关键条款。财务分析数字偶尔对不上。风险评估忽左忽右。改一个Agent的prompt另一个就出问题。第9周开始怀疑是框架的锅,换了LangGraph,花两周重构。问题一样。

第13周项目搁置。

问题不在框架也不在LLM。是他们没有一个Skill真正打磨好。文档解析没定义"解析成功"的标准。财务分析没约束输出格式。风险评估prompt里写了"请综合判断"——什么叫综合?标准是什么?五个半成品拼一起,不是一个产品,是五倍的混乱。


如果让我重新来


前两个月:只做一个Skill

就挑一个,比如"财务数据提取"。定义清楚输入是什么(PDF年报还是财报URL),输出是什么(JSON,哪些字段,什么类型,取值范围),成功标准是什么(字段完整率>95%,数值误差<1%)。给LLM配上PDF解析器和表格识别器,限定只读权限。然后跑50个不同类型的年报。修。再测。再修。

两个月后成功率从70%到了95%。20次错1次。这才叫靠谱。

第三个月:第二个Skill

比如"风险因子识别"。同样的流程,但这次快得多——第一个Skill里积累的经验全都能复用。一个月搞定,成功率93%。

第四个月:串Agent

两个93%以上的Skill串起来:0.93 x 0.93 = 86.5%。加上Agent层的重试和人工兜底,实际可用率90%以上。

时间差不多,结果天差地别。


所以Agent到底是什么


Agent = LLM + 一组Skill + 编排逻辑。

LLM负责理解意图、规划步骤、做判断。Skill负责真正干活,每一步有明确的输入输出和验证。编排逻辑把它们串起来,处理异常、重试、回退。

优先级:先有靠谱的Skill,才有靠谱的Agent。先有靠谱的Agent,才值得去优化编排。LLM的能力是底座,但不是你需要操心的部分,模型厂商会持续升级。你要做的是把Skill和编排做好。


给自己做个检查


如果你正在做Agent项目,问自己:

  1. 你的Agent用了几个Skill?每个成功率多少?你测过吗?
  2. 每个Skill有没有明确的输入输出契约?
  3. 有没有验证环节?你怎么知道这次执行成功了?
  4. 每个Skill能不能单独拎出来跑,不依赖其他Skill?
  5. 某个Skill失败了Agent知道吗?会怎么处理?

五个问题三个以上答不上来,你可能需要停下来回到Skill层重新打磨。别觉得是倒退。这是你能做的最大的加速。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

在这里插入图片描述

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐