1. AutoSkill:Skill的版本化进化论

传统RAG系统把知识当成静态文档,而AutoSkill提出了一个激进但合理的观点:用户的每一次反馈都应该让Skill变得更聪明

1.1 双循环架构:干活与进化并行

AutoSkill的核心是一个"双循环"设计:[近期,看到最惊喜的养龙虾工具(OpenClaw)~]

  • 左循环(Response Generation):检索相关Skill,生成当前回答
  • 右循环(Skill Evolution):从用户交互中提取新Skill或更新现有Skill

图1:AutoSkill框架图。右侧Skill Evolution Loop负责将交互经验转化为显式技能,左侧Response Generation Loop利用这些技能增强当前对话。

关键在于Skill Management的三种决策:

  • Add:全新能力,入库
  • Merge:与现有Skill合并,版本号+1(如v0.1.3 → v0.1.4)
  • Discard:一次性需求,丢弃

1.2 版本号是Skill的质量指标

论文中最具说服力的证据来自真实案例。在WildChat-1M数据集上构建的SkillBank中:

表1:四个SkillBank子集的统计信息

图2:技能类别分布。编程与软件开发(482个)和写作创作(363个)是进化最活跃的领域。

重点看版本号

  • professional_text_rewrite技能:版本 0.1.34(历经34次迭代优化)
  • 顶级心理咨询师技能:版本 0.1.0(保持初始形态)

这个对比揭示了一个残酷现实:用户反复调用的生产力技能会快速进化,而冷门技能则停留在v0.1.0。Skill的价值不在于初始完美度,而在于迭代次数

```plaintext
https://arxiv.org/pdf/2603.01145AutoSkill: Experience-Driven Lifelong Learning via Skill Self-Evolutionhttps://github.com/ECNU-ICALK/AutoSkill


2. XSKILL:Skill与Experience的协同进化
-------------------------------

如果说AutoSkill解决了"Skill如何纵向迭代"的问题,那么XSKILL则回答了"Skill如何横向适应复杂环境"的问题。

### 2.1 双流知识:肌肉记忆 vs 程序性知识

XSKILL针对多模态Agent(视觉+工具使用)提出了**双流架构**:

* **Skill Library**:结构化任务流程(类似"驾驶手册")
* **Experience Bank**:情境化动作提示(类似"驾驶直觉")

![](http://cdn.zhipoai.cn/179321f6.jpg)

*图2:XSKILL框架总览。Phase I通过视觉感知的轨迹总结和交叉批判积累知识,Phase II通过任务分解和上下文适应使用知识。*

**进化机制**:

1. **Cross-Rollout Critique**:对比多次尝试的成功与失败,提取因果经验
2. **Hierarchical Consolidation**:相似经验合并,冗余经验删除,Skill文档自动精简
3. **Visual Grounding**:所有知识提取都基于视觉观察,而非纯文本幻觉

### 2.2 进化带来的性能跃升

在5个多模态基准测试上的结果令人震惊:

![](http://cdn.zhipoai.cn/357140cd.jpg)

*表2:主实验结果(Average@4)。XSKILL比最强基线Agent-KB最高提升11.13分(论文Table 2)。*

消融实验证明了**Skill进化的必要性**:

* 只有Skill(无Experience):错误率15.3%
* 只有Experience(无Skill):错误率29.9%
* **两者协同**:错误率降至16.3%,且语法错误从114次锐减至71次

![](http://cdn.zhipoai.cn/bb36f909.jpg)

*图3:错误分析。Skill显著降低了语法错误(20.3%→11.4%)和工具名错误(2.85%→0.32%),Experience则优化了工具选择策略。*

### 2.3 跨任务迁移:进化的终极考验

真正的进化能力体现在**零样本跨任务迁移**上。将在VisualToolBench积累的知识直接用于TIR-Bench:

![](http://cdn.zhipoai.cn/7775e6a7.jpg)

*图5:跨任务迁移性能。XSKILL的知识具有强泛化性,显著优于其他基线。*

这意味着XSKILL进化的不是特定任务的"肌肉记忆",而是可迁移的**元能力**。

3. 为什么"能进化"是Skill的生死线?
----------------------

对比两篇论文,我们可以勾勒出未来Agent Skill的标准形态:

| 维度 | 静态Skill | 可进化Skill |
| --- | --- | --- |
| **存储形式** | 固定Prompt | Markdown工件 + 版本控制 |
| **更新机制** | 人工重写 | 自动Merge/Add/Discard |
| **知识来源** | 预设模板 | 用户交互轨迹 + 视觉观察 |
| **质量保证** | 初始质量 | 迭代次数 + 交叉验证 |
| **跨场景** | 单任务 | 零样本迁移 |

**核心洞察**:

1. **进化即压缩**:AutoSkill的Merge操作和XSKILL的Consolidation都是在做**有损压缩**——保留通用模式,丢弃实例细节。这与人类"遗忘细节但记住经验"的认知机制一致。
2. **进化即对齐**:每次版本更新(v0.1.x → v0.1.x+1)都是对用户偏好的微量对齐。34次迭代的professional\_text\_rewrite技能,本质上是对"什么是好改写"的34轮RLHF,且无需修改模型参数。
3. **进化即资产**:Skill的版本历史本身就是组织知识资产。当一个员工离职,他留下的不该是聊天记录,而是经过100次迭代的v0.1.100版Skill文档。

4. 从"写Skill"到"养Skill"
---------------------

这两篇论文预示着一个范式的转变:

* **过去**:我们写Prompt(静态)
* **现在**:我们写Skill(半静态)
* **未来**:我们**养育**Skill(动态)

就像你不会指望一个实习生第一天就完美无缺,但期待他在100天后成长为专家;我们也不应该期待初始提取的Skill完美无缺,但必须确保它有**进化机制**。

**能进化的Skill,才是好Skill。** 这不仅是一个技术结论,更是Agent产品设计的哲学基础。

```plaintext
XSkill: Continual Learning from Experience and Skills in Multimodal Agentshttps://arxiv.org/pdf/2603.12056Website: xskill-agent.github.io/xskillCode: github.com/XSkill-Agent/XSkill

2026年AI行业最大的机会,毫无疑问就在应用层

字节跳动已有7个团队全速布局Agent

大模型岗位暴增69%,年薪破百万!

腾讯、京东、百度开放招聘技术岗,80%与AI相关……

如今,超过60%的企业都在推进AI产品落地,而真正能交付项目的 大模型应用开发工程师 **,**却极度稀缺!

落地AI应用绝对不是写几个prompt,调几个API就能搞定的,企业真正需要的,是能搞定这三项核心能力的人:

✅RAG:融入外部信息,修正模型输出,给模型装靠谱大脑

✅Agent智能体:让AI自主干活,通过工具调用(Tools)环境交互,多步推理完成复杂任务。比如做智能客服等等……

✅微调:针对特定任务优化,让模型适配业务

目前,脉脉上有超过1000家企业发布大模型相关岗位,人工智能岗平均月薪7.8w!实习生日薪高达4000!远超其他行业收入水平!

技术的稀缺性,才是你「值钱」的关键!

具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

图片

AI浪潮,正在重构程序员的核心竞争力!现在入场,仍是最佳时机!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

⭐️从大模型微调到AI Agent智能体搭建

剖析AI技术的应用场景,用实战经验落地AI技术。从GPT到最火的开源模型,让你从容面对AI技术革新!

大模型微调

  • 掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。

  • 学习如何利用领域数据(如制造、医药、金融等)进行模型定制,提升任务准确性和效率。

RAG应用开发

  • 深入理解检索增强生成(Retrieval-Augmented Generation, RAG)技术,构建高效的知识检索与生成系统。
  • 应用于垂类场景(如法律文档分析、医疗诊断辅助、金融报告生成等),实现精准信息提取与内容生成。

AI Agent智能体搭建

  • 学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。
  • 构建垂类场景下的智能助手(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)。

图片

如果你也有以下诉求:

快速链接产品/业务团队,参与前沿项目

构建技术壁垒,从竞争者中脱颖而出

避开35岁裁员危险期,顺利拿下高薪岗

迭代技术水平,延长未来20年的新职业发展!

……

那这节课你一定要来听!

因为,留给普通程序员的时间真的不多了!

立即扫码,即可免费预约

「AI技术原理 + 实战应用 + 职业发展

「大模型应用开发实战公开课」

👇👇

在这里插入图片描述

👍🏻还有靠谱的内推机会+直聘权益!!

完课后赠送:大模型应用案例集、AI商业落地白皮书

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐