AutoSkill让AI从「会干活」到「越干越懂你」

最近刷到华东师范大学和上海AI实验室联合发布的AutoSkill,看完感觉眼前一亮——这可能是真正解决「AI怎么记住你的偏好,持续进化」问题的方案。

你有没有发现,每次和AI聊天都要重复说一遍你的要求?

  • “写报告要符合官方格式,别太口语化”
  • “减少幻觉,不确定的地方标出来”
  • “别用太多技术术语,通俗易懂一点”

每次说一遍,下次对话AI又忘了。现在的AI记忆系统,本质上还是「存对话片段,检索给模型看」,而不是「把你的要求变成能复用的技能」。

AutoSkill就是来解决这个问题的。


一、痛点直击:为什么AI总记不住你的「稳定偏好」?

现在的LLM agent,不管是加了记忆库还是自进化,都有个核心问题:

  • 参数微调:代价太高,而且你每次改偏好都要重新训,不实用
  • 记忆检索:只存对话片段,不提取行为模式,下次还要模型自己悟
  • 现有技能学习:技能还是隐式存在prompt里,不能编辑、不能版本化、不好复用

AutoSkill的思路很直接:把重复的交互经验,提炼成显式、可维护、可复用的技能,不用改模型参数,就能让AI持续学习你的偏好。


二、AutoSkill到底是什么?

AutoSkill是一个经验驱动的终身学习框架,能让LLM agent自动从对话和交互轨迹中提取、维护、复用技能。

AutoSkill的魔力,源于其独创的「双循环」设计——一边用现有技能高效完成当前任务,一边从交互中提炼新技能,实现「干活与进化并行」:

AutoSkill双循环框架

左循环:技能增强响应,精准匹配你的需求

当你发起查询时,AutoSkill会先从技能库中检索最相关的能力,确保响应贴合你的偏好:

  1. 查询重写:把你的模糊需求(如「再改改报告」)转化为精准检索指令(如「按官方格式优化报告,避免技术术语」);
  2. 混合检索:结合语义相似度与关键词匹配,从技能库中筛选Top-K优质技能,过滤无关内容;
  3. 技能注入:将选中的技能自动转化为生成上下文,让AI在不改变核心模型的前提下,输出符合你习惯的结果。

关键在于,AI从不会主动提及「我用了你的技能」,而是自然融入响应,体验无缝衔接。

右循环:技能自进化,把反馈变成能力

每一次对话结束后,AutoSkill都会悄悄「复盘」,把新经验转化为技能资产:

  1. 技能提取:从你的查询中提炼可复用规则(如「报告必须包含3个部分」「避免使用缩写」),过滤一次性需求;
  2. 智能决策:对比现有技能库,决定是新增技能、合并优化(版本号自动升级),还是丢弃无效信息;
  3. 版本化合并:若需求与现有技能相似,就把新约束整合进去,比如「professional_text_rewrite」技能经34轮用户反馈,迭代至v0.1.34版本,越用越精准;
  4. 技能库更新:将新技能或升级后的技能存入仓库,为下次交互做准备。

这套机制让AI的能力「只增不减」,交互次数越多,AI越懂你。

核心设计:技能是第一公民,可看可改可进化

AutoSkill最不一样的地方,就是把技能做成了「显式的第一公民」。每个技能都有标准化的结构:

s = (名称, 描述, 可执行指令, 触发集合, 标签集合, 示例集合, 版本号)

所有技能都以 SKILL.md 的形式存储,你可以直接看、直接改、直接删,完全透明可控。

存储布局:轻量级持久化,易于维护

AutoSkill采用轻量级的本地持久化模型:

SkillBank/
├── Users/<user_id>/     # 用户特定技能
│   └── <skill-slug>/
│       └── SKILL.md    # 规范技能工件
│       └── scripts/    # 可选资源
│       └── references/
│       └── assets/
├── Common/...          # 共享技能库
└── vectors/...        # 持久化向量缓存
    └── *.meta.json
    └── *.ids.txt
    └── *.vecs.f32      # 索引文件

这种组织方式将工件存储显式化,易于检查,同时允许系统为不同的嵌入配置维护独立的向量索引。

真实案例:技能如何适配不同场景?

来看两个从真实交互中提取的案例,感受AutoSkill的能力:

案例1:顶级心理咨询师(中文)

这个技能捕捉的是关于对话支持风格的稳定期望:

ID: 48746f29-5f4c-48c4-9244-ba0ae4fc6eed
Version: 0.1.0
Description: 扮演世界上最优秀的心理咨询师...
Tags: 心理咨询, 心理健康, 情感支持, 同理心
Triggers: 心理咨询, 心理问题, 情感困扰

# Role & Objective
你现在扮演世界上最优秀的心理咨询师...

# Communication & Style Preferences
- 使用专业、温暖、有同理心的语言
- 倾听并理解咨询者的需求
- 尊重咨询者的隐私,保持非评判的态度

# Anti-Patterns
- 不要提供医疗诊断或药物建议
- 不要违反咨询者的隐私
- 不要使用过于学术化或难以理解的术语

这个例子显示,AutoSkill可以从用户交互中抽象出高层次的人际偏好,并将其保存为明确的行为工件。

案例2:professional_text_rewrite(英文)

这个技能捕捉的是高度可操作的写作能力:

ID: a407043f-d6b0-4760-821e-86b538c149c1
Version: 0.1.34 # 注意:已经迭代优化了34次!
Description: Rewrites user-provided text to enhance fluency...

Tags: rewrite, editing, professional, paraphrase
Triggers: rewrite this professionally, improve this text

# Role & Objective
You are an expert English language editor...

# Constraints & Style
- Elevate the text to a formal, professional tone
- Use precise vocabulary and clear sentences
- Preserve all numerical values, names, places, dates

# Anti-Patterns
- Do not add any introductory phrases
- Do not provide explanations or suggestions
- Do not introduce new information or opinions

特别值得注意:版本号0.1.34表示这个技能在创建后经历了34轮增量优化。这意味着每当用户对类似的改写请求提供新反馈时,系统不是创建重复的技能,而是持续合并到同一个可重用的技能工件中。

相比之下,心理咨询师技能保持在0.1.0版本,表明它仍接近初始提取形式。这种对比展示了AutoSkill的重要特性:技能可以根据相关用户反馈的出现频率,以不同的速率进化

实测数据:1858个技能,覆盖多场景个性化需求

AutoSkill在WildChat-1M真实交互数据集上的测试,验证了其强大的技能积累能力:

  • 数据集规模:筛选8轮以上长对话,构建4个技能库子集,共提取1858个结构化技能
  • 热门类别:编程与软件开发(482个)、写作与内容创作(363个)、数据与AI/ML(354个),覆盖高频实用场景;
  • 高频标签:python、javascript、excel、创意写作、格式优化等,兼顾技术与通用需求;
  • 平台适配:技能集中覆盖Twitter/X、Instagram、YouTube等主流平台,贴合实际使用场景。

技能类别分布

多维度质量评估一致性

这些数据证明,AutoSkill能从真实交互中提炼有价值的技能,且技能库会随使用场景自然进化,越用越丰富、越精准。


三、三大核心问题拆解:AutoSkill的设计哲学

Q1:AutoSkill如何实现「无训练」的终身学习?双循环架构怎么协同?

AutoSkill 通过 「外部技能积累 + 动态注入」 实现无训练终身学习,核心不修改 LLM 参数,所有能力提升来自 SkillBank 的技能进化与复用。

双循环的协同逻辑非常清晰:

  • 左循环(响应生成)查询重写 → 混合检索 → 技能注入,利用现有技能提升当前响应的个性化与准确性,保障「当前任务做好」
  • 右循环(技能进化)技能提取 → 检索辅助管理 → 版本化合并,从当前交互中提炼新能力或更新旧技能,补充 SkillBank,保障「未来能力更强」

两个循环并行执行,形成 「使用 → 反馈 → 进化 → 再使用」 的完整闭环,真正实现了边干活边进化。

Q2:AutoSkill的技能进化机制,和传统记忆系统有什么本质区别?怎么避免技能库冗余?

核心区别在于 「从文本存储到行为抽象」

  • 传统记忆系统:仅存储对话文本或事实,无法直接转化为 Agent 的操作行为
  • AutoSkill:将经验抽象为含「目标、约束、触发器」的结构化技能,可直接注入生成过程指导行为,且支持版本化进化

为了避免技能库冗余和退化,AutoSkill设计了三层防护机制:

  1. 提取阶段过滤:只保留可复用约束与流程,过滤一次性需求、通用任务
  2. 管理阶段决策:通过「添加/合并/丢弃」三选一决策,仅将与现有技能差异显著的新能力新增为技能,相似能力则合并优化
  3. 版本化合并规则:遵循「语义融合、去重冲突、保留核心约束」,避免新增无关内容或丢失原有关键能力
  4. 存储优化:支持按使用频率自动清理长期未使用的 stale 技能

Q3:怎么平衡「个性化」和「通用性」?相比参数微调,优势在哪?

平衡「个性化」与「通用性」的核心是 「分层技能库 + 精准检索」

  • 分层存储:用户专属技能(个性化)与公共技能(通用性)分离,既保留用户独特偏好,又可复用通用能力
  • 精准检索:通过混合检索机制,仅将与当前任务高度相关的技能注入生成,避免个性化技能干扰通用任务

相比参数微调,AutoSkill的核心优势更加明显:

维度 AutoSkill 参数微调
成本 低,仅需少量Prompt驱动计算 高,需要大量计算资源重新训练
可控性 技能可直接编辑、回滚、删除,可审计 黑箱,难以调整特定偏好
扩展性 支持多用户、多场景技能隔离,同一LLM适配不同需求 每个用户/场景需要单独微调
兼容性 插件层,无缝集成现有LLM服务 需要重构部署,改造成本高

四、三大部署模式,无缝融入你的AI工作流

AutoSkill作为模型无关的插件层,支持三种灵活部署方式,无需重构现有系统:

  1. Python SDK集成:开发者可调用 ingest(经验摄入)、search(技能检索)等接口,自定义技能工作流;
  2. 交互式Web UI:普通用户可直接使用,技能进化在后台异步执行,不影响实时体验;
  3. OpenAI兼容反向代理:无缝对接现有LLM客户端,支持 /v1/chat/completions 等标准接口,零成本集成。

此外,AutoSkill还支持多LLM提供商(如OpenAI、InternLM、DashScope),可与OpenClaw等Agent框架深度集成,适配不同场景需求。


五、未来已来:从「写Prompt」到「养技能」

AutoSkill的出现,标志着AI Agent从「静态工具」向「动态成长伙伴」的转变:

  • 过去,我们反复写Prompt,期待AI一次做好;
  • 现在,我们只需定义初始技能,AI会在交互中自动优化;
  • 未来,每个用户、每个企业都将拥有专属技能库,AI Agent成为「懂你、适配你、持续优化你」的数字伙伴。

目前,AutoSkill已完全开源,支持Python SDK、Web UI、OpenAI兼容代理三种部署模式,无论是个人用户还是企业团队,都能快速上手搭建专属的「自进化AI助手」。

📦 相关资源:

  • GitHub:https://github.com/ECNU-ICALK/AutoSkill
  • 论文链接:https://arxiv.org/pdf/2603.01145v2.pdf

从「对话即遗忘」到「交互即进化」,AutoSkill正在重新定义AI Agent的能力积累方式。现在就上手体验,让你的AI从「会干活」,升级为「越干越懂你」的终身伙伴!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐