今天的大模型已经非常强大——会写代码,会做总结,会写方案,会角色扮演,也会安慰人。但它仍然有一个明显短板:它会回答,却不会真正成长。你今天告诉它“写方案别造假,别用表格,口吻稳一点”;下一次又要从零开始提示。问题不一定出在模型不够大,而在于缺少一层能够把“交互经验”沉淀成“长期能力”的技能系统。为此,能否设计一个模型在交互过程中学习用户的习惯和能力,成为其数字员工?

针对上述问题,上海人工智能实验室联合华东师大计算机学院研发并开源了 AutoSkill,基于技能自进化的经验驱动终身学习(Experience-driven Lifelong Learning)框架,旨在从对话、操作等交互行为中自动总结技能,让 AI 从“听令行事”的响应式工具,向“从实践中学习、在反馈中成长、于协作中共享”的终身学习体跃升。

[图片]

图1: AutoSkill框架图

AutoSkill 的本质突破在于重构模型持续学习范式:它以用户日常对话、操作反馈、行为轨迹等原始交互经验为学习源,自动识别其中具有稳定性、可迁移性与可执行性的个性化约束与任务规则,动态生成标准化技能模块,并支持版本演进。标准化技能模块以 SKILL.md 为核心描述文件,具备人类可读、机器可解析、系统可迁移的特性,可直接导入导出,亦可无缝嵌入各类 Agent 架构与业务平台。

AutoSkill 具备三大核心优势:它能够在持续交互中不断学习用户的偏好与做事方式,实现技能自进化,让 AI 从“听令行事”逐步成长为可以独立承担任务的数字员工;同时无需额外训练,可作为可插拔插件无缝接入现有各类大模型体系,部署成本低、使用门槛友好;此外,基于标准化的 Agent Skill 格式,沉淀下来的能力具备良好的可迁移性,可以在不同场景与系统之间复用与流转。

AutoSkill 现已全面开源,欢迎体验——让你的 AI 助手越用越聪明,越用越懂你。

GitHub开源链接: https://github.com/ECNU-ICALK/AutoSkill

技术报告https://arxiv.org/abs/2603.01145

为什么今天的大模型,还缺一层“技能系统”

过去解决大模型只能“临时记住”,却不能“长期学会”这个问题的方式,通常有三种:第一种是写更长的提示词;第二种是把历史对话一股脑塞回上下文;第三种是等下一轮微调或重训练。它们都有效,但都有一个共同的问题:临时、昂贵,而且不够可持续。

真正有价值的,不是让模型记住某一句话,而是让模型沉淀出一套做事的方法。比如“避免幻觉”“不要表格”“政策写作口吻要稳”“角色扮演时要保持设定一致”,这些都不只是记忆点,而是可以被复用、被组合、被更新的 Skill。如果说 Memory 解决的是“记住你说过什么”,那 Skill 解决的就是“学会你是怎么做事的”。这两者看起来相近,差别却很大:前者更像备忘录,后者更像手艺。

AutoSkill 想做的,就是在模型外面加上一层技能系统:从真实对话和交互轨迹中自动抽取 Skill,把一次次临时经验,变成可检索、可维护、可升级的长期能力。AutoSkill 基于经验驱动终身学习框架(Experience-driven Lifelong Learning)框架,不依赖重新训练底座模型,而是把经验转化为可复用技能,再动态注入到未来任务中。

一句话总结 AutoSkill 不是再造一个更大的模型,而是给现有模型装上一层会“沉淀经验、检索技能、持续升级”的 Skill 系统。

能不能一边对话,一边升级技能,实现自进化?

用户真正想要的,不是一个只会“临场发挥”的模型,而是一个会在交互中越来越懂你、越来越懂任务的方法型助手。今天你告诉它“不要幻觉,表述稳一点”,明天它就应该比昨天更会写;下周你再补一句“不要表格,避免术语堆砌”,它也应该把这些经验继续接上去,而不是重新学习一遍。对用户来说,这意味着更少重复解释;对 Agent 来说,这意味着能力可以在使用中积累,而不是只能靠重训或重新写提示词。

为了解决这个问题,AutoSkill 不是把整段聊天记录原封不动塞回上下文,而是把真正稳定、可复用的经验抽成 Skill,并让这些 Skill 直接参与当前回答。具体地,系统会在当前请求到来时进行问题重写、技能检索和技能注入,用命中的 Skill 增强当前回答;与此同时,再把交互中值得长期保留的方法和偏好整理成候选 Skill,判断是新增、合并,还是丢弃,最后以版本化形式写入技能库(SkillBank)。这样,模型一边对话,一边就在把“经验”慢慢长成“能力”。

这意味着 Skill 的成长不是一次性的。今天你说“尽量避免幻觉”,系统可能沉淀出第一个版本;明天你又补充“不要表格,避免术语堆砌,结论放前面”,它就不必重新造一个重复 Skill,而是优先把原有 skill 更新成更成熟的版本。真正的自进化,不是凭空变聪明,而是在一次次真实互动里持续修正、持续打磨。

能不能从大量真实对话中,得到全人类的技能集合?

如果一个人的对话能沉淀出 Skill,那么成千上万人的真实对话,能不能沉淀出一个时代的大模型使用方式?研究团队基于 300 多万级真实对话,抽取出上千个技能,它们不再是一堆零散的提示词,而是人类如何与大模型协作的真实切片:有人拿它算命,有人让它写代码,有人拿它做角色扮演,有人让它润色公文、备课、写脚本、做运营。

高频类别不仅有 python、javascript、excel,也包括 creative writing、formatting、education、translation、roleplay。也就是说,人类在使用大模型时,真正高频的需求并不只是“写代码”这一种,而是一整张非常鲜活的技能图谱。更重要的是,真正高频、真正有生命力的 skill,往往会在反复使用中被不断更新、合并、重写——如果一个 skill 被迭代了几十次,那它本质上就不再只是提示词,而是被实践反复打磨出来的人类结晶。

[图片]

图2: 技能事例1

[图片]

图3: 技能事例2(更新34个版本)

除了对话,Skill 能不能来自书本、操作手册和论文?

对话当然重要,但很多成熟的方法论,本来就沉淀在书本、论文和期刊里。一本好书之所以有价值,不只是因为它“有知识”,而是因为它往往已经把一个领域里反复验证过的工作方式整理好了。问题是,这些内容大多停留在“可阅读”层面,很难直接变成 Agent 随时可调用的 Skill。

为了解决这个问题,研究团队提出 AutoSkill4Doc。它不是简单地给文档做摘要,而是尝试把文档“编译”为Skill:从文档中抽出方法、约束、步骤、概念层级和适用边界,再把它们组织成可以维护、可以继承、可以调用的技能树。具体地,文档会先经过抽取、合并等流程获得不同类别不同粒度的 Skill,形成 结构化的技能树,最后写入技能库。这样,一篇论文不只是被“看过”,而是真正被转化成了可以工作的结构化能力。

比如,看完一本心理学的书,得到的就不只是几页笔记,而是一整套能够被调用的心理咨询 Skill;读完一组论文和期刊,沉淀下来的也不只是摘要,而是一套更接近专业流程的方法论。CLI 安装完成之后,启动的就不再只是一个通用模型,而是一个带着特定领域 Skill 包的 Agent。

能不能把 AutoSkill 接进 OpenClaw,让“小龙虾”越来越聪明?

如果 Skill 只存在于某个独立 Demo 里,它的意义还是有限的。真正值得期待的,是把 Skill 系统接进 Agent 的生命周期里,让它随着任务运行自动抽取、自动维护、自动复用。

AutoSkill4OpenClaw 已经把这件事往前推进了一步:在 Agent 启动前检索需要的技能,在任务结束后根据轨迹抽取候选 Skill,再进行新增、合并和版本更新。装上之后,今天完成的任务,会变成明天更顺手的工作流;今天踩过的坑,也会变成下次更稳的 Skill。

所以“小龙虾”越来越聪明,不该只是因为换了一个更强的底座模型,而应该是因为它开始积累经验、维护技能、不断成长。一次安装,不是获得一套静态能力,而是获得一个会随着使用持续演化的 Agent。

为什么我们会觉得,这可能是下一代 Agent 的关键一层

我们今天已经看到了很多“会调用工具”的 Agent,也看到了很多“上下文很长”的模型。但真正长期可用的智能体,未必只靠更长上下文、更大参数量,或者更频繁的重训练。它更需要一种能够把经验稳定积累下来、并在未来任务中继续生效的机制。

从这个意义上说,AutoSkill 提供的不是一个孤立功能,而是一种新的组织方式:把一次回答,沉淀成一套 Skill;把一次任务,沉淀成一条可复用 Workflow;把一次交互,沉淀成未来更好的自己。

真正重要的,不是 AI 记住了你说过什么,而是它学会了如何为你做事。

AutoSkill 想做的,也许不是让模型更像一本百科全书,而是让它更像一个会做事、会复盘、会成长的人。

当 AI 开始把经验变成 skill,再把 skill 继续变成能力,我们面对的就不再只是一个“会回答”的系统,而是一个越用越懂你、越做越会做的长期伙伴。

AutoSkill 案例展示

1)技能抽取:从一次性请求中识别可复用能力

当用户首次提出结构清晰、约束明确的任务(如“撰写一个关于大模型量化学习的公众号;不要有幻觉,要用word格式,不用花里胡哨的表达”),系统自动识别其稳定性与可迁移性,生成首个技能版本(如 “政府报告撰写 v0.1.0”),直接从真实交互中沉淀能力,避免经验流失。

[图片]

图4: 日常技能抽取

2)技能更新:基于用户反馈持续优化已有能力

当用户后续补充新要求(如“写的具体一些,问题犀利,要有自己的见解。”),系统将该反馈合并入原技能,自动升级版本号(如 “v0.1.0 → v0.1.1”),在不新建冗余技能的基础上实现动态更新。

[图片]

图5: 日常技能更新

3)技能复用:调用最新版本,实现稳定精准交付

当类似意图再次出现(如“写一个关于经验驱动终身学习的政府报告”),系统自动检索并注入最新版技能(“v0.1.1”),将全部约束无缝融入生成过程,无需重复说明、不依赖上下文记忆,输出天然符合用户演进后的全部要求。

[图片]

图6: 日常技能复用

AutoSkill 使用介绍

AutoSkill 支持开箱即用,可通过 Web 界面、OpenAI 兼容代理、SDK 编程接口等多种形态深度集成。

一键安装

git clone https://github.com/ECNU-ICALK/AutoSkill.git
cd AutoSkill
python3 -m pip install -e .
export INTERNLM_API_KEY="YOUR_INTERNLM_API_KEY"
export DASHSCOPE_API_KEY="YOUR_DASHSCOPE_API_KEY"
python3 -m examples.web_ui \
  --host 127.0.0.1 \
  --port 8000 \
  --llm-provider internlm \
  --embeddings-provider qwen \
  --store-dir Skills \
  --user-id u1 \
  --skill-scope all \
  --rewrite-mode always \
  --extract-mode auto \
  --extract-turn-limit 1 \
  --min-score 0.4 \
  --top-k 1

标准 API 接口

export INTERNLM_API_KEY="YOUR_INTERNLM_API_KEY"
export DASHSCOPE_API_KEY="YOUR_DASHSCOPE_API_KEY"
python3 -m examples.openai_proxy \
  --host 127.0.0.1 \
  --port 9000 \
  --llm-provider internlm \
  --embeddings-provider qwen \
  --store-dir Skills \
  --user-id u1 \
  --skill-scope all \
  --rewrite-mode always \
  --min-score 0.4 \
  --top-k 1

SDK 编程接口

from autoskill import AutoSkill, AutoSkillConfig
sdk = AutoSkill(
    AutoSkillConfig(
        llm={"provider": "mock"},
        embeddings={"provider": "hashing", "dims": 256},
        store={"provider": "local", "path": "Skills"},
    )
)
sdk.ingest(
    user_id="u1",
    messages=[
        {"role": "user", "content": "Before each release: run regression -> canary -> monitor -> full rollout."},
        {"role": "assistant", "content": "Understood."},
    ],
)
hits = sdk.search("How should I do a safe release?", user_id="u1", limit=3)
for h in hits:
    print(h.skill.name, h.score)
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐