AutoSkill：让 AI 从“听令行事”进化为持续成长的数字员工

InternLM

384人浏览 · 2026-03-24 16:43:21

InternLM · 2026-03-24 16:43:21 发布

今天的大模型已经非常强大——会写代码，会做总结，会写方案，会角色扮演，也会安慰人。但它仍然有一个明显短板：它会回答，却不会真正成长。你今天告诉它“写方案别造假，别用表格，口吻稳一点”；下一次又要从零开始提示。问题不一定出在模型不够大，而在于缺少一层能够把“交互经验”沉淀成“长期能力”的技能系统。为此，能否设计一个模型在交互过程中学习用户的习惯和能力，成为其数字员工？

针对上述问题，上海人工智能实验室联合华东师大计算机学院研发并开源了 AutoSkill，基于技能自进化的经验驱动终身学习（Experience-driven Lifelong Learning）框架，旨在从对话、操作等交互行为中自动总结技能，让 AI 从“听令行事”的响应式工具，向“从实践中学习、在反馈中成长、于协作中共享”的终身学习体跃升。

[图片]

图1: AutoSkill框架图

AutoSkill 的本质突破在于重构模型持续学习范式：它以用户日常对话、操作反馈、行为轨迹等原始交互经验为学习源，自动识别其中具有稳定性、可迁移性与可执行性的个性化约束与任务规则，动态生成标准化技能模块，并支持版本演进。标准化技能模块以 SKILL.md 为核心描述文件，具备人类可读、机器可解析、系统可迁移的特性，可直接导入导出，亦可无缝嵌入各类 Agent 架构与业务平台。

AutoSkill 具备三大核心优势：它能够在持续交互中不断学习用户的偏好与做事方式，实现技能自进化，让 AI 从“听令行事”逐步成长为可以独立承担任务的数字员工；同时无需额外训练，可作为可插拔插件无缝接入现有各类大模型体系，部署成本低、使用门槛友好；此外，基于标准化的 Agent Skill 格式，沉淀下来的能力具备良好的可迁移性，可以在不同场景与系统之间复用与流转。

AutoSkill 现已全面开源，欢迎体验——让你的 AI 助手越用越聪明，越用越懂你。

GitHub开源链接: https://github.com/ECNU-ICALK/AutoSkill

技术报告：https://arxiv.org/abs/2603.01145

为什么今天的大模型，还缺一层“技能系统”

过去解决大模型只能“临时记住”，却不能“长期学会”这个问题的方式，通常有三种：第一种是写更长的提示词；第二种是把历史对话一股脑塞回上下文；第三种是等下一轮微调或重训练。它们都有效，但都有一个共同的问题：临时、昂贵，而且不够可持续。

真正有价值的，不是让模型记住某一句话，而是让模型沉淀出一套做事的方法。比如“避免幻觉”“不要表格”“政策写作口吻要稳”“角色扮演时要保持设定一致”，这些都不只是记忆点，而是可以被复用、被组合、被更新的 Skill。如果说 Memory 解决的是“记住你说过什么”，那 Skill 解决的就是“学会你是怎么做事的”。这两者看起来相近，差别却很大：前者更像备忘录，后者更像手艺。

AutoSkill 想做的，就是在模型外面加上一层技能系统：从真实对话和交互轨迹中自动抽取 Skill，把一次次临时经验，变成可检索、可维护、可升级的长期能力。AutoSkill 基于经验驱动终身学习框架（Experience-driven Lifelong Learning）框架，不依赖重新训练底座模型，而是把经验转化为可复用技能，再动态注入到未来任务中。

一句话总结： AutoSkill 不是再造一个更大的模型，而是给现有模型装上一层会“沉淀经验、检索技能、持续升级”的 Skill 系统。

能不能一边对话，一边升级技能，实现自进化？

用户真正想要的，不是一个只会“临场发挥”的模型，而是一个会在交互中越来越懂你、越来越懂任务的方法型助手。今天你告诉它“不要幻觉，表述稳一点”，明天它就应该比昨天更会写；下周你再补一句“不要表格，避免术语堆砌”，它也应该把这些经验继续接上去，而不是重新学习一遍。对用户来说，这意味着更少重复解释；对 Agent 来说，这意味着能力可以在使用中积累，而不是只能靠重训或重新写提示词。

为了解决这个问题，AutoSkill 不是把整段聊天记录原封不动塞回上下文，而是把真正稳定、可复用的经验抽成 Skill，并让这些 Skill 直接参与当前回答。具体地，系统会在当前请求到来时进行问题重写、技能检索和技能注入，用命中的 Skill 增强当前回答；与此同时，再把交互中值得长期保留的方法和偏好整理成候选 Skill，判断是新增、合并，还是丢弃，最后以版本化形式写入技能库（SkillBank）。这样，模型一边对话，一边就在把“经验”慢慢长成“能力”。

这意味着 Skill 的成长不是一次性的。今天你说“尽量避免幻觉”，系统可能沉淀出第一个版本；明天你又补充“不要表格，避免术语堆砌，结论放前面”，它就不必重新造一个重复 Skill，而是优先把原有 skill 更新成更成熟的版本。真正的自进化，不是凭空变聪明，而是在一次次真实互动里持续修正、持续打磨。

能不能从大量真实对话中，得到全人类的技能集合？

如果一个人的对话能沉淀出 Skill，那么成千上万人的真实对话，能不能沉淀出一个时代的大模型使用方式？研究团队基于 300 多万级真实对话，抽取出上千个技能，它们不再是一堆零散的提示词，而是人类如何与大模型协作的真实切片：有人拿它算命，有人让它写代码，有人拿它做角色扮演，有人让它润色公文、备课、写脚本、做运营。

高频类别不仅有 python、javascript、excel，也包括 creative writing、formatting、education、translation、roleplay。也就是说，人类在使用大模型时，真正高频的需求并不只是“写代码”这一种，而是一整张非常鲜活的技能图谱。更重要的是，真正高频、真正有生命力的 skill，往往会在反复使用中被不断更新、合并、重写——如果一个 skill 被迭代了几十次，那它本质上就不再只是提示词，而是被实践反复打磨出来的人类结晶。

[图片]

图2: 技能事例1

[图片]

图3: 技能事例2（更新34个版本）

除了对话，Skill 能不能来自书本、操作手册和论文？

对话当然重要，但很多成熟的方法论，本来就沉淀在书本、论文和期刊里。一本好书之所以有价值，不只是因为它“有知识”，而是因为它往往已经把一个领域里反复验证过的工作方式整理好了。问题是，这些内容大多停留在“可阅读”层面，很难直接变成 Agent 随时可调用的 Skill。

为了解决这个问题，研究团队提出 AutoSkill4Doc。它不是简单地给文档做摘要，而是尝试把文档“编译”为Skill：从文档中抽出方法、约束、步骤、概念层级和适用边界，再把它们组织成可以维护、可以继承、可以调用的技能树。具体地，文档会先经过抽取、合并等流程获得不同类别不同粒度的 Skill，形成结构化的技能树，最后写入技能库。这样，一篇论文不只是被“看过”，而是真正被转化成了可以工作的结构化能力。

比如，看完一本心理学的书，得到的就不只是几页笔记，而是一整套能够被调用的心理咨询 Skill；读完一组论文和期刊，沉淀下来的也不只是摘要，而是一套更接近专业流程的方法论。CLI 安装完成之后，启动的就不再只是一个通用模型，而是一个带着特定领域 Skill 包的 Agent。

能不能把 AutoSkill 接进 OpenClaw，让“小龙虾”越来越聪明？

如果 Skill 只存在于某个独立 Demo 里，它的意义还是有限的。真正值得期待的，是把 Skill 系统接进 Agent 的生命周期里，让它随着任务运行自动抽取、自动维护、自动复用。

AutoSkill4OpenClaw 已经把这件事往前推进了一步：在 Agent 启动前检索需要的技能，在任务结束后根据轨迹抽取候选 Skill，再进行新增、合并和版本更新。装上之后，今天完成的任务，会变成明天更顺手的工作流；今天踩过的坑，也会变成下次更稳的 Skill。

所以“小龙虾”越来越聪明，不该只是因为换了一个更强的底座模型，而应该是因为它开始积累经验、维护技能、不断成长。一次安装，不是获得一套静态能力，而是获得一个会随着使用持续演化的 Agent。

为什么我们会觉得，这可能是下一代 Agent 的关键一层

我们今天已经看到了很多“会调用工具”的 Agent，也看到了很多“上下文很长”的模型。但真正长期可用的智能体，未必只靠更长上下文、更大参数量，或者更频繁的重训练。它更需要一种能够把经验稳定积累下来、并在未来任务中继续生效的机制。

从这个意义上说，AutoSkill 提供的不是一个孤立功能，而是一种新的组织方式：把一次回答，沉淀成一套 Skill；把一次任务，沉淀成一条可复用 Workflow；把一次交互，沉淀成未来更好的自己。

真正重要的，不是 AI 记住了你说过什么，而是它学会了如何为你做事。

AutoSkill 想做的，也许不是让模型更像一本百科全书，而是让它更像一个会做事、会复盘、会成长的人。

当 AI 开始把经验变成 skill，再把 skill 继续变成能力，我们面对的就不再只是一个“会回答”的系统，而是一个越用越懂你、越做越会做的长期伙伴。

AutoSkill 案例展示

1）技能抽取：从一次性请求中识别可复用能力

当用户首次提出结构清晰、约束明确的任务（如“撰写一个关于大模型量化学习的公众号；不要有幻觉，要用word格式，不用花里胡哨的表达”），系统自动识别其稳定性与可迁移性，生成首个技能版本（如 “政府报告撰写 v0.1.0”），直接从真实交互中沉淀能力，避免经验流失。

[图片]

图4: 日常技能抽取

2）技能更新：基于用户反馈持续优化已有能力

当用户后续补充新要求（如“写的具体一些，问题犀利，要有自己的见解。”），系统将该反馈合并入原技能，自动升级版本号（如 “v0.1.0 → v0.1.1”），在不新建冗余技能的基础上实现动态更新。

[图片]

图5: 日常技能更新

3）技能复用：调用最新版本，实现稳定精准交付

当类似意图再次出现（如“写一个关于经验驱动终身学习的政府报告”），系统自动检索并注入最新版技能（“v0.1.1”），将全部约束无缝融入生成过程，无需重复说明、不依赖上下文记忆，输出天然符合用户演进后的全部要求。

[图片]

图6: 日常技能复用

AutoSkill 使用介绍

AutoSkill 支持开箱即用，可通过 Web 界面、OpenAI 兼容代理、SDK 编程接口等多种形态深度集成。

一键安装

git clone https://github.com/ECNU-ICALK/AutoSkill.git
cd AutoSkill
python3 -m pip install -e .

export INTERNLM_API_KEY="YOUR_INTERNLM_API_KEY"
export DASHSCOPE_API_KEY="YOUR_DASHSCOPE_API_KEY"
python3 -m examples.web_ui \
  --host 127.0.0.1 \
  --port 8000 \
  --llm-provider internlm \
  --embeddings-provider qwen \
  --store-dir Skills \
  --user-id u1 \
  --skill-scope all \
  --rewrite-mode always \
  --extract-mode auto \
  --extract-turn-limit 1 \
  --min-score 0.4 \
  --top-k 1

标准 API 接口

export INTERNLM_API_KEY="YOUR_INTERNLM_API_KEY"
export DASHSCOPE_API_KEY="YOUR_DASHSCOPE_API_KEY"
python3 -m examples.openai_proxy \
  --host 127.0.0.1 \
  --port 9000 \
  --llm-provider internlm \
  --embeddings-provider qwen \
  --store-dir Skills \
  --user-id u1 \
  --skill-scope all \
  --rewrite-mode always \
  --min-score 0.4 \
  --top-k 1

SDK 编程接口

from autoskill import AutoSkill, AutoSkillConfig
sdk = AutoSkill(
    AutoSkillConfig(
        llm={"provider": "mock"},
        embeddings={"provider": "hashing", "dims": 256},
        store={"provider": "local", "path": "Skills"},
    )
)
sdk.ingest(
    user_id="u1",
    messages=[
        {"role": "user", "content": "Before each release: run regression -> canary -> monitor -> full rollout."},
        {"role": "assistant", "content": "Understood."},
    ],
)
hits = sdk.search("How should I do a safe release?", user_id="u1", limit=3)
for h in hits:
    print(h.skill.name, h.score)

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

天赐范式第10天早饭前：基于 ¬CH 力迫法的脑机接口：当经典混沌击穿高维边界——R²=0.960 的实证

AtomGit开源社区

大模型API中转平台技术深度解析：weelinking统一接入方案

AtomGit开源社区

【价格型需求响应】基于Logistic函数的负荷转移率模型需求响应研究（Matlab代码实现）

基于Logistic函数的负荷转移率模型通过刻画用户响应的非线性与模糊性，为价格型需求响应提供了精细化分析工具。其在实际应用中的成功案例（如微电网优化、峰谷差降低）验证了理论有效性，未来需进一步解决数据依赖性与动态适应性挑战，以实现更广泛的工程应用。📚2 运行结果🎉3参考文献部分理论来源于网络，如有侵权请联系删除。[1]杨世博. 计及分时电价的含CCHP型微网的配电网协调优化调度研究[D].东