让AI自己学会“打怪升级“：国内学者团队研发出“开挂“式AI进化新框架！

热点速递

217人浏览 · 2026-06-09 21:00:27

热点速递 · 2026-06-09 21:00:27 发布

人工智能发展迎来重要突破。里海大学计算机科学与工程系助理教授孙立超带领团队，最近推出了一套全新的AI进化框架OpenSkill，这套技术让人工智能系统能够不依赖人工指导就学会完成任务，在多个权威测试中刷新了历史最佳成绩。

AI自我进化的"卡点"在哪里？

过去很长一段时间，人工智能系统要持续学习，通常需要满足三个条件：要么有成功的案例可以学习，要么有现成的技能模板，要么需要人类提供明确的反馈。但在现实中，这三个条件很难同时满足。真实场景中，AI系统常常因为缺少这些前提而无法继续积累经验和自我迭代，就像一个人想学做菜，却既没有菜谱，也没有人教，更看不到成功的样菜。

OpenSkill：让AI在开放世界里"自学成才"

为解决这个难题，研究团队设计了OpenSkill框架。这套系统的核心思路是：让AI在不依赖任何目标任务监督信号的情况下，也能获得可以执行、可以迁移的技能。简单来说，就是给AI一个开放的学习环境，让它自己去获取知识、验证能力，最后形成一套完整的技能包。

这个框架的工作流程分为三步：第一步是从开放世界中获取知识，包括任务相关的背景概念、API文档、最佳实践和代码示例；第二步是通过自动构造的虚拟任务反复测试和改进AI生成的技能，这个过程中完全不使用真实测试集的答案；第三步是将进化完成的技能以文件形式部署到目标AI系统上，最后用真实的测试集进行评估。

数据说话：多个基准测试全面领先

测试结果显示，OpenSkill的表现确实不俗。在SkillsBench基准测试中，这套系统将Opus 4.6模型的总体通过率提升至43.6%，GPT 5.2提升至42.1%，比之前最强的基线方法分别高出8.9和8.8个百分点。研究团队指出，这个成绩距离人类参考水平仅差1至3个百分点。

同样的优异表现也出现在其他测试中。在SocialMaze测试中，OpenSkill在两个目标模型上的通过率分别达到82.7%和70.7%；在ScienceWorld测试中，通过率分别达到90.0%和85.3%。在这些设置中，OpenSkill均为表现最好的自动化方法。

技能可以"复制粘贴"：降低AI使用门槛

OpenSkill还有一个显著优势：技能可以直接迁移到其他模型上，无需额外适配。研究团队将Opus 4.6生成的技能直接迁移到Haiku 4.5、Qwen 3Coder、DeepSeek V3和Mistral Large 3等四个更弱的模型上，结果显示这些技能在所有目标模型上都带来了明显提升，提升幅度在5.5到14.8个百分点之间。