深夜两点,你还在为论文格式调整焦头烂额;文献综述写了一周,却还在补充新的相关研究;审稿意见返回,要花整整三天修改……这些场景对ML研究者来说并不陌生。

机器学习研究流程通常包括:文献调研、想法生成、实验设计、代码实现、结果分析、论文撰写、审稿响应等环节。每个环节都需要大量时间和专业知识。

传统的AI编程助手(如GitHub Copilot、Cursor)主要提供代码建议,无法理解研究上下文,更不能完成完整的研究任务。简单的prompt工程也难以应对复杂的研究流程——你需要的不只是生成几段文字,而是需要AI理解研究目标、协调多个工具、持久化知识、持续优化策略。

ARIS(Auto-Research-In-Sleep)的出现正是为了解决这个问题。它是一个为Claude Code设计的ML研究自动化框架,能够实现从文献调研、想法生成、实验设计到论文撰写和审稿响应的全流程自动化。

架构设计:跨模型协作机制

2-Agent对抗模式

ARIS最独特的设计是其2-agent对抗模式:Claude Code作为执行Agent负责具体研究任务,GPT-5.4作为审稿Agent提供批评和改进建议。

这种设计源于一个关键洞察:单一模型难以同时扮演"创作者"和"评审者"两个角色。Claude Code擅长理解和执行复杂任务,但在自我评估时容易陷入思维盲区;而GPT-5.4经过专门训练,能够从审稿人的角度发现问题。

技术实现细节

具体实现上,ARIS通过Oracle MCP集成GPT-5.4 Pro。当Claude Code完成一个研究环节(如实验设计或论文初稿),系统会自动触发GPT-5.4进行评审。评审意见以结构化形式返回,Claude Code根据反馈进行迭代改进。

image

跨模型协作的优势

与单一模型方案相比,跨模型协作有两个明显优势:

  • 减少自我强化的偏见:执行和评审由不同模型完成
  • 利用不同模型的优势组合:Claude Code擅长长文本理解和代码生成,GPT-5.4擅长批判性分析

技能驱动架构:67个Markdown文件的研究工具链

核心设计理念

ARIS的核心是技能驱动(Skill-Driven)架构。全部67个技能以纯Markdown文件形式存在,没有复杂的依赖,没有lock-in框架。

每个技能文件定义了一个具体的研究能力,例如:

  • idea_discovery.md:从OpenAlex检索相关文献,提取研究gap
  • experiment_bridge.md:将研究想法转化为实验设计
  • paper_writer.md:按照学术规范撰写论文各个部分
  • review_response.md:分析审稿意见,生成逐条响应

工程优势

image

这种设计带来几个工程优势:

  • 零依赖:不需要安装复杂的框架,只要有Claude Code就能运行
  • 可读可改:Markdown格式让每个技能都透明可见,研究者可以轻松定制
  • 版本可控:技能文件可以像代码一样进行git管理
  • 易于扩展:添加新技能只需创建一个Markdown文件

研究者还可以通过Codex技能镜像获得完整的Codex CLI能力,这意味着ARIS可以直接操作命令行、管理项目、运行实验。

Research Wiki:知识持久化与跨会话复用

问题背景

研究是一个长期积累的过程。你可能今天想到了一个好主意,过两周才真正开始实验;或者在写新论文时,需要参考之前的研究成果。传统LLM的会话记忆无法满足这种需求。

解决方案

ARIS的解决方案是Research Wiki——一个专门的研究知识库系统。它记录你的论文、想法、实验、结论,并支持跨会话查询和复用。

具体来说,Research Wiki通过research_wiki.py维护一个结构化的知识图谱。每当你完成一个研究环节,相关内容会被自动索引和存储。下次启动ARIS时,系统会读取Wiki中的历史知识,为新任务提供上下文。

持续学习能力

这带来一个重要能力:研究者可以"教导"ARIS。通过Research Wiki,你可以告诉系统你的研究领域、偏好风格、常用方法,ARIS会在后续任务中应用这些知识。

此外,ARIS还提供/meta-optimize功能,通过分析使用日志自动改进技能。这意味着系统会根据你的使用反馈,不断优化自己的能力。

实践指南:从安装到使用

安装部署

ARIS的部署非常简单,只需要一个安装脚本:

bash install_aris.sh

安装完成后,系统会自动创建必要的目录结构和技能文件。

典型使用场景

场景1:快速启动一个研究项目

使用idea_discovery技能,帮我分析"transformer效率优化"领域的研究gap

场景2:自动化论文撰写

基于实验结果,使用paper_writer技能撰写方法部分

场景3:审稿响应

针对这些审稿意见,使用review_response技能生成逐条回复

image

实际案例

实际案例中,ARIS已经帮助研究者完成了一篇AAAI 2026论文。从最初的研究想法,到文献调研、实验设计、论文撰写,整个过程大部分由ARIS自动完成,研究者主要在关键决策点进行干预。

需要注意的是,ARIS并非完全替代人类研究者。它擅长的是重复性、标准化的工作,研究创新性和深度思考仍然需要人类主导。

开发者扩展指南

ARIS是开源的,开发者可以根据自己的需求进行定制:

  • 自定义技能:创建新的Markdown技能文件,扩展ARIS的能力边界
  • 集成其他模型:通过MCP协议集成GPT-4、Gemini等其他模型
  • 连接实验平台:将ARIS与你的实验基础设施连接,实现从想法到结果的全自动化
  • 团队协作:在研究团队中部署ARIS,统一研究流程和知识管理

项目的GitHub仓库(wanshuiyin/Auto-claude-code-research-in-sleep)提供了完整文档和示例。

总结

ARIS代表了AI研究自动化的一个重要方向:不是简单地用AI生成内容,而是构建一套完整的工作流系统,让AI真正理解研究上下文、协调多个工具、积累领域知识。

跨模型协作、技能驱动架构、Research Wiki持久化,这三个技术设计共同构成了ARIS的核心能力。对于ML研究者来说,ARIS提供了一个7×24小时的研究助手,能够在你睡觉时完成大量重复性工作。

更重要的是,ARIS的开源设计和零依赖架构,让研究者可以轻松定制和扩展。这不仅仅是一个工具,更是一个研究自动化的实验平台。随着更多研究者和开发者的参与,AI辅助科研很可能成为学术界的标配。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐