对于github中ARIS项目的理解与感悟
目录
对于MCP与tools,本项目通过skill调用MCP与tools
一、项目概述
ARIS 是一个纯Markdown驱动的 AI 科研自动化框架。其核心理念是:用户睡觉时,AI 自主完成文献调研、产生 idea、做实验、写论文、回复审稿意见的全流程。
项目链接:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
核心特征:
零依赖——纯Markdown文件 + Python 工具脚本,无框架、无数据库、无 Docker
跨模型对抗协作——执行模型与评审模型必须是不同模型家族
评审者独立性——评审者直接读取原始文件,不接受执行者的摘要
每个技能是独立的skill,可嵌套调用形成管线
二、整体架构

注:此图中未展示MCP与tools部分
工作流详解图:

对于MCP与tools,本项目通过skill调用MCP与tools
1.MCP
MCP 服务器是 ARIS 的跨模型通信桥梁,它们通过 JSON-RPC 协议与 Claude Code 通信,为skills提供调用外部模型/服务的能力
支持Gemini(API和CLI)、Claude、OpenAI兼容API(OpenAI/DeepSeek/Kimi/MiniMax 等)、Codex原生图像等等MCP服务

2.tools
(1).安装与维护工具

(2).文献检索工具

(3).研究基础设施工具

(4).验证与审计工具

(5).元优化工具

(7).实验管理工具

工具与skill调用关系:
| skill | tool |
| research-lit |
arxiv_fetch.py exa_search.py |
| deepxiv | deepxiv_fetch.py |
| figure-spec | figure_renderer.py |
| research-wiki | research_wiki.py |
| paper-writing | extract_paper_style.py verify_paper_audits.sh |
| paper-illustration-image2 | paper_illustration_image2.py |
| monitor-experiment | watchdog.py |
|
auto-review-loop research-review paper-claim-audit |
save_trace.sh |
| meta-optimize | meta_opt/log_event.sh meta_opt/check_ready.sh |
| overleaf-sync | overleaf_setup.sh overleaf_audit.sh |
| experiment-queue |
experiment_queue/queue_manager.py experiment_queue/build_manifest.py |
| ... | ... |
此外,该项目还提供了各种模板以及各种docs适配指南以满足各式各样的需求,这里就不一一展示了
三、理解与感想
该项目是通过各种skills将各种各样的功能串联起来,从而形成一条完整的科研管线。功能齐全,不仅可以写代码、写论文,甚至还可以制作ppt等等。此外由于此项目的整个流程几乎都是由Agent去制作,所以难免会遇到Agent产生幻觉或者方向跑偏、实验不严谨等问题。
为了解决这些问题,此项目推出了智能体互判协议,这是这个项目的一个很大的亮点,让我印象很深
智能体互判协议
核心原则:执行模型和评审模型必须来自不同的模型家族
对于两个Agent:
执行者(Agent A):写代码、跑实验、写论文,不评审自己的代码,不解释/总结文件给评审者
评审者(Agent B):直接读取文件,评分、批评、要求修改,独立判断
Agent A与B的模型家族要求举例:
Claude (Anthropic) ↔ GPT (OpenAI) ✅
Codex (OpenAI) ↔ Gemini (Google) ✅
Claude (Anthropic) ↔ MiniMax ✅
Claude (Anthropic) ↔ Claude (Anthropic) ❌ 同一家族,不允许
评审者独立性:内容必须未经过滤地到达评审者。执行者指向文件并设定评审任务;评审者独立阅读和判断
实验完整性:编写实验代码的模型不得评判实验完整性
评审可追踪性:每次跨模型评审调用后,必须保存完整记录(追踪通过 `tools/save_trace.sh` 脚本自动保存)
跨技能协议:当两个 ARIS skill 之间发生集成时,必须满足以下 6 项要求:

角色定义:

项目链接:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)