对于github中ARIS项目的理解与感悟

DandTK

692人浏览 · 2026-05-14 11:30:00

DandTK · 2026-05-14 11:30:00 发布

目录

一、项目概述

核心特征：

二、整体架构

对于MCP与tools，本项目通过skill调用MCP与tools

三、理解与感想

智能体互判协议

一、项目概述

ARIS 是一个纯Markdown驱动的 AI 科研自动化框架。其核心理念是：用户睡觉时，AI 自主完成文献调研、产生 idea、做实验、写论文、回复审稿意见的全流程。

项目链接：https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep

核心特征：

零依赖——纯Markdown文件 + Python 工具脚本，无框架、无数据库、无 Docker

跨模型对抗协作——执行模型与评审模型必须是不同模型家族

评审者独立性——评审者直接读取原始文件，不接受执行者的摘要

每个技能是独立的skill，可嵌套调用形成管线

二、整体架构

注：此图中未展示MCP与tools部分

工作流详解图：

对于MCP与tools，本项目通过skill调用MCP与tools

1.MCP

MCP 服务器是 ARIS 的跨模型通信桥梁，它们通过 JSON-RPC 协议与 Claude Code 通信，为skills提供调用外部模型/服务的能力

支持Gemini（API和CLI）、Claude、OpenAI兼容API（OpenAI/DeepSeek/Kimi/MiniMax 等）、Codex原生图像等等MCP服务

2.tools

（1）.安装与维护工具

（2）.文献检索工具

（3）.研究基础设施工具

（4）.验证与审计工具

(5).元优化工具

（7）.实验管理工具

工具与skill调用关系：

skill	tool
research-lit	arxiv_fetch.py semantic_scholar_fetch.py openalex_fetch.py exa_search.py
deepxiv	deepxiv_fetch.py
figure-spec	figure_renderer.py
research-wiki	research_wiki.py
paper-writing	extract_paper_style.py verify_paper_audits.sh
paper-illustration-image2	paper_illustration_image2.py
monitor-experiment	watchdog.py
auto-review-loop research-review paper-claim-audit	save_trace.sh
meta-optimize	meta_opt/log_event.sh meta_opt/check_ready.sh
overleaf-sync	overleaf_setup.sh overleaf_audit.sh
experiment-queue	experiment_queue/queue_manager.py experiment_queue/build_manifest.py
...	...

此外，该项目还提供了各种模板以及各种docs适配指南以满足各式各样的需求，这里就不一一展示了

三、理解与感想

该项目是通过各种skills将各种各样的功能串联起来，从而形成一条完整的科研管线。功能齐全，不仅可以写代码、写论文，甚至还可以制作ppt等等。此外由于此项目的整个流程几乎都是由Agent去制作，所以难免会遇到Agent产生幻觉或者方向跑偏、实验不严谨等问题。

为了解决这些问题，此项目推出了智能体互判协议，这是这个项目的一个很大的亮点，让我印象很深

智能体互判协议

核心原则：执行模型和评审模型必须来自不同的模型家族

对于两个Agent：

执行者（Agent A）：写代码、跑实验、写论文，不评审自己的代码，不解释/总结文件给评审者

评审者（Agent B）：直接读取文件，评分、批评、要求修改，独立判断

Agent A与B的模型家族要求举例：

Claude (Anthropic) ↔ GPT (OpenAI) ✅

Codex (OpenAI) ↔ Gemini (Google) ✅

Claude (Anthropic) ↔ MiniMax ✅

Claude (Anthropic) ↔ Claude (Anthropic) ❌ 同一家族，不允许

评审者独立性：内容必须未经过滤地到达评审者。执行者指向文件并设定评审任务；评审者独立阅读和判断

实验完整性：编写实验代码的模型不得评判实验完整性

评审可追踪性：每次跨模型评审调用后，必须保存完整记录（追踪通过 `tools/save_trace.sh` 脚本自动保存）

跨技能协议：当两个 ARIS skill 之间发生集成时，必须满足以下 6 项要求:

角色定义：

项目链接：https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

cover

海外动态代理行业彻底换代，AI 数据时代新标准已到来

AtomGit开源社区

cover

2026年SEO+GEO优化指南：搜索排名机制解析与实用工具推荐

AtomGit开源社区

cover

2026年论文写作AI哪个好用？7款工具实测对比，轻松拿捏

AtomGit开源社区

所有评论(0)

查看更多评论

DandTK

已为社区贡献1条内容