MiroMind新模型超越GPT-5.4，三位顶尖AI科学家加盟

模型启动机

363人浏览 · 2026-03-18 13:19:23

模型启动机 · 2026-03-18 13:19:23 发布

MiroMind的MiroThinker系列模型，每次更新都有巨大进步。

刚刚发布的MiroThinker-v1.7模型家族，在深度研究任务中刷新了开源模型的最佳成绩，MiroThinker-H1深度研究评测成绩更是超越了OpenAI、Google、Anthropic等巨头的最新产品。

新模型发布的同时，MiroMind还迎来了三位顶尖科学家的加盟。

深度研究能力的新标杆

MiroThinker 1.7模型家族，这是一次针对长链条任务智能体的重大升级。

所谓长链条任务，指的是需要多步骤推理、多次工具调用、深度信息检索才能完成的复杂任务。

MiroThinker 1.7支持256K上下文窗口，能够进行长程推理和深度多步分析。

单个任务最多支持300次工具调用，相比前代产品在逐步推理和决策准确性上有了显著提升。

模型提供30B和235B两个参数规模，适配不同的研究场景和算力预算。

在评测数据方面，MiroThinker 1.7交出了一份亮眼的成绩单。

在BrowseComp评测中取得74.0%的准确率，在BrowseComp-ZH中文评测中达到75.3%，在GAIA-Val-165评测中获得82.7%，在HLE-Text评测中取得42.9%的成绩。其中，BrowseComp-ZH的成绩刷新了开源模型的最佳纪录。

而MiroThinker-1.7-mini仅用30B参数，就在BrowseComp-ZH上取得了72.3的成绩，同样打破了开源模型的纪录。通过优化的后训练流程，较小的模型规模也能在特定任务上达到出色的表现。

BrowseComp是由OpenAI发布的浏览智能体评测基准，要求模型在网络中持续导航以寻找难以发现、相互交织的信息。这个评测专门测试AI在网络环境中定位信息的能力，其问题设计简洁但挑战性极高，答案简短且易于验证。BrowseComp-ZH则是该评测的中文版本，专门评估模型在中文互联网环境中的信息检索能力。

MiroMind还推出了一款专有智能体MiroThinker-H1，它在多个评测中都取得了领先成绩。

在BrowseComp上达到88.2%，在BrowseComp-ZH上达到84.4%，在GAIA上达到88.5%，在xbench-DeepSearch-2510上达到72.0%，在SEAL-0上达到61.3%。多个基准上超越了目前顶级闭源模型Claude-4.6-Opus，Gemini-3.1-Pro和OpenAI-GPT-5.4。

长链条可验证推理是MiroMind技术路线的核心特点。推理过程可以被逐步验证，推理结果可以被全局验证。这种方法提升了复杂智能体工作流的性能，使AI系统能够完成更可靠的任务。

三位顶尖科学家加盟

与MiroThinker 1.7发布几乎同步，MiroMind宣布三位世界级科学家加入其核心AI研究团队。

三位科学家分别负责推理模型训练、运行时与智能体系统、可验证AI三大技术方向，构成了MiroMind重型求解器引擎的三大支柱。

杜少雷博士出任推理模型与训练首席科学家。

杜博士现任华盛顿大学保罗·艾伦计算机科学与工程学院副教授，研究领域涵盖机器学习理论、深度学习优化、大规模推理模型训练。

他曾在xAI担任技术团队成员，直接参与前沿大模型研发工作。此外，他曾在Facebook AI Research担任访问教授，在普林斯顿高等研究院从事博士后研究。

杜博士将负责MiroMind核心推理模型训练系统的端到端构建，包括模型架构设计、大规模训练策略、推理能力的系统性增强。

华盛顿大学计算机科学与工程学院在AI领域享有盛誉，杜博士于2024年获得斯隆研究奖，这是北美最具声望的青年科学家奖项之一。他的研究聚焦于为深度学习构建理论基础，理解模型的工作原理，并设计更好的算法。在强化学习、非凸优化、数据合成与选择等领域都有重要贡献。

安波教授出任运行时与智能体系统首席科学家。

安教授现任新加坡南洋理工大学终身教授，研究领域涵盖多智能体系统、强化学习、博弈论、AI驱动决策。他的研究成果发表在NeurIPS、ICML、AAAI等顶级国际会议上，论文被引用超过13300次。他领导了多项大规模研究项目，指导了一代博士研究员。

安教授不仅在学术上成就斐然，在应用AI和技术转化方面也有丰富经验。他曾与多家领先科技企业和政府机构合作，参与大规模决策系统、自主协调机制、AI驱动优化等项目。

他将负责MiroMind运行时与智能体系统技术部门，监督系统执行层架构的设计和持续演进，推动推理模型与验证核心的深度融合，目标是构建高度可靠、可水平扩展、完全可审计的系统框架。

杨凯宇博士出任可验证AI实验室首席科学家。

杨博士此前在Meta基础人工智能研究院担任研究科学家，更早之前在加州理工学院从事博士后研究。他在可验证推理和形式证明系统领域建立了领先的研究地位，这些领域正是MiroMind技术愿景的核心所在。

杨博士的研究目标是构建能够产出可信任结果的AI，其正确性无需耗费大量人工检验。他的研究涵盖AI辅助形式定理证明、自动形式化等领域，开发了LeanDojo、CoqGym、Goedel-Prover等工具，被引用超过9600次。他在2025年4月的西蒙斯研究所演讲中系统阐述了形式推理与大语言模型结合的前景。

在MiroMind，杨博士将负责建立和运营可验证AI实验室，聚焦两个关键研究方向，即可验证推理和可验证生成。

可发现智能的宏大愿景

MiroMind的使命不是构建更善言辞的语言模型，而是设计一类全新的AI系统，能够进行严格推理，解决现实世界的难题，其输出不仅看似合理，而且可以形式化验证。

创始人陈天桥是一位连续创业家和慈善家。他于1999年创立了盛大网络，开创了中国网络游戏产业的先河，盛大也成为国内最早的科技独角兽之一。此后，他与妻子创立了陈天桥雒芊芊脑科学研究所，长期致力于脑科学和神经科学研究。

陈天桥在中美两地都有深厚的商业和投资经验，这为他构建MiroMind的全球化视野奠定了基础。

MiroMind的愿景是打造可发现智能，即能够做出预测并探索新概念的AI，而非仅仅分析现有知识。

公司正在构建世界上第一个通用求解器，一种以推理为先的AI系统，其目标不仅是看起来正确，而是可以被证明正确。

通过开创可验证的长链条系统2推理，MiroMind的AI在软件工程、金融服务、医疗制药、法律合规、科学研究等高风险领域具备可靠性和可信度。

公司团队超过80%是博士研究员，由全球顶尖的科学领导团队引领。

MiroMind正在走出一条与众不同的道路，不追求模型规模的单纯扩张，而是聚焦于推理能力和可验证性，这在当前AI领域是一股清流。

从评测数据来看，这条技术路线已经初见成效。MiroThinker-H1在BrowseComp和BrowseComp-ZH上均取得了所有模型中的最高分，分别达到88.2%和84.4%。在GAIA评测中，MiroThinker-H1的88.5%同样是所有模型中的最佳成绩。

MiroThinker 1.7的开源发布，让更多研究者和开发者能够接触到这一技术路线的成果。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

2026年国内企业AI部署开发公司推荐指南

AtomGit开源社区

基于密集型复杂城市场景下求解无人机三维路径规划的Q-learning 算法研究（Matlab代码实现）

随着无人机在城市环境中应用的不断拓展，如物流配送、航拍测绘、交通监控等，其三维路径规划问题日益受到关注。密集型复杂城市场景具有障碍物密集、三维空间约束复杂、实时性要求高等特点，传统路径规划算法难以满足需求。Q-learning算法作为一种强化学习方法，具有无需环境模型、通过试错学习等优点，适合应用于此类场景。本文深入研究基于Q-learning算法的无人机三维路径规划方法，通过合理定义状态空间、动

AtomGit开源社区

ollama v0.23.3 发布：MLX 性能优化、安全加固与传输并发控制

代码地址：github.com/ollama/ollamaOllama v0.23.3 是一个以稳定性和安全性为主的维护版本。MLX 后端的多项优化显著改善了 Apple Silicon 平台上的推理体验，更新机制的加固为用户提供了更安全的自动升级保障，而传输并发控制的引入则为受限网络环境下的模型分发提供了灵活调整空间。建议所有用户升级到此版本，特别是 macOS 用户和启用了自动更新的 Wind