MiniMax M2.7 给我整不会了! 服务器炸了我当场追责,我的像素风数字员工反手甩锅
大家好,我是小林。
看到 MiniMax 又升级了,发布了最新模型 M2.7。

还记得吗?春节前我才跟大家分享过实测 M2.5 的心得。
这速度真的太快了,才转眼一个月,M2.7 新模型又卷出来了。
为什么这次那么快?
看了 MiniMax 官方说,这次之所以那么快,是模型自己迭代自己,达到了自我进化!

这可是质的变化,未来模型的更新迭代速度肯定是超乎我们想象的。
官方为了加速模型迭代,干脆让 M2.7 自己参与自己的研发进化。
它能自行组建复杂的智能体团队,自己调用工具学习新技能,甚至能在后台自己更新记忆、驱动自我强化学习,相当于掌握了左脚踩右脚上天的绝活,能够自己迭代升级自己。
模型具体是怎么自我进化的?MiniMax 已经把模型打造成一个能自我进化的研究型 Agent Harness。

M2 系列模型深度参与研发研究员定大方向,Agent去查文献、跑数据、排查问题甚至修bug。在部分场景下,它已经能搞定三到五成的工作流。
还具备自主迭代能力,能自己优化代码和架构。比如让它去优化一个脚手架,它能自己分析报错、改代码、跑评测,循环了100多轮,最后硬是把系统效果提升了30%。
而且评测成绩亮眼,在机器学习任务测试中,M2靠着短时记忆和自反馈机制不断进化,平均得牌率达到了66.6%,水平可以说是非常拔尖了。

M2 模型迭代系统
这个结果确实让人倒吸一口凉气。AI自我进化已经跨越了理论阶段,实实在在地落地到了工程实践中。以后开发者的核心竞争力可能真就变成了如何更好地给 Agent 下指令并把控大方向。
让Agent自己在错误中学习并调整策略,这个思路非常值得我们在日常的开发中直接借鉴。把代码体力活交给AI,咱们就可以专注决策和把控大方向。
未来的工作模式很明显会走向人类定目标、AI出苦力。我们得尽早适应这种新工作方式,把 AI 当成超级小弟来指挥。
未来还不会用 AI 来提高生产力的话,会用 AI 和不会 AI 的人,可能差距都比人和狗差距还大。
我也把 M2.7 新模型接入到了我的龙虾和 Claude Code,给大家实测一波。
云端资本家
既然AI都当我们的小弟了,我们为何不去当个资本家呢。
这里我用 AgentsOffice 开源项目,可以用像素风 RPG 办公室让我们的 AI 团队"可视化地上班"。
如果把 M2.7 模型接入进来,当我的数字员工,是不是很有趣?

它是能给我的AI团队组建一个办公室,你想要团队就什么团队

按照他的教程进行模型的配置和数据库,这里我把 M2.7 模型接入进去,

我搞了三个员工,分别是:

调度员就是我们的项目经理,助理就是产品,数据工程师就是程序员。
我先让他们同步下今天的工作进度,然后调度员就会让他的两个员工去发日报,自己是完全不动手的。
据说 M2.7 的角色扮演很厉害。
于是我就说这天服务器挂了,让所有人给我一个解释,没想到他们就开始了,疯狂甩锅哈哈,相信很多工作了的同学深有体会。

最后竟然还甩到我身上了。。。

开完会后,我跟数据工程师说了句悄悄话,直接把它开除了

极限比价的勤俭龙虾
对了,M2.7 用来养虾也很牛逼。
我把 M2.7 接入我的🦞龙虾,我给它挂载上了滴滴的MCP,试试让我的🦞龙虾帮我打最便宜的车。

我随口抱怨好累想打车。这只龙虾瞬间翻出我前天喊穷的长期记忆,直接触发多工具并发比价。

它列出了多种车型让我选,并且给出了最佳选择让我去确定,待我确定后,帮我下单,非常方便快捷,

不用自己去手动点开滴滴、输入上车地点,还要去自己看哪个最便宜,想想以前自己累了一天,临下班了还要在打车上浪费时间,真是生无可恋。
还是 M2.7 好,现在接入龙虾后,我直接躺平,动动嘴皮子就好了,直接帮我打到最便宜的车。
迭代小林简历
就在这个月,我上线了免费在线简历制作的小林简历,这期间收到了很多朋友的好评,真的非常感谢大家的支持!
网站地址:https://jianli.xiaolinnote.com/
除了鼓励,我也收集到了大家反馈到 bug 和意见。所以,我这里直接拿小林简历的真实需求练练手,看看 M2.7 模型能否解决我的需求。
比如,有林友建议增加一个「智能一页」功能,也就是自动排版把多页简历压缩到一页。这个想法非常棒,我立马安排 M2.7 来实现。

老规矩,唤醒我的 AI 编程搭档 Claude Code,这次接入 M2.7 模型,给出的 Prompt 非常直接:
增加一个"智能一页"的自动排版功能,帮助用户把多页简历内容压缩在一页内。

结果让我大吃一惊。抛开创建计划的时间,M2.7 仅仅用了 5 分钟 就完成了开发!
更绝的是它的产品感:我并没有在 Prompt 里告诉它按钮应该放在哪,它自己思考后,精准地把按钮嵌入在了第一页和第二页的预览区中间——这完全就是我心里的最佳位置!

起初我还挺担心,强行塞个按钮会不会撑大两页之间的间距,影响原本的 UI 美观。测试后发现我完全多虑了,UI 依然严丝合缝。

当然,核心功能也没掉链子,原本占两页的内容点击后瞬间完美压缩成了一页。不得不说,M2.7 的代码功底真的很深。

除了做新功能,我还用它修了个 Bug。
有林友反馈,当简历超过 3 页时,导出的 PDF 会变成 4 页,而且第三页大部分是空白。上线前我确实只测了 2 页的 Case,漏掉了这个边缘场景。

这个bug还是比较诡异的,我把问题抛给 M2.7,它依然保持了高水准,非常精准地定位并完成了修复。

经过这次实测,M2.7 模型的编程能力依然很强,不仅能直接在真实项目开发新功能,也能精准并修复bug。
小林简历产品还在不断进化中,欢迎大家继续多提宝贵建议,我不怕麻烦的,因为 M2.7 会帮我搞定一切哈哈。
整理股票Excel
平时炒股的时候,我可能需要对股票的交易记录和基本信息进行一些分析,但是对于这些信息,有时在excel会是比较凌乱或者格式错误的情况,整理起来很麻烦

我不想动手,让M2.7去做,我先搞了例子文件去试试水,让他帮我清洗交易记录,算出我的每只股票的总持仓成本

很快他就做好了,非常干净

持仓成本也算的明明白白,大大提升了我的决策效率

接下来我需要它将这份基本信息表与刚才清洗好的持仓成本表进行关联匹配,自动计算出我当前每只股票的实际浮盈或浮亏金额

展现出来的结果,很直观,能看到哪里亏,哪里赚,可惜我这个例子文件好像一片绿

最后我需要根据目前算好的盈亏数据,帮我做一个资产配置复盘

复盘表非常浅显易懂,结论也非常明确,对于我们自己去进行资产配置,能有很方便且重要的参考,数据分析能力嘎嘎顶

0代码自媒体选题系统
做自媒体的朋友肯定知道,平时很头疼的就是选题,尤其是现在AI发展极其迅速,天天都有新资讯,我得一个个网站去看,然后还要筛选,最后确定选题。
实在是太麻烦了,我真不想动手。
我受不了,想让M2.7去帮我做个选题Agent系统,Agent去拉资讯,整理选题,然后评分供我挑选:


很快它就做好了,我去试了试启动,但是有问题,不过M2.7它会自动监控和分析实验状态,并自动触发日志读取、问题排查、指标分析、代码修复

像这里,它就发现问题,自己去修复
修复后,再跑,可以正常跑通了。

但是我发现,运行的好慢,整整两分钟,于是我让他自己去优化:

原来是因为一开始它是一个个去抓取AI资讯,也就是串行处理,后面改成了异步并发,时间直接从两分钟到12秒。

不过我觉得,他这里有些选题相对太硬核,我就输入我的想法,看看它的反应


可以看到,过程中,M2.7完成每轮迭代后会形成一个短时记忆md文件,同时对当前轮次的结果进行自反馈,从而给下一轮次提供潜在的优化方向,下一轮次基于所有历史轮次的记忆及自反馈链进行下一步的自优化。
最后很明显看到,软性的或者说是更符合大众喜欢的选题评分明显高了,非常nice。

总结
这次体验下来,这次自我进化而来的 M2.7 模型能力显著提升。
它的原生协作非常丝滑,人设塑造和长短时记忆能力目前绝对处于断层领先的水平。
在日常办公和遇到系统报错时,它能自己找原因并直接出方案,实用性直接拉满,绝对是咱们提升效率的绝佳利器。
稍微吐槽一下,在让它同时处理超大规模的复杂任务时,偶尔还是会有点迷糊,这个时候就需要大家稍微调整一下提示词去给它指个路。
不过瑕不掩瑜,能拥有这样一个懂你、能帮你搞定繁琐工作、还能自我优化的专属赛博助理,真的可以躺平了。
把那些枯燥耗时的工作都交给它,咱们只管把控大方向就行。
既然现在都能自我进化了。
是不是M3.0离我们也不远了?
有点开始期待了!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)