相同提示词、相同 Skill、相同 MCP 工具,让 Claude Opus 4.6 和 GPT-5.4 分别还原某社媒平台的 a_bogus 参数。一个花了 86刀 完成纯算 Node.js 还原,另一个烧了 293刀 跑了两天没出结果。把逆向经验沉淀到 Skill 后,新线程 21 分钟搞定同样的活。

一、实验设计

这次的目标很明确:在完全相同的条件下,对比两个模型的 JSVMP 逆向能力。控制变量,只换模型。

提示词完全一致,首次对话都是同一句话开始:「使用 hello_js_reverse_skill 技能帮我进行一个新的站点调试」。第二次对话给出目标网址和 curl 参数,要求还原 a_bogus 并用 Node.js 纯算实现请求。

工具链仓库:
Skill:hello_js_reverse_skill
MCP:camoufox-reverse-mcp

二、Claude Opus 4.6 实战

第一步:项目初始化

发出首次对话后,2 分钟完成项目框架搭建,消耗 51.3 万 token,费用 $0.81。符合预期,Skill 技能包帮它快速理解了工作流。

第二步:开始逆向 a_bogus

给出目标网址和 curl 参数后,Claude 开始工作。耗时 35 分钟,自动完成了接口抓包、参数分析、加密函数定位,但第一轮没有跑出 a_bogus 的纯算 Node.js 版本——JSVMP 虚拟机保护的字节码解释器路径还没摸清。

第三步:引导补充

引导它可以在浏览器中进行 JS 调试、hook 插桩、分析链路,也可以在本地先用 jsdom 实现。Claude 继续工作,耗时约 1 小时 22 分钟,中间自主完成了 hook 插桩 → 拦截 JSVMP 字节码解释器 → 分析操作码链路 → jsdom 环境补全 → 纯算实现。

中间 Cursor 出现过好几次「Taking longer than expected」的卡顿,如果介入恢复后继续往下跑,没有中断逻辑。

最终结果:约 3 小时完成

费用明细:

对话轮次 Token(万) 费用
项目初始化 51.3 $0.81
首次逆向(35 分钟) 2,042.9 $18.95
补充对话 · Cookie 获取 1,536.2 $12.46
补充对话 · Hook 插桩 + JSVMP 分析 5,349.5 $54.12
合计 8,979.9 $86.34

三、GPT-5.4 实战

方式一:Codex(GPT-5.4 fast)

和 Claude 一样的首次对话,2 分钟完成项目初始化,消耗了 2% 的 Plus 套餐额度。进入第二步逆向阶段后,光是下载依赖和配置 Skill + MCP 就消耗了 8% 的 Plus 套餐额度(100% 总额度)。

开始分析后,90% 的剩余额度全部消耗完毕,没有任何产出。观察链路发现,分析过程很容易跑偏,不断在无关路径上消耗算力。

Codex 运行截图

Plus 套餐额度从 98% 消耗至 0%,逆向结果为空。

方式二:Cursor(GPT-5.4)

换到 Cursor 环境重新尝试。GPT-5.4 能生成 180 位长度的加密参数,格式看起来像那么回事,但发起请求后响应为空——JSVMP 的指纹校验没有补全,服务端直接拒绝了。

走 Chrome DOM 的方式可以取到数据,但这属于自动化方案,不符合纯算要求。继续要求纯算时,GPT 陷入了一个死循环:不断补浏览器环境,而不是去 hook 插桩分析 JSVMP 的字节码执行链路

GPT 的核心问题:它把 JSVMP 当成了普通的浏览器环境检测,一直在补 navigatorscreencanvas 这些对象,而不是先 hook 拦截字节码解释器,分析每一步操作码到底在做什么。这就像看到门锁就去配钥匙,但其实门里面还有三道密码锁。

手动引导它去 hook 插桩、用 jsdom 分析 JSVMP 后,仍然没有成功。多次对话消耗了 25,759.6 万 token / $271.74,跑了将近大半天。

Cursor GPT-5.4 单次对话消耗

多次对话累计 2.58 亿 token,$271.74,仍未完成 a_bogus 纯算还原。

费用明细(Cursor 部分):

对话轮次 Token(万) 费用
首次逆向尝试 1,543.1 $8.76
补充对话 · 继续纯算 1,727.0 $12.48
引导 Hook + JSVMP 分析(跨天) 25,759.6 $271.74
合计 29,029.7 $292.98

四、正面对比

维度 Claude Opus 4.6 GPT-5.4
Token 消耗 8,979.9 万 29,029.7 万
费用 $86.34 $292.98
耗时 约 3 小时 跨两天
Token 倍率 GPT 是 Claude 的 3.2 倍
费用倍率 GPT 是 Claude 的 3.4 倍
最终结果 ✅ 纯算成功 ❌ 未完成

差距在哪?

五、经验沉淀:从 3 小时到 21 分钟

这次逆向完成后,做了一件事:把 a_bogus 的 JSVMP 逆向经验回写到 Skill 技能包里。记录了这类加密的特征行为、关键 hook 点位、字节码分析流程、环境补全策略。

然后新建线程、新建目录,用完全相同的提示词,再走一遍。

Skill 沉淀后 · 新线程 21 分钟完成

相同提示词,VSCode + Claude Opus 4.6,21 分钟纯算还原完成。

这就是 Skill 的价值:模型能力不变,但经验在积累。第一次花 3 小时摸索的路径,沉淀下来之后就是 21 分钟的确定性流程。

六、总结

这次对比的结论很直观:

1. 模型差距真实存在。在 JSVMP 这种需要理解虚拟机执行逻辑的场景下,Claude Opus 4.6 的链路分析能力明显强于 GPT-5.4。GPT 不是不努力——它消耗了 3 倍的 token——而是方向上走偏了。

2. 经验沉淀比模型升级更实际。从 3 小时压缩到 21 分钟,靠的不是换更大的模型,而是把已验证的逆向路径写进 Skill。下次遇到同类加密特征,AI 不再从零摸索,而是直接走已知最优路径。

3. 贵不等于好。$293 没完成的事情,$86 做完了。Token 消耗量不代表成果——方向对了,消耗自然少。

后续会不断把市面上站点的逆向经验沉淀下来,把冰冷的 token 转化为温暖的加密

工具链地址:

Skill:github.com/WhiteNightShadow/hello_js_reverse_skill

MCP:github.com/WhiteNightShadow/camoufox-reverse-mcp

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐