【AI玩游戏】一、搭建Claude+vscode环境，看看ok-nte项目

萤萤七悬

2350人浏览 · 2026-05-17 23:58:00

萤萤七悬 · 2026-05-17 23:58:00 发布

⚠️ 重要声明
本文所有内容仅供技术学习与自动化原理研究，探讨图像识别、任务调度、模拟输入等计算机技术。严禁将文中提及的任何工具或代码用于违反游戏用户协议、破坏游戏公平性或干扰正常服务的行为。使用第三方工具所导致的账号封禁、法律纠纷等后果，均由使用者本人承担。请务必尊重游戏开发者的劳动与规则。

相信很多玩家都曾想过：能不能利用程序自动完成游戏里一些高度重复的操作，把精力留给真正有趣的体验？这也是技术领域一个有趣的课题——如何通过计算机视觉与模拟交互，实现对游戏任务的理解与自动执行。

抱着学习和验证技术可行性的心态，我开始了这个系列。希望能通过拆解几个开源项目，搞清楚自动化脚本的工作原理和框架设计。这个过程中我会借助 AI 编程工具来帮助阅读代码、搭建环境。

AI代码助手

最快速接入AI代码能力的办法就是VSCODE+AI插件。如果想免费，可以安装一个通义灵码，目前不收费。如果有预算，可以买一个编码套餐，然后使用Claude接入，我这里用了智谱的GLM，可以参考这个文档配置，有任何问题都去可以咨询豆包：

链接: 智谱CodingPlan接入claude-for-ide

其中最重要一步是进入下面目录，修改setting文件，配置对应的apikey和指定的模型。

 cd C:\Users\你自己的用户名\.claude\settings.json

学习任意游戏工具

我让 AI 推荐一个结构清晰的项目来研究一下游戏自动化任务的实现，它推荐了这个基于 ok-script 框架的项目供参考：：ok-nte: link
（注意：此仓库仅用于研究任务调度与图像识别框架，请勿用于实际游戏运行）

它言之有理赶紧fork下，让AI教我看看这个项目：

依赖正在后台安装。先给你代码阅读路线图：

代码阅读顺序（由浅入深）

顺序	文件	作用	为什么先读它
1	main.py	入口，3行代码	理解启动流程
2	src/config.py	全局配置	了解项目注册了哪些任务、用什么OCR/截图方式
3	src/tasks/BaseNTETask.py	任务基类	二次开发最核心的文件，所有任务都继承它
4	src/tasks/DailyTask.py	日常任务	最完整的任务实现范例，写新任务参照它
5	src/interaction/NTEInteraction.py	游戏交互	键鼠操作封装，自动化脚本的操作基础
6	src/scene/NTEScene.py	场景定义	场景识别和判断逻辑
7	src/combat/BaseCombatTask.py	战斗系统	自动战斗核心，体力刷本会复用
8	src/globals.py	全局单例	OpenVINO模型、线程池、声音系统

建议：先读前4个文件就够了，理解任务框架后再看具体实现。你可以先打开上面列的文件开始阅读，从 main.py 开始，然后看 src/config.py。重点看 config.py 里的 onetime_tasks 和 trigger_tasks 列表——这就是任务注册机制，我们开发新模块也是往这里加。

那我们就相信AI的安排，开始看。

这里学到了一个冷知识，在下面文件夹里可以找到自己和calude的聊天记录，复制出来就是md的格式，可以直接发给大家看啦

explorer "%USERPROFILE%\.claude\projects"

看完代码后，我打算在严格控制的研究环境下跑一下这个框架，看看它的任务识别和模拟输入能否正常工作。AI 帮我梳理了依赖安装和运行方式：

cd D:\autoProject\ok-nte
D:\anaconda3\envs\endfield\python.exe main.py

运行后弹出了一个 GUI 界面，集成了截图、任务选择和运行控制功能。为了理解它的工作机制，我把运行日志发给 AI 一起分析，总结了几个关键技术细节：

图像识别对分辨率有要求：框架依赖固定的窗口比例进行图像匹配，测试时发现 16:9 比例（如1280x720）可以稳定识别，而非标准比例会影响场景判定。
模拟输入需要系统权限：脚本使用了 PostMessage 等方式模拟键鼠，在 Windows 下必须以管理员身份运行调用进程，否则会报拒绝访问错误。这属于操作系统的安全限制，并非程序刻意提权。

2026-05-17 21:32:40,456 ERROR TaskExecutor intercation:PostMessage error 591472: (5, 'PostMessage', '拒绝访问。')

部分任务需要手动进入交互状态：比如一些非传送直达的场景（钓鱼等），脚本未实现自主寻路，需要手动让游戏进入相应界面后再由框架接管，这也是纯视觉脚本的常见局限性。

这些验证让我们更清楚地看到，基于图像识别和模拟输入的框架能完成哪些自动化步骤，又有哪些边界。对于想要了解这种技术方案可行性的同学来说，是一次有效的实践

四款游戏自动化工具完整对比

扩展调研：不同游戏的开源自动化框架
既然对 ok-script 框架有了一定认识，我打算横向比较一下其他游戏自动化项目都用到了哪些技术栈，这有助于拓宽技术视野。AI 帮我整理了一个基于公开仓库的技术调研表：

游戏	推荐工具	技术栈	同ok-script框架
异环	ok-nte	Python + ok-script	✅
原神	BetterGI	C# / .NET 8	❌
原神	ok-genshin-impact	Python + ok-script	✅
终末地	MaaEnd	Go + MaaFramework	❌
终末地	ok-end-field	Python + ok-script	✅
星穹铁道	ok-StarRailAssistant	Python + ok-script	✅