大三双非本科0基础自学大模型第一期-接入大模型
大三双非本科0基础自学大模型:从Hermes到DeepSeek,我的AI工具学习之路
本文记录了一个物联网专业普通大学生如何从0开始学习AI大模型工具的真实经历。没有鸡汤,没有凡尔赛,只有踩过的坑和总结的经验。
前言
先简单介绍一下自己:
- 身份:某双非一本物联网专业,大三在读
- 现状:0基础转大模型方向,正在投简历找实习
- 学习时长:从接触到现在大概一周多
- 设备:普通Windows笔记本(后续发现WSL是神器)
说实话,作为一个物联网专业的学生,我之前从没想过要搞AI。本科学的都是嵌入式、单片机、C语言,简历上写得最多的项目就是"智能小车"和"温湿度监测系统"。
转行的契机很简单:去年秋招投了几个大厂的后端岗位,面试官问我:"你有没有了解过LLM?有没有用过大模型相关的工具?"
我说没有。
然后就没然后了。
痛定思痛,今年3月份开始,我决定要真正学一学大模型相关的技术。不是那种"听说过ChatGPT"的了解,而是能实际用起来、写项目的程度。
这篇文章,就是我这周学习的完整记录。踩的坑比代码行数还多,但好在终于跑通了。
目录
- 先搞清楚:我该学哪些工具?
- DeepSeek模型那么多,到底用哪个?
- WSL+Linux基础:小白也能看懂
- Hermes安装避坑指南(血泪史)
- 把AI接进微信:终于可以调戏Bot了
- 三个工具怎么配合用?
- 省Token就是省钱!
- 磁盘清理:差点重装系统
- 总结和下一步
一、AI Agent工具生态全景
1.1 为什么需要AI Agent工具?
很多人可能跟我一样,之前用大模型就是去网页上对话。但实际上,真正好用的是Agent(智能体)。
简单理解:
- 普通Chat:你问我答,答完就忘
- AI Agent:能帮你执行命令、操作文件、记住你的习惯、自动完成任务
打个比方,普通对话是"雇了一个顾问",而Agent是"雇了一个助理"。顾问只能出主意,助理能帮你干活。
1.2 四大主流工具对比
| 工具 | 开发方 | 特点 | 适合场景 | 推荐指数 |
|---|---|---|---|---|
| Hermes Agent | Nous Research | 功能最全,支持17+平台 | 日常助手、消息平台接入 | ⭐⭐⭐⭐⭐ |
| Claude Code | Anthropic | 代码编辑体验最好 | 写代码、做项目、深度Debug | ⭐⭐⭐⭐⭐ |
| Codex | OpenAI | Computer Use操作桌面 | 暂不推荐,中国区受限 | ⭐ |
| Reasonix | DeepSeek原生 | 缓存优化,省钱5倍 | 省钱写代码 | ⭐⭐⭐⭐ |
1.3 Hermes Agent(重点掌握)
这是我花最多时间研究的工具,也是最推荐入门的。
一句话定位:开源AI代理框架,相当于一个超级助手,能接入微信、飞书、钉钉等多个平台。
核心优势:
- 47个内置工具:terminal、file、browser、TTS、image_gen、memory、cronjob、vision等
- 17+消息平台:微信、飞书、钉钉、QQ Bot、Telegram、Discord等
- 国内友好:有国内镜像安装源,支持DeepSeek等国内模型
- 技能系统:完成复杂任务后自动生成可复用技能文档,下次遇到类似任务自动加载
- 记忆系统:MEMORY.md + USER.md,跨会话记住你的偏好
- 子代理委派:最多3个并发子代理同时工作
1.4 Claude Code
一句话定位:Anthropic的终端编程Agent,代码编辑体验最好。
亮点功能:
- 精准替换(不像其他工具那样容易改乱)
- 检查点回退(写错了一键回到之前的状态)
- 推荐接入DeepSeek:比用Claude官方API便宜很多,国内直连不用梯子
- VS Code有官方插件
安装与配置:
bash
# 安装Claude Code(需要Node.js 22+)
npm install -g @anthropic-ai/claude-code
🔧 详细配置教程推荐看B站UP主「技术爬爬虾」的视频,搜
BV1qtdSBkEDy,手把手教你怎么接入DeepSeek,跟着做就行。简单说就是改一个配置文件(
~/.claude/settings.json),把API地址指向DeepSeek、填上API Key,搞定。国内直连,不用梯子,比Claude官方便宜很多。
1.5 Reasonix
一句话定位:DeepSeek原生编程Agent,主打省钱。
核心卖点:
- Cache-First循环:缓存命中率99.82%,同样工作量费用只有1/5
- 默认用
deepseek-v4-flash(便宜),需要时自动切换deepseek-v4-pro - 支持MCP、技能系统
⚠️ 使用前提:需要 Node.js 22+
bash
# 验证Node.js版本 node --version # 需要 22.x 以上
1.5.1 启动方式
bash
# 进入你的项目目录
cd 你的项目目录
# 启动编程模式(可读写文件、执行命令)
npx reasonix code
# 纯聊天模式(不碰文件)
npx reasonix chat
# 一次性执行,输出到stdout
npx reasonix run "你的任务描述"
1.5.2 核心命令
| 命令 | 用途 |
|---|---|
npx reasonix code |
编程模式(读写文件、执行命令) |
npx reasonix chat |
纯聊天模式(不碰文件) |
npx reasonix run "任务" |
一次性执行,输出到stdout |
npx reasonix doctor |
环境健康检查 |
npx reasonix update |
升级Reasonix |
npx reasonix stats |
查看使用统计和花费 |
1.5.3 常用斜杠命令
在对话中直接输入这些命令:
| 命令 | 作用 |
|---|---|
/help |
查看所有命令 |
/pro |
下一轮切到Pro模型 |
/preset max |
整个会话用Pro |
/apply |
确认应用代码修改 |
/undo |
撤回修改 |
/commit |
一键git commit |
/compact |
压缩上下文省token |
/skill new 名称 |
创建技能 |
1.5.4 省钱原理
Reasonix的核心是 Cache-First循环:
plaintext
同样的代码任务 → 缓存命中率99.82% → 费用只有1/5
这意味着对于重复性的编程任务,Reasonix会比其他工具便宜很多!
1.6 Codex(暂不推荐)
- Computer Use不支持中国区
- 需要ChatGPT Plus订阅 $20/月
- 性价比不高,不推荐
二、DeepSeek模型选择指南
2.1 四大模型对比
用DeepSeek API的同学肯定会纠结:这么多模型,我该用哪个?
| 模型 | 特点 | 费用 | 适合场景 |
|---|---|---|---|
| deepseek-v4-pro | 最强,代码推理最好 | 💰💰💰 | 重要项目、代码开发 |
| deepseek-chat | 日常聊天够用 | 💰 | 日常对话、简单任务 |
| deepseek-v4-flash | 最快最便宜 | 💰 | 简单重复任务 |
| deepseek-reasoner | 推理强但慢 | 💰💰 | 数学推理 |
2.2 我的选择策略
plaintext
日常对话/闲聊 → deepseek-chat(够用又便宜)
写代码/做项目 → deepseek-v4-pro(能力强)
简单重复任务 → deepseek-v4-flash(最快最省)
数学证明/推理 → deepseek-reasoner(专门优化)
血泪教训:我一开始啥都用v4-pro,一周烧了50块。后来学会区分使用场景,同样的效果只花了12块。
三、WSL+Linux基础知识
3.1 什么是WSL?
很多AI工具需要在Linux环境下运行,但装双系统又太麻烦。这时候WSL就派上用场了。
WSL = Windows Subsystem for Linux
通俗理解:在Windows系统里装一个Linux系统,两边无缝切换。
bash
# 一行命令安装WSL(需要管理员权限)
wsl --install --web-download
安装完会得到一个Ubuntu(最常见的Linux发行版)。
3.2 终端提示符解读
打开终端,你会看到这样的界面:
plaintext
zwh@DESKTOP-NC3L9GP:~$
让我帮你拆解:
zwh= 当前用户名(就是你)DESKTOP-NC3L9GP= 电脑名字(hostname)~= 当前目录(~代表"家目录",就是你的个人文件夹)$= 普通用户权限(如果是#,代表管理员/root)
3.3 常用命令解释
| 命令 | 含义 | 通俗解释 |
|---|---|---|
~ |
家目录 | 等于 /home/zwh/,你的"专属地盘" |
sudo |
管理员权限 | "我是老大,让我来"——执行敏感操作时用 |
apt |
软件包管理器 | Ubuntu的"应用商店",装软件用的 |
source ~/.bashrc |
重新加载配置 | 修改了配置文件后,用这个让它生效 |
find ~ -name "*.py" -type f |
查找文件 | 在家里翻箱倒柜找文件 |
3.4 虚拟环境(重要!)
这是我觉得最需要理解的Linux概念。
什么是虚拟环境? 给每个项目独立的Python空间,互不干扰。
plaintext
❌ 不用虚拟环境
→ 包都装到系统Python
→ 装多了系统乱套
→ 不同项目依赖冲突
✅ 用虚拟环境
→ 每个项目包隔离
→ 随便折腾,坏了重建一个就行
→ 干净整洁不打架
四、Hermes安装保姆级教程
4.1 踩坑记录(必看)
我踩过的坑:
- ❌ 一开始用官方源安装,curl超时,国内访问困难
- ❌ 装完后运行报错,提示缺
ripgrep和ffmpeg - ❌ 配置的时候选错了TTS引擎,语音功能用不了
- ❌ 不知道每次要用虚拟环境,运行命令找不到hermes
解决后的正确流程往下看 ↓
4.2 安装命令(国内镜像源)
bash
# 使用国内镜像源安装(强烈推荐)
curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash
这条命令会:
- 下载安装脚本
- 创建虚拟环境
- 安装所有依赖
💡 小贴士:安装过程大概需要3-5分钟,耐心等待即可。如果网络不好,可能会更长。
4.3 安装过程中的配置选择
安装脚本会让你做几个选择,按这个推荐来:
| 配置项 | 推荐选择 | 说明 |
|---|---|---|
| 模型提供商 | 16.DeepSeek | 选列表中的DeepSeek |
| 模型版本 | deepseek-v4-pro(强)或 deepseek-chat(省) | 看任务重要程度 |
| TTS引擎 | Edge TTS | 免费免配置,最简单 |
| Session Reset | Inactivity + daily reset | 自动重置,节省token |
| 消息平台 | 全部跳过 | 后续再接 |
4.4 补装依赖(如有报错)
如果运行时报错提示缺工具,补装一下:
bash
# 安装常用依赖
sudo apt install ripgrep ffmpeg
# ripgrep:命令行搜索工具,Hermes很多功能依赖它
# ffmpeg:音视频处理工具,TTS语音合成需要
4.5 文件目录结构
安装完成后,在 ~/.hermes/ 目录下:
plaintext
~/.hermes/
├── config.yaml # 主配置文件(修改配置看这里)
├── credentials/ # 存放API Key(敏感信息)
├── data/ # 对话数据、记忆文件
└── extensions/ # 扩展插件目录
4.6 常用命令汇总
bash
# ============================================
# 基础操作
# ============================================
# 激活虚拟环境(每次使用前必须执行!)
source ~/.hermes/hermes-agent/venv/bin/activate
# 启动聊天
hermes chat
# 切换模型
hermes model
# 配置工具(可以开关不需要的功能)
hermes tools
# ============================================
# 消息平台接入
# ============================================
# 接入聊天平台(如微信)
hermes gateway setup
# 启动微信
hermes gateway start weixin
# ============================================
# 系统维护
# ============================================
# 更新Hermes到最新版本
hermes update
# 诊断问题(出错了先跑这个)
hermes doctor
# 浏览技能商店
hermes skills browse
# 安装技能
hermes skills install 技能名
4.7 一劳永逸:自动激活虚拟环境
每次都要手动激活虚拟环境太麻烦了,配置一下让它自动激活:
bash
# 把激活命令加到配置文件里,开机自动生效
echo 'source ~/.hermes/hermes-agent/venv/bin/activate' >> ~/.bashrc
# 让配置立即生效
source ~/.bashrc
五、微信接入Hermes
5.1 为什么接微信?
接入了微信,你就可以直接跟AI对话,就像跟朋友发消息一样。而且AI能记住你们的对话历史,比网页版方便多了。
5.2 接入方式一:个人微信(iLink方案)⭐推荐
这是v0.6.0+原生支持的方式,走腾讯官方iLink Bot API,无需公网IP、无需WebSocket,普通家用网络即可。
Step 1:升级Hermes到最新版
bash
# 激活虚拟环境
source ~/.hermes/hermes-agent/venv/bin/activate
# 升级到最新版本(iLink支持需要v0.6.0+)
hermes update
Step 2:安装依赖
bash
# 安装微信接入所需的Python依赖
pip install aiohttp cryptography qrcode
# aiohttp:异步HTTP库,API通信用
# cryptography:数据加密
# qrcode:生成二维码(扫码登录用)
Step 3:启动网关配置
bash
# 进入网关配置模式
hermes gateway setup
# 选择 Weixin 选项
# 系统会引导你完成初始化配置
Step 4:扫码登录
终端会显示一个二维码,用手机微信扫码确认登录。
⚠️ 注意:二维码有时效,如果过期会自动刷新,最多重试3次
Step 5:配对验证(如需要)
首次登录后可能需要配对码:
bash
# 查看配对码
hermes pairing list
# 审批配对
hermes pairing approve weixin 配对码
Step 6:配置访问策略
在 ~/.hermes/.env 文件中配置访问权限:
ini
# 私聊策略:open(开放)/ allowlist(白名单)/ disabled(禁用)
WEIXIN_DM_POLICY=open
# 群聊策略:默认关闭,防止封号
WEIXIN_GROUP_POLICY=disabled
# 白名单用户(DM_POLICY为allowlist时生效)
WEIXIN_ALLOWED_USERS=user_id_1,user_id_2
# 管理员ID
WEIXIN_ADMIN_USER=your_user_id
5.3 接入方式二:企业微信
需要管理员权限 + 公网服务器。
Step 1:企业微信后台配置
- 登录 企业微信管理后台
- 进入「应用管理」→「自建应用」
- 创建应用,获取:
- CorpID
- AgentID
- Secret
Step 2:配置消息接收
- 在应用设置中启用「接收消息」
- 配置「消息接收URL」(需要公网可访问)
- 设置API接收消息
Step 3:修改配置文件
编辑 ~/.hermes/config.yaml,添加企业微信配置:
yaml
gateway:
wechat_work:
enabled: true
corp_id: "your_corp_id"
agent_id: "your_agent_id"
secret: "your_secret"
token: "your_token"
encoding_aes_key: "your_aes_key"
Step 4:重启网关
bash
hermes gateway restart
5.4 常见故障排除
| 问题 | 解决方案 |
|---|---|
aiohttp and cryptography are required |
执行 pip install aiohttp cryptography |
| Session expired (errcode=-14) | 重新扫码登录 |
| QR code expired | 自动刷新最多3次,检查网络连接 |
| Bot不响应私聊 | 检查 WEIXIN_DM_POLICY 配置和白名单 |
| 消息发送失败 | 检查API额度是否用完 |
| 配对码无效 | 重新执行 hermes pairing list 获取新码 |
5.5 启动和停止
bash
# 启动微信Gateway
hermes gateway start weixin
# 停止微信Gateway
hermes gateway stop weixin
# 查看运行状态
hermes gateway status
# 查看日志(排查问题时用)
tail -f ~/.hermes/logs/gateway.log
六、三大工具使用场景分工
很多人问我:Hermes、Claude Code、Reasonix到底用哪个?
我的经验是分工使用,各司其职:
| 场景 | 推荐工具 | 理由 |
|---|---|---|
| 日常聊天/学习问答 | Hermes + deepseek-chat | 记忆功能强,能记住你的偏好 |
| 写代码/做项目 | Claude Code | 代码编辑体验最好,有检查点回退 |
| 省钱写代码 | Reasonix | 缓存优化,能省5倍费用 |
| 定时自动化任务 | Hermes | 有cron-manager技能支持 |
| 消息推送/通知 | Hermes | 支持17+消息平台 |
| 桌面App操作 | Codex | 暂不推荐,中国区受限 |
我的日常工作流:
- 早上起床 → Hermes查天气、新闻
- 学习时 → 用Claude Code写代码,有问题直接问
- 写简单脚本 → Reasonix,便宜快
- 晚上 → Hermes总结今天学的内容
七、省Token实战技巧
用大模型就是烧钱,Token就是钱。下面是我总结的省Token技巧:
7.1 模型选择
plaintext
❌ 啥都用 deepseek-v4-pro(贵)
✅ 简单任务用 deepseek-chat(够用)
✅ 重复任务用 deepseek-v4-flash(最快)
7.2 工具管理
bash
# 关闭不需要的工具
hermes tools
# 弹出的菜单里把不用的功能关掉
7.3 对话管理
| 操作 | 命令 | 说明 |
|---|---|---|
| 压缩上下文 | /compact |
对话太长了用它压缩,节省Token |
| 清空对话 | /clear |
换话题时清空,重新开始 |
| 简短提问 | - | 别啰嗦,直接问要点 |
7.4 自动化任务
定时任务不需要最强模型:
plaintext
# 自动化任务配置里,把模型改成 deepseek-v4-flash
# 反正就是查个天气、发个提醒,不需要太聪明
7.5 使用缓存
用Reasonix写代码,缓存命中率99.82%,能省5倍费用:
bash
npx reasonix code
八、让AI帮你清理磁盘:从Claude到Hermes的实战
8.1 问题来了
上周发现C盘红了,仔细一查,各种缓存占了快30G!
罪魁祸首:
- 网易云音乐缓存:22G(我只是听了几首歌啊喂)
- Windows临时文件:2.1G
- npm/pip/Edge浏览器缓存:零零散散加起来也不少
8.2 第一版:用Claude手动清理
一开始我直接在Claude Code里让它帮我清:
plaintext
请帮我清理磁盘上的缓存文件,包括:
1. 网易云音乐缓存
2. 临时文件
3. npm缓存
4. pip缓存
5. Edge浏览器缓存
Claude确实能干,一步步帮我找到缓存目录、确认后删除。但问题是——每次都要手动操作,还得自己盯着确认。
8.3 第二版:Hermes定时清理+微信推送(推荐)
后来想到,Hermes有定时任务功能,还能发微信通知,完美!
思路:设置定时任务 → Hermes自动扫描清理 → 清理结果发到微信
bash
# 在Hermes中设置定时清理任务
# 每周日凌晨3点自动执行
# Step 1: 安装定时任务技能
hermes skills install official/cron-manager
# Step 2: 在Hermes中创建定时任务
# 输入以下指令:
"帮我创建一个每周日凌晨3点的定时任务,任务是:
1. 扫描并清理网易云音乐缓存目录
2. 清理Windows临时文件
3. 清理npm缓存(npm cache clean --force)
4. 清理pip缓存(pip cache purge)
5. 清理Edge浏览器缓存
6. 汇总清理结果,通过微信发送给我"
实际执行过程:Hermes会逐步扫描每个缓存目录,列出占用大小,确认后删除,最后生成一份清理报告发到微信上。
8.4 清理结果
| 清理项目 | 清理前 | 清理后 | 释放空间 |
|---|---|---|---|
| 网易云音乐缓存 | 22G | 20M | ~22G |
| Windows临时文件 | 2.1G | 232M | ~1.9G |
| npm缓存 | - | - | ~几百M |
| pip缓存 | - | - | ~几百M |
| Edge浏览器缓存 | - | - | ~几百M |
| 总计 | - | - | ~25G |
从快30G降到5G左右,C盘终于不红了。而且以后每周自动清,微信还会推送报告,再也不用担心C盘爆满。
💡 小贴士:网易云缓存是个"大户",建议在网易云设置里把缓存目录改到D盘,或者限制缓存大小
九、学习总结与下一步方向
9.1 这周学到了什么
plaintext
✅ 理解了AI Agent的概念和使用场景
✅ 掌握了Hermes Agent的安装和配置
✅ 学会了WSL基本操作
✅ 接入了微信,可以随时调戏AI了
✅ 了解了Claude Code和Reasonix的用法
✅ 学会了省Token的技巧
✅ 让AI帮我清理了25G缓存,还设了定时任务自动清
9.2 踩过的坑总结
| 坑 | 解决方案 |
|---|---|
| 官方源安装超时 | 用国内镜像:res1.hermesagent.org.cn |
| 缺少ripgrep/ffmpeg | sudo apt install ripgrep ffmpeg |
| 不知道用虚拟环境 | source ~/.hermes/.../activate |
| 啥都用最强模型 | 区分场景,用合适的模型 |
| C盘爆满 | 让AI帮清缓存,Hermes定时任务+微信推送 |
9.3 下一步学习计划
- 深入Claude Code:学一些高级用法,比如自定义工作流
- 接入更多平台:飞书、钉钉都试试
- MCP扩展:学习用MCP给Hermes装更多能力
- 实战项目:找个小项目真正用起来,不能光看不动手
十、学习资源链接
10.1 DeepSeek API Key获取步骤
还没有API Key的同学,按以下步骤获取:
- 访问 DeepSeek API平台
- 注册或登录账号
- 进入 API Keys 页面:https://platform.deepseek.com/api_keys
- 点击 "Create new key" 按钮
- 输入密钥名称(随便起,方便识别)
- 点击创建,复制sk-开头的密钥(只显示一次!务必保存好)
- 新用户有免费额度,可以先用着
⚠️ 重要:API Key就像密码一样重要,不要泄露给他人!
10.2 资源链接汇总
| 资源 | 链接 |
|---|---|
| DeepSeek API平台 | https://platform.deepseek.com/ |
| DeepSeek API Key获取 | https://platform.deepseek.com/api_keys |
| Hermes国内镜像 | https://res1.hermesagent.org.cn |
| Hermes官方文档 | https://hermes-agent.nousresearch.com/docs |
| Hermes技能市场 | https://agentskills.io |
| Claude Code安装 | npm install -g @anthropic-ai/claude-code |
| Reasonix GitHub | https://github.com/esengine/DeepSeek-Reasonix |
| WSL安装命令 | wsl --install --web-download |
| Node.js下载 | https://nodejs.org/ |
| 企业微信管理后台 | https://work.weixin.qq.com/ |
10.3 命令速查表
bash
# WSL安装
wsl --install --web-download
# Node.js验证
node --version
npm --version
# Hermes安装(国内镜像)
curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash
# Claude Code安装
npm install -g @anthropic-ai/claude-code
# Reasonix启动
npx reasonix code
结语
写这篇文章的时候,我回顾了自己从0到1的过程。说实话,走了不少弯路,但每一步都值得。
作为一个双非本科生,我之前总觉得技术圈是985/211的天下。但真正学起来发现,门槛没有想象中那么高。很多东西就是一层窗户纸,点破了就懂了。
希望这篇文章能帮到跟我一样背景的朋友。如果有问题,欢迎评论区交流!
作者:郑炜航
专业:物联网工程
目标:大模型开发求职
学习日期:2026年5月
码字不易,如果对你有帮助,点个赞再走~
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)