大三双非本科0基础自学大模型:从Hermes到DeepSeek,我的AI工具学习之路

本文记录了一个物联网专业普通大学生如何从0开始学习AI大模型工具的真实经历。没有鸡汤,没有凡尔赛,只有踩过的坑和总结的经验。

前言

先简单介绍一下自己:

  • 身份:某双非一本物联网专业,大三在读
  • 现状:0基础转大模型方向,正在投简历找实习
  • 学习时长:从接触到现在大概一周多
  • 设备:普通Windows笔记本(后续发现WSL是神器)

说实话,作为一个物联网专业的学生,我之前从没想过要搞AI。本科学的都是嵌入式、单片机、C语言,简历上写得最多的项目就是"智能小车"和"温湿度监测系统"。

转行的契机很简单:去年秋招投了几个大厂的后端岗位,面试官问我:"你有没有了解过LLM?有没有用过大模型相关的工具?"

我说没有。

然后就没然后了。

痛定思痛,今年3月份开始,我决定要真正学一学大模型相关的技术。不是那种"听说过ChatGPT"的了解,而是能实际用起来、写项目的程度。

这篇文章,就是我这周学习的完整记录。踩的坑比代码行数还多,但好在终于跑通了。

目录

  1. 先搞清楚:我该学哪些工具?
  2. DeepSeek模型那么多,到底用哪个?
  3. WSL+Linux基础:小白也能看懂
  4. Hermes安装避坑指南(血泪史)
  5. 把AI接进微信:终于可以调戏Bot了
  6. 三个工具怎么配合用?
  7. 省Token就是省钱!
  8. 磁盘清理:差点重装系统
  9. 总结和下一步

一、AI Agent工具生态全景

1.1 为什么需要AI Agent工具?

很多人可能跟我一样,之前用大模型就是去网页上对话。但实际上,真正好用的是Agent(智能体)

简单理解:

  • 普通Chat:你问我答,答完就忘
  • AI Agent:能帮你执行命令、操作文件、记住你的习惯、自动完成任务

打个比方,普通对话是"雇了一个顾问",而Agent是"雇了一个助理"。顾问只能出主意,助理能帮你干活。

1.2 四大主流工具对比

工具 开发方 特点 适合场景 推荐指数
Hermes Agent Nous Research 功能最全,支持17+平台 日常助手、消息平台接入 ⭐⭐⭐⭐⭐
Claude Code Anthropic 代码编辑体验最好 写代码、做项目、深度Debug ⭐⭐⭐⭐⭐
Codex OpenAI Computer Use操作桌面 暂不推荐,中国区受限
Reasonix DeepSeek原生 缓存优化,省钱5倍 省钱写代码 ⭐⭐⭐⭐

1.3 Hermes Agent(重点掌握)

这是我花最多时间研究的工具,也是最推荐入门的。

一句话定位:开源AI代理框架,相当于一个超级助手,能接入微信、飞书、钉钉等多个平台。

核心优势

  • 47个内置工具:terminal、file、browser、TTS、image_gen、memory、cronjob、vision等
  • 17+消息平台:微信、飞书、钉钉、QQ Bot、Telegram、Discord等
  • 国内友好:有国内镜像安装源,支持DeepSeek等国内模型
  • 技能系统:完成复杂任务后自动生成可复用技能文档,下次遇到类似任务自动加载
  • 记忆系统:MEMORY.md + USER.md,跨会话记住你的偏好
  • 子代理委派:最多3个并发子代理同时工作

1.4 Claude Code

一句话定位:Anthropic的终端编程Agent,代码编辑体验最好。

亮点功能

  • 精准替换(不像其他工具那样容易改乱)
  • 检查点回退(写错了一键回到之前的状态)
  • 推荐接入DeepSeek:比用Claude官方API便宜很多,国内直连不用梯子
  • VS Code有官方插件

安装与配置

bash

# 安装Claude Code(需要Node.js 22+)
npm install -g @anthropic-ai/claude-code

🔧 详细配置教程推荐看B站UP主「技术爬爬虾」的视频,搜 BV1qtdSBkEDy,手把手教你怎么接入DeepSeek,跟着做就行。

 

简单说就是改一个配置文件(~/.claude/settings.json),把API地址指向DeepSeek、填上API Key,搞定。国内直连,不用梯子,比Claude官方便宜很多。

1.5 Reasonix

一句话定位:DeepSeek原生编程Agent,主打省钱。

核心卖点

  • Cache-First循环:缓存命中率99.82%,同样工作量费用只有1/5
  • 默认用deepseek-v4-flash(便宜),需要时自动切换deepseek-v4-pro
  • 支持MCP、技能系统

⚠️ 使用前提:需要 Node.js 22+

 

bash

# 验证Node.js版本
node --version
# 需要 22.x 以上
1.5.1 启动方式

bash

# 进入你的项目目录
cd 你的项目目录

# 启动编程模式(可读写文件、执行命令)
npx reasonix code

# 纯聊天模式(不碰文件)
npx reasonix chat

# 一次性执行,输出到stdout
npx reasonix run "你的任务描述"

1.5.2 核心命令

命令 用途
npx reasonix code 编程模式(读写文件、执行命令)
npx reasonix chat 纯聊天模式(不碰文件)
npx reasonix run "任务" 一次性执行,输出到stdout
npx reasonix doctor 环境健康检查
npx reasonix update 升级Reasonix
npx reasonix stats 查看使用统计和花费

1.5.3 常用斜杠命令

在对话中直接输入这些命令:

命令 作用
/help 查看所有命令
/pro 下一轮切到Pro模型
/preset max 整个会话用Pro
/apply 确认应用代码修改
/undo 撤回修改
/commit 一键git commit
/compact 压缩上下文省token
/skill new 名称 创建技能

1.5.4 省钱原理

Reasonix的核心是 Cache-First循环

plaintext

同样的代码任务 → 缓存命中率99.82% → 费用只有1/5

这意味着对于重复性的编程任务,Reasonix会比其他工具便宜很多!

1.6 Codex(暂不推荐)

  • Computer Use不支持中国区
  • 需要ChatGPT Plus订阅 $20/月
  • 性价比不高,不推荐

二、DeepSeek模型选择指南

2.1 四大模型对比

用DeepSeek API的同学肯定会纠结:这么多模型,我该用哪个?

模型 特点 费用 适合场景
deepseek-v4-pro 最强,代码推理最好 💰💰💰 重要项目、代码开发
deepseek-chat 日常聊天够用 💰 日常对话、简单任务
deepseek-v4-flash 最快最便宜 💰 简单重复任务
deepseek-reasoner 推理强但慢 💰💰 数学推理

2.2 我的选择策略

plaintext

日常对话/闲聊     → deepseek-chat(够用又便宜)
写代码/做项目     → deepseek-v4-pro(能力强)
简单重复任务      → deepseek-v4-flash(最快最省)
数学证明/推理    → deepseek-reasoner(专门优化)

血泪教训:我一开始啥都用v4-pro,一周烧了50块。后来学会区分使用场景,同样的效果只花了12块。

三、WSL+Linux基础知识

3.1 什么是WSL?

很多AI工具需要在Linux环境下运行,但装双系统又太麻烦。这时候WSL就派上用场了。

WSL = Windows Subsystem for Linux

通俗理解:在Windows系统里装一个Linux系统,两边无缝切换

bash

# 一行命令安装WSL(需要管理员权限)
wsl --install --web-download

安装完会得到一个Ubuntu(最常见的Linux发行版)。

3.2 终端提示符解读

打开终端,你会看到这样的界面:

plaintext

zwh@DESKTOP-NC3L9GP:~$

让我帮你拆解:

  • zwh = 当前用户名(就是你)
  • DESKTOP-NC3L9GP = 电脑名字(hostname)
  • ~ = 当前目录(~ 代表"家目录",就是你的个人文件夹)
  • $ = 普通用户权限(如果是 #,代表管理员/root)

3.3 常用命令解释

命令 含义 通俗解释
~ 家目录 等于 /home/zwh/,你的"专属地盘"
sudo 管理员权限 "我是老大,让我来"——执行敏感操作时用
apt 软件包管理器 Ubuntu的"应用商店",装软件用的
source ~/.bashrc 重新加载配置 修改了配置文件后,用这个让它生效
find ~ -name "*.py" -type f 查找文件 在家里翻箱倒柜找文件

3.4 虚拟环境(重要!)

这是我觉得最需要理解的Linux概念。

什么是虚拟环境? 给每个项目独立的Python空间,互不干扰。

plaintext

❌ 不用虚拟环境 
   → 包都装到系统Python 
   → 装多了系统乱套
   → 不同项目依赖冲突

✅ 用虚拟环境   
   → 每个项目包隔离
   → 随便折腾,坏了重建一个就行
   → 干净整洁不打架

四、Hermes安装保姆级教程

4.1 踩坑记录(必看)

我踩过的坑

  1. ❌ 一开始用官方源安装,curl超时,国内访问困难
  2. ❌ 装完后运行报错,提示缺 ripgrepffmpeg
  3. ❌ 配置的时候选错了TTS引擎,语音功能用不了
  4. ❌ 不知道每次要用虚拟环境,运行命令找不到hermes

解决后的正确流程往下看

4.2 安装命令(国内镜像源)

bash

# 使用国内镜像源安装(强烈推荐)
curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash

这条命令会:

  1. 下载安装脚本
  2. 创建虚拟环境
  3. 安装所有依赖

💡 小贴士:安装过程大概需要3-5分钟,耐心等待即可。如果网络不好,可能会更长。

4.3 安装过程中的配置选择

安装脚本会让你做几个选择,按这个推荐来:

配置项 推荐选择 说明
模型提供商 16.DeepSeek 选列表中的DeepSeek
模型版本 deepseek-v4-pro(强)或 deepseek-chat(省) 看任务重要程度
TTS引擎 Edge TTS 免费免配置,最简单
Session Reset Inactivity + daily reset 自动重置,节省token
消息平台 全部跳过 后续再接

4.4 补装依赖(如有报错)

如果运行时报错提示缺工具,补装一下:

bash

# 安装常用依赖
sudo apt install ripgrep ffmpeg

# ripgrep:命令行搜索工具,Hermes很多功能依赖它
# ffmpeg:音视频处理工具,TTS语音合成需要

4.5 文件目录结构

安装完成后,在 ~/.hermes/ 目录下:

plaintext

~/.hermes/
├── config.yaml       # 主配置文件(修改配置看这里)
├── credentials/      # 存放API Key(敏感信息)
├── data/             # 对话数据、记忆文件
└── extensions/       # 扩展插件目录

4.6 常用命令汇总

bash

# ============================================
# 基础操作
# ============================================

# 激活虚拟环境(每次使用前必须执行!)
source ~/.hermes/hermes-agent/venv/bin/activate

# 启动聊天
hermes chat

# 切换模型
hermes model

# 配置工具(可以开关不需要的功能)
hermes tools

# ============================================
# 消息平台接入
# ============================================

# 接入聊天平台(如微信)
hermes gateway setup

# 启动微信
hermes gateway start weixin

# ============================================
# 系统维护
# ============================================

# 更新Hermes到最新版本
hermes update

# 诊断问题(出错了先跑这个)
hermes doctor

# 浏览技能商店
hermes skills browse

# 安装技能
hermes skills install 技能名

4.7 一劳永逸:自动激活虚拟环境

每次都要手动激活虚拟环境太麻烦了,配置一下让它自动激活:

bash

# 把激活命令加到配置文件里,开机自动生效
echo 'source ~/.hermes/hermes-agent/venv/bin/activate' >> ~/.bashrc

# 让配置立即生效
source ~/.bashrc

五、微信接入Hermes

5.1 为什么接微信?

接入了微信,你就可以直接跟AI对话,就像跟朋友发消息一样。而且AI能记住你们的对话历史,比网页版方便多了。

5.2 接入方式一:个人微信(iLink方案)⭐推荐

这是v0.6.0+原生支持的方式,走腾讯官方iLink Bot API,无需公网IP、无需WebSocket,普通家用网络即可

Step 1:升级Hermes到最新版

bash

# 激活虚拟环境
source ~/.hermes/hermes-agent/venv/bin/activate

# 升级到最新版本(iLink支持需要v0.6.0+)
hermes update

Step 2:安装依赖

bash

# 安装微信接入所需的Python依赖
pip install aiohttp cryptography qrcode

# aiohttp:异步HTTP库,API通信用
# cryptography:数据加密
# qrcode:生成二维码(扫码登录用)

Step 3:启动网关配置

bash

# 进入网关配置模式
hermes gateway setup

# 选择 Weixin 选项
# 系统会引导你完成初始化配置

Step 4:扫码登录

终端会显示一个二维码,用手机微信扫码确认登录。

⚠️ 注意:二维码有时效,如果过期会自动刷新,最多重试3次

Step 5:配对验证(如需要)

首次登录后可能需要配对码:

bash

# 查看配对码
hermes pairing list

# 审批配对
hermes pairing approve weixin 配对码

Step 6:配置访问策略

~/.hermes/.env 文件中配置访问权限:

ini

# 私聊策略:open(开放)/ allowlist(白名单)/ disabled(禁用)
WEIXIN_DM_POLICY=open

# 群聊策略:默认关闭,防止封号
WEIXIN_GROUP_POLICY=disabled

# 白名单用户(DM_POLICY为allowlist时生效)
WEIXIN_ALLOWED_USERS=user_id_1,user_id_2

# 管理员ID
WEIXIN_ADMIN_USER=your_user_id

5.3 接入方式二:企业微信

需要管理员权限 + 公网服务器。

Step 1:企业微信后台配置

  1. 登录 企业微信管理后台
  2. 进入「应用管理」→「自建应用」
  3. 创建应用,获取:
    • CorpID
    • AgentID
    • Secret

Step 2:配置消息接收

  1. 在应用设置中启用「接收消息」
  2. 配置「消息接收URL」(需要公网可访问)
  3. 设置API接收消息

Step 3:修改配置文件

编辑 ~/.hermes/config.yaml,添加企业微信配置:

yaml

gateway:
  wechat_work:
    enabled: true
    corp_id: "your_corp_id"
    agent_id: "your_agent_id"
    secret: "your_secret"
    token: "your_token"
    encoding_aes_key: "your_aes_key"

Step 4:重启网关

bash

hermes gateway restart

5.4 常见故障排除

问题 解决方案
aiohttp and cryptography are required 执行 pip install aiohttp cryptography
Session expired (errcode=-14) 重新扫码登录
QR code expired 自动刷新最多3次,检查网络连接
Bot不响应私聊 检查 WEIXIN_DM_POLICY 配置和白名单
消息发送失败 检查API额度是否用完
配对码无效 重新执行 hermes pairing list 获取新码

5.5 启动和停止

bash

# 启动微信Gateway
hermes gateway start weixin

# 停止微信Gateway
hermes gateway stop weixin

# 查看运行状态
hermes gateway status

# 查看日志(排查问题时用)
tail -f ~/.hermes/logs/gateway.log

六、三大工具使用场景分工

很多人问我:Hermes、Claude Code、Reasonix到底用哪个?

我的经验是分工使用,各司其职

场景 推荐工具 理由
日常聊天/学习问答 Hermes + deepseek-chat 记忆功能强,能记住你的偏好
写代码/做项目 Claude Code 代码编辑体验最好,有检查点回退
省钱写代码 Reasonix 缓存优化,能省5倍费用
定时自动化任务 Hermes 有cron-manager技能支持
消息推送/通知 Hermes 支持17+消息平台
桌面App操作 Codex 暂不推荐,中国区受限

我的日常工作流

  1. 早上起床 → Hermes查天气、新闻
  2. 学习时 → 用Claude Code写代码,有问题直接问
  3. 写简单脚本 → Reasonix,便宜快
  4. 晚上 → Hermes总结今天学的内容

七、省Token实战技巧

用大模型就是烧钱,Token就是钱。下面是我总结的省Token技巧:

7.1 模型选择

plaintext

❌ 啥都用 deepseek-v4-pro(贵)
✅ 简单任务用 deepseek-chat(够用)
✅ 重复任务用 deepseek-v4-flash(最快)

7.2 工具管理

bash

# 关闭不需要的工具
hermes tools
# 弹出的菜单里把不用的功能关掉

7.3 对话管理

操作 命令 说明
压缩上下文 /compact 对话太长了用它压缩,节省Token
清空对话 /clear 换话题时清空,重新开始
简短提问 - 别啰嗦,直接问要点

7.4 自动化任务

定时任务不需要最强模型:

plaintext

# 自动化任务配置里,把模型改成 deepseek-v4-flash
# 反正就是查个天气、发个提醒,不需要太聪明

7.5 使用缓存

用Reasonix写代码,缓存命中率99.82%,能省5倍费用:

bash

npx reasonix code

八、让AI帮你清理磁盘:从Claude到Hermes的实战

8.1 问题来了

上周发现C盘红了,仔细一查,各种缓存占了快30G!

罪魁祸首

  • 网易云音乐缓存:22G(我只是听了几首歌啊喂)
  • Windows临时文件:2.1G
  • npm/pip/Edge浏览器缓存:零零散散加起来也不少

8.2 第一版:用Claude手动清理

一开始我直接在Claude Code里让它帮我清:

plaintext

请帮我清理磁盘上的缓存文件,包括:
1. 网易云音乐缓存
2. 临时文件
3. npm缓存
4. pip缓存
5. Edge浏览器缓存

Claude确实能干,一步步帮我找到缓存目录、确认后删除。但问题是——每次都要手动操作,还得自己盯着确认。

8.3 第二版:Hermes定时清理+微信推送(推荐)

后来想到,Hermes有定时任务功能,还能发微信通知,完美!

思路:设置定时任务 → Hermes自动扫描清理 → 清理结果发到微信

bash

# 在Hermes中设置定时清理任务
# 每周日凌晨3点自动执行

# Step 1: 安装定时任务技能
hermes skills install official/cron-manager

# Step 2: 在Hermes中创建定时任务
# 输入以下指令:
"帮我创建一个每周日凌晨3点的定时任务,任务是:
1. 扫描并清理网易云音乐缓存目录
2. 清理Windows临时文件
3. 清理npm缓存(npm cache clean --force)
4. 清理pip缓存(pip cache purge)
5. 清理Edge浏览器缓存
6. 汇总清理结果,通过微信发送给我"

实际执行过程:Hermes会逐步扫描每个缓存目录,列出占用大小,确认后删除,最后生成一份清理报告发到微信上。

8.4 清理结果

清理项目 清理前 清理后 释放空间
网易云音乐缓存 22G 20M ~22G
Windows临时文件 2.1G 232M ~1.9G
npm缓存 - - ~几百M
pip缓存 - - ~几百M
Edge浏览器缓存 - - ~几百M
总计 - - ~25G

从快30G降到5G左右,C盘终于不红了。而且以后每周自动清,微信还会推送报告,再也不用担心C盘爆满。

💡 小贴士:网易云缓存是个"大户",建议在网易云设置里把缓存目录改到D盘,或者限制缓存大小

九、学习总结与下一步方向

9.1 这周学到了什么

plaintext

✅ 理解了AI Agent的概念和使用场景
✅ 掌握了Hermes Agent的安装和配置
✅ 学会了WSL基本操作
✅ 接入了微信,可以随时调戏AI了
✅ 了解了Claude Code和Reasonix的用法
✅ 学会了省Token的技巧
✅ 让AI帮我清理了25G缓存,还设了定时任务自动清

9.2 踩过的坑总结

解决方案
官方源安装超时 用国内镜像:res1.hermesagent.org.cn
缺少ripgrep/ffmpeg sudo apt install ripgrep ffmpeg
不知道用虚拟环境 source ~/.hermes/.../activate
啥都用最强模型 区分场景,用合适的模型
C盘爆满 让AI帮清缓存,Hermes定时任务+微信推送

9.3 下一步学习计划

  1. 深入Claude Code:学一些高级用法,比如自定义工作流
  2. 接入更多平台:飞书、钉钉都试试
  3. MCP扩展:学习用MCP给Hermes装更多能力
  4. 实战项目:找个小项目真正用起来,不能光看不动手

十、学习资源链接

10.1 DeepSeek API Key获取步骤

还没有API Key的同学,按以下步骤获取:

  1. 访问 DeepSeek API平台
  2. 注册或登录账号
  3. 进入 API Keys 页面:https://platform.deepseek.com/api_keys
  4. 点击 "Create new key" 按钮
  5. 输入密钥名称(随便起,方便识别)
  6. 点击创建,复制sk-开头的密钥(只显示一次!务必保存好)
  7. 新用户有免费额度,可以先用着

⚠️ 重要:API Key就像密码一样重要,不要泄露给他人!

10.2 资源链接汇总

资源 链接
DeepSeek API平台 https://platform.deepseek.com/
DeepSeek API Key获取 https://platform.deepseek.com/api_keys
Hermes国内镜像 https://res1.hermesagent.org.cn
Hermes官方文档 https://hermes-agent.nousresearch.com/docs
Hermes技能市场 https://agentskills.io
Claude Code安装 npm install -g @anthropic-ai/claude-code
Reasonix GitHub https://github.com/esengine/DeepSeek-Reasonix
WSL安装命令 wsl --install --web-download
Node.js下载 https://nodejs.org/
企业微信管理后台 https://work.weixin.qq.com/

10.3 命令速查表

bash

# WSL安装
wsl --install --web-download

# Node.js验证
node --version
npm --version

# Hermes安装(国内镜像)
curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash

# Claude Code安装
npm install -g @anthropic-ai/claude-code

# Reasonix启动
npx reasonix code

结语

写这篇文章的时候,我回顾了自己从0到1的过程。说实话,走了不少弯路,但每一步都值得

作为一个双非本科生,我之前总觉得技术圈是985/211的天下。但真正学起来发现,门槛没有想象中那么高。很多东西就是一层窗户纸,点破了就懂了。

希望这篇文章能帮到跟我一样背景的朋友。如果有问题,欢迎评论区交流!

作者:郑炜航
专业:物联网工程
目标:大模型开发求职
学习日期:2026年5月

码字不易,如果对你有帮助,点个赞再走~

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐