# 大三双非本科0基础自学大模型第三期-接入模型后该学什么

zwh_glne

489人浏览 · 2026-05-26 00:12:38

zwh_glne · 2026-05-26 00:12:38 发布

大三双非本科0基础自学大模型（三）：接入模型后该学什么？

前言

前两期写了 Hermes 安装和微信接入的教程，没想到居然有这么多人看。但最近收到最多的私信，其实是同一个问题：

"我把 Hermes、Ollama、各种 API 都弄好了，然后呢？我该学什么？"

这个问题真的问到我心坎里了——因为就在两周前，我就是这个状态：

plaintext

✅ Hermes Agent 能聊天了
✅ Claude Code 能写代码了
✅ Reasonix 能帮我干活了
✅ Ollama 跑起来了，qwen2 也下好了
✅ DeepSeek、硅基流动的 API Key 全齐了

❌ 一个能拿得出手、能给别人看的东西都没有

我彻底陷入了 "工具收集癖" 的怪圈：每天打开电脑第一件事就是开终端，看看又出了什么新工具，装一下，玩个十分钟，然后关掉终端。成就感来得快，去得更快。

这感觉就像你兴冲冲买了一整套厨房设备，锅碗瓢盆样样齐全，结果每天还是只会煮泡面。

B站学大模型，90%的人死在这5个坑
我是怎么用 AI 打破死循环的
AI 带我学 Git——原来不是用来装X的
AI 教我搭项目结构——专业的代码长这样
AI 教我写代码——从"能跑"到"能维护"
我的项目：本地 RAG 知识库
踩坑全记录（真·血泪史 · 8大坑）
总结：接入模型后到底该学什么

一、B站学大模型，90%的人死在这5个坑

前两个月我几乎把 B站上所有"0基础学大模型"的教程都刷了一遍。但刷着刷着我就发现，B站学习的坑，真的比教程还多。

很多人不是学不会，是被这些坑硬生生劝退的：

表格

坑点	具体表现
教程永远比技术慢半拍	LangChain API改了、Ollama命令变了、模型下架了，评论区全是"跟着敲全是错"
学了一堆碎片，做不出完整东西	会装Ollama、会接微信、会写简单RAG，但拼不出一个完整项目
只教"怎么做"，不教"为什么"	复制粘贴跑起来了，但想改个功能就彻底懵了
环境问题劝退90%新手	5GB编译器、权限问题、Python版本冲突，教程永远只说"自己解决环境"
没人答疑，卡壳就是终点	报错了评论区没人理，搜三天解决不了，放弃看下一个教程

我就在这个死循环里挣扎了整整两个月：看教程 → 敲代码 → 报错 → 搜不到解决方案 → 放弃 → 看下一个教程。

直到两周前，我决定换个思路——直接用 AI 带着我学，没想到彻底打开了新世界的大门。

二、我是怎么用 AI 打破死循环的

我直接打开 Reasonix 跟它说： "你当我的编程导师，带我从零做一个项目，从 Git 开始教。"

本来没抱什么希望，想着 AI 随便给我个教程链接就不错了。结果它真的开始一步一步带着我走，连每一行命令为什么要这么写都讲得清清楚楚。

那之后我才发现，原来用 AI 学习，居然能这么爽。它完美解决了 B站学习的所有痛点。

用 AI 当老师的5大好处

表格

好处	具体说
永远不会过时的"活教程"	知道最新的库版本、最新的API、最新的最佳实践。装chromadb遇到C++编译错误，它不给我推5GB编译器，直接给了个纯Python包的命令，一行搞定
量身定制的学习路径	不管你基础，上来就讲Transformer？不存在的。知道我0基础只会点Python，直接带我做RAG项目，用到什么学什么
不仅教"怎么做"，还教"为什么"	搭目录的时候跟我说"代码放src、数据放data，以后换数据不用改代码；每个文件只做一件事，改PDF读取只动loader.py"——这些B站教程从来不会讲这么细
24小时在线的专属答疑	报错了直接贴过去，马上给解决方案。中文引号的语法错误，AI一眼就看出来了，还安慰我"不是你的错，是Python和中文标点打架了"
把大目标拆成小目标	"做RAG系统"听起来很吓人，但AI拆成5天的小目标，每天做完一个就前进一大步

三、Git 到底有啥用？新手为什么一定要学

说出来不怕大家笑话，我之前对 Git 的全部认知，就只有两行命令：

bash

git init   # 初始化一下
git push   # 上传到 GitHub

看起来很酷，但我根本不知道为什么要用它。

Git 对新手的三个核心用处

表格

用处	大白话解释
时光机	写崩了随时回退到上个版本，再也不怕"改了之后还不如原来"
后悔药	想知道上周写了什么、为什么这么写，直接查历史记录
入场券	找工作只要是写代码的，100%会问 Git，不会直接减分

之前我写代码就是一个文件改来改去，改坏了就 Ctrl+Z 撤销，撤销多了也不知道哪个是对的。有了 Git 之后，每写完一个功能就提交一次，心里特别踏实。

AI 带我学 Git 的真实过程

直接敲三行命令就完事了，没那么多花里胡哨的：

bash

# 1. 进入项目目录
cd 我的项目目录

# 2. 初始化 Git 仓库（只做一次）
git init

# 3. 把所有文件加到暂存区（. 就是当前目录的意思）
git add .

# 4. 提交，写清楚这次改了什么
git commit -m "🎉 项目初始化：搭建目录结构，配置依赖和忽略规则"

就这么简单，以后每次改完代码，重复 git add . + git commit 就行了。

整个项目我分成了5个阶段，每完成一个小目标就提交一次，现在打开日志整整齐齐：

bash

$ git log --oneline
2ec106c 🚀 阶段4+5：实现完整CLI工具，RAG问答系统正式完成
20c7bc4 ✨ 阶段1：实现文档加载器和文本分块器
1cf4624 🎉 项目初始化：搭建目录结构，配置依赖和忽略规则

这种掌控感，真的比装10个新工具强太多了。

四、AI 教我搭项目结构——专业的代码长这样

AI给我的第一个任务，居然不是写代码，而是搭目录结构：

plaintext

knowledge-base-qa/
├── src/                    ← 源代码目录
│   ├── loader.py           ← 文件加载器
│   ├── chunker.py          ← 文本分块器
│   ├── vector_store.py     ← 向量存储与搜索
│   ├── ollama_client.py    ← 大模型调用
│   └── cli.py              ← 命令行交互界面
├── data/                   ← 文档文件目录
├── tests/                  ← 测试用例
├── .gitignore              ← Git忽略规则
├── requirements.txt        ← 依赖管理
└── README.md               ← 项目说明

我以前写 Python 都是一个 .py 文件走天下，所有代码堆在一起，跑完就删。

AI的两个关键建议

1. 目录分离原则

src/ 放代码，data/ 放数据，代码和数据要分开。这样以后要换数据，不用改代码。

2. 依赖锁定

txt

# requirements.txt
pypdf==5.1.0
chromadb==0.5.18
requests==2.32.3

每一行就是一句："我的项目需要这个库，版本要这个号。"锁版本是为了别人（或者以后的你）装依赖时不会因为版本变更而出错。

它还教我写 .gitignore，把 __pycache__/、chroma_data/ 这些不该提交的文件统统忽略掉。

五、AI 教我写代码——从"能跑"到"能维护"

我以前写代码只有两个状态：

能跑 → 完美，不管了
不能跑 → 修到能跑为止

AI教了我第三件事：写给人看的代码。

1. 加注释不是废话

python

def load_text(file_path: str) -> str:
    """读取 .txt 文件，返回文件内容
    
    Args:
        file_path: 文本文件的路径
        
    Returns:
        文件内容字符串
        
    Raises:
        FileNotFoundError: 文件不存在时抛出
    """
    path = Path(file_path)
    if not path.exists():
        raise FileNotFoundError(f"文件不存在：{file_path}")
    return path.read_text(encoding="utf-8")

AI说：注释不是写给电脑看的，是写给两天后的你看的。

我当时不信。两天后回头看自己没加注释的代码——真看不懂了。

2. 单一职责原则

表格

文件	只负责一件事
`loader.py`	读取各种格式的文件，提取纯文本
`chunker.py`	把长文本切成合适大小的块
`vector_store.py`	存储向量，做相似度搜索
`ollama_client.py`	封装 Ollama API 调用
`cli.py`	处理用户输入和输出展示

好处： 如果以后要改 PDF 读取方式，我只改 loader.py，其他文件不用动。

六、我的项目：本地 RAG 知识库

在学 Git 和项目结构的过程中，我顺便完成了这个 本地 RAG 知识库问答系统。

它能做什么

bash

# 添加自己的文档
python src/cli.py --add data/我的笔记.txt

# 提问
python src/cli.py --ask "这个文档讲了什么？"

# 或者像聊天一样交互
python src/cli.py
> 什么是RAG？
💬 RAG 是检索增强生成的缩写，工作原理是把文档切分成小段...

RAG 工作原理（四步走）

plaintext

你的问题 
    ↓
① 在本地文档里搜索相关段落
    ↓
② 把问题 + 搜到的段落 一起发给本地大模型
    ↓
③ 模型看完参考信息后回答
    ↓
④ 带上原文引用输出给你

手写 TF-IDF 向量搜索（国内用户福音）

很多教程用 Chroma + Sentence Transformer 做语义搜索，但我在国内连 HuggingFace 超时了——干脆自己手写了一个 TF-IDF 搜索：

python

import math

def cosine_similarity(vec1, vec2):
    """计算两个向量的余弦相似度"""
    dot_product = sum(a * b for a, b in zip(vec1, vec2))
    norm1 = math.sqrt(sum(a*a for a in vec1))
    norm2 = math.sqrt(sum(b*b for b in vec2))
    return dot_product / (norm1 * norm2) if norm1 and norm2 else 0

虽然 TF-IDF 只能匹配关键词（不如语义搜索准），但它零依赖、纯 Python、跑得飞快。

后来接上 Ollama 的 nomic-embed-text 做语义搜索，效果直线上升。

调用本地大模型

用 Ollama 跑 qwen2:0.5b（阿里千问小模型，352MB，中文好）：

python

import requests

def ask_ollama(question: str, context: str) -> str:
    """调用本地 Ollama 模型回答问题"""
    response = requests.post(
        "http://localhost:11434/api/generate",
        json={
            "model": "qwen2:0.5b",
            "prompt": f"""基于以下参考信息回答用户的问题：

参考信息：
{context}

用户问题：{question}

如果参考信息不足以回答问题，请如实说"我不知道"。""",
            "stream": False,
        },
        timeout=60
    )
    return response.json()["response"]

七、踩坑全记录（真·血泪史 · 8大坑）

表格

#	坑点	报错/现象	教训
1	为了装一个库，下了5GB编译器	`error: Microsoft Visual C++ 14.0 or greater is required.`	Windows装库遇到C++错误，先搜预编译wheel包或换纯Python替代品
2	下载模型下到怀疑人生	83KB/s，预计1小时18分钟	下模型的时候去干别的事，别盯着进度条看，会自闭
3	手动导入的GGUF不兼容	`Error: unable to allocate CPU buffer`	能走官方源就走官方源，别省那点流量
4	中文引号让Python崩溃了	`SyntaxError: invalid syntax`	Python和中文标点打架，用单引号包字符串
5	数据没保存，等于白做	脚本一关数据就丢了	加`pickle`序列化，数据存到磁盘文件
6	复制粘贴带进来的"隐形字符"	`▎ : 无法将"▎"项识别为 cmdlet...`	手敲命令，不复制粘贴
7	模型加进去了，但脚本说连不上	一直报"Ollama服务不可用"	终端之前设置了代理环境变量，curl请求走了代理连不上本地。关掉重开就好了——环境变量污染是最坑的隐形bug
8	Ollama装好了，但提示找不到命令	`ollama --version` 找不到	没关终端重开，环境变量没刷新。重启治百病

八、总结：接入模型后到底该学什么

如果让我给刚接触大模型的同学一个建议，那就是：

别再沉迷于收集工具，也别再死磕过时的教程。找一个你真正想做的小项目，然后让 AI 当你的老师，带着你一步一步做。

装 Hermes 花一天，接微信花半天，下模型花一小时……然后呢？你还是在原地。

但如果你定一个目标——"我要做一个能用的东西"——你会发现你需要：

表格

能力	怎么学会的
Git 版本管理	做项目过程中自然养成习惯
Python 项目结构	知道了怎么组织代码才叫"专业"
API 调用	学会了怎么让程序跟大模型对话
需求拆解	知道了怎么把一个功能拆成几个小步骤
搜错能力	这才是程序员最重要的能力

这些才是真正值钱的东西。工具会过时，但这些能力不会。

写在最后

我依然是一个双非本科、正在找实习的普通学生。

但跟两周前不同的是：

✅ 我有了一个能给别人演示的项目
✅ 我学会了 Git，并且养成了提交习惯
✅ 我知道怎么用 AI 来教我，而不是替我做

AI 不是用来代替你学习的，它不会替你写代码，也不会替你思考。

但它是最好的老师，最好的助教，最好的陪练。它能帮你跳过那些毫无意义的坑，让你把时间和精力，花在真正重要的事情上。

希望这篇文章能帮到跟我一样迷茫的朋友。

下一期预告： 把 TF-IDF 升级成语义搜索，顺便做个 Web 界面。

码字不易，如果对你有帮助，点个赞再走～

附录：我的学习资源清单

表格

资源	说明
黑马程序员 Python+AI大模型	B站 BV1h1VbzHER2
LLM-Universe	GitHub 开源学习资源
Hermes Agent	AI 调度助手
Reasonix	AI 编程导师
Ollama	本地大模型运行
qwen2:0.5b	轻量中文模型

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Prometheus - 监控 K8s 集群：kube-state-metrics 集成与全维度监控

AtomGit开源社区

从零到一：Flex布局入门指南

AtomGit开源社区

大语言模型处理大规模代码的认知误区与合理实践

在网页端或客户端应用中，向大语言模型上传包含百万行代码的独立文件，无法使模型突破自身上下文窗口的限制。从模型单次可承载的信息总量来看，文件上传操作与在输入框内直接复制粘贴文本，二者不存在本质区别。文件上传功能本质上是客户端与服务端之间的传输优化方案，其背后依赖的RAG技术，是通过“切片-检索-注入”的方式，让模型在海量文档中快速定位有效信息，而非让模型一次性读取完整文档。