人工智能学习笔记（一）AI大模型基础篇

veminhe

446人浏览 · 2026-02-02 09:19:18

veminhe · 2026-02-02 09:19:18 发布

1、人工智能发展历程

符号注意

连接主义

感知机，

反向传播，验证，可以提高准确率

2、提示词Prompt

六大因素，最好是都用上，这样可以更精确地通过对话大模型获取结果。如果是简单的提问，倒没必要。可以根据实际情况优化提示词。

可以参考：

https://www.promptingguide.ai/zh

目前国内主流的对话大模型有：

https://yuanbao.tencent.com/chat

https://www.qianwen.com/

https://www.coze.cn/

https://www.doubao.com/chat/

https://www.deepseek.com/

https://www.kimi.com/

月之暗面：https://www.moonshot.cn/

MiniMax

智谱AI：https://open.bigmodel.cn/console/overview

面壁智能

知乎直答

3、大模型底层运行机制：

3.1、Tokens是通用货币，需要付费才能调用大模型产商的接口，联想到之前的NLP,hanlp怎么分词的。

Tokens的计费标准：

怎么使用代码获取到提示词花费多少Tokens：

3.2、大模型是怎么理解文字的。

通过使用向量、语义相似度、训练推理等方式。

词向量，代表⼀个词的Token级别的词向量，词向量的主要作⽤是把句⼦拆分成最⼩语义单元。

句向量，代表⼀个句⼦的句向量，句向量的主要作⽤是⽤⼀个向量直接表示整段⽂本的核⼼语义，不需要依赖额外的上下⽂。

切分词向量的Tokenizer只是拆分语义单元，句向量其实是复⽤的底层训练的Tokenizer。

3.3、大模型是如何生成答案的。

Temperature，调整概率分布，设置太低了就变得极端相差大，设置太高了就变得平缓相差小。

Top-k，设置前几名排名保留。

Top-p，设置概率大于等于多少才能保留。

一般是设置了合理的Top-p作为安全网，然后控制Temperature来调整。

可以参考如下地址玩玩：

https://poloclub.github.io/transformer-explainer/

3.4、大模型的幻觉

提供更准确的资料

构建更科学的应用，比如RAG

永远记得最终决策，人机协同。

3.5、维护好大模型的记忆。

3.6、理解大模型的参数。

https://huggingface.co/

这个网站可以查看大模型的参数文件，主要的文件大小超大。

我用了deekseek对话大模型，即梦AI文生图模型。

4、深度解析Transformer

Norm是指归一化，限定在0到1之间，所有数的和作为分母，单个的数作为分子，就不会越来越大，不会爆炸。

为了保证分母不为0，平方项后面加上e可以保证分母不会为0，这个e可以理解为超参数。

为什么要本地搭建大模型应用。如果总是调用其它大模型的接口的话，第一点，Token的消耗量是不可控的，因为用户多了，用户的输入以及对应的输出不可控。第二点，将自己企业的数据传输给其它企业，自己企业的数据将不安全。

5、搭建本地大模型服务体系

5.1、使⽤Ollama本地运⾏DeepSeekR1

访问ollama.com

下载ollama，下载完成后，安装后，即可使用

版本太小了，连2加1都不知道。

运行后，咱们可以通过python代码调用本地模型，key随便填写，因为是ChatOpenAI要求的。

执行命令：

pip install langchain_openai

代码如下：


from langchain_openai import ChatOpenAI

client = ChatOpenAI(
    model="deepseek-r1:1.5b",
    openai_api_key="123",
    base_url="http://localhost:11434/v1",
)

print(client.invoke("你是谁？"))

运行结果如下：

5.2、Ollama部署Embedding向量化模型

下载、使用

编写代码使用：

from langchain_ollama from OllamaEmbeddings

embedding_model = OllamaEmbeddings(model="nomic-embed-text",base_url="http://localhost:11434")

embedding = embedding_model.embed_query("你好")
print(len(embedding))

运行结果如下：

5.3、安装与使用one-api

One-API可以认为是⼀个本地知识库⽹关。One-API提供了⼀套遵循OpenAI标
准的统⼀API，访问多个不同的⼤模型产品。