1、人工智能发展历程

符号注意

连接主义

感知机,

反向传播,验证,可以提高准确率

2、提示词Prompt

六大因素,最好是都用上,这样可以更精确地通过对话大模型获取结果。如果是简单的提问,倒没必要。可以根据实际情况优化提示词。

可以参考:

https://www.promptingguide.ai/zh

目前国内主流的对话大模型有:

https://yuanbao.tencent.com/chat

https://www.qianwen.com/

https://www.coze.cn/

https://www.doubao.com/chat/

https://www.deepseek.com/

https://www.kimi.com/

月之暗面:https://www.moonshot.cn/

MiniMax

智谱AI:https://open.bigmodel.cn/console/overview

面壁智能

知乎直答

3、大模型底层运行机制:

3.1、Tokens是通用货币,需要付费才能调用大模型产商的接口,联想到之前的NLP,hanlp怎么分词的。

Tokens的计费标准:

怎么使用代码获取到提示词花费多少Tokens:

3.2、大模型是怎么理解文字的。

通过使用向量、语义相似度、训练推理等方式。

词向量,代表⼀个词的Token级别的词向量,词向量的主要作⽤是把句⼦拆分成最⼩语义单元。

句向量,代表⼀个句⼦的句向量,句向量的主要作⽤是⽤⼀个向量直接表示整段⽂本的核⼼语义,不需要依赖额外的上下⽂。

切分词向量的Tokenizer只是拆分语义单元,句向量其实是复⽤的底层训练的Tokenizer。
3.3、大模型是如何生成答案的。

Temperature,调整概率分布,设置太低了就变得极端相差大,设置太高了就变得平缓相差小。

Top-k,设置前几名排名保留。

Top-p,设置概率大于等于多少才能保留。

一般是设置了合理的Top-p作为安全网,然后控制Temperature来调整。

可以参考如下地址玩玩:

https://poloclub.github.io/transformer-explainer/

3.4、大模型的幻觉

提供更准确的资料

构建更科学的应用,比如RAG

永远记得最终决策,人机协同。

3.5、维护好大模型的记忆。

3.6、理解大模型的参数。

https://huggingface.co/

这个网站可以查看大模型的参数文件,主要的文件大小超大。

我用了deekseek对话大模型,即梦AI文生图模型。

4、深度解析Transformer

Norm是指归一化,限定在0到1之间,所有数的和作为分母,单个的数作为分子,就不会越来越大,不会爆炸。

为了保证分母不为0,平方项后面加上e可以保证分母不会为0,这个e可以理解为超参数。

为什么要本地搭建大模型应用。如果总是调用其它大模型的接口的话,第一点,Token的消耗量是不可控的,因为用户多了,用户的输入以及对应的输出不可控。第二点,将自己企业的数据传输给其它企业,自己企业的数据将不安全。

5、搭建本地大模型服务体系

5.1、使⽤Ollama本地运⾏DeepSeekR1

访问ollama.com
下载ollama,下载完成后,安装后,即可使用
版本太小了,连2加1都不知道。
运行后,咱们可以通过python代码调用本地模型,key随便填写,因为是ChatOpenAI要求的。
执行命令:
pip install langchain_openai

代码如下:


from langchain_openai import ChatOpenAI

client = ChatOpenAI(
    model="deepseek-r1:1.5b",
    openai_api_key="123",
    base_url="http://localhost:11434/v1",
)

print(client.invoke("你是谁?"))

运行结果如下:

5.2、Ollama部署Embedding向量化模型
下载、使用
编写代码使用:
from langchain_ollama from OllamaEmbeddings

embedding_model = OllamaEmbeddings(model="nomic-embed-text",base_url="http://localhost:11434")

embedding = embedding_model.embed_query("你好")
print(len(embedding))
运行结果如下:
5.3、安装与使用one-api
One-API可以认为是⼀个本地知识库⽹关。One-API提供了⼀套遵循OpenAI标
准的统⼀API,访问多个不同的⼤模型产品。
重点关注支持的大模型有哪些。
5.3.1、部署
5.3.2、登录
5.3.3、添加渠道
5.3.4、生成令牌
5.4、使用FastGPT搭建本地知识库
后续还会学习

langchain等

学习参考:https://reference.langchain.com/python/langchain/

可以在如下网站查看应该使用多少显存的设备:

Llamafactory.cn

如下图所示:

进入“显存计算助手”。最上面是总的,下面是推理等方面的。整体下面还有单位说明。

有兴趣可以搜索“英伟达H200显卡显存容量141GB”

modelscope.cn

Ollama的端口11434/neo4j的端口7687

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐