使用 Gemma 2 构建 RAG的全过程（ Ollama 或 Hugginface ）

Python_金钱豹

430人浏览 · 2024-08-14 20:33:41

Python_金钱豹 · 2024-08-14 20:33:41 发布

没错，这两天关于Gemma2 9B、27B开源的消息又刷屏了，如果你还不知道的话，可以搜搜看看，还是挺不错的。

▲ 从这组官方的对比数据看出，能力已经力压llama3，甚至gemma:27b的能力也接近了llama3 70b，看来模型真的是在往小了发展，越来越接地气，我们老百姓的普通电脑配置也能跑起来！

既然老百姓的普通电脑都能跑了（9B），那我们就介绍使用 Gemma 2 构建 RAG的全过程：

步骤一：下载和安装Gemma 2

首先，您需要在本地计算机上安装Ollama，这是一个终端应用程序，可以帮助您下载大型语言模型，例如Gemma 2。只需打开终端，复制并粘贴以下命令即可：ollama run gemma``2。这将把模型下载到你的计算机上。

我已经完成了这一步，现在我们继续在代码编辑器中安装必要的包。

# 要下载的软件包列表      ```python   # 安装所需的软件包   #!pip install transformers   #!pip install langchain-chroma   #!pip install langchain   #!pip install langchain_community   #!pip install langchainhub   #pip install langchain-huggingface   #pip install --upgrade --quiet langchain sentence_transformers   #!pip install -U "huggingface_hub[cli]"   #!huggingface-cli login

步骤二：加载和转换数据

接下来，我们将从一个网站加载数据，这里选择了关于LeBron James的网站。尽管有观众在我之前的视频中表示偏好其他球员，但我选择这个网站是因为它包含了复杂的数据，能够很好地测试模型的性能。我们将使用一个网络数据加载器来加载数据，并将其转换为一个名为Chroma DB的向量数据库。

from langchain_community.document_loaders import WebBaseLoader      # 加载数据   loader = WebBaseLoader("https://www.nba.com/player/2544/lebron-james")   data = loader.load()   data

将数据转换为向量数据库

from langchain.vectorstores import Chroma   from langchain_huggingface import HuggingFaceEmbeddings      # 使用 HuggingFace 的嵌入模型   embeddings_model = HuggingFaceEmbeddings() # 例如 sentence-transformers/all-mpnet-base-v2      # 创建 Chroma 向量数据库   vectorstore = Chroma.from_documents(documents=data, embedding=embeddings_model, persist_directory="./chroma_db")

步骤三：构建RAG管道

在这个步骤中，我们将导入所需的各种包，如chatolama、output parser、chat prompt等，并导入Transformers包。接着，使用chatolama加载Gemma 2模型，并从Lang chain Hub导入一个RAG prompt。我们会创建一个QA链，传入我们选择的LLM（Gemma 2）、检索器和RAG prompt，然后运行这个链，传入问题并检视结果。

from langchain_community.chat_models importChatOllama   from langchain_core.output_parsers importStrOutputParser   from langchain_core.prompts importChatPromptTemplate   from langchain.chains importRetrievalQA   from langchain import hub   from langchain_huggingface.llms importHuggingFacePipeline   from transformers importAutoModelForCausalLM,AutoTokenizer, pipeline      # 使用 ChatOllama 模型   llm =ChatOllama(model="gemma2")      # 拉取 RAG 提示模板   prompt = hub.pull("rlm/rag-prompt")      # 使用向量数据库创建检索器   vectorstore =Chroma(persist_directory="./chroma_db", embedding_function=HuggingFaceEmbeddings())      # 创建 RetrievalQA 链   qa_chain =RetrievalQA.from_chain_type(       llm,       retriever=vectorstore.as_retriever(),       chain_type_kwargs={"prompt": prompt}   )      # 提问并获取结果   question ="这些统计数据属于谁？"   result = qa_chain({"query": question})      # 输出结果   print(result["result"])

以上代码包含了所有步骤，从安装软件包、加载数据、创建向量数据库到创建 RAG 管道，并最终进行问答。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m