终于解决！大模型“一本正经胡说八道”？万字长文带你从零构建高性能RAG系统，彻底消灭幻觉

Python怎么学啊

327人浏览 · 2026-03-14 20:25:28

Python怎么学啊 · 2026-03-14 20:25:28 发布

本文深入解析RAG技术，旨在解决大模型“幻觉”问题。内容涵盖幻觉根源分析、四大主流向量数据库实战、Embedding模型选型、文档智能分割及检索器核心原理。重点详解混合检索、重排序、CRAG等进阶优化策略，并提供完整RAG系统架构与代码模板，助你从零构建高可用的智能问答系统。

万字长文，一次性掌握RAG核心技术

大语言模型“一本正经胡说八道”的毛病，终于有解了！这就是今天要讲的RAG（检索增强生成）技术。它能让AI的回答有据可查，避免幻觉，真正成为你的智能助手。

🤔 第一关：搞懂LLM为什么会“幻觉”

幻觉的三大根源

训练数据偏差：模型只在训练数据中出现过的知识上表现可靠
参数记忆限制：知识被压缩在权重中，细节容易丢失
概率生成本质：每次都是“猜”下一个词，不是“回忆”事实

7大解决方案对比

方案	原理	适用场景	复杂度
提示工程	在Prompt中明确要求“不要编造”	简单问答	★☆☆
Few-shot示例	提供正确回答示例	格式固定场景	★★☆
知识检索	实时查外部知识库	动态知识问答	★★★
思维链推理	让模型展示推理过程	复杂问题	★★★
自我验证	让模型检查自己回答	高准确性要求	★★★
不确定性量化	输出置信度分数	风险控制	★★★
集成方法	多个模型投票	关键决策	★★★★

# 实战：减少幻觉的Prompt模板anti_hallucination_prompt = """请你基于提供的知识回答问题，遵循以下规则：  
1. 只使用提供的参考信息2. 如果信息不足，明确说“根据已有信息无法确定”3. 不要添加额外信息4. 如果信息冲突，说明冲突点  
参考信息：{context}  
问题：{question}  
回答："""

🗄️ 第二关：四大向量数据库实战配置

FAISS - Facebook开源，本地首选

# 安装：pip install faiss-cpuimport faissimport numpy as np  
# 创建索引dimension = 768  # embedding维度index = faiss.IndexFlatL2(dimension)  
# 添加向量embeddings = np.random.rand(1000, dimension).astype('float32')index.add(embeddings)  
# 搜索query = np.random.rand(1, dimension).astype('float32')k = 5distances, indices = index.search(query, k)print(f"找到最相似的 {k} 个文档索引：{indices}")

FAISS进阶用法：

# IVF索引加速nlist = 100  # 聚类中心数quantizer = faiss.IndexFlatL2(dimension)index = faiss.IndexIVFFlat(quantizer, dimension, nlist)index.train(embeddings)  # 先训练index.add(embeddings)  
# 保存和加载faiss.write_index(index, "my_index.faiss")loaded_index = faiss.read_index("my_index.faiss")

Pinecone - 云端托管，简单易用

# 安装：pip install pinecone-clientimport pineconefrom langchain.vectorstores import Pineconefrom langchain.embeddings import OpenAIEmbeddings  
# 初始化pinecone.init(api_key="your-api-key", environment="us-west1-gcp")  
# 创建索引index_name = "my-knowledge-base"if index_name not in pinecone.list_indexes():    pinecone.create_index(        name=index_name,        dimension=1536,  # text-embedding-ada-002维度        metric="cosine"    )  
# 连接索引index = pinecone.Index(index_name)  
# 通过LangChain使用embeddings = OpenAIEmbeddings()vectorstore = Pinecone(index, embeddings, "text")

腾讯云VectorDB - 国产新星

from tcvectordb.model.enum import FieldType, IndexTypefrom tcvectordb.model.index import VectorIndex, FilterIndexfrom tcvectordb.model.document import Document, SearchParamsfrom tcvectordb.model.collection import Embedding  
# 创建连接client = VectorDBClient(    url='http://xxxxx.xxxxx.xxxxx.tencentcloudapi.com',    username='root',    key='your-key',    timeout=30)  
# 创建集合db = client.database('db-test')coll = db.create_collection(    name='my-collection',    shard=1,    replicas=0,    description='知识库文档',    index=Index(        VectorIndex(            'vector',            768,            IndexType.HNSW,            MetricType.COSINE        ),        FilterIndex('id', FieldType.String, IndexType.PRIMARY_KEY)    ))

Weaviate - 开源图向量混合

import weaviatefrom weaviate.classes.init import AdditionalConfig, Timeoutimport weaviate.classes as wvc  
# 客户端配置client = weaviate.WeaviateClient(    additional_config=AdditionalConfig(        timeout=Timeout(init=2, query=45, insert=120)  # 超时设置    ))  
# 创建集合client.collections.create(    name="Document",    vectorizer_config=wvc.config.Configure.Vectorizer.text2vec_openai(),    properties=[        wvc.config.Property(            name="title",            data_type=wvc.config.DataType.TEXT        ),        wvc.config.Property(            name="content",            data_type=wvc.config.DataType.TEXT        )    ])

📊 向量数据库选型指南

维度	FAISS	Pinecone	腾讯云VectorDB	Weaviate
部署方式	本地	全托管	全托管	自托管/云托管
开源	✅	❌	❌	✅
最大数据量	内存限制	无限制	PB级	无限制
多模态	❌	✅	✅	✅
成本	免费	按用量	按用量	免费/自建成本
适合场景	中小规模	企业级	国内企业	图向量混合

🔤 第三关：Embedding模型深入解析

文本向量化原理

from sentence_transformers import SentenceTransformer  
# 加载模型model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')  
# 生成向量sentences = ['我爱编程', 'Python是最好的语言', '机器学习很有趣']embeddings = model.encode(sentences)print(f"向量维度：{embeddings.shape}")  # (3, 384)  
# 计算相似度from sklearn.metrics.pairwise import cosine_similaritysimilarity = cosine_similarity(    [embeddings[0]],  # "我爱编程"    [embeddings[1]]   # "Python是最好的语言")print(f"语义相似度：{similarity[0][0]:.3f}")

主流Embedding模型对比

embedding_models = {    "OpenAI text-embedding-3": {        "dimension": 1536,        "价格": "$0.13/1M tokens",        "特点": "效果最好，英文优化"    },    "BGE-M3": {        "dimension": 1024,        "价格": "免费开源",        "特点": "多语言，检索SOTA"    },    "Jina Embeddings": {        "dimension": 768,        "价格": "免费开源",        "特点": "中文优化，8K上下文"    },    "阿里通义千问": {        "dimension": 1024,        "价格": "API调用",        "特点": "中文场景优化"    }}

📄 第四关：文档加载与智能分割

LangChain文档加载器大全

from langchain.document_loaders import (    TextLoader,           # 文本文件    PyPDFLoader,          # PDF    UnstructuredWordDocumentLoader,  # Word    CSVLoader,            # CSV    UnstructuredHTMLLoader,  # HTML    JSONLoader,           # JSON    SeleniumURLLoader,   # 动态网页    YoutubeLoader,        # YouTube视频    GitLoader,            # Git仓库    NotionDirectoryLoader # Notion导出)  
# 加载PDFloader = PyPDFLoader("docs/report.pdf")pages = loader.load()print(f"加载了 {len(pages)} 页PDF")  
# 加载网页loader = SeleniumURLLoader(["https://example.com"])docs = loader.load()  
# 批量加载目录from langchain.document_loaders import DirectoryLoaderloader = DirectoryLoader(    './docs',    glob="**/*.pdf",    loader_cls=PyPDFLoader)documents = loader.load()

递归字符分割器 - 深入源码

from langchain.text_splitter import RecursiveCharacterTextSplitter  
# 核心分割逻辑def split_text(self, text: str) -> List[str]:    """递归分割文本的源码逻辑"""    final_chunks = []  
    # 按分隔符优先级分割    separators = self._separators if self._separators is not None else ["/n/n", "/n", " ", ""]  
    for separator in separators:        if separator:            splits = text.split(separator)        else:            splits = list(text)  
        # 合并小片段        good_splits = []        current_chunk = ""  
        for s in splits:            if len(current_chunk) + len(s) < self._chunk_size:                current_chunk += s            else:                if current_chunk:                    good_splits.append(current_chunk)                current_chunk = s  
        if current_chunk:            good_splits.append(current_chunk)  
        if len(good_splits) > 1:            final_chunks.extend(good_splits)            break  
    return final_chunks

智能分割策略

# 按语义分割from langchain.text_splitter import SemanticChunkerfrom langchain.embeddings import OpenAIEmbeddings  
text_splitter = SemanticChunker(    embeddings=OpenAIEmbeddings(),    breakpoint_threshold_type="percentile"  # 按分位数分割)  
# 按Markdown结构分割from langchain.text_splitter import MarkdownTextSplitter  
markdown_splitter = MarkdownTextSplitter(    chunk_size=1000,    chunk_overlap=200)  
# 按代码结构分割from langchain.text_splitter import (    Language,    RecursiveCharacterTextSplitter)  
python_splitter = RecursiveCharacterTextSplitter.from_language(    language=Language.PYTHON,    chunk_size=2000,    chunk_overlap=200)

🔍 第五关：检索器核心原理

基础检索器实现

from langchain.vectorstores import FAISSfrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.retrievers import BM25Retriever, EnsembleRetriever  
class SmartRetriever:    def __init__(self, vectorstore, bm25_retriever):        # 混合检索器        self.ensemble_retriever = EnsembleRetriever(            retrievers=[vectorstore.as_retriever(), bm25_retriever],            weights=[0.7, 0.3]  # 向量检索70%，关键词检索30%        )  
    def retrieve(self, query, k=5, score_threshold=0.7):        """智能检索文档"""        # 1. 并行检索        vector_results = self.vector_retriever.get_relevant_documents(query)        bm25_results = self.bm25_retriever.get_relevant_documents(query)  
        # 2. 结果融合        all_results = self._merge_results(vector_results, bm25_results)  
        # 3. 去重        unique_results = self._deduplicate(all_results)  
        # 4. 重排序        reranked = self._rerank(query, unique_results)  
        # 5. 分数过滤        filtered = [doc for doc in reranked                    if doc.metadata.get('score', 0) > score_threshold]  
        return filtered[:k]  
    def _merge_results(self, vec_results, bm25_results):        """合并两种检索结果"""        # 使用RRF（倒数排名融合）算法        fused_scores = {}  
        for i, doc in enumerate(vec_results):            doc_id = doc.metadata.get('id', str(i))            fused_scores[doc_id] = fused_scores.get(doc_id, 0) + 1/(60 + i)  
        for i, doc in enumerate(bm25_results):            doc_id = doc.metadata.get('id', str(i))            fused_scores[doc_id] = fused_scores.get(doc_id, 0) + 1/(60 + i)  
        # 按融合分数排序        return sorted(vec_results + bm25_results,                      key=lambda x: fused_scores.get(                         x.metadata.get('id', '0'), 0),                      reverse=True)

✂️ 第六关：中文分词与关键词提取

import jiebaimport jieba.analysefrom collections import Counter  
class ChineseTextProcessor:    def __init__(self, user_dict_path=None):        if user_dict_path:            jieba.load_userdict(user_dict_path)  
        # 停用词        self.stopwords = set([            '的', '了', '在', '是', '我', '有', '和', '就',            '不', '人', '都', '一', '一个', '上', '也', '很',            '到', '说', '要', '去', '你', '会', '着', '没有',            '看', '好', '自己', '这'        ])  
    def extract_keywords(self, text, top_k=10, with_weight=True):        """提取关键词"""        # TF-IDF算法        keywords = jieba.analyse.extract_tags(            text,             topK=top_k,            withWeight=with_weight,            allowPOS=('n', 'vn', 'v', 'ns', 'nr')  # 名词、动名词、动词、地名、人名        )  
        # TextRank算法        textrank_keywords = jieba.analyse.textrank(            text,            topK=top_k,            withWeight=with_weight,            allowPOS=('n', 'vn', 'v')        )  
        # 融合结果        combined = self._combine_keywords(keywords, textrank_keywords)        return combined  
    def segment_with_pos(self, text):        """分词+词性标注"""        words = jieba.posseg.cut(text)        return [(word, flag) for word, flag in words]  
    def _combine_keywords(self, tfidf_kws, textrank_kws):        """融合TF-IDF和TextRank结果"""        keyword_scores = {}  
        # 加权融合        for word, score in tfidf_kws:            keyword_scores[word] = keyword_scores.get(word, 0) + score * 0.6  
        for word, score in textrank_kws:            keyword_scores[word] = keyword_scores.get(word, 0) + score * 0.4  
        return sorted(keyword_scores.items(), key=lambda x: x[1], reverse=True)  
# 使用示例processor = ChineseTextProcessor()text = "人工智能是计算机科学的一个分支，它企图了解智能的实质..."  
keywords = processor.extract_keywords(text, top_k=5)print("提取的关键词：", keywords)# 输出：[('人工智能', 1.0), ('计算机科学', 0.8), ('智能', 0.6), ...]

🎯 第七关：重排序Rerank原理与实践

Cross-Encoder重排序

from sentence_transformers import CrossEncoder  
class Reranker:    def __init__(self, model_name="BAAI/bge-reranker-large"):        self.model = CrossEncoder(model_name)  
    def rerank(self, query, documents, top_k=5):        """对检索结果重排序"""        # 构造query-doc对        pairs = [[query, doc.page_content] for doc in documents]  
        # 计算相关性分数        scores = self.model.predict(pairs)  
        # 组合结果        reranked_results = []        for i, (doc, score) in enumerate(zip(documents, scores)):            doc.metadata['rerank_score'] = float(score)            reranked_results.append((score, doc))  
        # 按分数排序        reranked_results.sort(key=lambda x: x[0], reverse=True)  
        return [doc for _, doc in reranked_results[:top_k]]  
# 使用示例reranker = Reranker()initial_results = vectorstore.similarity_search(query, k=20)final_results = reranker.rerank(query, initial_results, top_k=5)

多阶段重排序策略

class MultiStageReranker:    def __init__(self):        # 第一层：快速粗排        self.fast_ranker = CrossEncoder("cross-encoder/ms-marco-MiniLM-L-6-v2")  
        # 第二层：精准精排        self.precise_ranker = CrossEncoder("BAAI/bge-reranker-large")  
        # 第三层：LLM判断        self.llm_ranker = OpenAI(model="gpt-3.5-turbo")  
    def rerank(self, query, documents):        """三级重排序"""        # 第一阶段：快速过滤（前50->20）        stage1 = self._fast_rerank(query, documents[:50], keep=20)  
        # 第二阶段：精确排序（20->10）        stage2 = self._precise_rerank(query, stage1, keep=10)  
        # 第三阶段：LLM验证（10->5）        stage3 = self._llm_rerank(query, stage2, keep=5)  
        return stage3  
    def _fast_rerank(self, query, docs, keep=20):        """快速粗排"""        pairs = [[query, doc.page_content[:500]] for doc in docs]        scores = self.fast_ranker.predict(pairs, batch_size=32)        return self._select_top_k(docs, scores, keep)  
    def _llm_rerank(self, query, docs, keep=5):        """LLM智能判断"""        prompt = f"""请判断以下文档与问题的相关性，给出0-10分：  
问题：{query}  
请按以下格式输出：文档1: 分数文档2: 分数...  
文档列表：{self._format_docs(docs)}"""  
        response = self.llm_ranker.predict(prompt)        scores = self._parse_llm_scores(response)        return self._select_top_k(docs, scores, keep)

🚀 第八关：RAG优化策略大全

策略1：多查询融合

def multi_query_expansion(original_query, llm, n=3):    """生成多个相关问题"""    prompt = f"""基于以下问题，生成 {n} 个不同角度的相关问题：  
原始问题：{original_query}  
生成的问题应该：1. 从不同角度理解原问题2. 使用同义词替换3. 分解复杂问题4. 用不同方式提问  
输出格式（每行一个问题）："""  
    response = llm.predict(prompt)    queries = [original_query] + [q.strip() for q in response.split('/n') if q.strip()]    return queries[:n+1]  
# 并行检索多个查询expanded_queries = multi_query_expansion(original_query, llm, n=3)all_results = []for q in expanded_queries:    results = vectorstore.similarity_search(q, k=3)    all_results.extend(results)

策略2：问题分解

def query_decomposition(complex_query, llm):    """分解复杂问题"""    prompt = f"""将复杂问题分解为多个子问题：  
复杂问题：{complex_query}  
请分解为可以独立检索和回答的子问题。输出格式：1. 子问题12. 子问题2..."""  
    response = llm.predict(prompt)    sub_queries = [q.strip() for q in response.split('/n') if q.strip()]    return sub_queries  
# 分别回答子问题，然后整合sub_queries = query_decomposition(complex_query, llm)sub_answers = []for sub_q in sub_queries:    context = retrieve_context(sub_q)    answer = answer_question(sub_q, context)    sub_answers.append(answer)  
final_answer = integrate_answers(sub_answers, complex_query, llm)

策略3：混合检索

class HybridRetriever:    def __init__(self, vector_store, keyword_retriever):        self.vector_store = vector_store        self.keyword_retriever = keyword_retriever  
    def hybrid_search(self, query, alpha=0.7, k=10):        """混合检索"""        # 向量检索        vector_results = self.vector_store.similarity_search_with_score(query, k=k*2)  
        # 关键词检索        keyword_results = self.keyword_retriever.get_relevant_documents(query)  
        # 归一化分数        vector_scores = self._normalize_scores([score for _, score in vector_results])        keyword_scores = self._normalize_scores(            [doc.metadata.get('bm25_score', 0) for doc in keyword_results]        )  
        # 融合结果        fused_results = {}  
        # 融合向量检索结果        for (doc, score), norm_score in zip(vector_results, vector_scores):            doc_id = doc.metadata.get('id', hash(doc.page_content))            fused_results[doc_id] = {                'doc': doc,                'score': alpha * norm_score + (1-alpha) * fused_results.get(doc_id, {}).get('score', 0)            }  
        # 融合关键词检索结果        for doc, norm_score in zip(keyword_results, keyword_scores):            doc_id = doc.metadata.get('id', hash(doc.page_content))            if doc_id in fused_results:                fused_results[doc_id]['score'] += (1-alpha) * norm_score            else:                fused_results[doc_id] = {                    'doc': doc,                    'score': (1-alpha) * norm_score                }  
        # 排序返回        sorted_results = sorted(            fused_results.values(),            key=lambda x: x['score'],            reverse=True        )        return [item['doc'] for item in sorted_results[:k]]

策略4：逻辑路由

class LogicalRouter:    def __init__(self, llm):        self.llm = llm  
    def route_query(self, query, chat_history):        """路由查询到不同处理流程"""        prompt = f"""判断问题类型并选择处理策略：  
问题：{query}对话历史：{chat_history}  
可选的策略：1. vector_rag - 需要检索知识库的问题2. direct_llm - 通用知识或逻辑推理3. calculator - 数学计算4. search_web - 需要实时信息5. clarification - 需要澄清的问题  
请只返回策略名称："""  
        response = self.llm.predict(prompt).strip()  
        routing_rules = {            'vector_rag': self.handle_vector_rag,            'direct_llm': self.handle_direct_llm,            'calculator': self.handle_calculator,            'search_web': self.handle_search_web,            'clarification': self.handle_clarification        }  
        return routing_rules.get(response, self.handle_vector_rag)

策略5：父文档检索

class ParentDocumentRetriever:    def __init__(self, vector_store, parent_docs):        self.vector_store = vector_store        self.parent_docs = parent_docs  # 父文档映射  
    def retrieve_with_parent(self, query, k=5):        """检索子文档，返回父文档"""        # 检索子文档        child_docs = self.vector_store.similarity_search(query, k=k*3)  
        # 获取父文档        parent_ids = set()        parent_docs = []  
        for doc in child_docs:            parent_id = doc.metadata.get('parent_id')            if parent_id and parent_id not in parent_ids:                parent_docs.append(self.parent_docs[parent_id])                parent_ids.add(parent_id)  
                if len(parent_docs) >= k:                    break  
        return parent_docs

策略6：CRAG（自我纠正RAG）

class CRAGSystem:    def __init__(self, retriever, llm, judge_llm):        self.retriever = retriever        self.llm = llm        self.judge_llm = judge_llm  
    def answer_with_correction(self, query):        """带自我纠正的RAG"""        # 1. 初步检索        docs = self.retriever.retrieve(query)  
        # 2. 生成初步答案        context = "/n/n".join([doc.page_content for doc in docs])        answer = self.llm.predict(f"基于以下信息：/n{context}/n/n回答：{query}")  
        # 3. 置信度评估        confidence = self._evaluate_confidence(query, answer, docs)  
        if confidence < 0.7:  # 低置信度            # 4. 扩大检索            expanded_docs = self._expand_retrieval(query, docs)  
            # 5. 重新生成            new_context = "/n/n".join([doc.page_content for doc in expanded_docs])            corrected_answer = self.llm.predict(f"基于以下更全信息：/n{new_context}/n/n重新回答：{query}")  
            # 6. 验证改进            improvement = self._verify_improvement(                query, answer, corrected_answer, docs, expanded_docs            )  
            if improvement:                return corrected_answer, expanded_docs  
        return answer, docs

🎯 完整RAG系统架构

class ProductionRAGSystem:    def __init__(self, config):        # 1. 初始化组件        self.embeddings = self._init_embeddings(config)        self.vector_store = self._init_vector_store(config)        self.llm = self._init_llm(config)        self.reranker = Reranker()        self.query_analyzer = QueryAnalyzer()  
        # 2. 多检索器        self.retrievers = {            'vector': VectorRetriever(self.vector_store),            'keyword': KeywordRetriever(),            'hybrid': HybridRetriever(self.vector_store, self.keyword_retriever)        }  
        # 3. 缓存        self.cache = RedisCache()  
    def answer_question(self, query, session_id, use_cache=True):        """完整问答流程"""        # 检查缓存        if use_cache:            cached = self.cache.get(query, session_id)            if cached:                return cached  
        # 1. 查询分析        query_type, decomposed = self.query_analyzer.analyze(query)  
        # 2. 智能路由        retriever_type = self._route_retriever(query_type)        retriever = self.retrievers[retriever_type]  
        # 3. 多策略检索        all_docs = []        for sub_query in decomposed:            docs = retriever.retrieve(sub_query, k=10)            all_docs.extend(docs)  
        # 4. 去重和重排序        unique_docs = self._deduplicate(all_docs)        reranked_docs = self.reranker.rerank(query, unique_docs, top_k=8)  
        # 5. 上下文构建        context = self._construct_context(reranked_docs, query)  
        # 6. 生成答案        answer = self._generate_answer(query, context)  
        # 7. 引用溯源        answer_with_citations = self._add_citations(answer, reranked_docs)  
        # 8. 缓存结果        self.cache.set(query, session_id, answer_with_citations)  
        return answer_with_citations

🚀 快速开始模板

# requirements.txtlangchain==0.1.0langchain-openai==0.0.1sentence-transformers==2.2.2faiss-cpu==1.7.4rank-bm25==0.2.1jieba==0.42.1redis==4.5.4  
# 快速启动from rag_system import ProductionRAGSystem  
config = {    "embedding_model": "BAAI/bge-large-zh",    "llm_model": "gpt-4",    "vector_store": "faiss",    "cache": "redis"}  
rag = ProductionRAGSystem(config)  
# 问答answer = rag.answer_question(    query="什么是机器学习？",    session_id="user_123",    use_cache=True)print(answer)

📈 性能监控与优化

class RAGMonitor:    def __init__(self):        self.metrics = {            'retrieval_time': [],            'generation_time': [],            'cache_hit_rate': 0,            'accuracy_scores': []        }  
    def log_retrieval(self, query, docs, retrieval_time):        """记录检索指标"""        self.metrics['retrieval_time'].append(retrieval_time)  
        # 计算检索相关性        relevance = self._calculate_relevance(query, docs)        self.metrics['accuracy_scores'].append(relevance)  
    def get_performance_report(self):        """生成性能报告"""        return {            'avg_retrieval_time': np.mean(self.metrics['retrieval_time']),            'avg_generation_time': np.mean(self.metrics['generation_time']),            'cache_hit_rate': self.metrics['cache_hit_rate'],            'avg_accuracy': np.mean(self.metrics['accuracy_scores']),            'total_queries': len(self.metrics['retrieval_time'])        }

🎯 核心要点总结

幻觉问题：通过RAG从根本上解决，让AI回答有据可查
向量数据库：根据场景选择，小项目用FAISS，大项目用Pinecone/腾讯云
文档处理：合理分割是关键，递归分割器+语义分割结合使用
检索优化：混合检索+重排序是效果提升的关键
中文优化：使用BGE、Jina等中文优化模型
RAG进阶：多查询、问题分解、逻辑路由等策略组合使用

假如你从2026年开始学大模型，按这个步骤走准能稳步进阶。

接下来告诉你一条最快的邪修路线，

3个月即可成为模型大师，薪资直接起飞。

阶段1:大模型基础

阶段2:RAG应用开发工程

阶段3:大模型Agent应用架构

阶段4:大模型微调与私有化部署

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇
在这里插入图片描述

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【`保证100%免费`】👇👇

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

深度解析BestBlogs开源项目：基于GitHub Actions自动化构建个人技术博客与内容聚合平台的实战指南

BestBlogs项目以其巧妙的架构设计，将GitHub强大的开发者工具链转化为内容创作的利器。它通过GitHub Issues实现了极简的内容管理，利用GitHub Actions达成了极致的自动化体验，让开发者能够专注于内容本身，而非繁琐的运维工作。无论你是想建立一个纯粹的技术笔记库，还是打造一个具有行业影响力的技术聚合站，BestBlogs都提供了一个低成本、高效率且极具极客精神的解决方案。

AtomGit开源社区

白嫖启智社区（OpenI）50点卡（低级卡有50卡时)的方法支持各个国产算力卡和nvidia的卡

【摘要】DeepSpark（deepspark.org.cn/GitHub）与启智社区（openi.org.cn）是两个提供国产算力资源的开源平台。启智云脑（cloud.openi.org.cn）提供天垓100等国产算力租借服务，新用户注册可获赠50卡时算力（需通过推荐链接注册）。注册地址为openi.pcl.ac.cn，推荐人yanggg1133。平台支持多种异构算力（GPU/NPU/GCU等）