现在做AI应用,尤其是做:

  • 智能客服
  • 企业知识库
  • RAG问答
  • 相似文档检索
  • AI营销文案复用
  • Agent长期记忆
  • 多模态图片/视频检索

都会绕不开一个东西:

向量数据库

而在众多向量数据库里面,Milvus 是企业级落地里非常常见的一种。

一句话概括:

Milvus 是一个专门为海量向量检索设计的开源向量数据库,适合做大规模RAG、语义搜索、相似内容推荐和AI知识库底座。

Milvus 官方也把它定位为面向高性能相似度搜索、海量向量数据集的云原生开源向量数据库,并且采用计算与存储分离的分布式架构。


一、先说清楚:什么是向量数据库?

很多人一听“向量数据库”,感觉很抽象。

其实不用想复杂。

普通数据库存的是:

用户ID、姓名、手机号、订单号、金额、状态

搜索方式是:

select * from user where name = '张三';

这种叫:

精确匹配。

但是AI场景不一样。

用户可能问:

我借款还不上怎么办?

知识库里面写的是:

用户无法按期偿还贷款时,可查看延期还款规则。

两个句子字面不一样,但意思接近。

传统数据库很难查出来。

于是我们会用Embedding模型,把文本转成一串数字:

“我借款还不上怎么办?”
↓
[0.12, -0.55, 0.89, ...]

这串数字就叫:

向量。

如果两句话意思接近,它们的向量距离就比较近。

向量数据库干的事情就是:

存储这些向量,并快速找出和用户问题最相似的TopK内容。

比如用户问一句话:

借款还不上怎么办?

系统流程是:

用户问题
 ↓
Embedding向量化
 ↓
去向量数据库里查相似Chunk
 ↓
召回TopK知识片段
 ↓
交给大模型组织答案

这就是RAG的核心链路。


二、为什么不能直接用MySQL做向量检索?

MySQL当然能存数据。

甚至也能把向量存成JSON。

比如:

[0.12, -0.55, 0.89, 0.34]

但是问题来了。

向量检索不是简单查字段。

它要做的是:

从100万条、1000万条向量里面,快速找出最相似的前10条。

这对MySQL非常不友好。

原因主要有三个。


1、MySQL不擅长高维向量计算

Embedding向量通常有:

384维
768维
1024维
1536维
3072维

每条数据都是一大串浮点数。

检索时要比较:

当前问题向量 和 库里每个Chunk向量的相似度

如果全量计算,数据量一大就非常慢。


2、MySQL没有专业向量索引

普通数据库索引适合:

等值查询
范围查询
排序查询

比如:

where user_id = 1001
where create_time > '2026-01-01'

但是向量检索需要的是:

HNSW
IVF
DiskANN
PQ

这类近似最近邻索引。

Milvus 官方文档也说明,向量索引是建立在数据之上的额外结构,它依赖近似最近邻搜索算法,用来加速搜索。


3、MySQL做不了大规模语义召回

如果知识库只有几百条数据,MySQL凑合能玩。

但企业场景通常是:

几十万Chunk
几百万Chunk
上千万Chunk

这时候必须要专业向量库。

所以:

MySQL适合存业务数据,向量数据库适合存语义向量。


三、Milvus到底是什么?

Milvus 是一个开源向量数据库。

它不是传统意义上的关系型数据库,也不是普通搜索引擎。

它最核心的能力是:

大规模向量存储 + 高性能相似度检索

你可以把它理解成:

AI时代的“语义检索数据库”。

传统搜索引擎擅长查关键词。

Milvus擅长查语义。

举个例子。

用户问:

这个活动能不能退款?

知识库里可能没有“退款”两个字,而是写:

活动权益一经发放,不支持撤销或返还。

关键词搜索可能查不到。

但是向量检索可以发现:

退款 ≈ 撤销 / 返还 / 退回

这就是Milvus的价值。


四、Milvus在RAG系统里的位置

一个典型企业RAG系统大概是这样:

文档上传
 ↓
PDF/Word/HTML解析
 ↓
内容清洗
 ↓
Chunk切分
 ↓
Embedding向量化
 ↓
写入Milvus

查询时:

用户问题
 ↓
问题向量化
 ↓
Milvus语义召回TopK
 ↓
Rerank精排
 ↓
Prompt组装
 ↓
大模型生成答案

所以Milvus不是直接生成答案的。

它做的是:

帮大模型找到相关资料。

大模型负责回答。

Milvus负责找资料。

Rerank负责重新排序。

Prompt负责组织上下文。


五、Milvus的核心优势一:专门为向量检索而生

很多数据库是后来加了向量能力。

比如:

  • Elasticsearch加dense_vector
  • PostgreSQL加pgvector插件
  • Redis加向量索引

这些都能用。

但Milvus不一样。

它从一开始就是为向量搜索设计的。

Milvus官方介绍中提到,它构建在 Faiss、HNSW、DiskANN、SCANN 等向量搜索库之上,用于AI应用和非结构化数据检索。

这意味着:

Milvus更适合处理:

  • 海量Embedding
  • 高维向量
  • 高并发检索
  • TopK相似度召回
  • 多种向量索引
  • 分布式扩展

如果系统只是简单Demo,用什么都行。

但如果是企业生产环境,数据量和并发上来之后,专门化能力就很重要。


六、Milvus的核心优势二:支持多种向量索引

向量库性能好不好,关键看索引。

没有索引时,系统可能要一条条比对。

有索引后,可以快速缩小搜索范围。

Milvus支持多类索引,官方文档把索引按向量类型分为浮点向量、二进制向量、稀疏向量等类别。

常见索引包括:

HNSW
IVF_FLAT
IVF_SQ8
IVF_PQ
DiskANN

下面用大白话解释。


1、HNSW:速度快,召回好,但吃内存

HNSW可以理解成:

给向量建了一张“关系网”。

每个向量都和相似向量建立连接。

查询时不是全库扫描,而是沿着这张网快速找到相似结果。

优点:

查询快
召回效果好
适合低延迟场景

缺点:

比较吃内存
数据特别大时成本较高

Milvus文档也说明,HNSW是图索引算法,可以提升高维浮点向量搜索性能,具有较好的准确率和低延迟,但需要较高内存开销。

适合:

智能客服
实时问答
低延迟RAG
知识库检索

2、IVF:适合大规模数据,成本更可控

IVF可以理解成:

先把向量分成很多个桶,查询时只查最可能相关的几个桶。

比如有1000万个向量。

不需要全部查。

先判断用户问题大概属于哪个区域,再去相关区域里查。

优点:

适合大规模数据
内存压力相对可控
查询速度不错

缺点:

参数需要调优
召回率和速度之间要取平衡

适合:

大规模文档库
营销活动库
商品语义搜索
图片向量检索

3、DiskANN:适合更大规模、低内存成本场景

DiskANN可以理解成:

把更多索引和数据放到磁盘上,降低内存压力。

Milvus官方文档介绍,DiskANN结合了基于磁盘的Vamana图索引和产品量化压缩,用于高效向量搜索。

适合:

数据量巨大
内存成本敏感
检索规模特别大

比如:

千万级、亿级向量检索

七、Milvus的核心优势三:分布式架构,适合企业级扩展

企业系统最怕什么?

不是Demo跑不起来。

而是:

一上线就慢
数据一多就崩
流量一高就炸
扩容很麻烦

Milvus的优势之一就是分布式架构。

Milvus官方说明,它采用计算与存储分离架构,可以水平扩展,并根据不同流量模式独立扩容。例如读多时增加Query Node,写多时增加Data Node。

这句话翻译成大白话就是:

查询压力大,就加查询节点;写入压力大,就加写入节点;存储压力大,就扩存储。

这非常适合企业系统。

比如智能客服场景:

白天咨询量高,查询压力大。

可以扩Query Node。

比如知识库批量入库场景:

晚上批量处理文档,写入压力大。

可以扩Data Node。

这比单机向量库灵活很多。


八、Milvus的核心优势四:适合海量Chunk场景

RAG系统里,真正进入向量库的不是一整篇文档。

而是Chunk。

比如一份PDF有100页。

系统会切成:

Chunk 1
Chunk 2
Chunk 3
...
Chunk 500

一个企业知识库可能有:

10万份文档

切完可能是:

几百万Chunk
甚至上千万Chunk

这时候向量库必须能扛。

Milvus的定位就是面向大规模向量数据集的高性能相似度搜索。

所以它天然适合:

  • 企业知识库
  • 金融客服知识库
  • 营销活动知识库
  • 法务合同知识库
  • 医疗资料知识库
  • 商品图文检索
  • 多模态检索

九、Milvus的核心优势五:适合私有化部署

很多企业做AI应用时,有一个硬要求:

数据不能出公司
知识库不能上传外部平台
用户信息不能进第三方SaaS

特别是:

  • 金融
  • 政企
  • 医疗
  • 教育
  • 保险
  • 法务

这类场景更敏感。

Milvus是开源项目,可以私有化部署。

企业可以把:

原始文档
Chunk内容
Embedding向量
元数据
访问权限

都放在自己的内网环境里。

这对国内很多企业非常重要。


十、Milvus的核心优势六:生态成熟,容易接入AI框架

现在很多AI应用框架都支持Milvus。

比如:

LangChain
LlamaIndex
Haystack
Spring AI
Dify
FastGPT
RAGFlow

这意味着开发成本会低很多。

你不用从零写一套向量检索系统。

只需要关注:

文档怎么切
Embedding模型怎么选
检索参数怎么调
Rerank怎么加
Prompt怎么组织
答案怎么兜底

Milvus负责底层向量存储和检索。


十一、Milvus和Elasticsearch相比,有什么优势?

Elasticsearch大家都很熟。

它原来是搜索引擎。

核心强项是:

关键词检索
倒排索引
日志检索
全文搜索
聚合查询
过滤查询

现在Elasticsearch也支持向量检索,比如官方文档提到,dense_vector字段可以存储数值向量,主要用于kNN搜索。

那问题来了:

既然ES也能做向量检索,为什么还要Milvus?

答案是:

ES能做,但它不是专门为大规模向量检索而生。


1、ES的优势

ES适合:

关键词搜索
精确词搜索
结构化过滤
日志检索
复杂查询

比如:

活动编号:A1001
产品名称:免费提现券
业务线:保险
时间范围:最近30天

这种场景ES很强。


2、Milvus的优势

Milvus适合:

语义相似搜索
海量向量TopK召回
高维向量检索
大规模Embedding存储
高并发RAG召回

比如用户问:

这个券退不了吗?

知识库写的是:

权益发放后不支持撤销。

Milvus更容易召回语义相近内容。


3、企业最佳实践:ES + Milvus混合检索

生产环境很少只用一个。

更常见的是:

ES负责关键词召回
Milvus负责语义召回
RRF做融合排序
Rerank做最终精排

为什么?

因为两者互补。

ES解决:

精确匹配、关键词、业务编号、过滤条件

Milvus解决:

语义理解、同义表达、口语化问题

这才是企业级RAG常见做法。


十二、Milvus和pgvector相比,有什么优势?

pgvector 是 PostgreSQL 的向量插件。

它非常受欢迎。

pgvector官方介绍里支持向量相似度搜索,也支持HNSW和IVFFlat索引。

它的最大优势是:

简单
便宜
容易接入
不用多部署一个数据库

如果你的系统本来就用PostgreSQL,那加一个pgvector非常方便。


pgvector适合什么场景?

适合:

小型知识库
内部工具
Demo项目
MVP验证
数据量不大
团队运维能力有限

比如:

几千条Chunk
几万条Chunk
几十万条Chunk

pgvector完全可以。


Milvus相比pgvector的优势

Milvus更适合:

百万级、千万级向量
高并发查询
复杂索引选择
分布式扩展
独立向量检索服务
大规模RAG平台

简单说:

pgvector像是在PostgreSQL里加了一个向量能力;Milvus是专门为向量检索打造的一整套数据库系统。

如果你只是做一个小工具:

PostgreSQL + pgvector

很好。

如果你要做企业级AI平台:

Milvus更合适。

十三、Milvus和Chroma相比,有什么优势?

Chroma在AI教程里很常见。

很多LangChain入门项目都会用:

Chroma.from_documents(...)

它的优势是:

上手快
开发简单
适合本地Demo
适合快速验证RAG流程

但它的短板也很明显:

大规模能力弱
企业运维能力弱
分布式能力不如Milvus
高并发生产场景不如Milvus

所以可以这样理解:

Chroma适合学习和原型验证
Milvus适合生产级落地

如果只是演示:

Chroma很方便

如果要上线:

Milvus更稳

十四、Milvus和FAISS相比,有什么优势?

FAISS 是 Meta 开源的向量检索库。

注意:

FAISS不是数据库

它更像一个:

向量检索算法库

它很强。

但它缺少数据库能力。

比如:

没有完整服务治理
没有天然分布式
没有完善权限管理
没有数据库级持久化管理
没有企业级运维能力

Milvus底层就使用了类似Faiss、HNSW、DiskANN等向量搜索能力,但在上层补齐了数据库系统能力。

可以这样理解:

FAISS = 发动机
Milvus = 一辆完整的车

FAISS适合:

算法实验
本地检索
单机向量搜索
研究场景

Milvus适合:

企业应用
RAG系统
集群部署
数据管理
高并发检索

十五、Milvus和Pinecone相比,有什么区别?

Pinecone是托管式向量数据库。

它的优势是:

不用自己运维
开箱即用
云服务体验好
适合海外团队

但国内企业会遇到几个问题:

数据合规
网络延迟
成本控制
私有化要求
供应商绑定

Milvus的优势是:

开源
可私有化部署
可控性强
适合内网环境
适合金融、政企、医疗等敏感数据场景

如果企业能接受SaaS,Pinecone很方便。

如果企业要求数据在内网,Milvus更合适。


十六、Milvus适合哪些业务场景?


1、企业知识库问答

这是最常见场景。

比如:

制度文档
产品手册
客服FAQ
合同条款
营销活动规则
操作流程
技术文档

流程:

文档切Chunk
 ↓
Embedding向量化
 ↓
写入Milvus
 ↓
用户提问
 ↓
Milvus召回相关片段
 ↓
大模型生成答案

2、智能客服

客服场景非常适合Milvus。

因为用户问题非常口语化:

我钱还不上了咋办?
这个券怎么不能用?
保险理赔入口在哪?
额度为啥没了?

这些问题很难靠关键词完全匹配。

Milvus可以做语义召回。

再结合:

FAQ
ES关键词检索
Rerank
人工转接
合规拒答

就能形成企业级智能客服。


3、相似活动/相似案例检索

比如运营要做新活动。

系统可以根据当前活动目标,检索历史相似活动:

相似人群
相似渠道
相似优惠
相似转化目标
相似文案
相似复盘结论

Milvus负责找语义相似的历史活动。

然后大模型总结:

过去哪些活动效果好
文案怎么写
AB测试怎么设计
风险点有哪些

4、图片搜索

图片也可以Embedding化。

比如:

以图搜图
商品相似图
服装相似款
Logo检索
图片版权检测

图片向量写入Milvus后,就可以做相似图片搜索。


5、推荐系统

比如:

文章推荐
商品推荐
短视频推荐
课程推荐
音乐推荐

用户行为、内容特征、商品描述都可以向量化。

Milvus可以快速找相似内容。


6、Agent长期记忆

Agent需要记住:

用户偏好
历史对话
任务记录
项目资料
工具调用结果

这些记忆可以向量化后写入Milvus。

当用户再次提问时,Agent从Milvus里找相关记忆。

这就是:

长期记忆检索

十七、企业里怎么设计Milvus数据结构?

一个典型Collection可以这样设计:

collection: knowledge_chunks

字段包括:

id:Chunk唯一ID
doc_id:文档ID
chunk_id:片段ID
content:Chunk文本
embedding:向量字段
biz_type:业务类型
category:知识分类
version:知识版本
status:是否有效
source:来源
create_time:创建时间
update_time:更新时间

为什么要有这些字段?

因为真实企业检索不是只看相似度。

还要过滤:

只查已发布知识
只查当前业务线
只查某个产品类型
只查最新版本
只查有权限的知识

所以一个好的向量库设计,一定不是只存:

content + embedding

还要存:

业务元数据
权限字段
版本字段
状态字段
来源字段

十八、Milvus在Java项目里怎么接入?

很多人以为Milvus只能Python用。

不是。

Java项目也能接。

常见架构是:

Java业务系统
 ↓
Embedding服务
 ↓
Milvus
 ↓
Rerank服务
 ↓
大模型服务

Java负责:

业务流程
权限校验
用户鉴权
知识版本管理
任务调度
接口编排
日志追踪
兜底降级

Python或模型服务负责:

Embedding
Rerank
LLM生成

Milvus负责:

向量存储
语义召回
TopK检索

企业里常见做法是:

Java不直接做模型推理
Java调用AI能力服务
AI能力服务操作Milvus
或者Java通过SDK直接查Milvus

两种都可以。

如果公司是Java主技术栈,我更推荐:

Java负责业务编排
Python AI服务负责模型相关能力
Milvus作为独立基础设施

这样职责清晰。


十九、Milvus查询链路怎么做?

一个完整查询链路如下:

1、用户输入问题
2、做敏感词和权限校验
3、调用Embedding模型生成问题向量
4、去Milvus检索TopK相似Chunk
5、同时去ES做BM25关键词检索
6、对两路结果做RRF融合
7、调用Rerank模型精排
8、取TopN片段进入Prompt
9、调用大模型生成答案
10、做合规后处理
11、返回答案和来源引用
12、记录日志和Badcase

这才是生产级RAG。

不要只说:

问题向量化,然后查Milvus。

这太浅了。

企业里一定要有:

权限
过滤
召回
融合
精排
生成
引用
拒答
日志
评测
兜底

二十、Milvus写入链路怎么做?

写入链路通常是:

1、文档上传
2、文件格式识别
3、PDF/Word/HTML解析
4、OCR或版面分析
5、内容清洗
6、按标题、段落、语义切Chunk
7、生成Chunk ID
8、调用Embedding模型
9、向量写入Milvus
10、元数据写入数据库或Milvus标量字段
11、记录版本号
12、触发索引构建
13、发布知识状态

这里有几个坑。


1、Chunk不能太长

太长会导致:

召回不准
Prompt浪费
答案引用不精确

2、Chunk不能太短

太短会导致:

语义不完整
上下文断裂
大模型理解困难

3、要保留来源

每个Chunk都要知道来自哪里:

哪个文档
哪一页
哪个标题
哪个段落
哪个版本

否则大模型回答后没法引用来源。


4、要支持知识更新

企业知识经常变化。

比如:

活动规则过期
产品费率调整
客服话术更新
政策变更

所以必须设计:

版本管理
失效机制
增量更新
重新Embedding

二十一、Milvus怎么做权限控制?

很多人做RAG Demo时忽略权限。

但企业项目里非常重要。

比如:

普通员工不能看财务制度
客服只能看本业务线知识
外包人员不能看内部策略
不同城市看到不同政策

做法一般是:

在Milvus里存元数据字段:

department
role
biz_line
tenant_id
permission_group
status
version

查询时加过滤条件。

比如:

只查 tenant_id = A
只查 status = published
只查 biz_line = finance

这样可以避免:

模型召回了用户无权查看的内容

注意:

权限控制不能只靠Prompt,必须在检索层就过滤。


二十二、Milvus异常时怎么降级?

生产环境一定要考虑:

Milvus挂了怎么办?
Embedding服务超时怎么办?
Rerank超时怎么办?
大模型失败怎么办?

Milvus异常时,可以这样降级:

1、向量检索失败 → 降级ES关键词检索
2、Milvus超时 → 返回缓存答案
3、Embedding失败 → 走FAQ精确匹配
4、Rerank失败 → 使用粗排结果
5、全部失败 → 返回标准兜底话术或人工客服

这就是企业级稳定性。

不能让用户看到:

系统异常,请稍后再试

尤其是金融客服、营销运营、企业知识库场景。


二十三、Milvus怎么选索引?

不用讲复杂数学。

记住这几个原则就够了。


1、小数据量,优先HNSW

如果数据量不大,但要求低延迟:

HNSW

适合:

几十万到几百万向量
客服问答
知识库检索
实时RAG

2、大数据量,考虑IVF类索引

如果数据量比较大,内存压力明显:

IVF_FLAT
IVF_PQ

适合:

几百万到千万级向量
成本敏感场景

3、超大规模,考虑DiskANN

如果向量量特别大:

千万级、亿级

并且希望降低内存成本,可以考虑DiskANN。


4、不要只看速度,要看召回率

检索快但找不到正确知识,没有意义。

企业调优通常看:

Recall@K
HitRate
MRR
答案准确率
人工标注命中率
用户满意度

二十四、Milvus不是万能的

虽然Milvus很强,但也不是所有场景都必须上Milvus。


1、数据量很小,不一定需要Milvus

如果只有几千条知识:

pgvector
Chroma
甚至ES

都可以。


2、强关键词场景,不一定只靠Milvus

比如:

订单号
手机号
活动编号
产品代码
合同编号

这类必须用关键词或结构化查询。

向量检索反而不合适。


3、Milvus不能替代Rerank

Milvus负责召回。

但召回结果不一定顺序最优。

所以生产环境通常还要加:

Rerank精排

4、Milvus不能解决幻觉

Milvus只负责找资料。

大模型胡说八道的问题,还要靠:

Prompt约束
来源引用
低置信度拒答
合规后处理
评测集
Badcase优化

二十五、不同向量数据库怎么选型?

可以按下面这套逻辑。


1、Demo验证

选:

Chroma
FAISS

原因:

简单
快
适合学习

2、小型业务系统

选:

pgvector

原因:

依赖少
成本低
PostgreSQL直接支持

3、中大型企业RAG

选:

Milvus + Elasticsearch

原因:

Milvus负责语义检索
ES负责关键词检索
两者互补

4、超大规模向量检索

选:

Milvus集群

原因:

分布式
可扩展
索引丰富
适合海量向量

5、海外SaaS优先

选:

Pinecone

原因:

托管方便
免运维

但如果有私有化和数据合规要求,Milvus更合适。


二十六、Milvus和其他方案对比总结

方案

优点

缺点

适合场景

Milvus

专业向量库、分布式、性能强、适合私有化

运维成本比插件型方案高

企业级RAG、智能客服、海量知识库

Elasticsearch

关键词检索强、过滤强、生态成熟

不是专门向量库,纯向量大规模成本高

BM25、日志、关键词+向量混合检索

pgvector

简单、便宜、PostgreSQL生态好

超大规模和高并发能力有限

小型知识库、MVP、内部工具

Chroma

上手快、适合教程

企业级能力弱

Demo、学习、原型验证

FAISS

检索算法强、性能好

不是数据库,缺少服务治理

算法实验、本地检索

Pinecone

托管方便、免运维

私有化和成本可能受限

海外SaaS、云原生团队


二十七、企业真实推荐架构

如果要做一个比较稳的企业级AI知识库,我推荐:

MySQL:存文档、版本、权限、任务状态
Elasticsearch:做关键词检索、过滤、日志检索
Milvus:做Embedding向量召回
Redis:做缓存、会话、热点问题
Kafka/RabbitMQ:做异步入库、日志、重试
Rerank模型:做召回结果精排
LLM:做答案生成
Grafana/日志平台:做监控和Badcase分析

查询链路:

用户问题
 ↓
意图识别
 ↓
Embedding向量化
 ↓
Milvus语义召回
 ↓
ES关键词召回
 ↓
RRF融合排序
 ↓
Rerank精排
 ↓
Prompt组装
 ↓
大模型生成答案
 ↓
合规校验
 ↓
返回答案+来源引用

这套方案非常适合:

智能客服
企业知识库
营销知识库
内部助手
金融问答
售后问答
政策问答

二十八、面试或技术文章里可以怎么总结Milvus?

可以这样说:

Milvus的核心价值不是“能存向量”,而是它面向大规模AI检索场景,提供了专业向量索引、分布式扩展、高性能TopK召回、私有化部署和成熟AI生态。相比pgvector,它更适合大规模和高并发;相比Chroma,它更适合生产环境;相比FAISS,它补齐了数据库级管理能力;相比Elasticsearch,它在纯向量检索和海量Embedding场景下更专业。企业落地时通常不会只依赖Milvus,而是采用ES + Milvus + Rerank的混合检索架构,让关键词精确匹配和语义相似检索互补。


二十九、结尾总结

Milvus为什么重要?

因为大模型本身不记得企业内部知识。

企业要让大模型回答得准,必须先让它找到正确资料。

而Milvus解决的正是:

怎么从海量知识中快速找到语义最相关的内容。

它的优势可以总结成六句话:

第一,专门为向量检索设计。
第二,适合海量Embedding存储。
第三,支持多种向量索引。
第四,支持分布式扩展。
第五,适合企业私有化部署。
第六,生态成熟,容易接入RAG和Agent系统。

但真正生产级系统里,不要神化Milvus。

最稳的方案往往是:

Milvus负责语义召回
Elasticsearch负责关键词召回
Rerank负责排序纠偏
大模型负责组织答案
日志和评测负责持续优化

这才是企业级AI应用真正落地的路线。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐