Milvus向量数据库详解：为什么它能成为企业级RAG系统的核心底座？

闵浮龙

495人浏览 · 2026-05-08 19:26:05

闵浮龙 · 2026-05-08 19:26:05 发布

现在做AI应用，尤其是做：

智能客服
企业知识库
RAG问答
相似文档检索
AI营销文案复用
Agent长期记忆
多模态图片/视频检索

都会绕不开一个东西：

向量数据库

而在众多向量数据库里面，Milvus 是企业级落地里非常常见的一种。

一句话概括：

Milvus 是一个专门为海量向量检索设计的开源向量数据库，适合做大规模RAG、语义搜索、相似内容推荐和AI知识库底座。

Milvus 官方也把它定位为面向高性能相似度搜索、海量向量数据集的云原生开源向量数据库，并且采用计算与存储分离的分布式架构。

一、先说清楚：什么是向量数据库？

很多人一听“向量数据库”，感觉很抽象。

其实不用想复杂。

普通数据库存的是：

用户ID、姓名、手机号、订单号、金额、状态

搜索方式是：

select * from user where name = '张三';

这种叫：

精确匹配。

但是AI场景不一样。

用户可能问：

我借款还不上怎么办？

知识库里面写的是：

用户无法按期偿还贷款时，可查看延期还款规则。

两个句子字面不一样，但意思接近。

传统数据库很难查出来。

于是我们会用Embedding模型，把文本转成一串数字：

“我借款还不上怎么办？”
↓
[0.12, -0.55, 0.89, ...]

这串数字就叫：

向量。

如果两句话意思接近，它们的向量距离就比较近。

向量数据库干的事情就是：

存储这些向量，并快速找出和用户问题最相似的TopK内容。

比如用户问一句话：

借款还不上怎么办？

系统流程是：

用户问题
 ↓
Embedding向量化
 ↓
去向量数据库里查相似Chunk
 ↓
召回TopK知识片段
 ↓
交给大模型组织答案

这就是RAG的核心链路。

二、为什么不能直接用MySQL做向量检索？

MySQL当然能存数据。

甚至也能把向量存成JSON。

比如：

[0.12, -0.55, 0.89, 0.34]

但是问题来了。

向量检索不是简单查字段。

它要做的是：

从100万条、1000万条向量里面，快速找出最相似的前10条。

这对MySQL非常不友好。

原因主要有三个。

1、MySQL不擅长高维向量计算

Embedding向量通常有：

每条数据都是一大串浮点数。

检索时要比较：

当前问题向量 和 库里每个Chunk向量的相似度

如果全量计算，数据量一大就非常慢。

2、MySQL没有专业向量索引

普通数据库索引适合：

等值查询
范围查询
排序查询

比如：

where user_id = 1001
where create_time > '2026-01-01'

但是向量检索需要的是：

HNSW
IVF
DiskANN
PQ

这类近似最近邻索引。

Milvus 官方文档也说明，向量索引是建立在数据之上的额外结构，它依赖近似最近邻搜索算法，用来加速搜索。

3、MySQL做不了大规模语义召回

如果知识库只有几百条数据，MySQL凑合能玩。

但企业场景通常是：

几十万Chunk
几百万Chunk
上千万Chunk

这时候必须要专业向量库。

所以：

MySQL适合存业务数据，向量数据库适合存语义向量。

三、Milvus到底是什么？

Milvus 是一个开源向量数据库。

它不是传统意义上的关系型数据库，也不是普通搜索引擎。

它最核心的能力是：

大规模向量存储 + 高性能相似度检索

你可以把它理解成：

AI时代的“语义检索数据库”。

传统搜索引擎擅长查关键词。

Milvus擅长查语义。

举个例子。

用户问：

这个活动能不能退款？

知识库里可能没有“退款”两个字，而是写：

活动权益一经发放，不支持撤销或返还。

关键词搜索可能查不到。

但是向量检索可以发现：

退款 ≈ 撤销 / 返还 / 退回

这就是Milvus的价值。

四、Milvus在RAG系统里的位置

一个典型企业RAG系统大概是这样：

文档上传
 ↓
PDF/Word/HTML解析
 ↓
内容清洗
 ↓
Chunk切分
 ↓
Embedding向量化
 ↓
写入Milvus

查询时：

用户问题
 ↓
问题向量化
 ↓
Milvus语义召回TopK
 ↓
Rerank精排
 ↓
Prompt组装
 ↓
大模型生成答案

所以Milvus不是直接生成答案的。

它做的是：

帮大模型找到相关资料。

大模型负责回答。

Milvus负责找资料。

Rerank负责重新排序。

Prompt负责组织上下文。

五、Milvus的核心优势一：专门为向量检索而生

很多数据库是后来加了向量能力。

比如：

Elasticsearch加dense_vector
PostgreSQL加pgvector插件
Redis加向量索引

这些都能用。

但Milvus不一样。

它从一开始就是为向量搜索设计的。

Milvus官方介绍中提到，它构建在 Faiss、HNSW、DiskANN、SCANN 等向量搜索库之上，用于AI应用和非结构化数据检索。

这意味着：

Milvus更适合处理：

海量Embedding
高维向量
高并发检索
TopK相似度召回
多种向量索引
分布式扩展

如果系统只是简单Demo，用什么都行。

但如果是企业生产环境，数据量和并发上来之后，专门化能力就很重要。

六、Milvus的核心优势二：支持多种向量索引

向量库性能好不好，关键看索引。

没有索引时，系统可能要一条条比对。

有索引后，可以快速缩小搜索范围。

Milvus支持多类索引，官方文档把索引按向量类型分为浮点向量、二进制向量、稀疏向量等类别。

常见索引包括：

HNSW
IVF_FLAT
IVF_SQ8
IVF_PQ
DiskANN

下面用大白话解释。

1、HNSW：速度快，召回好，但吃内存

HNSW可以理解成：

给向量建了一张“关系网”。

每个向量都和相似向量建立连接。

查询时不是全库扫描，而是沿着这张网快速找到相似结果。

优点：

查询快
召回效果好
适合低延迟场景

缺点：

比较吃内存
数据特别大时成本较高

Milvus文档也说明，HNSW是图索引算法，可以提升高维浮点向量搜索性能，具有较好的准确率和低延迟，但需要较高内存开销。

适合：

智能客服
实时问答
低延迟RAG
知识库检索

2、IVF：适合大规模数据，成本更可控

IVF可以理解成：

先把向量分成很多个桶，查询时只查最可能相关的几个桶。

比如有1000万个向量。

不需要全部查。

先判断用户问题大概属于哪个区域，再去相关区域里查。

优点：

适合大规模数据
内存压力相对可控
查询速度不错

缺点：

参数需要调优
召回率和速度之间要取平衡

适合：

大规模文档库
营销活动库
商品语义搜索
图片向量检索

3、DiskANN：适合更大规模、低内存成本场景

DiskANN可以理解成：

把更多索引和数据放到磁盘上，降低内存压力。

Milvus官方文档介绍，DiskANN结合了基于磁盘的Vamana图索引和产品量化压缩，用于高效向量搜索。

适合：

数据量巨大
内存成本敏感
检索规模特别大

比如：

千万级、亿级向量检索

七、Milvus的核心优势三：分布式架构，适合企业级扩展

企业系统最怕什么？

不是Demo跑不起来。

而是：

一上线就慢
数据一多就崩
流量一高就炸
扩容很麻烦

Milvus的优势之一就是分布式架构。

Milvus官方说明，它采用计算与存储分离架构，可以水平扩展，并根据不同流量模式独立扩容。例如读多时增加Query Node，写多时增加Data Node。

这句话翻译成大白话就是：

查询压力大，就加查询节点；写入压力大，就加写入节点；存储压力大，就扩存储。

这非常适合企业系统。

比如智能客服场景：

白天咨询量高，查询压力大。

可以扩Query Node。

比如知识库批量入库场景：

晚上批量处理文档，写入压力大。

可以扩Data Node。

这比单机向量库灵活很多。

八、Milvus的核心优势四：适合海量Chunk场景

RAG系统里，真正进入向量库的不是一整篇文档。

而是Chunk。

比如一份PDF有100页。

系统会切成：

Chunk 1
Chunk 2
Chunk 3
...
Chunk 500

一个企业知识库可能有：

10万份文档

切完可能是：

几百万Chunk
甚至上千万Chunk

这时候向量库必须能扛。

Milvus的定位就是面向大规模向量数据集的高性能相似度搜索。

所以它天然适合：

企业知识库
金融客服知识库
营销活动知识库
法务合同知识库
医疗资料知识库
商品图文检索
多模态检索

九、Milvus的核心优势五：适合私有化部署

很多企业做AI应用时，有一个硬要求：

数据不能出公司
知识库不能上传外部平台
用户信息不能进第三方SaaS

特别是：

金融
政企
医疗
教育
保险
法务

这类场景更敏感。

Milvus是开源项目，可以私有化部署。

企业可以把：

原始文档
Chunk内容
Embedding向量
元数据
访问权限

都放在自己的内网环境里。

这对国内很多企业非常重要。

十、Milvus的核心优势六：生态成熟，容易接入AI框架

现在很多AI应用框架都支持Milvus。

比如：

LangChain
LlamaIndex
Haystack
Spring AI
Dify
FastGPT
RAGFlow

这意味着开发成本会低很多。

你不用从零写一套向量检索系统。

只需要关注：

文档怎么切
Embedding模型怎么选
检索参数怎么调
Rerank怎么加
Prompt怎么组织
答案怎么兜底

Milvus负责底层向量存储和检索。

十一、Milvus和Elasticsearch相比，有什么优势？

Elasticsearch大家都很熟。

它原来是搜索引擎。

核心强项是：

关键词检索
倒排索引
日志检索
全文搜索
聚合查询
过滤查询

现在Elasticsearch也支持向量检索，比如官方文档提到，dense_vector字段可以存储数值向量，主要用于kNN搜索。

那问题来了：

既然ES也能做向量检索，为什么还要Milvus？

答案是：

ES能做，但它不是专门为大规模向量检索而生。

1、ES的优势

ES适合：

关键词搜索
精确词搜索
结构化过滤
日志检索
复杂查询

比如：

活动编号：A1001
产品名称：免费提现券
业务线：保险
时间范围：最近30天

这种场景ES很强。

2、Milvus的优势

Milvus适合：

语义相似搜索
海量向量TopK召回
高维向量检索
大规模Embedding存储
高并发RAG召回

比如用户问：

这个券退不了吗？

知识库写的是：

权益发放后不支持撤销。

Milvus更容易召回语义相近内容。

3、企业最佳实践：ES + Milvus混合检索

生产环境很少只用一个。

更常见的是：

ES负责关键词召回
Milvus负责语义召回
RRF做融合排序
Rerank做最终精排

为什么？

因为两者互补。

ES解决：

精确匹配、关键词、业务编号、过滤条件

Milvus解决：

语义理解、同义表达、口语化问题

这才是企业级RAG常见做法。

十二、Milvus和pgvector相比，有什么优势？

pgvector 是 PostgreSQL 的向量插件。

它非常受欢迎。

pgvector官方介绍里支持向量相似度搜索，也支持HNSW和IVFFlat索引。

它的最大优势是：

简单
便宜
容易接入
不用多部署一个数据库

如果你的系统本来就用PostgreSQL，那加一个pgvector非常方便。

pgvector适合什么场景？

适合：

小型知识库
内部工具
Demo项目
MVP验证
数据量不大
团队运维能力有限

比如：

几千条Chunk
几万条Chunk
几十万条Chunk

pgvector完全可以。

Milvus相比pgvector的优势

Milvus更适合：

百万级、千万级向量
高并发查询
复杂索引选择
分布式扩展
独立向量检索服务
大规模RAG平台

简单说：

pgvector像是在PostgreSQL里加了一个向量能力；Milvus是专门为向量检索打造的一整套数据库系统。

如果你只是做一个小工具：

PostgreSQL + pgvector

很好。

如果你要做企业级AI平台：

Milvus更合适。

十三、Milvus和Chroma相比，有什么优势？

Chroma在AI教程里很常见。

很多LangChain入门项目都会用：

Chroma.from_documents(...)

它的优势是：

上手快
开发简单
适合本地Demo
适合快速验证RAG流程

但它的短板也很明显：

大规模能力弱
企业运维能力弱
分布式能力不如Milvus
高并发生产场景不如Milvus

所以可以这样理解：

Chroma适合学习和原型验证
Milvus适合生产级落地

如果只是演示：

Chroma很方便

如果要上线：

Milvus更稳

十四、Milvus和FAISS相比，有什么优势？

FAISS 是 Meta 开源的向量检索库。

注意：

FAISS不是数据库

它更像一个：

向量检索算法库

它很强。

但它缺少数据库能力。

比如：

没有完整服务治理
没有天然分布式
没有完善权限管理
没有数据库级持久化管理
没有企业级运维能力

Milvus底层就使用了类似Faiss、HNSW、DiskANN等向量搜索能力，但在上层补齐了数据库系统能力。

可以这样理解：

FAISS = 发动机
Milvus = 一辆完整的车

FAISS适合：

算法实验
本地检索
单机向量搜索
研究场景

Milvus适合：

企业应用
RAG系统
集群部署
数据管理
高并发检索

十五、Milvus和Pinecone相比，有什么区别？

Pinecone是托管式向量数据库。

它的优势是：

不用自己运维
开箱即用
云服务体验好
适合海外团队

但国内企业会遇到几个问题：

数据合规
网络延迟
成本控制
私有化要求
供应商绑定

Milvus的优势是：

开源
可私有化部署
可控性强
适合内网环境
适合金融、政企、医疗等敏感数据场景

如果企业能接受SaaS，Pinecone很方便。

如果企业要求数据在内网，Milvus更合适。

十六、Milvus适合哪些业务场景？

1、企业知识库问答

这是最常见场景。

比如：

制度文档
产品手册
客服FAQ
合同条款
营销活动规则
操作流程
技术文档

流程：

文档切Chunk
 ↓
Embedding向量化
 ↓
写入Milvus
 ↓
用户提问
 ↓
Milvus召回相关片段
 ↓
大模型生成答案

2、智能客服

客服场景非常适合Milvus。

因为用户问题非常口语化：

我钱还不上了咋办？
这个券怎么不能用？
保险理赔入口在哪？
额度为啥没了？

这些问题很难靠关键词完全匹配。

Milvus可以做语义召回。

再结合：

FAQ
ES关键词检索
Rerank
人工转接
合规拒答

就能形成企业级智能客服。

3、相似活动/相似案例检索

比如运营要做新活动。

系统可以根据当前活动目标，检索历史相似活动：

相似人群
相似渠道
相似优惠
相似转化目标
相似文案
相似复盘结论

Milvus负责找语义相似的历史活动。

然后大模型总结：

过去哪些活动效果好
文案怎么写
AB测试怎么设计
风险点有哪些

4、图片搜索

图片也可以Embedding化。

比如：

以图搜图
商品相似图
服装相似款
Logo检索
图片版权检测

图片向量写入Milvus后，就可以做相似图片搜索。

5、推荐系统

比如：

文章推荐
商品推荐
短视频推荐
课程推荐
音乐推荐

用户行为、内容特征、商品描述都可以向量化。

Milvus可以快速找相似内容。

6、Agent长期记忆

Agent需要记住：

用户偏好
历史对话
任务记录
项目资料
工具调用结果

这些记忆可以向量化后写入Milvus。

当用户再次提问时，Agent从Milvus里找相关记忆。

这就是：

长期记忆检索

十七、企业里怎么设计Milvus数据结构？

一个典型Collection可以这样设计：

collection: knowledge_chunks

字段包括：

id：Chunk唯一ID
doc_id：文档ID
chunk_id：片段ID
content：Chunk文本
embedding：向量字段
biz_type：业务类型
category：知识分类
version：知识版本
status：是否有效
source：来源
create_time：创建时间
update_time：更新时间

为什么要有这些字段？

因为真实企业检索不是只看相似度。

还要过滤：

只查已发布知识
只查当前业务线
只查某个产品类型
只查最新版本
只查有权限的知识

所以一个好的向量库设计，一定不是只存：

content + embedding

还要存：

业务元数据
权限字段
版本字段
状态字段
来源字段

十八、Milvus在Java项目里怎么接入？

很多人以为Milvus只能Python用。

不是。

Java项目也能接。

常见架构是：

Java业务系统
 ↓
Embedding服务
 ↓
Milvus
 ↓
Rerank服务
 ↓
大模型服务

Java负责：

业务流程
权限校验
用户鉴权
知识版本管理
任务调度
接口编排
日志追踪
兜底降级

Python或模型服务负责：

Embedding
Rerank
LLM生成

Milvus负责：

向量存储
语义召回
TopK检索

企业里常见做法是：

Java不直接做模型推理
Java调用AI能力服务
AI能力服务操作Milvus
或者Java通过SDK直接查Milvus

两种都可以。

如果公司是Java主技术栈，我更推荐：

Java负责业务编排
Python AI服务负责模型相关能力
Milvus作为独立基础设施

这样职责清晰。

十九、Milvus查询链路怎么做？

一个完整查询链路如下：

1、用户输入问题
2、做敏感词和权限校验
3、调用Embedding模型生成问题向量
4、去Milvus检索TopK相似Chunk
5、同时去ES做BM25关键词检索
6、对两路结果做RRF融合
7、调用Rerank模型精排
8、取TopN片段进入Prompt
9、调用大模型生成答案
10、做合规后处理
11、返回答案和来源引用
12、记录日志和Badcase

这才是生产级RAG。

不要只说：

问题向量化，然后查Milvus。

这太浅了。

企业里一定要有：

权限
过滤
召回
融合
精排
生成
引用
拒答
日志
评测
兜底

二十、Milvus写入链路怎么做？

写入链路通常是：

1、文档上传
2、文件格式识别
3、PDF/Word/HTML解析
4、OCR或版面分析
5、内容清洗
6、按标题、段落、语义切Chunk
7、生成Chunk ID
8、调用Embedding模型
9、向量写入Milvus
10、元数据写入数据库或Milvus标量字段
11、记录版本号
12、触发索引构建
13、发布知识状态

这里有几个坑。

1、Chunk不能太长

太长会导致：

召回不准
Prompt浪费
答案引用不精确

2、Chunk不能太短

太短会导致：

语义不完整
上下文断裂
大模型理解困难

3、要保留来源

每个Chunk都要知道来自哪里：

哪个文档
哪一页
哪个标题
哪个段落
哪个版本

否则大模型回答后没法引用来源。

4、要支持知识更新

企业知识经常变化。

比如：

活动规则过期
产品费率调整
客服话术更新
政策变更

所以必须设计：

版本管理
失效机制
增量更新
重新Embedding

二十一、Milvus怎么做权限控制？

很多人做RAG Demo时忽略权限。

但企业项目里非常重要。

比如：

普通员工不能看财务制度
客服只能看本业务线知识
外包人员不能看内部策略
不同城市看到不同政策

做法一般是：

在Milvus里存元数据字段：

department
role
biz_line
tenant_id
permission_group
status
version

查询时加过滤条件。

比如：

只查 tenant_id = A
只查 status = published
只查 biz_line = finance

这样可以避免：

模型召回了用户无权查看的内容

注意：

权限控制不能只靠Prompt，必须在检索层就过滤。

二十二、Milvus异常时怎么降级？

生产环境一定要考虑：

Milvus挂了怎么办？
Embedding服务超时怎么办？
Rerank超时怎么办？
大模型失败怎么办？

Milvus异常时，可以这样降级：

1、向量检索失败 → 降级ES关键词检索
2、Milvus超时 → 返回缓存答案
3、Embedding失败 → 走FAQ精确匹配
4、Rerank失败 → 使用粗排结果
5、全部失败 → 返回标准兜底话术或人工客服

这就是企业级稳定性。

不能让用户看到：

系统异常，请稍后再试

尤其是金融客服、营销运营、企业知识库场景。

二十三、Milvus怎么选索引？

不用讲复杂数学。

记住这几个原则就够了。

1、小数据量，优先HNSW

如果数据量不大，但要求低延迟：

HNSW

适合：

几十万到几百万向量
客服问答
知识库检索
实时RAG

2、大数据量，考虑IVF类索引

如果数据量比较大，内存压力明显：

IVF_FLAT
IVF_PQ

适合：

几百万到千万级向量
成本敏感场景

3、超大规模，考虑DiskANN

如果向量量特别大：

千万级、亿级

并且希望降低内存成本，可以考虑DiskANN。

4、不要只看速度，要看召回率

检索快但找不到正确知识，没有意义。

企业调优通常看：

Recall@K
HitRate
MRR
答案准确率
人工标注命中率
用户满意度

二十四、Milvus不是万能的

虽然Milvus很强，但也不是所有场景都必须上Milvus。

1、数据量很小，不一定需要Milvus

如果只有几千条知识：

pgvector
Chroma
甚至ES

都可以。

2、强关键词场景，不一定只靠Milvus

比如：

订单号
手机号
活动编号
产品代码
合同编号

这类必须用关键词或结构化查询。

向量检索反而不合适。

3、Milvus不能替代Rerank

Milvus负责召回。

但召回结果不一定顺序最优。

所以生产环境通常还要加：

Rerank精排

4、Milvus不能解决幻觉

Milvus只负责找资料。

大模型胡说八道的问题，还要靠：

Prompt约束
来源引用
低置信度拒答
合规后处理
评测集
Badcase优化

二十五、不同向量数据库怎么选型？

可以按下面这套逻辑。

1、Demo验证

选：

Chroma
FAISS

原因：

简单
快
适合学习

2、小型业务系统

选：

pgvector

原因：

依赖少
成本低
PostgreSQL直接支持

3、中大型企业RAG

选：

Milvus + Elasticsearch

原因：

Milvus负责语义检索
ES负责关键词检索
两者互补

4、超大规模向量检索

选：

Milvus集群

原因：

分布式
可扩展
索引丰富
适合海量向量

5、海外SaaS优先

选：

Pinecone

原因：

托管方便
免运维

但如果有私有化和数据合规要求，Milvus更合适。

二十六、Milvus和其他方案对比总结

方案	优点	缺点	适合场景
Milvus	专业向量库、分布式、性能强、适合私有化	运维成本比插件型方案高	企业级RAG、智能客服、海量知识库
Elasticsearch	关键词检索强、过滤强、生态成熟	不是专门向量库，纯向量大规模成本高	BM25、日志、关键词+向量混合检索
pgvector	简单、便宜、PostgreSQL生态好	超大规模和高并发能力有限	小型知识库、MVP、内部工具
Chroma	上手快、适合教程	企业级能力弱	Demo、学习、原型验证
FAISS	检索算法强、性能好	不是数据库，缺少服务治理	算法实验、本地检索
Pinecone	托管方便、免运维	私有化和成本可能受限	海外SaaS、云原生团队

二十七、企业真实推荐架构

如果要做一个比较稳的企业级AI知识库，我推荐：

MySQL：存文档、版本、权限、任务状态
Elasticsearch：做关键词检索、过滤、日志检索
Milvus：做Embedding向量召回
Redis：做缓存、会话、热点问题
Kafka/RabbitMQ：做异步入库、日志、重试
Rerank模型：做召回结果精排
LLM：做答案生成
Grafana/日志平台：做监控和Badcase分析

查询链路：

用户问题
 ↓
意图识别
 ↓
Embedding向量化
 ↓
Milvus语义召回
 ↓
ES关键词召回
 ↓
RRF融合排序
 ↓
Rerank精排
 ↓
Prompt组装
 ↓
大模型生成答案
 ↓
合规校验
 ↓
返回答案+来源引用

这套方案非常适合：

智能客服
企业知识库
营销知识库
内部助手
金融问答
售后问答
政策问答

二十八、面试或技术文章里可以怎么总结Milvus？

可以这样说：

Milvus的核心价值不是“能存向量”，而是它面向大规模AI检索场景，提供了专业向量索引、分布式扩展、高性能TopK召回、私有化部署和成熟AI生态。相比pgvector，它更适合大规模和高并发；相比Chroma，它更适合生产环境；相比FAISS，它补齐了数据库级管理能力；相比Elasticsearch，它在纯向量检索和海量Embedding场景下更专业。企业落地时通常不会只依赖Milvus，而是采用ES + Milvus + Rerank的混合检索架构，让关键词精确匹配和语义相似检索互补。

二十九、结尾总结

Milvus为什么重要？

因为大模型本身不记得企业内部知识。

企业要让大模型回答得准，必须先让它找到正确资料。

而Milvus解决的正是：

怎么从海量知识中快速找到语义最相关的内容。

它的优势可以总结成六句话：

第一，专门为向量检索设计。
第二，适合海量Embedding存储。
第三，支持多种向量索引。
第四，支持分布式扩展。
第五，适合企业私有化部署。
第六，生态成熟，容易接入RAG和Agent系统。

但真正生产级系统里，不要神化Milvus。

最稳的方案往往是：

Milvus负责语义召回
Elasticsearch负责关键词召回
Rerank负责排序纠偏
大模型负责组织答案
日志和评测负责持续优化

这才是企业级AI应用真正落地的路线。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

完全免费、绿色免安装的Windows轻量级硬件检测工具，零依赖查看电脑配置

📌 摘要：推荐一款免费免安装的Windows硬件检测工具SysView，单文件便携、零依赖，兼容Win7/10/11系统。支持一键读取CPU、内存、显卡等硬件参数，无广告、不上传隐私。特点包括毫秒级启动、纯本地运行、无需管理员权限，适合普通用户、DIY玩家及运维人员。开源项目，提供32/64位版本下载，点击即用，彻底关闭无残留。 🔗 核心优势： ✅ 永久免费无阉割 ✅ 绿色免安装，U盘随身带

AtomGit开源社区

所有评论(0)

查看更多评论

闵浮龙

@2501_92593481

已为社区贡献25条内容

Milvus向量数据库详解：为什么它能成为企业级RAG系统的核心底座？

闵浮龙

向量数据库

一、先说清楚：什么是向量数据库？

二、为什么不能直接用MySQL做向量检索？

1、MySQL不擅长高维向量计算

2、MySQL没有专业向量索引

3、MySQL做不了大规模语义召回

三、Milvus到底是什么？

四、Milvus在RAG系统里的位置

五、Milvus的核心优势一：专门为向量检索而生

六、Milvus的核心优势二：支持多种向量索引

1、HNSW：速度快，召回好，但吃内存

2、IVF：适合大规模数据，成本更可控

3、DiskANN：适合更大规模、低内存成本场景

七、Milvus的核心优势三：分布式架构，适合企业级扩展

八、Milvus的核心优势四：适合海量Chunk场景

九、Milvus的核心优势五：适合私有化部署

十、Milvus的核心优势六：生态成熟，容易接入AI框架

十一、Milvus和Elasticsearch相比，有什么优势？

既然ES也能做向量检索，为什么还要Milvus？

1、ES的优势

2、Milvus的优势

3、企业最佳实践：ES + Milvus混合检索

十二、Milvus和pgvector相比，有什么优势？

pgvector适合什么场景？

Milvus相比pgvector的优势

十三、Milvus和Chroma相比，有什么优势？

十四、Milvus和FAISS相比，有什么优势？

FAISS不是数据库

十五、Milvus和Pinecone相比，有什么区别？

十六、Milvus适合哪些业务场景？

1、企业知识库问答

2、智能客服

3、相似活动/相似案例检索

4、图片搜索

5、推荐系统

6、Agent长期记忆

十七、企业里怎么设计Milvus数据结构？

十八、Milvus在Java项目里怎么接入？

十九、Milvus查询链路怎么做？

二十、Milvus写入链路怎么做？

1、Chunk不能太长

2、Chunk不能太短

3、要保留来源

4、要支持知识更新

二十一、Milvus怎么做权限控制？

二十二、Milvus异常时怎么降级？

二十三、Milvus怎么选索引？

1、小数据量，优先HNSW

2、大数据量，考虑IVF类索引

3、超大规模，考虑DiskANN

4、不要只看速度，要看召回率

二十四、Milvus不是万能的

1、数据量很小，不一定需要Milvus

2、强关键词场景，不一定只靠Milvus

3、Milvus不能替代Rerank

4、Milvus不能解决幻觉

二十五、不同向量数据库怎么选型？

1、Demo验证

2、小型业务系统

3、中大型企业RAG

4、超大规模向量检索

5、海外SaaS优先

二十六、Milvus和其他方案对比总结

二十七、企业真实推荐架构

二十八、面试或技术文章里可以怎么总结Milvus？

二十九、结尾总结

所有评论(0)

温馨提示：您尚未绑定手机号

闵浮龙