# 芯片良率是怎么算出来的？——从泊松到负二项分布，一个芯片测试工程师的视角

蜗牛蜗蜗牛

551人浏览 · 2026-06-11 07:22:42

蜗牛蜗蜗牛 · 2026-06-11 07:22:42 发布

一个场景：

今天流水线送来1000颗Die，你测完发现只有850颗是好的。

老板问：良率85%？行。

但如果明天变成70%，后天变成60%，你能告诉他是哪出问题了吗？

你手里的武器，就是良率模型（Yield Model）——它不是"好的除以总的"这么简单，它是你理解芯片制造过程健康状况的X光机。

一、造芯片不是做饼干

良率 = 好Die数 / 总Die数。定义就这么简单，但背后的故事一点也不简单。

想象你在做饼干：揉面、压模、入烤箱。有一块烤焦了？扔掉就是，下一块重新做，损失几乎为零。

造芯片可不是做饼干。

晶圆是一整片硅片，上面同时制造成百上千颗Die。如果光刻机的一道光照偏了0.1微米——整片晶圆上的每一颗Die都可能废了。不是"重做一块就好"，这几百道工序、几百个工时、几千美金的成本，全打水漂。

这就是为什么良率是半导体制造中最敏感、最关键的指标之一。

而且对一个芯片测试工程师来说，良率的意义分三层：

良率低 = 同样的测试时间→拿到的良品更少→产出暴跌
良率突然下滑 = 工艺出了问题→你需要在最短时间内定位故障源
良率太高？——等等，高不好吗？——如果良率好得离谱，你反而得怀疑：是不是测试覆盖漏掉了什么？

二、三个模型，一个比一个精

晶圆上为什么会出现坏Die？归根结底是因为缺陷（Defect）。缺陷来自：空气中的微粒落在晶圆上、光刻胶涂布不均匀、刻蚀过度或不足、金属线间短路或断路……

这些缺陷随机地落在晶圆上。如果一颗缺陷落在Die的活性区域内，这颗Die就坏了。

问题来了：给定缺陷密度，怎么预测良率？

1️⃣ Poisson模型：最朴素也最悲观

最简单的假设：缺陷在晶圆上完全随机分布，互不影响，服从泊松分布。

公式： Y = e^(-A·D₀)

其中Y是良率，A是Die面积（cm²），D₀是缺陷密度（defects/cm²）。

生活类比： 你在下雨天站在空地上，头顶一块面积A的纸板。雨滴均匀随机落下，D₀是单位面积的雨滴数。纸板上没有雨滴的概率——就是e^(-AD₀)。

问题在哪？ Poisson模型假设缺陷均匀随机分布。但在真实环境中，缺陷倾向于聚集（Clustering）——工艺波动往往在晶圆上造成"坏区"和"好区"。

结果：Poisson模型对良率的预测总是过于悲观。实际良率通常比Poisson预测高。

2️⃣ Murphy模型：更贴近现实

Murphy对Poisson做了修正，假设缺陷密度D本身是一个随机变量，服从Gamma分布。这引入了缺陷密度的变化，更贴合实际情况。

公式： Y = (1 - e^(-A·D₀)) / (A·D₀)

刚才那场雨变成了"局部阵雨"——有的地方瓢泼大雨，有的地方几乎没雨。你的纸板（Die）放在哪里？取决于它落在哪个区域。

Murphy模型比Poisson乐观一些，在大面积Die时差距尤其明显。

3️⃣ Negative Binomial模型：业界标配

这是当今半导体行业最广泛使用的良率模型。

在Poisson基础上引入一个聚类因子α，描述缺陷的聚集程度。

公式： Y = (1 + A·D₀/α)^(-α)

α → ∞时 → Poisson模型（完全随机，无聚类）
α = 1时 → Murphy模型
α越小 → 缺陷越聚集

这次不是下雨了。你看着一群蚂蚁搬食物——它们不是均匀散开的，而是成群结队沿着某些路径走。你的Die就像路上的纸片：如果恰好有蚂蚁队伍经过（缺陷聚集区），这颗Die大概率完蛋；如果落在没蚂蚁的区域，安然无事。

实战意义：

工艺控制得好，α通常在2~5之间
如果α忽然变小（比如0.5），说明出现了严重的局部工艺问题
对测试工程师来说：跟踪α的变化比跟踪良率数字本身更敏感——它可以提前数周预警工艺漂移

三、堆叠良率——Chiplet时代的噩梦

如果单片芯片的良率是"一锤子买卖"，那先进封装（Chiplet）时代的良率就是俄罗斯轮盘赌。

当你把N颗独立的Die集成到一个封装中，整体良率等于每颗Die良率的乘积：

Y_total = Y₁ × Y₂ × … × Y_N

为什么？ 因为任何一颗Die坏了，整个封装模块就废了——你不能拆了重焊。

Chiplet数量	单颗良率	整体良率
3	95%	85.7%
4	95%	81.5%
5	95%	77.4%
8	95%	66.3%
10	90%	34.9% ❗

三条曲线分别对应单颗良率95%/90%/85%时，整体良率随Chiplet数量的变化。红线跌到34.9%的点——10颗90%良率的Die封在一起，整体不到35%。

10颗90%良率的Chiplet封在一起→整体良率只有34.9%！

将近65%的先进封装模块因为某颗Die的不良而报废——每个封装价值几百到几千美元。

这就是为什么在Chiplet时代，**KGD（已知良好裸片）**从"nice-to-have"变成了"must-have"。你必须在裸片阶段就做到极致筛选——不能靠封装后再筛选，因为那为时已晚。

想象你是个高端餐厅的品控经理。以前你把一道菜做坏了，扔掉重做成本是50块。现在你做了10道菜，拼成一道满汉全席，其中一道菜是馊的——整桌全废了，成本2000块。
你现在必须保证每一道菜在出锅前就是完美的。

四、【测试视角】良率与测试的跷跷板

良率不是孤立指标，它和测试覆盖率之间有经典的跷跷板关系。

Defect Level（缺陷等级）公式：

DL ≈ 1 - Y^(1 - TC)

DL是"已经出货但仍然有缺陷的芯片比例"，TC是测试覆盖率。

良率Y	测试覆盖率TC	DL (ppm)	含义
90%	99%	~1,053	每百万颗出货芯片中约1000颗是坏的
90%	99.9%	~105	好一些
90%	95%	~5,129	这个质量交出去会被客户骂死
99%	99%	~100	良率高≠品质好！

给测试工程师的硬核启示：

想降低DL有两种途径：提高良率 OR 提高测试覆盖率
但如果良率提高是因为测试覆盖不足，DL反而会更高——这就是为什么看到"超高良率"时要警觉
在量产爬坡阶段，用这个公式来设定测试Pattern的质量门限

用一张良率地图（Yield Map）配合Shmoo图，训练有素的工程师可以像读心电图一样"读"晶圆厂的生产健康——边缘密集的坏Die暗示刻蚀速率不均，中心聚集暗示光刻对准偏差，条纹状划痕暗示机械搬运损伤……

狗蛋说：

良率模型不是书呆子的数学游戏。Poisson告诉你最坏情况，Murphy给你中位数参考，Negative Binomial才是实战中的王牌——跟踪α的变化，比盯着良率数字本身，能早几周发现工艺漂移。在Chiplet时代，一颗Die的良率决定了整个封装模块的生死，每多一颗Chiplet，数学就对良率多一分残忍。

本文基于芯片测试工程师的实战视角整理，欢迎讨论。如果对ATE测试、DFT、良率分析等话题感兴趣，关注专栏持续更新。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Step3-VL 多模态模型主干代码九章排错与重写

Step3-VL多模态模型代码优化摘要原1074行代码经九章编程法重构为385行，修复20个核心缺陷（含6个致命崩溃级问题）。主要改进：缺陷修复：解决未初始化变量、维度硬编码、参数边界缺失等致命问题架构分层：拆分配置池(C)、数据池(B)、操作池(A)，实现物理隔离边界强化：新增参数校验、异常兜底机制，覆盖输入维度、索引范围等风险点代码精简：清理死代码冗余逻辑，函数职责单一化典型问题示