2026年03月09日

WAT/CP测试数据分析:从海量数据中挖掘良率密码

WAT/CP测试数据分析:从海量数据中挖掘良率密码

做过良率的人都知道,WAT和CP数据是离”真相”最近的数据。工艺波动藏在WAT趋势里,良率损失写在CP的bin map上。问题是,这两类数据加在一起,一个月能产生几十GB,光靠人盯Excel早就盯不过来了。这篇文章想聊聊,我们在实际项目中怎么用数据方法把WAT和CP的价值真正挖出来。

先说清楚:WAT和CP到底测的是什么

经常有人把WAT和CP搞混,觉得都是”测晶圆”。其实它们测的东西、测的时机、回答的问题完全不一样。

WAT(Wafer Acceptance Test),中文叫晶圆可接受性测试,也有叫PCM(Process Control Monitor)的。它测的不是你的产品die,而是wafer上专门留出来的测试结构——scribe line上的TEG(Test Element Group)。时间点是在前道工艺全部跑完、切割之前。说白了,WAT回答的问题是:“这批wafer的工艺做得怎么样?”

CP(Circuit Probe),也叫wafer sort或者EWS(Electrical Wafer Sort),是在WAT之后,用探针卡直接扎到每颗die上去测。它回答的问题是:“这颗die能不能用?” 测完之后每颗die会被分到不同的bin里——bin 1是好的,其他bin对应不同的失效模式。

打个不太严谨的比方:WAT像是体检报告,看你各项指标正不正常;CP像是上岗考试,直接决定你能不能上班。体检过了不代表考试能过,但体检指标要是飘了,考试大概率要出问题。

WAT到底测哪些参数

WAT测的都是器件级的电学参数,具体测哪些取决于你的工艺平台。拿一个典型的BCD工艺来说,我经手过的一个平台,WAT参数有87项,这还不算多的。主要包括:

MOSFET相关的:阈值电压Vth(NMOS和PMOS都要测,不同沟道长度可能各测几个)、饱和漏电流Idsat、亚阈值摆幅SS、漏致势垒降低DIBL。这几项直接反映栅氧质量和沟道掺杂水平。我见过一次Vth偏了30mV,最后查出来是离子注入的剂量漂了2%。

电阻相关的:多晶硅方块电阻Rsp、金属层方块电阻Rs、接触孔电阻Rc、通孔电阻Rvia。这些参数对数字电路的时序影响很大,对模拟电路就更不用说了。Rc偏高通常指向接触孔刻蚀不干净或者barrier层沉积的问题。

结特性:PN结击穿电压BV、漏电流leakage。功率器件尤其关注BV,因为这直接决定了你的耐压等级能不能达标。有一次我们一个40V的LDMOS,BV从42V掉到了38V,整个lot直接报废,后来追到是STI填充出了void。

电容和可靠性结构:栅氧电容Cox、TDDB测试结构、电迁移测试条。这些跟长期可靠性直接挂钩。

每片wafer上一般有9到17个test site,分布在wafer的中心、边缘和中间区域。一个标准的25片lot,就是225到425组WAT数据。每组87个参数,一个lot下来就是将近两万个数据点。

CP测的又是什么

CP是真正面对每一颗die的。300mm wafer上,根据die size不同,可能有几百到上万颗die。一颗die上的测试项可能从几十项到几千项不等,取决于产品复杂度。

CP测试大致分两类:

参数测试:实际去量每个pin的静态电流IDD、输出驱动能力、基准电压精度、ADC的INL/DNL这些。这类测试结果是连续值,可以做分布分析。

功能测试:给die灌pattern,看输出对不对。数字逻辑部分主要靠这种方式,结果是pass或fail,比较”硬”。

测完之后每颗die会被打上bin code。一般bin 1是全部pass的好die,bin 2可能是降级品(比如速度没达到最高等级但还能用),bin 3往后就是各种不同原因的fail。一个成熟产品的CP yield能做到95%以上,但新产品刚开始跑的时候,60%-70%都是常态,良率爬坡就是从这个阶段开始的。

数据量到底有多大

我算过一笔账。假设一片300mm wafer上有600颗die,CP测试项200项,一个lot 25片wafer。那单纯CP数据就是600 x 200 x 25 = 300万个数据点。一条产线一天跑10个lot,一个月就是9亿个CP数据点。再加上WAT数据、测试时间戳、bin code、wafer map坐标,一个月的原始数据量轻松到几十GB。

这还只是一个产品、一条线的量。一个Fab里同时跑十几个产品,数据量再翻一个数量级。

传统分析方法:能用,但越来越不够用

做WAT/CP分析,传统上大家用的方法其实很成熟:

均值和标准差,算Cpk,判断工艺能力够不够。Cpk大于1.33是基本要求,大于1.67才算舒服。画trend chart,看参数有没有随时间漂移。画wafer map,看fail die的空间分布——是边缘效应、还是某个区域集中失效、还是随机分布。

这些方法我现在也在用,基本功不能丢。但问题出在哪?

第一,维度太多。87项WAT参数,你一项一项看trend chart,看完一个lot得半天。200项CP参数就更别提了。人的精力是有限的,实际操作中大家往往只盯几个”关键参数”,其他的出了问题才回头去翻。但有时候问题恰恰出在你没盯的那个参数上。

第二,参数之间的关联性看不到。比如Vth轻微偏移了15mV,Cpk还是达标的,单看这一项你不会报警。但如果同时Idsat也偏了3%、Ron也偏了5%,三个参数一起动,大概率说明某道工艺的窗口已经在边缘了。人脑很难同时处理这种多参数联动的信号。

第三,WAT和CP之间的桥接分析做不动。WAT参数是test site级别的,CP数据是die级别的,两者的空间分辨率不一样,要做关联分析需要空间插值和对齐,手动做这个工作量很大。

AI方法:不是替代工程师,是帮工程师看到看不到的东西

我们在几个实际项目中逐步引入了数据驱动的分析方法,踩了不少坑,也确实看到了效果。说几个实际在做的方向:

多参数关联分析与异常检测

把WAT的所有参数放在一起做主成分分析(PCA),把87维的数据降到几个主成分上。正常情况下,数据点会聚集在一个比较紧凑的区域。一旦某个lot的数据点跑出了这个区域,马上就能发现异常——哪怕每个单项参数看起来都还”在spec内”。

我们有一次就靠PCA抓到了一个隐性问题:某个lot的WAT数据,所有参数都在spec以内,Cpk也还行,但PCA分数明显偏离了历史分布。最后查下来是光刻对准偏了0.02um,单个参数的影响都很小,但累积效应导致CP良率掉了3个百分点。如果只看传统SPC chart,这个信号很容易被漏掉。

WAT漂移追溯前道工艺

WAT参数是前道工艺结果的”指纹”。当WAT参数出现系统性漂移的时候,问题一定出在前面的某道或某几道工艺上。传统做法是靠工程师的经验去判断——Vth漂了可能是注入的问题,Rc高了可能是接触孔的问题。但这种经验对新工艺、新产品不一定适用。

我们现在的做法是把WAT数据和前道的设备数据(比如每道刻蚀的功率、每次沉积的温度和速率、注入的束流和剂量)做关联建模。用随机森林或者梯度提升树来找,哪些上游工艺参数对WAT结果的影响最大。模型训练好之后,WAT一旦漂移,直接把最近一段时间的设备数据喂进去,模型能给出top 3可疑的工艺步骤和设备腔体。

实际用下来,准确率没办法做到100%,但能把排查范围从”整条产线几十道工艺”缩小到”3-5道工艺”,工程师的排查效率提升很明显。有一次模型把根因指向了一台PVD设备的靶材寿命,这个我们一开始完全没想到——靶材用了3500个wafer之后,膜厚均匀性开始恶化,但膜厚监控还没报警,WAT的Rs先感觉到了。

CP的空间模式识别

CP wafer map上的fail die分布模式,对定位问题根因非常有价值。边缘ring状分布通常指向涂胶或刻蚀的边缘效应,扇形分布可能和离子注入的角度有关,某个固定位置反复出现fail可能是探针卡的问题而不是wafer的问题。

用卷积神经网络(CNN)对wafer map做模式分类,把常见的十几种空间模式自动识别出来,然后和已知的根因数据库做匹配。这在量产阶段特别有用,因为很多问题是反复出现的,第一次花了两周排查出来,第二次出现的时候模型几秒钟就能识别出来,直接告诉你上次是什么原因。

与虚拟量测(VM)的闭环

最后说说WAT/CP数据和虚拟量测(Virtual Metrology)的关系,因为这两件事本质上是一个闭环。

虚拟量测是用设备端的实时传感器数据(FDC数据)来预测wafer出来之后的量测结果,好处是不用等实际量测,每片wafer都能有”预测值”。但VM模型的精度需要持续校准,校准的基准是什么?就是WAT实测数据。

我们现在做的方案是:VM模型先给出每片wafer的WAT预测值,等实际WAT数据出来之后,和预测值做比对。如果偏差在可接受范围内,说明模型还是准的;如果偏差突然变大,要么是工艺发生了变化(模型需要重新训练),要么是量测本身有问题。这个反馈回路让VM模型能够自适应地跟踪工艺漂移,而不是训练一次就放在那不管了。

往下游延伸,CP良率也可以用WAT数据来预估。如果WAT参数已经出现了偏移的趋势,在CP测试之前就可以做预判,提前安排工程资源去分析和处理,而不是等CP测完发现良率掉了再去亡羊补牢。这个提前量在实际生产中非常有价值,因为从前道工艺完成到CP测试中间可能隔了好几天,早发现一天就能少损失一天的产能。

让WAT/CP数据真正驱动良率提升

集芯科技NeuroBox E3200产线AI平台,集成了多参数关联分析、空间模式识别和虚拟量测闭环校准能力,帮助Fab从海量测试数据中快速定位良率损失根因。如果您正在面对良率爬坡或产线数据分析的挑战,欢迎了解我们的方案。

良率提升方案详情
了解 NeuroBox E3200

💬 在线客服 📅 预约演示 📞 021-58717229 contact@ai-mst.com
📱 微信扫码
企业微信客服

扫码添加客服