2026年03月08日

Trace Data的隐藏价值:你的设备数据用了多少?

半导体设备Trace Data的四类特征提取方法,以及在VM、FDC、PM预测中的实际应用。

Trace Data的隐藏价值:你的设备数据用了多少?

每一台半导体设备在运行时都在产生大量数据。温度传感器每秒采样10次,压力计以毫秒级频率记录腔体压力变化,RF功率的前进波和反射波被持续监控——这些以时间序列形式记录的传感器数据,就是Trace Data。一台刻蚀设备每天产生的Trace Data可达数GB,一个中型Fab全年积累的数据量轻松突破PB级。

然而,一个令人惊讶的事实是:大多数半导体工厂实际利用的Trace Data不到总量的10%。

什么是Trace Data?

Trace Data是设备在加工每一片晶圆时,各传感器按时间序列记录的运行参数。与Summary Data(每片晶圆只记录一个均值或极值)不同,Trace Data保留了完整的时间维度信息。

以一个典型的等离子刻蚀步骤为例,一个Recipe Step可能持续30秒,期间记录的Trace参数包括:

  • RF正向功率 / 反射功率(采样率100Hz)
  • 腔体压力(采样率50Hz)
  • 各路气体实际流量(采样率10Hz)
  • 静电卡盘温度、背压He流量
  • 匹配器电容位置(C1/C2)
  • 等离子阻抗相关参数(Vpp、Vdc)

这意味着一片晶圆、一个Step就可能产生数千个数据点。而一个完整的刻蚀Recipe可能包含10-20个Step,加工一片晶圆的Trace Data总量可达数万到数十万个数据点。

为什么90%的Trace Data被”浪费”了?

多数Fab对Trace Data的利用仅停留在两个层面:

1. 实时报警。设备控制器内置的上下限报警(如压力超过设定值±5%则触发Alarm)。这只用到了瞬时极值信息。

2. Summary统计。将每片晶圆的Trace数据压缩为均值、标准差等汇总值,存入MES/FDC系统用于SPC监控。这一步丢失了绝大部分时间维度信息。

造成这一现象的原因并非工程师不想用,而是:数据量太大、存储成本高、缺乏有效的特征提取工具、以及传统统计方法难以处理高频时序数据。但随着存储成本下降和AI技术成熟,这一局面正在被打破。

4类特征提取方法:从原始波形到可用信号

Trace Data之所以难以直接使用,是因为它是高维、变长的时间序列。将其转化为结构化特征(Feature),是释放其价值的关键步骤。以下是工程实践中最常用的4类特征提取方法:

第一类:统计特征(Statistical Features)

这是最基础也最广泛使用的方法。对每个传感器的每个Step时间段,计算:均值、标准差、最大值、最小值、偏度(Skewness)、峰度(Kurtosis)、变异系数等。统计特征简单直观,但会丢失波形的时间结构信息。例如,一条”先高后低”和一条”先低后高”的曲线可能有相同的均值和标准差,但物理含义完全不同。

第二类:分段特征(Segmented Features)

将每个Step的Trace曲线按时间分段——通常分为上升段(Ramp-up)、稳态段(Steady-state)、下降段(Ramp-down),分别提取各段的斜率、过冲量(Overshoot)、稳定时间(Settling Time)、终值偏差等。这类特征能捕捉工艺控制回路的动态响应特性,对检测设备劣化尤其有效。比如,匹配器C1的稳定时间从0.5秒逐渐漂移到1.2秒,往往预示着匹配网络需要维护。

第三类:频域特征(Frequency-domain Features)

通过FFT(快速傅里叶变换)或小波变换,将时域信号转换到频域,提取主频率分量、功率谱密度、能量分布等。频域特征特别适合检测周期性异常——例如泵的机械磨损会在特定频率上引入新的振动分量,这在时域波形上可能很难察觉,但在频谱上会表现为明显的峰值。

第四类:时序特征(Temporal Features)

利用时序分析方法提取更高阶的模式信息,包括:自相关系数(衡量信号的周期性)、近似熵/样本熵(衡量信号的复杂度和规律性)、趋势分量(通过STL分解提取)、以及基于DTW(动态时间规整)的波形相似度。这类特征计算成本较高,但能捕捉到其他方法遗漏的细微变化。

Trace Data特征的三大应用场景

应用一:虚拟量测(VM)建模的输入。传统VM模型以Summary Data为输入,预测膜厚、CD等量测值。但Summary Data的信息量有限,模型精度往往遇到瓶颈。将Trace特征作为VM模型的输入,能显著提升预测精度。实践表明,加入分段特征和频域特征后,VM模型的R²可从0.85提升到0.93以上,MAPE(平均绝对百分比误差)降低30%-50%。

应用二:FDC异常检测的信号源。传统FDC基于Summary Data设定控制限,只能检测”某个参数的均值超标”这类简单异常。基于Trace特征的FDC能检测更细微的异常模式:Ramp-up斜率变化、稳态段的高频振荡、Step转换时的异常过冲等。这些异常往往是设备故障的早期信号,比Summary Data的报警提前数小时甚至数天。

应用三:预测性维护的信号源。设备零部件的劣化过程会在Trace Data中留下渐进式的痕迹——RF发生器的功率稳定性下降、阀门的响应时间增加、温控的稳态波动加大。通过持续监控这些Trace特征的趋势,可以在故障发生前预测维护需求,从”基于时间的PM”转向”基于状态的PM”。

实施建议

对于希望开始利用Trace Data的工厂,建议采取渐进式策略:

  1. 从关键设备开始。选择产线上最关键、故障影响最大的1-2台设备作为试点。
  2. 先做统计特征和分段特征。这两类特征工程难度低、价值密度高,ROI最明显。
  3. 建立特征数据库。将提取的特征与量测数据、维护记录对齐,形成可追溯的数据资产。
  4. 逐步引入高阶特征和模型。在积累足够数据和经验后,再引入频域特征和时序特征。

这一过程的核心挑战不在算法,而在数据工程:如何高效采集、对齐、存储和处理海量Trace Data。一个良好的数据基础设施,是一切上层AI应用的前提。

想了解如何系统化地利用您的设备Trace Data?

了解 NeuroBox E3200 产线AI方案 →

💬 在线客服 📅 预约演示 📞 021-58717229 contact@ai-mst.com
📱 微信扫码
企业微信客服

扫码添加客服