CVD/PVD薄膜沉积:AI膜厚均匀性预测实践
薄膜沉积是半导体制造的基础工艺,无论是CVD(化学气相沉积)的介质膜、还是PVD(物理气相沉积)的金属阻挡层,膜厚均匀性都是影响后续工艺和器件性能的关键指标。本文介绍如何利用AI技术对CVD/PVD工艺的膜厚进行在线预测和漂移补偿,从工程实践角度分享建模方法、特征选取和部署经验。
一、膜厚均匀性控制的现实困难
1.1 多参数耦合
薄膜沉积的膜厚分布受多个工艺参数的耦合影响:
- CVD工艺:反应温度(多区加热器设定)、腔体压力、前驱体流量及配比、载气流量、等离子体功率(PECVD)、Shower Head与晶圆的间距。
- PVD工艺:DC/RF溅射功率、Ar气流量及压力、基板温度、靶材到基板距离(T-S Distance)、磁控管配置。
这些参数之间存在复杂的交互效应。例如,在PECVD SiO2沉积中,提高RF功率可增加沉积速率,但同时会改变等离子体的空间分布,导致Center-to-Edge的膜厚差异变化。工程师很难仅凭经验把握所有参数的交互关系。
1.2 长期漂移
薄膜沉积设备的特性会发生缓慢漂移:
- CVD:Shower Head的微孔堵塞(前驱体分解产物沉积)、加热器功率衰减、腔体内壁沉积膜的累积(影响热辐射特性和颗粒水平)。
- PVD:靶材刻蚀沟槽(Target Erosion Track)的深度变化导致溅射角分布改变、磁控管磁场衰减。
这些漂移通常在数百片到数千片的尺度上发生,量测数据的反馈周期往往跟不上漂移速度。
1.3 量测成本与周期
膜厚量测(椭偏仪、XRF、四探针)通常是离线操作,量测点位有限(通常9-49点),无法获得全晶圆的完整膜厚Map。特殊膜层(如高k介质、超薄ALD膜)的量测更加耗时,每片可达10-15分钟。
二、AI膜厚预测的建模方法
2.1 建模框架
CVD/PVD膜厚预测的AI建模框架分为三层:
- 工艺参数层(静态特征):Recipe设定值——温度、压力、功率、流量等。这些是工程师设定的目标值。
- 设备状态层(动态特征):传感器实测值与设定值的偏差、设备累计使用状态(靶材寿命、Shower Head使用片数、加热器校准系数等)。这些特征捕捉设备的实际工作状态与理想状态之间的差异。
- 时序过程层(波形特征):沉积过程中温度、压力、功率的时序曲线。尤其是升温阶段的温度过冲、稳态阶段的压力波动等瞬态特征,与膜厚分布有强相关性。
2.2 模型架构选择
根据预测目标的不同,推荐以下模型架构:
平均膜厚预测:使用GBDT(如LightGBM)即可达到较高精度。输入为结构化的静态+动态特征,模型训练快、可解释性强。典型精度:MAPE < 1%。
膜厚均匀性预测(Within-Wafer Uniformity):需要预测晶圆面内多个位置的膜厚值,本质上是一个多输出回归问题。推荐使用多任务学习(Multi-Task Learning)框架:底层共享特征提取网络,顶层为每个量测位置设置独立的输出头。这种架构可以利用不同位置之间的空间相关性,提升整体预测精度。
膜厚Map预测(全晶圆分布重建):如果需要预测完整的膜厚分布Map(例如用于前馈到CMP工序),可以使用CNN-based方法。将少量量测点的数据作为约束条件,结合设备参数预测完整的2D分布。
2.3 在线漂移补偿
沉积设备的长期漂移是膜厚预测精度的最大威胁。我们采用以下策略实现在线漂移补偿:
- 滑动窗口更新:维护最近N片(通常N=50-200)的量测数据,定期(如每天或每50片)对模型进行增量学习,使模型持续跟踪设备状态变化。
- 漂移检测:利用Page-Hinkley检测或CUSUM算法监控预测残差的均值偏移。一旦检测到显著漂移(如PM后的突变),自动触发模型的快速适应机制。
- 分段建模:以PM事件为分割点,将数据划分为不同的设备状态段。每段内部使用局部模型,段与段之间通过迁移学习共享知识。这种方法特别适合PVD靶材更换后的快速模型适配。
三、工程实践案例
某8英寸晶圆厂在PECVD SiNx薄膜沉积工序的AI膜厚预测实践:
工艺背景:PECVD SiNx作为钝化层,膜厚目标值3000Å,均匀性要求 ≤ 2%(1σ,49点)。设备为双腔体配置,每日产能约300片。
数据准备:采集6个月历史数据,包含约45,000片晶圆的设备传感器数据(200+通道,1Hz采样)和对应的膜厚量测数据(抽检率约15%,约6,750片有量测值)。
模型结果:
| 预测目标 | 模型 | 测试集精度 |
|---|---|---|
| 平均膜厚 | LightGBM | MAPE 0.68% |
| 49点膜厚 | 多任务DNN | MAPE 0.92% |
| 均匀性(%) | LightGBM | MAE 0.15% |
部署收益:
- 膜厚虚拟全检覆盖,量测抽检率从15%降至5%(仅用于模型校准),每月节省量测机台约120小时。
- 发现并修正了两个腔体之间的系统性膜厚偏差(约45Å),此前因抽检频率不足未被察觉。
- 新Recipe开发阶段,利用AI模型进行参数寻优,试片量减少约60%。
四、CVD与PVD的建模差异
虽然AI建模的基本框架相似,但CVD和PVD工艺在实践中存在一些重要差异:
- 特征重要性不同:CVD中温度和流量是最关键的特征,PVD中功率和压力的权重更高。
- 漂移模式不同:CVD的漂移通常较为平缓(Shower Head堵塞是渐进过程),PVD的靶材消耗导致的漂移更加显著且非线性。
- 数据质量差异:PVD过程通常较短(几十秒到几分钟),时序特征的信息密度低于CVD过程(几分钟到十几分钟),需要更精细的特征工程。
五、总结
CVD/PVD膜厚均匀性的AI预测已经从学术研究走向工程落地。关键成功因素包括:完善的数据采集基础设施(EDA)、合理的特征工程(融合静态参数与时序波形)、以及有效的在线漂移补偿机制。对于计划引入AI膜厚预测的工厂,建议从单一工序的平均膜厚预测起步,逐步扩展到均匀性预测和全晶圆Map预测。
了解更多
集芯科技 NeuroBox E3200 产线智能控制平台,内置CVD/PVD膜厚预测引擎,支持多任务学习建模、在线漂移自适应、全晶圆Map重建,覆盖PECVD、LPCVD、ALD、PVD全品类沉积工艺。