2026年03月08日

CVD/PVD薄膜沉积:AI膜厚均匀性预测实践

CVD/PVD薄膜沉积AI预测实践:从特征工程到在线漂移补偿,实现膜厚均匀性的精准预测。

CVD/PVD薄膜沉积:AI膜厚均匀性预测实践

薄膜沉积是半导体制造的基础工艺,无论是CVD(化学气相沉积)的介质膜、还是PVD(物理气相沉积)的金属阻挡层,膜厚均匀性都是影响后续工艺和器件性能的关键指标。本文介绍如何利用AI技术对CVD/PVD工艺的膜厚进行在线预测和漂移补偿,从工程实践角度分享建模方法、特征选取和部署经验。

一、膜厚均匀性控制的现实困难

1.1 多参数耦合

薄膜沉积的膜厚分布受多个工艺参数的耦合影响:

  • CVD工艺:反应温度(多区加热器设定)、腔体压力、前驱体流量及配比、载气流量、等离子体功率(PECVD)、Shower Head与晶圆的间距。
  • PVD工艺:DC/RF溅射功率、Ar气流量及压力、基板温度、靶材到基板距离(T-S Distance)、磁控管配置。

这些参数之间存在复杂的交互效应。例如,在PECVD SiO2沉积中,提高RF功率可增加沉积速率,但同时会改变等离子体的空间分布,导致Center-to-Edge的膜厚差异变化。工程师很难仅凭经验把握所有参数的交互关系。

1.2 长期漂移

薄膜沉积设备的特性会发生缓慢漂移:

  • CVD:Shower Head的微孔堵塞(前驱体分解产物沉积)、加热器功率衰减、腔体内壁沉积膜的累积(影响热辐射特性和颗粒水平)。
  • PVD:靶材刻蚀沟槽(Target Erosion Track)的深度变化导致溅射角分布改变、磁控管磁场衰减。

这些漂移通常在数百片到数千片的尺度上发生,量测数据的反馈周期往往跟不上漂移速度。

1.3 量测成本与周期

膜厚量测(椭偏仪、XRF、四探针)通常是离线操作,量测点位有限(通常9-49点),无法获得全晶圆的完整膜厚Map。特殊膜层(如高k介质、超薄ALD膜)的量测更加耗时,每片可达10-15分钟。

二、AI膜厚预测的建模方法

2.1 建模框架

CVD/PVD膜厚预测的AI建模框架分为三层:

  1. 工艺参数层(静态特征):Recipe设定值——温度、压力、功率、流量等。这些是工程师设定的目标值。
  2. 设备状态层(动态特征):传感器实测值与设定值的偏差、设备累计使用状态(靶材寿命、Shower Head使用片数、加热器校准系数等)。这些特征捕捉设备的实际工作状态与理想状态之间的差异。
  3. 时序过程层(波形特征):沉积过程中温度、压力、功率的时序曲线。尤其是升温阶段的温度过冲、稳态阶段的压力波动等瞬态特征,与膜厚分布有强相关性。

2.2 模型架构选择

根据预测目标的不同,推荐以下模型架构:

平均膜厚预测:使用GBDT(如LightGBM)即可达到较高精度。输入为结构化的静态+动态特征,模型训练快、可解释性强。典型精度:MAPE < 1%。

膜厚均匀性预测(Within-Wafer Uniformity):需要预测晶圆面内多个位置的膜厚值,本质上是一个多输出回归问题。推荐使用多任务学习(Multi-Task Learning)框架:底层共享特征提取网络,顶层为每个量测位置设置独立的输出头。这种架构可以利用不同位置之间的空间相关性,提升整体预测精度。

膜厚Map预测(全晶圆分布重建):如果需要预测完整的膜厚分布Map(例如用于前馈到CMP工序),可以使用CNN-based方法。将少量量测点的数据作为约束条件,结合设备参数预测完整的2D分布。

2.3 在线漂移补偿

沉积设备的长期漂移是膜厚预测精度的最大威胁。我们采用以下策略实现在线漂移补偿:

  • 滑动窗口更新:维护最近N片(通常N=50-200)的量测数据,定期(如每天或每50片)对模型进行增量学习,使模型持续跟踪设备状态变化。
  • 漂移检测:利用Page-Hinkley检测或CUSUM算法监控预测残差的均值偏移。一旦检测到显著漂移(如PM后的突变),自动触发模型的快速适应机制。
  • 分段建模:以PM事件为分割点,将数据划分为不同的设备状态段。每段内部使用局部模型,段与段之间通过迁移学习共享知识。这种方法特别适合PVD靶材更换后的快速模型适配。

三、工程实践案例

某8英寸晶圆厂在PECVD SiNx薄膜沉积工序的AI膜厚预测实践:

工艺背景:PECVD SiNx作为钝化层,膜厚目标值3000Å,均匀性要求 ≤ 2%(1σ,49点)。设备为双腔体配置,每日产能约300片。

数据准备:采集6个月历史数据,包含约45,000片晶圆的设备传感器数据(200+通道,1Hz采样)和对应的膜厚量测数据(抽检率约15%,约6,750片有量测值)。

模型结果:

预测目标 模型 测试集精度
平均膜厚 LightGBM MAPE 0.68%
49点膜厚 多任务DNN MAPE 0.92%
均匀性(%) LightGBM MAE 0.15%

部署收益:

  • 膜厚虚拟全检覆盖,量测抽检率从15%降至5%(仅用于模型校准),每月节省量测机台约120小时。
  • 发现并修正了两个腔体之间的系统性膜厚偏差(约45Å),此前因抽检频率不足未被察觉。
  • 新Recipe开发阶段,利用AI模型进行参数寻优,试片量减少约60%。

四、CVD与PVD的建模差异

虽然AI建模的基本框架相似,但CVD和PVD工艺在实践中存在一些重要差异:

  • 特征重要性不同:CVD中温度和流量是最关键的特征,PVD中功率和压力的权重更高。
  • 漂移模式不同:CVD的漂移通常较为平缓(Shower Head堵塞是渐进过程),PVD的靶材消耗导致的漂移更加显著且非线性。
  • 数据质量差异:PVD过程通常较短(几十秒到几分钟),时序特征的信息密度低于CVD过程(几分钟到十几分钟),需要更精细的特征工程。

五、总结

CVD/PVD膜厚均匀性的AI预测已经从学术研究走向工程落地。关键成功因素包括:完善的数据采集基础设施(EDA)、合理的特征工程(融合静态参数与时序波形)、以及有效的在线漂移补偿机制。对于计划引入AI膜厚预测的工厂,建议从单一工序的平均膜厚预测起步,逐步扩展到均匀性预测和全晶圆Map预测。

了解更多

集芯科技 NeuroBox E3200 产线智能控制平台,内置CVD/PVD膜厚预测引擎,支持多任务学习建模、在线漂移自适应、全晶圆Map重建,覆盖PECVD、LPCVD、ALD、PVD全品类沉积工艺。

下载技术白皮书 | 预约产品演示

💬 在线客服 📅 预约演示 📞 021-58717229 contact@ai-mst.com
📱 微信扫码
企业微信客服

扫码添加客服