AI 在半导体制造中的真实落地:一份给工程师的诚实地图
大量工业 AI 项目卡在 PoC 到生产之间。真正决定 AI 能否在半导体设备和 Fab 落地的,不是模型大小,而是能不能接入设备、拿到可信数据、让工程师愿意使用。
过去一年,很多工业企业都被同一句话推着走:把 AI 用起来,提高效率。但真正做设备、工艺、CIM、APC、FDC 和能源管理的人都知道,从 PoC 到生产之间还有很长一段路。AI 演示可以很快,真正进设备、进产线、进工程师工作流,难度完全不同。
这篇文章不讨论泛泛的工业 AI 概念,而是从半导体制造的真实链条出发,看 AI 已经在哪些环节进入生产,哪些仍然是厂商声明或试点,以及为什么很多项目卡在最后一公里。
我们的核心判断是:AI 在半导体行业的机会不只在更大的模型,而在能接入设备、理解工艺、被工程师信任的落地层 AI。
1. AI 已经在哪些环节进入生产
如果把半导体链条摊开看,AI 的进展是真实的,但成熟度很不均衡。证据最硬的地方主要在两端:芯片设计和计算光刻。
在计算光刻和 OPC 环节,TSMC、Synopsys、NVIDIA 已经联合宣布将 NVIDIA cuLitho 投入生产。相关材料中提到的 40-60 倍加速、20-50% 成本或周期改善属于三方官方 PR 和联合测试口径,不等同于独立审计结果。[3] IMEC 相关研究也提供了部分独立技术佐证,但仍应谨慎区分实验结果、厂商联测和量产审计。[4]
在芯片设计和 EDA 环节,Google AlphaChip 经 Nature 论文发表,并在 Google TPU v5e、v5p、Trillium 等项目中使用。[5] 这说明强化学习和 AI 优化已经进入部分真实设计流程。但关于 AlphaChip 是否已经被独立证明强于全部商用工具,学术界仍有争议。[6] 所以更稳妥的说法是:AI 已经进入部分先进芯片设计流程,但不能简单宣传为“全面超越工程师或商用 EDA”。
商用 EDA AI 工具也已经有具名客户 PR,例如 Synopsys DSO.ai、Cadence Cerebrus 等。但这类收益通常来自厂商或客户新闻稿,适合作为采用趋势的证据,不适合作为独立验证的 ROI 结论。[7]
对设备商来说,这些案例证明 AI 进生产不是 PPT。但它们离设备制造、P&ID、SolidWorks、调机、FDC、VM、R2R 仍有距离。真正贴近设备商和 Fab 现场的机会,在更靠近设备和工艺的环节。
2. 越靠近设备现场,证据越软,机会也越真实
前道过程控制、虚拟量测、故障检测、缺陷分类、数字孪生和能耗优化,是最接近 Fab 和设备现场的 AI 战场。这里的真实状态可以概括为一句话:产品能力在成熟,但公开量化证据大多仍是厂商口径。
TSMC 公开披露过使用 NVIDIA Metropolis/TAO 做缺陷分类,使用 cuML 做 APC 分析,但相关公开材料没有给出量化改善数据。[8] Applied Materials 的 E3 平台很早就覆盖 APC、FDC、R2R 等功能,2008 年发布稿中提到工艺能力和 OEE 改善,但那是厂商发布稿里的历史口径,不应被当作新的独立验证。[9]
虚拟量测 VM 也需要讲清楚。一篇 2024 年同行评审综述把 VM 定义为辅助 APC 的工具:用设备状态、工艺变量和稀疏真实量测来预测产品质量。[10] 换句话说,VM 的诚实定位不是“完全替代物理量测”,而是“补充物理量测,并用真实量测持续校准”。
先进封装、良率闭环、数字孪生和自主工厂也在快速推进。例如 Siemens 和 PDF Solutions 讨论过 EOL 测试到 Fab 良率闭环,但公开口径更接近仿真验证和方案声明。[12] SK hynix 也提出过面向 2030 的自主工厂路线图,但它仍应被理解为路线图和探索方向,不是已经全面落地的自主 Fab。[13]
这些并不削弱 AI 的价值。相反,它说明了真正的空间在哪里:谁能把 AI 从厂商演示和离线分析带到具体设备、具体工序、具体工程任务里,谁就抓住了产业落地的机会。
3. 真正卡住落地的,不是算法,是集成、数据、信任
把宣传语言拨开,半导体 AI 落地的核心瓶颈不是“模型够不够大”,而是三件非常工程化的事:集成、数据、信任。
集成:设备原本不是为 AI 分析而设计的
大量设备和产线系统基于 SECS-I、SECS-II、GEM 等标准完成通信、状态上报和设备自动化。这套体系对半导体制造极其重要,但它主要服务事件、状态、命令和自动化控制,并不是为高频传感数据、复杂分析和 AI 工作流而设计。
SEMI 后来定义 EDA / Interface A,就是为了支持更高吞吐的数据采集和更丰富的数据访问场景。[14] 这解释了为什么很多 AI 项目不是卡在模型,而是卡在数据接口、设备协议、老系统集成、现场权限和数据质量。
对设备商来说,如果设备要变得更智能,第一道问题不是“用哪个大模型”,而是:数据怎么出得来、接得上、对得齐、能持续稳定地用。
数据:基准测试不等于产线可用
很多论文可以在公开数据集上取得高准确率,但公开论文很少披露真实产线部署、长期漂移表现和 ROI。以晶圆缺陷识别为例,许多研究仍主要基于 WM-811K 等公开基准展开。[15]
公开基准有价值,但它和真实 Fab 之间还隔着小样本、数据孤岛、工艺保密、标注成本、设备差异和工况漂移。工程师真正关心的问题不是“论文准确率多高”,而是“我这条线、这台设备、这个配方、这个小样本条件下能不能用”。
信任:工程师不会轻易让黑盒接管设备
在高风险制造场景中,黑盒模型的不透明会带来安全、信任和运维风险。[16] 另一个更实际的问题是漂移。工业现场不是静态环境,传感器、设备状态、材料批次、腔体条件、维护状态都会变化。研究显示,多种算法在漂移下都会出现性能下降。[17]
所以 AI 落地不是换一个更大的模型就结束了。真正要解决的是:模型怎么知道自己失准,怎么提示工程师,怎么解释判断依据,怎么在工程师确认后再闭环。
这就是“工程师在环”的意义。半导体设备 AI 的第一阶段,不应该追求黑盒全自动,而应该先追求可解释、可复核、可回放、可逐步闭环。
4. 为什么设备端侧 AI Agent 是下一阶段机会
如果把前面的事实连起来,就会得到一个很清楚的判断:下一阶段的价值不只在云端模型,而在装进设备、贴近工艺、靠近工程师的端侧 AI Agent。
传统 CIM、MES、EAP 更偏生产执行、设备自动化和系统集成。很多工业 AI 项目是在这些系统外面再接一层分析工具。但设备端侧 AI Agent 的区别在于,它把数据采集、模型推理、异常判断、工程师复核尽量靠近设备本身。
这对半导体设备商尤其重要。设备商不只是卖硬件,未来还要回答客户的新问题:
- 这台设备能不能更快调起来?
- 能不能少用 dummy wafer?
- 能不能把工程师经验沉淀进交付流程?
- 能不能在客户现场更早发现 drift 和异常?
- 能不能把设备数据以安全、可控、可解释的方式变成 AI 能用的资产?
这也是“AI-enabled equipment”的机会。设备出厂不再只是硬件和控制软件,而是带着可部署、可验证、可持续优化的智能能力。
5. 最先落地的三个设备商场景
设备设计:P&ID 到 SolidWorks 原生装配
设备设计中有大量重复但高度依赖经验的工作,例如 P&ID 理解、气路连接关系、客户零件库调用、有限空间布局、装配约束处理和工程复核。这里的目标不是让 AI 取代工程师,而是让 AI 先生成可复核的工程草案,再由工程师确认。
这类场景适合端侧 AI,因为它靠近工程师工作站、客户零件库和企业设计规范,也更强调可编辑、可复核、可追溯。
设备调机:Smart DOE 和工程师经验沉淀
调机目标明确、成本高、反馈闭环清晰,是 AI 比较容易切入的设备商场景。AI 可以帮助工程师设计实验、记录过程、减少无效试片、总结参数窗口,但前提仍然是保留工程师判断,不能直接把黑盒建议当成最终 recipe。
产线在线:VM、R2R、FDC 更靠近设备端
VM、R2R、FDC 的价值在于提前发现偏移、减少停机、提升稳定性。但它们必须接得上设备数据,并且能解释、能追踪、能和现有 MES、EAP、APC、SPC 体系协同。
这类系统不应该只是“云端分析报表”,而应该逐步靠近设备端,成为工程师现场判断的一部分。
6. 工程师判断 AI 方案的 12 个问题
下次有人推 Fab AI、设备 AI 或工业大模型,不要只问“准确率多少”,可以先问这 12 个问题:
- 能不能接入现有 SECS-II、GEM、EDA / Interface A,还是要重新布线?
- 起步需要多少标注数据?小样本条件下能不能开始?
- 数据能不能本地或边缘部署,不出厂?
- 漂移后系统怎么知道自己失准?有没有告警、回放和再训练机制?
- 判断结果能不能解释给工程师看?
- 是黑盒自动闭环,还是给建议后由工程师确认?
- VM 是替代量测,还是补充量测并用真实量测校准?
- 所谓 ROI 来自仿真、基准数据、厂商 PR,还是真实产线长期数据?
- 上线要改多少 MES、EAP、APC、recipe 和现场流程?
- 它解决的是具体设备和具体工序,还是泛泛声称“全自主”?
- 出错时有没有兜底、回退和人工确认机制?
- ROI 怎么量化:试片量、调机时间、OEE、良率、能耗,基线是什么?
能落地的 AI 经得起这些问题。经不起这些问题的,往往只是演示系统。
7. 迈烁集芯的判断
我们的判断是:半导体 AI 的下一阶段机会,不只在更大的模型,而在能接入设备、理解工艺、被工程师信任的落地层 AI。
迈烁集芯围绕这个判断设计产品:
- NeuroBox D:面向设备设计,聚焦 P&ID 到 3D 空间布局与 SolidWorks 原生装配,沉淀客户零件库和工程规则。
- NeuroBox E5200 / E5200V:面向调机、交付和视觉检测,支持 Smart DOE、调机建模、参数窗口分析和设备视觉异常识别。
- NeuroBox E3200:面向产线在线智能,覆盖 VM、R2R、FDC、SPC、预测性维护等设备端场景。
- NeuroEnergy:面向工厂能耗优化,覆盖 HVAC、CDA、PCW、UPW、真空等大宗辅助系统与设备能耗。
这些方案适合从历史数据回放、离线复盘和单机 POC 开始验证,再逐步走向产线。原因很简单:半导体制造的 AI 落地,必须先在可控范围内建立工程师信任,再谈规模化闭环。
参考来源
- [1] RL 晶圆厂排程仿真研究:https://arxiv.org/abs/2302.07162
- [2] RL 排程真实工业数据复现:https://arxiv.org/abs/2505.11135
- [3] NVIDIA cuLitho 与 TSMC/Synopsys/NVIDIA 联合声明:https://nvidianews.nvidia.com/news/tsmc-synopsys-nvidia-culitho
- [4] IMEC 相关预印本:https://arxiv.org/abs/2602.15036
- [5] AlphaChip Nature 论文:https://www.nature.com/articles/s41586-024-08032-5 ; DeepMind 博客:https://deepmind.google/blog/how-alphachip-transformed-computer-chip-design/
- [6] AlphaChip 争议与复现讨论:https://arxiv.org/abs/2302.11014 ; https://arxiv.org/abs/2411.10053
- [7] 商用 EDA AI 客户 PR:Synopsys https://news.synopsys.com/2023-02-07-AI-designed-Chips-Reach-Scale-with-First-100-Commercial-Tape-outs-Using-Synopsys-Technology ; Cadence https://www.cadence.com/en_US/home/company/newsroom/press-releases/pr/2022/cadence-cerebrus-ai-based-solution-delivers-transformative.html
- [8] TSMC 与 NVIDIA 关于 ADC/APC 的公开材料:https://nvidianews.nvidia.com/news/nvidia-and-tsmc-bring-ai-into-fabs-to-advance-semiconductor-design-and-manufacturing
- [9] Applied Materials E3 发布稿:https://ir.appliedmaterials.com/news-releases/news-release-details/applied-materials-launches-breakthrough-e3-equipment-and-process/
- [10] 虚拟量测综述,Expert Systems with Applications, DOI 10.1016/j.eswa.2024.123559:https://www.sciencedirect.com/science/article/abs/pii/S095741742400424X
- [11] Onto Innovation Dragonfly G5:https://investors.ontoinnovation.com/news/news-details/2026/Onto-Innovation-Launches-Dragonfly-G5-Inspection-System/
- [12] Siemens 与 PDF Solutions 良率闭环材料:https://news.siemens.com/en-us/siemens-tessent-pdf-ic-yield/
- [13] SK hynix 与 NVIDIA 多年技术合作声明:https://news.skhynix.com/multi-year-tech-partnership-with-nvidia/
- [14] SEMI 设备自动化标准演进:https://www.semi.org/en/blogs/the-evolution-of-semiconductor-equipment-automation-standards-from-the-1980s-to-now
- [15] 晶圆缺陷公开基准相关同行评审研究:https://pmc.ncbi.nlm.nih.gov/articles/PMC11773255/
- [16] 高风险制造中的黑盒风险:https://link.springer.com/article/10.1007/s42452-025-07908-z
- [17] 工业数据漂移研究:https://arxiv.org/abs/2112.06986
- [18] 格创东智国产 CIM 与案例:https://www.getech.cn/ ; https://www.getech.cn/en/newdetail-1201.html
- [19] SMIC 创始人与中微 CEO 呼吁国内 Fab 测试国产工具的媒体报道:https://www.tomshardware.com/tech-industry/semiconductors/smic-founder-and-amec-ceo-urge-chinese-fabs-to-test-domestic-chip-tools-on-production-lines
这篇属于 NeuroBox D 设计自动化场景
获取一份 NeuroBox D 设计自动化评估,看看 P&ID 到 SolidWorks 原生装配体如何接入您的工程流程。
把 P&ID 图纸类型、客户零件库现状、3D 空间边界和装配规则发给我们。工程团队会先判断适合从哪一个机械设计环节切入,再给出落地建议。
- 适合设备商、气路/机械设计、CAD 自动化和工程复核团队
- 可从 P&ID、SolidWorks 零件库、装配规则和空间边界开始
- 优先评估旁接式本地 D 盒子,不要求上传机密图纸到公有云