2026年04月12日

半导体工厂自动化路线图:从手动到Lights-Out的五个阶段

半导体Fab自动化五阶段:手动→半自动(GEM200)→全自动(GEM300/AMHS)→Lights-Out(AI闭环)→AI自适应。含自评方法、技术要求和升级路径。

核心结论

半导体工厂自动化可分为5个成熟度阶段:手动→半自动→全自动→Lights-Out→AI自适应。目前全球90%的300mm晶圆厂处于Stage 3(全自动),仅不到5%的产线达到Stage 4(Lights-Out)水平。迈烁集芯NeuroBox产品线覆盖Stage 2到Stage 5的关键转型节点——E5200帮助工厂从半自动迈向全自动,E3200实现全自动到Lights-Out的跨越,NeuroBox D则为各阶段设备设计提供AI自动化支持。

为什么需要一张自动化路线图?

如果你问一位Fab厂长”你的工厂自动化水平如何?”,答案往往是含糊的——”我们有MES”、”OHT在跑”、”SPC也做了”。但自动化不是一个有或无的二元问题,它是一个连续的、有明确阶段的演进过程

没有路线图,投资就是盲目的。你可能花了几千万上了FDC系统,却发现设备连GEM300都没达标,数据根本采不上来。你可能引进了AI算法,却没有足够的历史数据来训练模型。

这篇文章给出一张清晰的五阶段路线图,帮你定位当前位置、明确下一步、合理分配投资

Stage 1:手动操作(Manual)

特征描述

这是自动化的”原始阶段”。操作员用手搬运晶圆盒(cassette),手动启动工艺配方(recipe),在设备屏幕上逐条读取报警信息。工厂依赖纸质记录和Excel表格来追踪产品批次。

通信方面几乎为零,设备之间互不交流。最多有基础的SECS-I串口连接用于数据记录,但没有实时的主机通信。工程师要了解设备状态,必须走到机台前亲自查看。

典型场景

  • 大学和研究机构的R&D实验线
  • 非常老旧的150mm/200mm生产线
  • 小型MEMS或化合物半导体工厂的早期阶段

关键技术指标

  • 通信协议:无或基础SECS-I(RS-232串口)
  • 数据基础设施:本地文件存储,Excel/纸质记录
  • 人员需求:每台设备 1-2 名操作员值守
  • 典型投资:极低(几乎无IT/自动化投入)
  • 良率管理:事后统计,靠经验判断

Stage 2:半自动(Semi-Auto)

特征描述

工厂开始”联网”了。设备达到GEM200(SEMI E30)合规,能与Host系统进行基本的SECS/GEM通信。MES(制造执行系统)上线,可以追踪批次、管理工单、记录设备状态。

但这个阶段的核心矛盾是:系统采集了数据,决策权仍在人。SPC图表生成了,但需要工程师手动审查和判定。FDC报警了,但处置方案靠经验。Recipe管理有了版本控制,但选择哪个recipe、参数怎么调,还是人说了算。

物料搬运仍以人工或半自动方式为主——操作员用推车或简易传输装置在设备间移动cassette。

典型场景

  • 成熟的200mm量产线(DRAM、模拟IC、功率器件)
  • 中小型Foundry的主力产线
  • 正在向300mm过渡的封测厂

关键技术指标

  • 通信协议:SECS-II / GEM(SEMI E5/E30),TCP/IP HSMS
  • 核心系统:MES、基础SPC、Recipe Management System(RMS)
  • 数据基础设施:关系型数据库,批次级数据采集
  • 人员需求:每4-6台设备1名操作员
  • 典型投资:MES + EAP基础版 ¥500万-2000万
  • 良率管理:SPC人工判图,基础统计分析

Stage 3:全自动(Full Auto)

特征描述

这是当今300mm先进晶圆厂的标准配置。设备全面达到GEM300(SEMI E40/E87/E90/E94/E116)合规,AMHS(自动物料搬运系统)通过OHT(天车)在洁净室内自动传输FOUP。

MES不仅追踪批次,还负责自动派工(dispatch)——根据优先级、设备状态、工艺约束自动决定下一个lot去哪台机。EAP(设备自动化程序)管理recipe下载、数据采集和过程监控。FDC和SPC实现自动化判定,异常设备可以自动hold。

但请注意关键限制:工艺调整仍然需要人工干预。当VM模型显示某个参数偏移,或者SPC连续违规时,最终决定”怎么调”、”调多少”还是由工艺工程师做出。R2RRun-to-Run)控制在部分工序上试用,但覆盖率通常不超过20%。

典型场景

  • TSMC、Samsung、Intel、SK hynix的300mm主力线
  • 中国大陆新建的12英寸线(中芯国际、华虹、长鑫等)
  • 先进封装(CoWoS等)生产线

关键技术指标

  • 通信协议:GEM300全套标准 + Interface A(SEMI E133)
  • 核心系统:MES + EAP + RMS + FDC + SPC + YMS + AMHS
  • 数据基础设施:时序数据库,实时采集(100ms-1s粒度),数据湖初步建设
  • 人员需求:每10-20台设备1名操作员(洁净室内)
  • 典型投资:全套CIM系统 ¥5000万-2亿
  • 良率管理:自动SPC/FDC + 离线分析 + 初步VM试点

Stage 4:Lights-Out(熄灯工厂)

特征描述

这是每一个Fab厂长的梦想——操作员几乎不需要进入洁净室。”Lights-Out”并非字面意义上关灯生产,而是指工厂能在极少人工干预下持续运转。

与Stage 3的根本区别在于:AI接管了工艺决策。R2R控制覆盖80%以上的关键工序,自动根据前一步的量测结果调整下一步的recipe参数。VM(虚拟量测)提供100%的虚拟全检能力,将物理量测频率降低到每批次抽检,或者完全依赖VM结果做实时判定。

预测性维护(Predictive Maintenance)取代了传统的定期PM。系统通过监控设备传感器数据的微弱漂移,在故障发生前2-7天预警,并自动生成最优维护方案。设备可以自诊断并主动请求PM,而不是等到跑了固定片数才停机。

异常处理也由AI驱动:当FDC检测到异常pattern时,系统不仅报警,还会自动执行预定义的响应策略——可能是微调参数、暂停批次、或者将lot路由到备选设备。

典型场景

  • TSMC部分先进节点产线(3nm/2nm部分模块)
  • Samsung平泽工厂的个别示范线
  • Intel的”灯塔工厂”项目
  • 大多数先进Fab的目标状态(尚未完全实现)

关键技术指标

  • 通信协议:GEM300 + EDA/Interface A(高频数据采集)+ OPC UA/MQTT(边缘计算)
  • 核心系统:AI-driven R2R + VM + Predictive Maintenance + 智能调度 + 数字孪生
  • 数据基础设施:实时流处理平台、大数据湖、GPU集群(模型训练/推理)
  • 人员需求:每50-100台设备1名值守人员(主要做异常处理)
  • 典型投资:在Stage 3基础上额外 ¥1亿-5亿(AI平台 + 数据基础设施)
  • 良率管理:AI自动控制 + 100% VM全检 + 自适应recipe优化

Stage 5:AI自适应(AI-Adaptive)

特征描述

如果说Stage 4是”AI辅助人做决策”,Stage 5就是“工厂自己优化自己”

这个阶段的核心特征是跨设备、跨工序、跨维度的全局优化。不再是每台设备独立做R2R,而是整条产线作为一个整体进行联合优化——上游的刻蚀参数变化,下游的CMP recipe自动跟着调整。

优化目标也不再是单一的良率,而是良率、产能、能耗、成本四个维度的帕累托最优。比如,在电价波动的情况下,系统可能会主动调整排产顺序,把高能耗工序安排在谷电时段。在设备老化加速时,自动降低产能以维持良率,同时通知采购准备备件。

数字孪生在这个阶段不再是”看看的Dashboard”,而是真正的决策工具。系统在执行任何重大工艺变更前,先在数字孪生中模拟100次what-if场景,确认最优方案后再下发到物理设备。

最关键的特征是自学习——系统的性能随着时间推移不断提高,不需要人工重新训练模型或调整规则。新产品导入时,AI可以从历史上类似产品的工艺数据中自动推导出初始recipe,大幅缩短ramp-up时间。

典型场景

  • 目前仍属于行业前沿愿景
  • 个别模块在TSMC、Samsung的先进线上有早期试点
  • IMEC等研究机构的概念验证项目
  • 预计2028-2032年可能出现首个接近Stage 5的完整产线

关键技术指标

  • 通信协议:统一数据总线 + 边缘-云协同 + 语义数据模型
  • 核心系统:工厂级AI大脑 + 数字孪生 + 强化学习引擎 + 自适应控制系统
  • 数据基础设施:PB级数据湖、实时联邦学习、边缘AI推理集群
  • 人员需求:极少量AI/数据科学家和工艺专家(无需传统操作员)
  • 典型投资:在Stage 4基础上额外 ¥3亿-10亿(含软件研发)
  • 良率管理:自优化、自进化、自愈的全闭环系统

五阶段对比总览

维度 Stage 1
手动
Stage 2
半自动
Stage 3
全自动
Stage 4
Lights-Out
Stage 5
AI自适应
通信标准 无/SECS-I GEM200 GEM300 GEM300 + EDA 统一数据总线
物料搬运 人工搬运 人工+推车 AMHS/OHT 全自动AMHS 智能AMHS+AGV
工艺控制 手动设定 人工决策 自动执行
人工调优
AI自动调优
R2R全覆盖
全局自优化
自学习进化
量测策略 人工抽检 SPC人工判图 自动SPC+FDC VM 100%全检 自适应量测
维护模式 故障维修 定期PM 定期PM+
状态监控
预测性维护 自愈系统
人员密度 1-2人/台 1人/4-6台 1人/10-20台 1人/50-100台 极少量专家
数据采集 无/手抄 批次级 实时(秒级) 高频(毫秒级) 全维度实时流
典型OEE <50% 55-65% 70-82% 85-92% >93%

如何评估你的工厂处于哪个阶段?

自动化阶段不是一个非此即彼的标签——大多数工厂同时跨越多个阶段。你的刻蚀线可能在Stage 3,但扩散炉还在Stage 2;光刻区的AMHS已经是Stage 3水平,但量测设备的数据采集还停留在Stage 2。

评估时应关注以下5个核心问题

1. 设备通信合规性

你的设备支持哪一代SEMI标准?如果大部分设备还只支持SECS-I或基础GEM200,那整体水平最多是Stage 2。通信标准是自动化的地基——没有标准化的设备通信,上层的所有AI和自动化都是空中楼阁。

相关阅读:GEM200 vs GEM300:半导体设备通信标准完全对比

2. 数据采集完整度

你的FDC能采集到多少比例的设备参数?数据的时间粒度是批次级还是实时?如果关键工艺参数的采集覆盖率低于80%,就很难支撑Stage 3以上的自动化水平。

3. 决策自动化程度

当SPC报警时,是人去看还是系统自动处置?当R2R建议调整参数时,是自动执行还是等工程师批准?决策权在哪里,自动化就在哪个阶段

4. 异常响应速度

从设备出现异常到生产线做出响应,需要多长时间?Stage 2可能需要30分钟到数小时(等工程师接到电话),Stage 3可以缩短到5-10分钟(自动报警+人工处置),Stage 4则是秒级(AI自动响应)。

5. 知识沉淀方式

工艺经验是在工程师脑子里,还是在系统里?如果一个资深工程师离职会导致产线波动,说明你还没到Stage 3。如果系统能自己从数据中学习到新的优化规则,那已经接近Stage 5了。

阶段转型的关键挑战与路径

Stage 2 → Stage 3:标准化是第一关

这是大多数中国大陆晶圆厂正在经历的转型。核心挑战不在于买多少系统,而在于设备通信的标准化改造。很多老旧设备需要加装EAP Gateway才能达到GEM300合规,光这一项的改造成本就可能占到总投入的30%-40%。

建议路径:

  1. 先做设备通信审计——哪些设备已经GEM300合规,哪些需要改造
  2. 从关键工序(光刻、刻蚀、薄膜)开始部署EAP和FDC
  3. AMHS建设与CIM系统同步推进
  4. Smart DOE(智能实验设计)快速验证和优化工艺参数

Stage 3 → Stage 4:数据质量决定AI天花板

Stage 4的核心是AI驱动的工艺控制,而AI的效果完全取决于数据质量。许多Fab在Stage 3积累了海量数据,但数据质量问题严重:传感器漂移未校正、元数据缺失、不同时期的数据格式不一致。

建议路径:

  1. 建立数据质量管理体系——数据清洗、校验、标注的SOP
  2. 从VM起步——它对数据量要求低(10-15片即可建模),风险为零(不改工艺)
  3. 逐步扩展R2R覆盖——从单设备到多设备联动
  4. 部署预测性维护——优先覆盖故障成本最高的设备

Stage 4 → Stage 5:需要范式转变

从Stage 4到Stage 5不是简单的”多加几个AI模型”,而是需要整个工厂的计算架构和控制架构的范式转变。单设备的AI优化要升级为跨设备、跨工序的全局优化,这需要统一的数据模型、实时的决策引擎和可靠的数字孪生。

目前来看,这个转型还需要5-8年的技术积累。但提前布局数据基础设施和AI团队是明智的。

NeuroBox产品如何助力每个阶段转型

迈烁集芯的NeuroBox产品线是围绕这张自动化路线图设计的——不是一个”大而全”的平台,而是针对每个关键转型节点的精准解决方案

产品 定位 核心能力 对应转型
NeuroBox E5200 设备调机交付 Smart DOE将试片量减少80%,10-15片数据快速完成参数优化;加速设备通信合规达标 Stage 2 → 3
NeuroBox E3200 产线在线AI VM虚拟量测 + R2R自动控制 + EIP(设备智能平台),实现工艺决策自动化 Stage 3 → 4
NeuroBox D AI设计云平台 P&ID到SolidWorks装配体自动生成,设备设计周期从7-10天缩短到数小时 全阶段通用

E5200:让设备先”达标”

很多设备商交付的设备在工艺参数上并未达到最优状态,客户需要花大量时间做DOE调机。NeuroBox E5200的Smart DOE功能用AI算法将传统的50-100片试片工作量压缩到10-15片,在Stage 2到Stage 3的转型中扮演”加速器”角色。

E5200S版本还提供设备通信合规评估和改造方案,帮助老旧设备达到GEM300标准——这是进入Stage 3的前提条件。

E3200:让工艺决策自动化

当工厂已经在Stage 3运转,大量数据在手但仍然依赖人工做工艺决策时,NeuroBox E3200就是下一步。它的VM模块从10-15片数据建模起步,逐步覆盖全线量测点;R2R模块自动调整recipe参数,将工艺波动控制在规格限内。

E3200不是要一步到位实现Lights-Out,而是渐进式地将决策权从人转移到AI——先在低风险工序验证,积累信任后逐步扩展。

NeuroBox D:设备设计的自动化基础

无论工厂处于哪个阶段,设备本身都需要设计和迭代。NeuroBox D通过AI自动将P&ID图纸转化为完整的SolidWorks 3D装配体,将设计周期从数天压缩到数小时。对于Stage 4和Stage 5追求的”快速设备迭代”和”自适应设备设计”,NeuroBox D提供了不可或缺的底层能力。

制定你的自动化升级计划

最后给出一个实操性的建议框架:

第一步:诚实评估

用上面的5个问题评估你的工厂。不要看”最好的那条线”,看“最差的那个环节”——木桶效应在自动化领域同样适用。你的自动化水平由最薄弱的环节决定。

第二步:只跨一级

不要试图从Stage 2直接跳到Stage 4。每一级的跨越都需要技术积累、团队成长和文化变革。扎实地走好一步,比激进地规划三步更有效。

第三步:先见效后扩展

从ROI最高、风险最低的切入点开始。根据迈烁集芯服务数十家半导体客户的经验:

  • Stage 2→3:从Smart DOE + EAP部署切入,3-6个月见效
  • Stage 3→4:从VM(虚拟量测)切入,1-2周建模,零风险验证
  • Stage 4→5:从单工序的跨设备联动优化切入,逐步扩展

第四步:投资数据,而不只是系统

很多Fab在自动化投资中犯的最大错误是”买系统忘了建数据”。系统是手段,数据是资产。确保每一笔投资都在增加你的数据资产——更全的采集、更好的质量、更标准的格式。数据质量不好,再先进的AI也白搭。

想知道你的工厂在哪个阶段?

迈烁集芯提供免费的自动化成熟度评估。告诉我们你的设备清单和现有系统,我们帮你制定最优的升级路径。

预约免费评估 →

集芯
迈烁集芯技术团队
由迈烁集芯(上海)科技有限公司工程团队撰写。团队成员包括半导体制程工程师、AI/ML研究员和设备自动化专家,在中国、新加坡、台湾及美国的晶圆厂拥有超过50年的累计行业经验。

常见问题

半导体工厂自动化分几个阶段?
5个阶段:①手动操作(SECS-I/R&D)→②半自动(GEM200/成熟200mm)→③全自动(GEM300/AMHS/标准300mm)→④Lights-Out(AI R2R+VM全检+预测维护)→⑤AI自适应(跨设备跨工艺全局优化)。目前90%的300mm Fab在Stage 3,不到5%达到Stage 4。
从半自动升级到全自动需要什么?
核心三件事:①设备通信从GEM200升级到GEM300(E87载具管理+E90基板追踪);②部署AMHS自动搬运系统(OHT天车);③MES从辅助工具升级为生产调度核心。投资00万-000万,周期12-24个月。
Lights-Out工厂需要哪些AI能力?
4个核心AI能力:①VM虚拟量测实现100%全检(替代3-5%抽检);②R2R自动调参(无需工程师手动调Recipe);③预测性维护(PM前预警而非定期PM);④异常自动处置(FDC报警后自动决策hold/continue)。
开始体验
迈烁集芯 AI 平台

AI定义制造——从设备设计到产线智能,一站式半导体AI解决方案。

💬 在线客服 📅 预约演示 📞 021-58717229 contact@ai-mst.com
📱 微信扫码
企业微信客服

扫码添加客服