集芯科技 · 技术白皮书
NeuroBox D:AI驱动的半导体设备机械设计平台
从P&ID图纸到3D SolidWorks装配体的全自动生成
版本 1.6 · 2026年3月 · 迈烁集芯(上海)科技有限公司
摘要
半导体设备的机械设计长期依赖工程师手工完成”P&ID图纸→3D装配体”的转化,一台设备从方案设计到完整装配模型通常需要数周。NeuroBox D 采用四引擎架构(检测引擎 + BOM推理引擎 + 多视图投影引擎 + 装配引擎),结合视觉大模型(VLM)、约束求解和SolidWorks API集成,实现了从2D工程图到3D原生装配文件的自动化生成。实测数据显示,10人设计团队可节省60%工时,装配约束推理准确率达93%。本白皮书详细介绍NeuroBox D的系统架构、核心算法和工程实现。
目录
一、行业痛点:为什么机械设计需要AI
半导体设备的机械设计是一个高度依赖经验的工程过程。一台典型的CVD或PVD设备包含数百个零部件——阀门、管件、气体面板(Gas Panel)、传感器、密封件、紧固件等——它们之间的装配关系受到物理约束(接口尺寸匹配)、工艺约束(气体兼容性)和企业规范(标准件选型偏好)的多重约束。
当前设计流程的核心瓶颈在于:
- P&ID到BOM的转化依赖人工:工程师需要逐个识别P&ID上的设备符号,查找对应的标准件,确定密封件、紧固件等辅件——这是一个重复且易出错的过程
- 3D装配建模耗时长:确定BOM后,工程师需要在SolidWorks中逐一插入零件、定义装配约束(配合关系),一个Gas Panel的3D模型可能需要3-5天
- 经验难以沉淀:资深工程师知道”MFC后面应该配IGS Block还是VCR Block”,但这些知识存在个人脑子里,新人需要数月才能积累
- 设计变更代价高:P&ID修改后,整个BOM和3D模型需要人工重新核对,变更管理效率低
NeuroBox D 的设计目标是:让AI完成从P&ID到3D装配体的全流程,工程师只需审核和微调。
二、系统架构:四引擎流水线
NeuroBox D 采用微服务架构,核心流水线由四个独立引擎组成,每个引擎负责一个阶段的任务:
↓
① 检测引擎 (Detection Engine)
目标检测 + 视觉大模型(VLM) + 开放词汇检测 → 识别设备符号、管路连接、BOM表格
↓
② BOM推理引擎 (BOM Inference Engine)
L1硬规则 + L2物理约束 + L3学习约束 → 推理完整BOM(设备+辅件+紧固件)
↓
③ 多视图投影引擎 (MultiView Projection Engine)
视图检测 + 跨视图特征匹配 + 坐标对齐 → 2D坐标映射到3D空间
↓
④ 装配引擎 (Assembly Engine)
约束布局优化 + 智能管路寻路 + SolidWorks API → 输出原生.sldasm文件
四个引擎作为独立的独立微服务运行,通过REST API通信,可独立扩展和更新。整体通过容器化编排,支持一键部署。
支撑服务
- 关系数据库:存储零件库元数据、装配规则、历史学习数据
- 高速缓存:缓存零件几何信息和推理中间结果
- 对象存储:存储上传的图纸、生成的3D文件和零件库
- Web前端:可视化操作界面,集成3D预览
三、检测引擎:多模型融合的图纸理解
检测引擎的任务是”看懂”P&ID图纸——识别出图纸上的每一个设备符号、管路连接关系和标注信息。
3.1 多模型融合策略
单一检测模型难以覆盖P&ID图纸的多样性(不同客户、不同标准、不同绘图风格),因此我们采用三模型融合方案:
- 专用目标检测模型(快速定位):基于监督学习,经过P&ID符号数据集微调的深度学习检测模型,负责快速定位图纸上的设备区域。支持MFC、Filter、Regulator、Valve等30+类设备符号
- 视觉大语言模型(语义理解):VLM负责理解检测区域的语义信息——设备型号、接口规格、标注文字。VLM的优势在于能处理非标准标注和手写修改
- 开放词汇检测模型(开放检测):文本驱动的目标检测,用于识别训练集中未覆盖的新设备类型。工程师只需描述设备特征(如”带有三角形符号的减压阀”),即可检测
3.2 One-Shot学习
当客户使用非标准P&ID符号时,传统方法需要重新标注数据并训练模型。NeuroBox D 支持One-Shot学习:客户只需提供一个符号样本,系统通过特征嵌入和相似度匹配,即可在后续图纸中识别该符号。
3.3 辅助检测模块
- 管路追踪器(Pipe Tracer):基于图像处理的管线跟踪,识别设备之间的连接关系
- 表格检测器(Table Detector):自动提取P&ID图纸中附带的BOM表格信息
- 智能分割:用于多视图图纸的视图分割(正视图/顶视图/侧视图边界识别)
四、BOM推理引擎:三层约束推理
检测引擎识别出设备后,BOM推理引擎负责推理出完整的物料清单——不仅包括图纸上标注的设备,还包括密封件、紧固件、管接头等辅件。这些辅件在P&ID上通常不画出,但在实际装配中不可缺少。
4.1 三层约束架构
L1 — 硬约束(Hard Constraints)
基于行业标准和产品规格的确定性规则,不允许违反:
- MFC设备必须搭配对应接口的Gas Block(IGS或VCR,取决于接口类型)
- Filter设备需要特定材质的密封圈(由介质决定:腐蚀性气体用PTFE,惰性气体用Viton)
- 接口尺寸必须匹配:1/4″管路不能直接接1/2″设备,需要Reducer
L2 — 软约束(Soft Constraints)
基于物理规律和工程常识的约束,有优先级但允许在特殊情况下调整:
- 端口数量验证:Block的端口数必须 ≥ 连接设备数
- 空间布局约束:相邻设备间距需满足维护空间要求
- 重力方向约束:液体管路需考虑坡度和排空点
L3 — 学习约束(Learned Constraints)
从客户历史设计数据中自动学习的模式:
- 客户A在类似场景中偏好使用品牌X的阀门而非品牌Y
- 特定工艺段(如Gas Panel入口段)通常使用Weld连接而非VCR
- 某类设备组合在历史项目中总是成对出现
L3约束是”数据飞轮”的核心实现——客户使用越多,L3约束越丰富,BOM推理越准确。
4.2 两轮推理流程
第一轮:基于检测结果和L1/L2约束,生成初始BOM(主设备+直接辅件)
第二轮:基于第一轮BOM和L3学习约束,补充间接辅件(紧固件数量、密封件规格、管接头类型),并做完整性校验
五、多视图投影引擎:2D到3D的坐标映射
当输入是装配图(而非P&ID)时,图纸上通常包含多个视图(正视图、顶视图、侧视图)。多视图投影引擎负责将2D视图中的坐标信息融合,还原设备在3D空间中的位置。
核心算法
- 视图检测:自动识别图纸上的视图类型和边界,支持标准三视图和等轴测视图
- 特征匹配:基于优化匹配算法的跨视图特征关联——在正视图中识别的设备A,对应顶视图中的哪个轮廓?
- 坐标对齐:建立各视图坐标系与3D世界坐标系的映射关系,将2D位置投影到3D空间
六、装配引擎:从布局优化到原生SLDASM输出
装配引擎是整个流水线的最后一站,也是技术难度最高的环节——将BOM和3D位置信息转化为可直接在SolidWorks中打开和编辑的原生装配文件。装配模型通过监督学习的方式训练:以工程师历史完成的装配案例作为标注数据,学习零件间的配合关系、约束类型和空间布局模式,从而实现自动化装配推理。
6.1 3D布局优化
使用约束满足(CP-SAT)求解器进行零件布局:
- 约束条件:零件不重叠、接口对齐、维护空间预留、管路最短化
- 优化目标:最小化整体占地面积和管路总长度
- 支持机柜约束:零件必须布置在指定机柜尺寸范围内
6.2 管路自动布线
基于智能寻路算法的管路自动布线:
- 在3D空间中构建栅格地图,已放置零件区域标记为障碍
- 对每对需要连接的端口自动搜索最短无碰撞路径
- 管路交叉优化:检测交叉点并自动调整高度分层
6.3 装配面智能匹配:SolidWorks自动装配的关键技术
这是NeuroBox D区别于其他”伪自动化”工具的核心技术。
NeuroBox D 通过对零件库的深度预处理,建立了每个零件装配面的唯一标识映射。装配时,系统自动匹配零件之间的对应装配面,通过SolidWorks API直接创建精确的配合关系(Mate),全程后台自动执行,无需人工干预。
这意味着生成的SLDASM文件包含完整的配合关系定义,工程师打开后看到的是一个正确装配的模型,而不是一堆散落的零件。
6.4 SolidWorks集成
通过自研远程通信模块与SolidWorks实例通信:
- 远程连接运行SolidWorks的Windows工作站
- 发送装配指令序列(插入零件→定义配合→生成子装配→导出STEP)
- 输出文件通过Web界面下载
七、数据飞轮:越用越精准的学习机制
NeuroBox D 不是一个静态的规则引擎。它内置了三个层面的持续学习机制:
7.1 检测模型迭代
通过One-Shot学习,每次客户标注一个新的P&ID符号,都会扩展检测模型的能力范围。积累足够样本后,可触发YOLO模型的增量训练,进一步提升识别精度。
7.2 BOM规则学习
工程师对系统推理的BOM进行审核和修改后,修改记录会自动反馈到L3学习约束:
- “系统推荐了IGS Block,工程师改成了VCR Block”→ 学习到该场景下VCR更合适
- “系统遗漏了一个Gasket,工程师手动补上”→ 学习到该设备组合需要额外密封件
7.3 装配模式积累
每次成功生成的装配体及其配合关系,都会入库作为历史参考。当遇到类似的设备组合时,系统可以直接复用历史配合方案,而不必从零推理。
八、部署架构与性能指标
8.1 部署方式
NeuroBox D 支持两种部署模式:
- 私有化部署:全部服务部署在客户内网,图纸和模型数据不出厂。通过容器化一键部署,需配备一台GPU服务器(运行检测引擎的VLM模型)和一台运行SolidWorks的Windows工作站
- 混合部署:检测引擎和推理引擎部署在集芯云端,装配引擎和SolidWorks集成部署在客户侧,图纸通过加密通道传输
8.2 性能指标
| 指标 | 数值 | 说明 |
|---|---|---|
| P&ID符号识别率 | 94% | ISO 10628-2标准符号集,含One-Shot补充 |
| BOM推理准确率 | 93% | 使用10+项目数据学习后的L3约束加持 |
| 标准件库规模 | 500+ | 原生SolidWorks零件,含装配面预处理 |
| 端到端处理时间 | 5-15分钟 | 从P&ID上传到SLDASM生成(视复杂度) |
| 支持输入格式 | PDF/PNG/DWG/DXF | AutoCAD原生格式直接导入 |
| 输出格式 | .sldasm / .step | SolidWorks原生装配文件或通用STEP格式 |
九、客户价值与应用场景
9.1 目标客户
- 半导体设备制造商(OEM):需要频繁设计Gas Panel、Chamber组件等模块,设计周期直接影响设备交付
- 设备集成商:根据终端客户的P&ID定制设备配置,需要快速生成3D方案
- 设计院/研究所:承接多个设备设计项目,设计人力是核心瓶颈
9.2 典型应用场景
场景一:Gas Panel快速设计
客户提供P&ID图纸和标准件库,NeuroBox D在15分钟内生成完整的Gas Panel 3D装配体,包含所有阀门、管件、Block、密封件和紧固件的正确装配关系。工程师审核微调后即可用于后续的结构设计和出图。
场景二:设计变更快速响应
P&ID修改后(如增加一路气体),重新上传修改后的图纸,系统自动识别变更内容,增量更新BOM和3D模型,而非从零生成。
场景三:新人快速上手
新入职的机械工程师无需花数月学习”哪个设备配什么辅件”——这些知识已经沉淀在系统的L1/L2/L3约束中。新人可以直接使用系统生成初始方案,通过审核和修改逐步积累经验。
9.3 投资回报
实测案例:某半导体设备企业10人设计团队
- 单个Gas Panel设计时间:从3-5天缩短至0.5天(含审核)
- BOM核对时间:从2小时缩短至15分钟
- 设计团队整体工时节省:60%
- 设计错误率(漏件/错件):降低75%
相关资源
© 2025-2026 迈烁集芯(上海)科技有限公司 · ai-mst.com · 本白皮书内容受知识产权保护