原标题:上海交大:基于机器学习的轻合金压铸关键工艺参数分析 随着汽车制造技术的更新迭代,以镁、铝代钢,以铸代冲得到行业的重视。在全球双碳政策达成基本共识的背景下,轻量化、低碳、节能得到广泛关注。大型复杂薄壁结构件减重效果好、制造效率高,是汽车轻量化与制造高效化发展的必然趋势,当前超大型一体化集成设计产品正在被各主机厂开发和应用。高压铸造作为大铸件高效成形方法之一也存在若干技术壁垒,与传统压铸件合格率(90%以上)相比,大铸件成品率仅有50%~70%。大型薄壁一体化压铸件在压铸过程中,存在铸件各部位铸造条件不均匀、影响铸件品质的因素众多(30~50种)、参数与质量间的映射关系复杂高维等问题,很难通过传统的“经验+试错”法来对铸件质量进行精确的预测与控制。随着现代信息技术与人工智能的发展,基于数据驱动的机器学习方法已经逐渐融入先进材料研究与制造过程,推动了材料制造智能化的发展。在轻合金研发与制造领域,多项研究证明了机器学习在建立材料“参数-性能”关系的有效性,但这些研究大多基于少量样本和参数的简单制造方法,无法适用于工艺参数众多、影响因素复杂的大型一体化压铸的实际工业制造过程。针对此问题,本研究建立基于工业压铸生产线的“压铸工艺参数-铸件下线质量”关系大数据库,通过大数据驱动的机器学习的方法建立铸件质量预测模型,获得15种压铸关键工艺参数与铸件品质的影响权重排序,为大型一体化压铸过程智能控制提供参考。 图文结果 为了建立压铸工艺参数与铸件质量之间的大数据预测模型,通过制造执行系统(MES)采集与记录了2452条经过异常值去除的铝合金前机舱压铸生产线数据样本,并通过Matlab软件提取相关工艺参数形成数据集,数据集结构见图1。每一条样本由27个压铸机本体工艺参数(模型输入)与1个铸件质量等级(模型输出)组成。工艺参数由压铸机集成的传感器采集,直接汇入工厂MES系统;质量等级为铸件下线后由人工检查铸件表面各类缺陷后判断所得的等级,人工输入MES系统。质量等级分为0、1、2,其中0级代表报废,即该铸件外观缺陷较为明显、数量较多,不满足合格标准,下线后直接淘汰;1级代表待定,即铸件外观缺陷数量中等,需要通过后续检验来确定是否淘汰;2级代表合格品,即外观缺陷较少,符合产品合格标准。采用MySQL数据库软件对数据集进行储存与检索。 为了降低冗余参数或者噪音参数对模型预测准确性产生影响,需要首先对工艺参数进行筛选与降维。主成分分析(PCA)等降维算法是应对维度爆炸的常用方法,但经过主成分分析后的特征可解释性较差,难以分析不同工艺参数在压铸过程中所产生的影响。因此,本研究结合专家经验与数据波动分析对27个工艺参数进行预筛选降维,在消除冗余特征与噪音过大参数的同时保持可解释性。经过预筛选后,选用与铸件品质相关程度较高、数据分布较为优质的15个工艺参数进行机器学习训练集的建立,见表1。
图1 压铸大数据集结构
表1 筛选后的压铸工艺参数 本研究通过Matlab R2021a软件中集成的K近邻、支持向量机、袋装树以及BP神经网络模型对数据集进行训练与测试,并通过超参数调节,分别获得了各模型最优的训练结果。模型超参数与预测准确率见表2。可以看出,4种模型均能获得极高的训练集准确率,表示此4种机器学习模型均具备极高的高纬度非线性分类能力。但是K近邻、支持向量机以及BP神经网络3个模型的测试集准确率却非常低下,产生了较为严重的过拟合,缺乏对未知数据的泛化推广能力。相对而言,袋装树模型的测试集准确率达60.9%,泛化能力显著高于其他几种机器学习模型。袋装树模型属于集成学习方法的一种,原理见图2。该模型利用多个决策树模型(Decision Tree)分别对多个子数据集进行训练学习,通过投票的方法进行袋装(Bagging),将多个准确率低下的弱分类器组合成一个具有较强准确率的强分类器。和BP神经网络、支持向量机等单分类器模型相比,集成算法有效减少了数据波动的随机性与高噪声所带来的准确率下降,也减少了过拟合的风险,从而提升了模型总体预测准确性与泛化能力。因此,本研究选择具有最优预测能力的袋装树模型作为关键工艺参数分析的预测模型。
表2 不同机器学习模型的超参数设置与模型预测准确率
图2 袋装树模型原理示意图
图3 袋装树模型训练损失与决策树数量的关系曲线
表3 测试集混淆矩阵 通过对数据集进行均值与欧氏距离计算,可以获得3类数据的等效半径以及两个类均值中心之间的间距,见表4。R0、R1、R2分别代表报废、待定、合格3类铸件的工艺参数的等效半径,D01、D02、D12分别代表3类铸件工艺参数均值中心之间的距离。显然,3类的等效半径均大于3个中心间距,说明3类数据之间存在较大的重叠区域,分类模型若要获得较高的训练集准确率,则需要对重叠区域数据进行细致分割,一定会产生严重的过拟合现象,导致模型对于已知训练集的预测能力极强,而对于未知样本的泛化推广能力较为薄弱。由于铸件品质不仅受到压铸机本体的27个主要工艺参数的影响,同样受到模温机、真空机、喷涂设备、点冷机等多个周边设备上众多工艺参数的影响,忽略这些因素是导致数据分布产生缺陷的主要原因。若需要进一步有效提升模型预测性能,则必须将压铸周边设备的重要工艺参数进行集成,建立更复杂更庞大的预测模型。然而,这些周边设备的工艺参数众多,可达800个以上,目前尚未有完善的方法来对这些工艺参数进行集成分析与降维,是未来对于压铸智能化控制领域将要面对的主要挑战与重要研究内容。
表4 数据集类聚中心间距与类等效半径
(a)相对重要度 (b)灵敏度图4 结论 (1)以铝合金大型薄壁压铸件生产线中获取的工业大数据为研究对象,通过袋装树方法建立了压铸关键工艺参数与铸件下线质量之间的多参数映射模型,可以初步实现对前机舱等压铸件进行下线质量初筛,减少人工成本。模型的训练集预测准确率为100%,测试集准确率为60.9%,测试集容忍准确率为77.3%,报废、待定和合格3类铸件预测的容忍真正率(TTPR)分别为80.6%、68.3%、84.4%。 (2)通过相对重要度与灵敏度的计算,获得了15种压铸关键工艺参数对铸件品质影响程度的大小,为大型薄壁压铸件压铸工艺参数的优化与控制策略提供参考。 本文作者:
王鑫 汪星辰 彭立明 付彭怀 本文来自:《特种铸造及有色合金》杂志,《压铸周刊》战略合作伙伴 |