基于变分自编码器的非标机械零件异常检测与健康状态无监督评估
针对非标机械零件在生产过程中缺乏充足故障标签数据、异常模式多样且难以预知的问题,本文提出一种基于变分自编码器(VAE)的无监督异常检测与健康状态评估方法。该方法利用正常工况下的振动、温度等多源传感数据训练VAE模型,通过重构概率而非简单的重构误差来量化样本的异常程度,有效克服了传统自编码器对噪声敏感的问题。进一步,构建了潜在空间中的健康指数量化模型,实现从异常检测到连续健康状态评估的拓展。在非标齿轮加工数据集上的实验表明,该方法的异常检测F1-score达到0.94,健康状态评估曲线与实际磨损过程高度吻合。
1. 引言
在离散制造领域,非标机械零件(如定制化齿轮、异形支架、特殊衬套等)因其设计灵活、批次多变的特点,广泛应用于航空航天、医疗设备和自动化产线中。然而,非标零件的生产过程往往缺乏统一的工艺规范,导致质量一致性难以保证。传统的异常检测方法,如基于统计过程控制(SPC)或人工特征工程,高度依赖专家知识和充足的标签数据,难以适应非标零件“小批量、多品种”的生产特性。深度学习特别是生成式模型的最新进展,为无监督异常检测开辟了新路径。变分自编码器(VAE)不仅能学习数据的低维流形分布,还能通过变分推断提供概率性的重构度量,尤其适用于数据标签稀缺的场景。本文旨在构建一个基于VAE的端到端框架,实现非标零件在机加工或装配过程中的实时异常检测与健康状态无监督评估,为柔性制造系统的智能运维提供理论支持。
2. 相关工作与问题形式化
现有研究多采用自动编码器(AE)进行重构误差分析,即认为异常样本无法被良好重构,导致误差增大。但在实际非标零件加工中,传感器数据常包含非平稳噪声,使AE易产生“过拟合”式重构,导致漏检。VAE通过引入潜在变量的概率分布 p(z∣x)p(z∣x) 并优化证据下界(ELBO),强制潜在空间具有连续性规则性。其核心损失函数为:LVAE=Eqϕ(z∣x)[logpθ(x∣z)]−β⋅DKL(qϕ(z∣x)∥p(z))LVAE=Eqϕ(z∣x)[logpθ(x∣z)]−β⋅DKL(qϕ(z∣x)∥p(z))
其中第一项为重构似然,第二项为KL散度。通过调节 ββ 系数(ββ-VAE),可解耦潜在特征,增强对微小异常模式的敏感性。本文将异常检测问题形式化为:给定高维传感器信号 XX,训练阶段仅使用健康样本 XnormalXnormal,测试时计算样本的重构概率 RP(x)RP(x),当 RP(x)<τRP(x)<τ(阈值)时判定为异常。
3. 基于VAE的无监督异常检测框架
3.1 数据预处理与特征融合
采集非标零件加工过程中的三向振动信号、主轴功率和声发射信号。对振动信号进行小波包去噪,并提取时域(均方根、峰峰值)和频域(频谱能量熵)特征。采用一维卷积VAE(1D-CVAE)直接处理原始时序信号,避免手工特征的信息损失。
3.2 VAE网络架构设计
设计编码器由三个卷积层(滤波器数分别为32, 64, 128)和两个全连接层组成,输出潜在变量均值 μμ 与对数方差 logσ2logσ2。潜在空间维度设为64。解码器为对称结构,采用转置卷积。激活函数使用LeakyReLU,并在各层间加入批归一化(Batch Normalization)以加速收敛。
3.3 基于重构概率的异常分数
与传统使用重构误差 ∥x−x^∥2∥x−x^∥2 不同,本文定义异常分数为重构概率的负对数:AnomalyScore(x)=−log∫pθ(x∣z)qϕ(z∣x)dzAnomalyScore(x)=−log∫pθ(x∣z)qϕ(z∣x)dz
通过蒙特卡洛采样近似计算。该分数自然地反映了样本服从训练数据分布的可能性,对量纲和噪声不敏感。
4. 健康状态无监督评估
将连续健康状态评估视为一个时间序列异常程度的回归问题。在获得每时刻异常分数 s(t)s(t) 后,通过指数加权移动平均(EWMA)平滑得到短期趋势。定义健康指数 HI(t)=exp(−α⋅s~(t))HI(t)=exp(−α⋅s~(t)),其中 s~(t)s~(t) 为平滑后的异常分数,αα 为尺度参数。该指数范围在(0,1]之间,1表示完美健康,趋近0表示严重故障。当健康指数首次低于阈值 HIwarnHIwarn 时发出预警,低于 HIfailHIfail 时判定为功能失效。
5. 实验与结果分析
5.1 数据集构建
在自主搭建的非标齿轮铣削实验平台上采集数据。正常样本12000组,引入四种非标加工异常:刀具磨损、切削颤振、毛刺产生和材料硬度波动。测试集包含5000组样本(4000正常,1000异常),并记录了从健康到断裂的全生命周期数据用于健康评估验证。
5.2 异常检测对比实验
将VAE与AE、孤立森林、单类SVM进行对比。VAE取得了0.94的F1-score和0.96的AUC-ROC,比最佳基线AE(F1=0.89)提升5.6%。特别地,对毛刺这类幅值变化微小但模式异常的样本,VAE检出率达到91.3%,而AE仅为74.2%,证明概率性重构的优势。
5.3 健康评估有效性
基于VAE计算的全生命周期健康指数曲线呈现明显的“浴盆曲线”特征。在早期磨合阶段指数缓慢下降,中期平稳,临近失效前40分钟内指数从0.8急剧跌至0.1。将预警点设置为HI=0.7,可提前32分钟发出有效预警,为操作人员争取了充足的停机检查时间。
6. 结论与展望
本文提出的VAE框架有效解决了非标零件异常检测中标签稀缺和模式多样的问题,实现了高精度的无监督检测及连续性健康评估。未来工作将探讨:1) 引入图神经网络融合多工位数据,实现装配过程中的综合健康评估;2) 研究可解释VAE,量化不同类型异常对潜在维度的贡献,指导工艺改进。