一、研究背景與意義
在工業(yè)4.0時(shí)代,高端復(fù)雜設(shè)備向智能化、系統(tǒng)化快速演進(jìn),其運(yùn)行安全性與可靠性成為工業(yè)生產(chǎn)的核心訴求。設(shè)備在長(zhǎng)期運(yùn)行中,受磨損、隨機(jī)沖擊、負(fù)載變化等惡劣工況影響,性能會(huì)逐漸退化,甚至引發(fā)嚴(yán)重安全事故。故障預(yù)測(cè)與健康管理(PHM)技術(shù)應(yīng)運(yùn)而生,其中設(shè)備剩余壽命(RUL)預(yù)測(cè)是PHM的核心環(huán)節(jié),可為維修決策提供關(guān)鍵依據(jù),對(duì)保障設(shè)備安全運(yùn)行、降低運(yùn)維成本具有重要意義。
傳統(tǒng)基于深度學(xué)習(xí)的RUL預(yù)測(cè)方法多依賴監(jiān)督學(xué)習(xí)框架,需大量含完整壽命標(biāo)簽的“理想數(shù)據(jù)”訓(xùn)練模型。然而,實(shí)際工業(yè)場(chǎng)景中,完整壽命周期數(shù)據(jù)稀缺,大量存在的是片段式、無(wú)完整標(biāo)簽的“非理想數(shù)據(jù)”。這種數(shù)據(jù)特性導(dǎo)致傳統(tǒng)模型泛化性弱、預(yù)測(cè)精度低。此外,現(xiàn)有時(shí)序模型存在兩大局限:一是對(duì)高頻噪聲敏感,易導(dǎo)致預(yù)測(cè)波動(dòng);二是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的模型采用順序計(jì)算,效率低且難以捕捉長(zhǎng)時(shí)程特征。因此,開發(fā)能有效利用非理想數(shù)據(jù)的高效RUL預(yù)測(cè)方法成為工業(yè)界與學(xué)術(shù)界的迫切需求。
二、主要研究?jī)?nèi)容
(一)模型整體架構(gòu)
SCAN模型采用“編碼-解碼”雙階段架構(gòu),核心由時(shí)序?qū)Ρ染幋a器與壽命預(yù)測(cè)注意力解碼器組成。編碼器負(fù)責(zé)從非理想數(shù)據(jù)中提取深層退化特征,無(wú)需依賴壽命標(biāo)簽;解碼器基于編碼特征實(shí)現(xiàn)RUL預(yù)測(cè),通過注意力機(jī)制捕捉時(shí)序依賴。兩者通過彈性權(quán)重共享策略實(shí)現(xiàn)協(xié)同優(yōu)化,形成端到端的預(yù)測(cè)框架。
(二)時(shí)序?qū)Ρ染幋a器設(shè)計(jì)
編碼器旨在無(wú)標(biāo)簽條件下提取設(shè)備退化的時(shí)序特征,由非線性編碼模塊與自回歸整合模塊構(gòu)成。
非線性編碼模塊基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)構(gòu)建,包含多個(gè)卷積層、批標(biāo)準(zhǔn)化層與ReLU激活函數(shù)。其功能是將原始監(jiān)測(cè)數(shù)據(jù)(如振動(dòng)信號(hào)、磨損參數(shù))映射為高維隱變量,捕捉局部退化特征。通過卷積操作的局部感受野特性,有效過濾高頻噪聲,增強(qiáng)特征的魯棒性。
自回歸整合模塊基于門控循環(huán)單元(GRU)設(shè)計(jì),整合歷史隱變量序列,生成含長(zhǎng)時(shí)程時(shí)序信息的退化特征向量。GRU通過重置門與更新門動(dòng)態(tài)控制信息傳遞,既能保留關(guān)鍵歷史信息,又能遺忘冗余噪聲,解決傳統(tǒng)RNN的梯度消失問題,更精準(zhǔn)地刻畫設(shè)備性能隨時(shí)間的退化趨勢(shì)。
編碼器的訓(xùn)練通過“對(duì)比預(yù)測(cè)任務(wù)”實(shí)現(xiàn):利用當(dāng)前時(shí)刻的特征向量預(yù)測(cè)未來k步的隱變量,通過噪聲對(duì)比估計(jì)損失函數(shù)優(yōu)化模型。該過程強(qiáng)化了特征的時(shí)序自相關(guān)性,使模型無(wú)需壽命標(biāo)簽即可學(xué)習(xí)設(shè)備退化規(guī)律。
解碼器負(fù)責(zé)將編碼后的退化特征映射為RUL預(yù)測(cè)值,核心是多頭自注意力機(jī)制,解決傳統(tǒng)時(shí)序模型的效率與長(zhǎng)依賴捕捉問題。
為彌補(bǔ)自注意力機(jī)制對(duì)時(shí)序順序不敏感的缺陷,解碼器首先引入位置編碼,通過正弦余弦函數(shù)組合為每個(gè)時(shí)間步嵌入位置信息,確保模型理解時(shí)序先后關(guān)系。
多頭自注意力機(jī)制將特征向量映射為查詢(Q)、鍵(K)、值(V)矩陣,通過計(jì)算Q與K的相似度得到注意力分?jǐn)?shù),再與V加權(quán)求和生成輸出。“多頭”設(shè)計(jì)使模型能并行學(xué)習(xí)不同子空間的時(shí)序依賴,增強(qiáng)對(duì)復(fù)雜退化模式的建模能力。相較于RNN的順序計(jì)算,自注意力機(jī)制支持并行處理,大幅提升計(jì)算效率,同時(shí)通過全局依賴建模,捕捉長(zhǎng)時(shí)程退化特征。
解碼器末端通過線性層整合注意力特征,輸出最終RUL預(yù)測(cè)值,實(shí)現(xiàn)從特征到預(yù)測(cè)結(jié)果的映射。
為解決編碼器與解碼器的協(xié)同優(yōu)化問題,本文提出基于彈性權(quán)重共享(EWC)的訓(xùn)練模式,分三階段實(shí)現(xiàn)模型優(yōu)化。
第一階段,用非理想數(shù)據(jù)預(yù)訓(xùn)練編碼器,通過對(duì)比預(yù)測(cè)損失函數(shù)優(yōu)化參數(shù),保存預(yù)訓(xùn)練模型,使其具備獨(dú)立提取退化特征的能力。
第二階段,將預(yù)訓(xùn)練編碼器作為解碼器的前置模塊,引入EWC策略微調(diào)編碼器參數(shù)。通過計(jì)算編碼器參數(shù)的費(fèi)希爾信息,衡量參數(shù)對(duì)特征提取的重要性:對(duì)關(guān)鍵參數(shù)施加強(qiáng)約束,避免其在解碼器訓(xùn)練中被過度修改;對(duì)次要參數(shù)放松約束,使其適應(yīng)預(yù)測(cè)任務(wù)。這種差異化約束保障了編碼器特征提取能力的穩(wěn)定性。
第三階段,用少量含標(biāo)簽的理想數(shù)據(jù)訓(xùn)練解碼器,以均方誤差(MSE)為損失函數(shù),優(yōu)化解碼器參數(shù)的同時(shí),通過EWC約束同步微調(diào)編碼器,實(shí)現(xiàn)兩者的高效協(xié)同。
(五)實(shí)驗(yàn)驗(yàn)證設(shè)計(jì)
為驗(yàn)證方法有效性,實(shí)驗(yàn)選取兩類典型工業(yè)設(shè)備場(chǎng)景:軸承與城軌列車輪對(duì),采用公開與實(shí)際數(shù)據(jù)集開展驗(yàn)證。
軸承數(shù)據(jù)集包括XJTU-SY全壽命數(shù)據(jù)集與CWRU非完整壽命數(shù)據(jù)集,涵蓋不同轉(zhuǎn)速、負(fù)載下的外圈、內(nèi)圈、保持架故障樣本;輪對(duì)數(shù)據(jù)集來自5列城軌列車,含不圓度、輪緣高度等磨損參數(shù),具有采樣間隔不均、參數(shù)趨勢(shì)不一致的非理想特性。
實(shí)驗(yàn)采用滑動(dòng)窗口分段與正則化預(yù)處理數(shù)據(jù),以均方根誤差(RMSE)為評(píng)估指標(biāo),將SCAN與雙向LSTM、GCU-Transformer、多尺度CNN等主流方法對(duì)比,并通過消融實(shí)驗(yàn)驗(yàn)證各模塊作用。
三、關(guān)鍵技術(shù)解析
(一)非理想數(shù)據(jù)的特征提取技術(shù)
針對(duì)非理想數(shù)據(jù)(片段化、無(wú)標(biāo)簽)的特性,時(shí)序?qū)Ρ染幋a器通過“無(wú)監(jiān)督特征學(xué)習(xí)+時(shí)序建模”雙機(jī)制實(shí)現(xiàn)有效特征提取。
非線性編碼模塊利用CNN的局部感知能力,對(duì)原始信號(hào)進(jìn)行多層卷積與激活,過濾高頻噪聲與無(wú)關(guān)干擾,提取局部退化特征(如振動(dòng)信號(hào)中的沖擊成分、磨損參數(shù)的微小變化)。批標(biāo)準(zhǔn)化層穩(wěn)定訓(xùn)練過程,ReLU激活函數(shù)引入非線性,增強(qiáng)特征表達(dá)能力。
自回歸整合模塊通過GRU的門控機(jī)制,將局部特征按時(shí)間序列整合,形成含長(zhǎng)時(shí)程信息的退化特征向量。例如,在軸承退化過程中,早期振動(dòng)信號(hào)變化微弱,GRU可累積多時(shí)刻的微小變化,捕捉性能緩慢退化的趨勢(shì);后期信號(hào)突變時(shí),又能快速更新狀態(tài),反映加速退化階段的特征。
對(duì)比預(yù)測(cè)訓(xùn)練通過“預(yù)測(cè)未來特征”任務(wù),迫使模型學(xué)習(xí)時(shí)序相關(guān)性:若當(dāng)前特征與未來特征關(guān)聯(lián)緊密(如退化趨勢(shì)一致),模型預(yù)測(cè)誤差小;反之誤差大。這種機(jī)制使模型無(wú)需壽命標(biāo)簽,即可自主學(xué)習(xí)設(shè)備從健康到失效的退化規(guī)律。
(二)時(shí)序依賴建模與并行計(jì)算技術(shù)
壽命預(yù)測(cè)注意力解碼器通過多頭自注意力機(jī)制,解決傳統(tǒng)時(shí)序模型的長(zhǎng)依賴捕捉與計(jì)算效率問題。
位置編碼為每個(gè)時(shí)間步嵌入獨(dú)特的位置信息,使模型能區(qū)分“早期-中期-晚期”的時(shí)序順序,例如在輪對(duì)磨損數(shù)據(jù)中,即使某兩天的磨損值相同,模型也能通過位置編碼識(shí)別其處于退化前期還是后期。
多頭自注意力機(jī)制通過多組Q、K、V矩陣并行計(jì)算注意力,每組專注于不同的時(shí)序關(guān)系。例如,一組可能關(guān)注相鄰時(shí)刻的短期變化(如每日磨損增量),另一組關(guān)注跨周/月的長(zhǎng)期趨勢(shì)(如磨損速率的季節(jié)性波動(dòng))。通過拼接多組結(jié)果,模型可全面捕捉復(fù)雜的時(shí)序依賴。
并行計(jì)算特性使注意力機(jī)制無(wú)需像RNN那樣按時(shí)間步順序處理數(shù)據(jù),而是一次性計(jì)算所有時(shí)刻的關(guān)聯(lián),大幅提升效率。實(shí)驗(yàn)顯示,自注意力解碼器的迭代速度比GRU快45%,比LSTM快31%,尤其適用于大規(guī)模工業(yè)監(jiān)測(cè)數(shù)據(jù)。
(三)編碼-解碼協(xié)同優(yōu)化技術(shù)
彈性權(quán)重共享(EWC)策略通過差異化約束參數(shù),實(shí)現(xiàn)編碼器與解碼器的有機(jī)協(xié)同。
費(fèi)希爾信息量化了編碼器參數(shù)對(duì)特征提取的重要性:例如,卷積層中負(fù)責(zé)捕捉振動(dòng)信號(hào)特定頻率成分的參數(shù),對(duì)退化特征提取至關(guān)重要,其費(fèi)希爾信息值高,EWC對(duì)其施加強(qiáng)約束,確保微調(diào)時(shí)不丟失關(guān)鍵特征提取能力;而某些輔助參數(shù)的費(fèi)希爾信息值低,允許較大調(diào)整以適應(yīng)預(yù)測(cè)任務(wù)。
這種機(jī)制平衡了“保留編碼器能力”與“適配解碼任務(wù)”的矛盾:編碼器預(yù)訓(xùn)練獲得的非理想數(shù)據(jù)特征提取能力被保留,解碼器則通過少量標(biāo)簽數(shù)據(jù)學(xué)習(xí)如何將這些特征映射為RUL,實(shí)現(xiàn)“無(wú)監(jiān)督特征學(xué)習(xí)+有監(jiān)督預(yù)測(cè)”的高效結(jié)合。
四、創(chuàng)新點(diǎn)提煉
(一)理論框架創(chuàng)新:時(shí)序?qū)Ρ葘W(xué)習(xí)與注意力機(jī)制的深度融合
突破傳統(tǒng)監(jiān)督學(xué)習(xí)對(duì)理想數(shù)據(jù)的依賴,提出“時(shí)序?qū)Ρ葘W(xué)習(xí)+注意力機(jī)制”的聯(lián)合框架,首次將時(shí)序?qū)Ρ葘W(xué)習(xí)范式應(yīng)用于非理想數(shù)據(jù)的RUL預(yù)測(cè)。
時(shí)序?qū)Ρ葘W(xué)習(xí)通過無(wú)監(jiān)督方式從非理想數(shù)據(jù)中挖掘退化規(guī)律,解決標(biāo)簽稀缺問題;注意力機(jī)制通過并行計(jì)算與全局依賴建模,提升預(yù)測(cè)效率與精度。兩者結(jié)合形成“特征提取-時(shí)序建模-預(yù)測(cè)輸出”的端到端解決方案,為非理想數(shù)據(jù)場(chǎng)景下的壽命預(yù)測(cè)提供了新范式。
(二)技術(shù)方法創(chuàng)新:非理想數(shù)據(jù)的無(wú)監(jiān)督特征學(xué)習(xí)機(jī)制
設(shè)計(jì)時(shí)序?qū)Ρ染幋a器,實(shí)現(xiàn)無(wú)需壽命標(biāo)簽的退化特征提取。傳統(tǒng)方法需完整壽命數(shù)據(jù)標(biāo)注退化階段,而本方法通過“預(yù)測(cè)未來特征”的自監(jiān)督任務(wù),使模型自主學(xué)習(xí)時(shí)序相關(guān)性,例如在無(wú)標(biāo)簽的軸承振動(dòng)片段中,可自動(dòng)識(shí)別“輕微磨損-中度磨損-嚴(yán)重磨損”的特征差異。
這種機(jī)制不僅降低了對(duì)數(shù)據(jù)標(biāo)注的依賴,還能利用海量非理想數(shù)據(jù)(如設(shè)備日常運(yùn)行的片段監(jiān)測(cè)數(shù)據(jù)),提升模型的泛化能力,尤其適用于難以獲取全壽命數(shù)據(jù)的高端設(shè)備(如軌交列車輪對(duì))。
(三)模型設(shè)計(jì)創(chuàng)新:高效時(shí)序依賴建模的注意力解碼器
針對(duì)傳統(tǒng)RNN順序計(jì)算效率低、長(zhǎng)依賴捕捉弱的問題,設(shè)計(jì)基于多頭自注意力的解碼器:
1. 多頭子空間并行學(xué)習(xí),可同時(shí)捕捉短期波動(dòng)與長(zhǎng)期趨勢(shì),例如在輪對(duì)數(shù)據(jù)中,既能關(guān)注每日磨損的微小變化,又能捕捉月度磨損速率的變化規(guī)律;
2. 并行計(jì)算架構(gòu)大幅提升效率,解決工業(yè)大數(shù)據(jù)實(shí)時(shí)預(yù)測(cè)的時(shí)效性需求;
3. 動(dòng)態(tài)權(quán)重分配使模型聚焦關(guān)鍵退化階段,例如在軸承失效前的加速退化期,注意力分?jǐn)?shù)自動(dòng)提高,增強(qiáng)對(duì)故障預(yù)警的敏感性。
(四)訓(xùn)練策略創(chuàng)新:彈性權(quán)重共享的協(xié)同優(yōu)化模式
提出EWC策略,通過量化參數(shù)重要性實(shí)現(xiàn)編碼器與解碼器的協(xié)同優(yōu)化。傳統(tǒng)聯(lián)合訓(xùn)練易導(dǎo)致“災(zāi)難性遺忘”(解碼器訓(xùn)練破壞編碼器已學(xué)能力),而EWC對(duì)關(guān)鍵參數(shù)施加保護(hù),次要參數(shù)靈活調(diào)整,例如在軸承與輪對(duì)跨場(chǎng)景遷移時(shí),編碼器中通用的退化特征提取參數(shù)被保留,與設(shè)備相關(guān)的特異性參數(shù)被調(diào)整,平衡了模型的通用性與場(chǎng)景適配性。
五、實(shí)驗(yàn)結(jié)果與分析
(一)軸承剩余壽命預(yù)測(cè)實(shí)驗(yàn)
采用XJTU-SY與CWRU數(shù)據(jù)集,將SCAN與雙向LSTM、GCU-Transformer、多尺度CNN對(duì)比,結(jié)果顯示:
SCAN的平均RMSE為0.0686,較最優(yōu)對(duì)比方法(GCU-Transformer)降低34%。在#1-1、#2-3等典型樣本中,SCAN的預(yù)測(cè)曲線更貼近真實(shí)值,尤其在退化加速階段,對(duì)故障的敏感性更高。
消融實(shí)驗(yàn)驗(yàn)證:含時(shí)序?qū)Ρ染幋a器的模型預(yù)測(cè)曲線振蕩幅度降低40%,表明其有效過濾高頻噪聲;自注意力解碼器的迭代速度(201.77s/次)顯著快于GRU(368.46s/次)與LSTM(293.97s/次),驗(yàn)證了并行計(jì)算的效率優(yōu)勢(shì)。
(二)城軌列車輪對(duì)剩余壽命預(yù)測(cè)實(shí)驗(yàn)
基于5列列車的輪對(duì)磨損數(shù)據(jù)集,SCAN的平均RMSE為6.4371,除038號(hào)列車外均優(yōu)于對(duì)比方法。輪對(duì)退化過程較平穩(wěn),SCAN仍能精準(zhǔn)捕捉磨損趨勢(shì),例如在39車1號(hào)車廂2軸樣本中,對(duì)輪緣厚度的緩慢退化預(yù)測(cè)誤差比GCU-Transformer降低18%。
結(jié)果表明,SCAN不僅適用于軸承這類退化特征復(fù)雜的場(chǎng)景,也能有效處理輪對(duì)這類平穩(wěn)退化過程,體現(xiàn)了良好的泛化能力。
(三)綜合分析
兩類場(chǎng)景的實(shí)驗(yàn)均表明,SCAN在非理想數(shù)據(jù)下的預(yù)測(cè)精度、穩(wěn)定性與效率均優(yōu)于主流方法,平均精度提升約34%。其優(yōu)勢(shì)源于:
1. 時(shí)序?qū)Ρ染幋a器充分利用非理想數(shù)據(jù),提取穩(wěn)健的退化特征;
2. 注意力解碼器高效捕捉時(shí)序依賴,提升預(yù)測(cè)精度與速度;
3. EWC策略保障模型協(xié)同優(yōu)化,增強(qiáng)魯棒性。
六、結(jié)論與展望
(一)研究結(jié)論
本文提出的SCAN模型通過時(shí)序?qū)Ρ葘W(xué)習(xí)與注意力機(jī)制的融合,有效解決了非理想數(shù)據(jù)下設(shè)備剩余壽命預(yù)測(cè)的難題:
1. 時(shí)序?qū)Ρ染幋a器實(shí)現(xiàn)無(wú)標(biāo)簽特征提取,擺脫對(duì)理想數(shù)據(jù)的依賴,適用于工業(yè)場(chǎng)景中標(biāo)簽稀缺的現(xiàn)狀;
2. 注意力解碼器通過多頭自注意力機(jī)制,兼顧長(zhǎng)時(shí)程時(shí)序依賴捕捉與并行計(jì)算效率,提升預(yù)測(cè)精度與速度;
3. 彈性權(quán)重共享策略實(shí)現(xiàn)編碼-解碼協(xié)同優(yōu)化,增強(qiáng)模型魯棒性與泛化能力。 實(shí)驗(yàn)驗(yàn)證,SCAN在軸承與輪對(duì)場(chǎng)景中平均預(yù)測(cè)精度提升34%,為工業(yè)設(shè)備PHM提供了高效可靠的技術(shù)方案。
(二)未來展望
1. 擴(kuò)展數(shù)據(jù)集類型:將方法應(yīng)用于航空發(fā)動(dòng)機(jī)、風(fēng)電設(shè)備等更多工業(yè)場(chǎng)景,驗(yàn)證其普適性;
2. 優(yōu)化時(shí)序?qū)Ρ热蝿?wù):設(shè)計(jì)更貼合設(shè)備退化規(guī)律的對(duì)比策略,如引入領(lǐng)域知識(shí)引導(dǎo)特征學(xué)習(xí);
3. 輕量化模型設(shè)計(jì):針對(duì)邊緣設(shè)備部署需求,壓縮模型參數(shù),在保持精度的同時(shí)降低計(jì)算成本;
4. 融合多源數(shù)據(jù):結(jié)合振動(dòng)、溫度、壓力等多傳感器數(shù)據(jù),進(jìn)一步提升預(yù)測(cè)魯棒性。
SCAN方法為非理想數(shù)據(jù)下的壽命預(yù)測(cè)提供了新思路,其核心技術(shù)可推廣至工業(yè)健康管理的其他領(lǐng)域,推動(dòng)PHM技術(shù)在實(shí)際生產(chǎn)中的落地應(yīng)用。
參考文獻(xiàn):非理想數(shù)據(jù)下基于時(shí)序?qū)Ρ茸⒁饬δP偷膲勖A(yù)測(cè)方法,林天驕等,機(jī)械工程學(xué)報(bào)