胡 杰,張 瀟,魏 敏,,陳 林,卿海華,高長斌
(1.武漢理工大學,現代汽車零部件技術湖北省重點實驗室,武漢 430070;2.武漢理工大學,現代零部件技術湖北省協同創新中心,武漢 430070;3.新能源與智能網聯車湖北工程技術研究中心,武漢 430070;4.上汽通用五菱汽車股份有限公司,柳州 545000)
隨著汽車電子技術的不斷發展,汽車功能復雜性日益提高,車載故障診斷系統的出現為故障診斷開拓了新的思路。當車輛發生故障時其自診斷系統會產生故障碼(diagnostic trouble codes,DTC)并保存[1-2],維修人員通過診斷儀讀取故障碼并對其分析進行故障定位并診斷。然而,由于車輛運行中各電控模塊互相進行信息傳遞,使得維修過程讀取的故障碼具有駁雜、數量大的特點。同時,實際上故障碼產生這一情況本身并不表明故障碼自身定義中涉及的部件一定發生了故障,存在著車輛行駛過程中由于環境引起的偶發情況而產生故障碼、某些部件受到其它故障部件影響而信號異常產生故障碼等情況。面對大量雜亂的故障碼導致通過分析故障碼來進行精準快速的故障定位并未取得理想效果。
通過分析問題為根據維修過程讀取出的大量雜亂故障碼推理出源頭故障部件,首先考慮貝葉斯網絡(Bayesian network)[3]方法。然而,由于故障樣本數量少、故障碼眾多導致貝葉斯網絡的條件概率表難以通過樣本數據或專家經驗生成,故利用D-S 證據理論(D-S evidence theory)[4],將不同部件在各故障碼下發生故障的后驗概率看作推理出故障部件的證據,通過融合貝葉斯網絡和證據理論解決問題。
李仲興等[5]構建BN 模型得到不同工況下基于振動和噪聲的BN模型后驗概率,再通過證據理論將其融合實現輪轂電機的故障診斷。李宏梅等[6]通過構建BN 模型針對汽車網絡故障的不確定性進行分析,利用信息融合方法實現發動機的故障診斷。史曉娟等[7]將故障樹轉化為BN 模型,利用專家評估確定故障與征兆間關系,實現排水系統的故障診斷。上述文獻通過專家知識以及樣本數據確定BN 的結構與參數,實現了不同領域的故障診斷。但在節點眾多且樣本數據不足的情況下,確定先驗概率和條件概率表等參數是一項工作量巨大且存在不確定性的任務。
陶鵬等[8]提出了一種證據可信度的修正函數用以解決證據信度為零的悖論,再利用支持概率解決證據沖突問題,將其應用于電氣設備故障診斷且取得了良好效果。張寬等[9]提出基于Pignistic 概率距離構建相似度的方法對基本概率賦值修正,并引入平均支持度加權優化的證據融合規則,實現對變壓器進行故障診斷。夏飛等[10]提出了一種利用證據間相似度構造新證據體并將新舊證據同時合成的方法,實現了燃氣輪機振動故障診斷。上述文獻均通過引用不同指標衡量證據之間的距離來分析各證據的可信度、相似度以作為證據修正的依據并取得良好的效果,但其均從不同證據間沖突角度考慮,未考慮證據自身存在的不確定性。
考慮到上述所提不足,并為解決由于部件的關聯故障而產生大量復雜故障碼導致通過分析故障碼進行故障定位的準確性差、效率低的問題,本文以某企業某新能源車型的ABS 系統為例,相關售后數據為基礎,提出一種基于模糊BN和改進證據理論的故障定位方法。首先根據求援索賠和售后診斷故障碼的歷史數據以及該車型維修手冊構建BN,并通過云模型對其參數進行模糊化。然后將后驗概率作為證據,考慮證據的不確定性和證據間沖突,提出融合鄧熵和Pignistic 概率距離的修正系數對證據進行修正。最后采用基于矩陣分析的合成規則在降低沖突的同時減小由于證據量多、合成規則復雜帶來的計算量大、合成悖論等情況,得到最終故障定位結果,準確高效地實現故障定位。
本文數據來源于某公司某新能源車型2020 年10 月至2022 年10 月大數據平臺存儲的售后診斷故障碼數據以及售后部門存儲的求援索賠數據,該兩份數據均以表格形式保存。其中,故障碼數據表結構如表1所示。
表1 故障碼數據分類
求援索賠數據結構如表2所示。
表2 求援索賠數據分類及說明
1.2.1 故障碼數據處理
故障碼狀態包含當前和歷史兩種狀態,其代表故障碼為與該次故障相關或歷史診斷遺留。針對售后維修存在著實際故障已解決但部分故障碼無法消除的情況,由于這種故障碼不影響車輛正常運行,故將該類故障碼丟棄處理。
同時,由于存在維修工人誤操作導致重復上傳的現象,故限制同一車輛診斷事件的時間間隔不得少于3天,對多次上傳數據進行去重處理。
此外,由于車輛各模塊通過CAN 網絡互相收發信息,導致某些故障碼會在不同模塊重復出現,故將該類重復故障碼進行去重處理。
1.2.2 求援索賠數據處理
求援索賠中存在著更換配件與實際故障配件不匹配的問題,由于該類數據不多,故采用人工處理。根據分析處理過程判斷故障原因是否準確,若存在問題則對該條數據丟棄處理。對于數據重復上傳問題同故障碼數據表方法處理。
1.2.3 數據集成
將處理后的故障碼數據和求援索賠數據按照車型、VIN 碼和維修時間進行集成。經過數據預處理后,得到ABS 系統共327 個案例,共包含4 614 條故障碼數據,部分數據如表3所示。
表3 預處理后故障歷史數據
本文提出一種基于模糊BN 和改進證據理論的車輛故障定位方法。所構建的故障定位模型流程如圖1所示,具體步驟如下。
圖1 故障定位模型流程圖
(1)模糊BN 構建。將故障碼作為故障征兆,通過歷史數據和專家經驗確定BN結構,并通過云模型數字特征模糊化其先驗概率。
(2)基本概率賦值轉化。將模糊BN故障部件后驗概率作為各條證據的基本概率賦值。
(3)證據修正。融合鄧熵和Pignistic 概率距離作為修正系數對證據的不確定性和證據之間沖突進行修正。
(4)改進合成規則。采用基于矩陣分析的合成規則將修正后的基本概率賦值合成,得到各部件故障的可能性。
(5)故障定位結果。比較各部件故障的可能性,最大值對應的部件即為最終故障定位結果。
根據歷史樣本數據以及維修手冊確定整個系統中可能發生故障的部件以及故障碼,將故障碼作為故障征兆,通過歷史樣本數據確定各故障征兆與故障部件之間的關聯。
故障部件節點與故障碼節點通過有向邊建立關聯。以ABS 系統為例,本研究所構建的BN結構如圖2 所示,其分為兩層結構,上層為可能發生故障的部件,下層為全部可能出現的故障碼。
圖2 BN網絡結構圖
由于節點的故障概率是通過歷史樣本數據獲取,而故障數據屬于小樣本數據,故采用云模型模糊化先驗概率。
云模型作為一種在概率論和模糊理論基礎上發展的綜合模型,刻畫了數值之間隨機和模糊的性質,在描述不確定信息上極具優勢[11]。其具有3 個數字特征:期望Ex、熵En和超熵He。期望Ex代表論域空間中云滴分布的期望值;熵En代表云的跨度,反映云分布的不確定性;超熵He代表熵的離散程度,反映熵的不確定性。
云生成器為標準云生成算法,按其功能可以劃分為正向云生成器與逆向云生成器。正向云生成器需要預先設置數字特征(Ex,En,He)以及生成的云滴數量,輸出云圖像,過程如圖3所示。
圖3 正向云生成器
圖4 云模型圖像
逆向云為正向云生成的逆過程,通過輸入已有的樣本分布,輸出其對應的數字特征(Ex,En,He),過程如圖5所示。
圖5 逆向云生成器
假設兩個標準云分別為Ci和Cj,云模型的算術運算規則[12]為
根據已有樣本和經驗通過逆向云生成器輸出各故障部件先驗概率的云模型數字特征,以先驗概率的數字特征代替先驗概率作為模糊處理,通過云模型的算術運算規則公式和貝葉斯公式計算出各部件在不同DTC 下發生故障的后驗概率數字特征。其中貝葉斯公式如式(6)所示。
式中:p(Fi)為基本部件故障的先驗概率,由歷史數據得到;p(DTCj|Fi)為在已知實際故障部件的前提下某故障碼出現的條件概率。
最后將后驗概率的數字特征依次通過正、逆向云生成器迭代10 次體現其不確定性與隨機性,以其迭代10 次所得數字特征期望Ex的平均值作為最終后驗概率。
將已構建的BN 的標準故障部件后驗概率歸一化,轉化為證據的基本概率賦值。由于傳統D-S 證據理論存在著未考慮證據自身權重,忽略沖突中所蘊含的信息等缺點,難以直接進行實際應用,故本文提出了融合鄧熵和Pignistic 概率距離的修正系數,對證據的沖突部分重新分配基本概率賦值,以實現準確合理的故障定位。
2.2.1 證據確定程度
鄧熵(deng entropy)[13]是Deng 提出的一種不確定性度量方法,他受到香農熵的啟發,在測量不確定度時考慮了基本命題的基數造成的影響,提出了鄧熵的概念。其具體公式如下:
式中|A|是A的基數。鄧熵具有|A|越大則ED越大,其不確定程度越大的性質。
根據式(7)可計算出各證據自身的不確定程度。由于鄧熵ED的值越大,不確定程度就越大,則可定義(1-ED)為證據的確定程度Ens。
2.2.2 證據可信度
Liu 在證據距離量化過程中引入Pignistic 概率距離[14],用以描述證據之間的沖突程度。其定義Pignistic概率函數BetPm(A)為
式中|A|是A的基數,則兩個獨立的證據主體BetPm1和BetPm2的Pignistic概率距離為
由上式可知,Pignistic 概率距離的范圍為[0,1]且具有值越大則沖突越明顯的性質。
通過式(8)和式(9)可計算出各證據之間沖突程度。分析Pignistic 概率距離的性質則可將定義為m1和m2一致性程度,其值越大則一致性越強。定義各證據可信度Beli的計算公式如下:
2.2.3 證據修正
依據證據的確定程度與其可信度,將二者結合并與所得最大值相除可得證據的相對權重,即作為修正系數。
則修正后的基本概率賦值為
2.2.4 證據合成規則
傳統證據理論合成規則如下式所示:
式中k為沖突因子,代表證據之間的沖突程度,其范圍為[0,1],k值越大則沖突程度越大。
傳統合成規則具有面對高沖突證據融合會產生悖論,且當證據和基本命題的數量增加時其合成計算的復雜程度呈指數趨勢增加等缺點。故采用基于矩陣分析的合成規則[15]在降低沖突的同時減少計算量,其偽代碼如表4所示。
表4 改進合成規則偽代碼
本文以某企業新能源某車型的ABS防抱死系統為例,對已處理好的數據進行切片操作,按4∶1 的比例隨機選取訓練集260個案例、驗證集67個案例,進行故障定位的應用研究。
選取驗證集中某簡單案例為例進行故障定位模型演示,該案例的具體數據如表5所示。
表5 演示案例數據展示
在實際售后維修過程中,由于服務站受技術水平限制,大多部件出現損壞后服務站采取的措施更多的是對故障部件整體進行更換,故根據求援索賠數據中ABS 系統更換的部件,將發生故障后被更換的部件整體定義為標準故障部件F1~F6。根據該車型維修手冊以及歷史維修數據構建演示案例的BN,標準故障部件F1~F6作為故障部件層,故障碼作為故障征兆層,如圖6所示。
圖6 演示案例BN
根據專家知識并結合售后維修數據,對各標準部件故障出現概率統計,得到各標準故障部件的先驗概率云模型數字特征,并以其代替先驗概率作為模糊化處理,如表6所示。
表6 標準故障部件的先驗概率數字特征
通過正向云生成器生成各標準部件的云圖像,云滴數設置為5 000即可看出各朵云的大致形狀,如圖7所示。
圖7 標準部件云模型圖像
本案例中,在單一部件發生故障時某故障碼出現的條件概率P(DTCj|Fi)如表7 所示,其余子節點的條件概率可按相同方法計算。
表7 子節點的條件概率
根據貝葉斯公式可計算出各標準故障部件在不同DTC 下發生故障的后驗概率數字特征。將所得到的后驗概率數字特征通過正、逆向云生成器迭代10 次后,取期望的均值作為后驗概率,所得后驗概率如表8所示。
表8 節點Fi的后驗概率
將故障部件在本案例所涉及到的故障碼的后驗概率作為證據的基本概率賦值,并對其進行修正處理。根據專家經驗將各標準故障部件的故障基數分別設置為A={4,2,2,2,1,1}。
3.2.1 確定程度計算
由式(7)和確定程度定義可分別計算出鄧熵和證據的確定程度,如表9所示。
表9 證據確定程度
3.2.2 可信度計算
對各證據的基本概率賦值之間的沖突程度計算,根據式(8)和式(9)則可以計算出各條證據之間的Pignistic概率距離矩陣,如表10所示。
表10 證據間Pignistic概率距離
根據式(10)將所求得的Pignistic 概率距離轉化為各條證據的可信度,如表11所示。
表11 證據可信度
3.2.3 基本概率賦值修正
根據式(11)可計算出相對修正系數矩陣:η=[0.9635,0.9881,0.9963,1,0.7818]。利用式(12)可計算出各證據修正后的基本概率賦值,其中最后一列為
以傳統D-S 證據理論中的沖突因子k作為評價指標,對比采用不同方法進行相似度計算并修正后的各證據之間沖突程度,其中包括Wasserstein 距離[16]修正、Jousselme 距離[17]修正、Pignistic 概率距離[18]修正和本文提出的方法,具體效果如圖8所示。
圖8 不同方法修正后效果圖
通過分析圖8 可發現,本文提出的方法雖然面對前4 條修正后的證據之間沖突程度減少效果略遜于單獨以Pignistic 概率距離進行修正的方法,但是修正后的第5 條證據與其他證據之間的沖突程度顯著下降。通過分析鄧熵得出的證據確定程度可知,第5 條證據相比于其他證據的確定程度更高,則更應該減少第5 條證據與其他證據之間的沖突程度,故從總體角度認為本文所提出的證據修正方法效果更好。
最后根據基于矩陣分析的證據合成規則將修正后的基本概率賦值進行融合,得到故障定位結果,如表12所示。
經比較分析故障可能性可知,通過故障定位模型得出本案例應為輪速傳感器發生故障,故障部件定位結果與實際案例一致。
將本文提出的方法應用于驗證集進行準確性驗證,得到各標準故障部件發生故障時的故障定位準確率,如表13所示。
表13 標準故障部件故障定位準確率
經對故障定位的錯誤案例分析發現,雖然定位結果與實際故障部件不符,但實際故障部件的可能性大小基本排在自大到小的第二位,仍可以在一定程度上為故障定位提供參考,故認為本文提出的方法在故障定位的應用上具有有效性。
為了進一步驗證本文提出方法的優勢,將傳統DS 證據理論、鄧勇加權平均法[19]和采用基于矩陣分析的合成規則將未修正證據、分別以Wasserstein 距離、Jousselme 距離和Pignistic 概率距離計算相似度并修正后的證據合成以及本文提出的方法均應用于驗證集并進行比較,統計準確率和合成平均耗時情況,結果如表14所示。
表14 不同方法結果比較
經分析發現合成失敗案例均為故障碼數量較多的案例。比較采用不同方法的故障定位結果可發現,本文方法在提高準確率的同時實現了降低證據合成所需時間,避免了故障碼較多時合成失敗的情況,故認為本文方法具有可行性且更具優勢。
本文針對由于車輛部件關聯故障而產生大量復雜故障碼,導致通過分析故障碼定位源頭故障部件效率低的問題,提出基于模糊BN和改進證據理論的故障定位方法。首先通過根據求援索賠和售后診斷故障碼的歷史數據和專家知識構建BN,并用云模型對其先驗概率模糊化;然后將模糊BN后驗概率作為改進證據理論的基本概率賦值輸入,將鄧熵和Pignistic概率距離融合作為修正系數進行證據修正,并采用基于矩陣分析的證據合成規則保證無合成失敗情況的同時減少計算量,得到最終故障定位結果;最后通過實際案例驗證了該方法的可行性。所提方法有效地解決了售后維修過程中面對大量故障碼時分析故障部件困難的問題,提升了故障定位的效率和準確率,為售后維修人員提供幫助。