?

基于大數據的純電動客車動力電池安全風險多維度評價

2023-12-30 09:15俞蔣彬張永濤
北京交通大學學報 2023年5期
關鍵詞:動力電池單體電池

俞蔣彬, 張 欣, 張永濤, 常 亮

(北京交通大學 機械與電子控制工程學院,北京 100044)

新能源電動汽車因其在減少碳排放、降低化石能源消耗和推動電氣化交通運輸發展等方面發揮重要作用,其產業規模迅速增長,總體發展形勢向好[1].動力電池在使用過程中不可避免的性能衰退會導致車輛運行安全隱患增大,準確評價和預測動力電池安全風險情況是提升電動汽車的安全性、可靠性的重要保證[2].研究人員從故障觸發機制、特征指標變化、反應機理等方面進行了大量探索,形成了初步的理論體系和解決方案[3-4].然而,在電動汽車實際運行過程中,工況復雜交變,在試驗條件下所建立的安全風險評價機制難以應對實車工況下多因素耦合的情況.

隨著新能源汽車國家監測與管理平臺的建立與發展,大數據技術以其實時性、全局性等優勢在車用動力電池系統安全風險預測預警上展現出良好的應用前景.因此,基于電動汽車運行數據,建立大數據視角下的故障風險預測和預警,是目前車用動力電池安全風險領域的熱點[5-6].

何淑波等[7]采用樣本卷積和交互神經網絡算法實現動力電池關鍵狀態預測,再利用多分類隨機森林算法,對動力電池1 min 后的安全風險進行分級預警,經過數據驗證該方法的查準率為84%.劉偉霞等[8]對動力電池的5 個維度分別建立風險評估算法并進行線性融合,通過大數據訓練算法參數,經過實車驗證,該算法提前7 min 預警了電池的熱失控.宗磊等[9]針對行駛和充電2 個工況確定了不同電池荷電狀態(State of Charge,SOC)、不同溫度、不同充放電倍率的電壓極差閾值.Hong 等[10]采用改進香農熵和樣本熵2 種熵對實車監測和故障報警數據進行分析.研究表明改進的香農熵能夠檢測出電壓異常的單體電池,并有效預測電壓異常發生的時間和地點且計算量相對較少.Jia 等[11]搭建卷積神經網絡預測模型,經過大數據訓練,該模型可以快速準確地預測鋰電池在各種工作條件下的短路電阻,平均絕對相對誤差為6.75%±2.8%.Jia 等[12]采用專家啟發算法、邏輯分類、近鄰算法、支持向量機、決策樹、隨機森林6 個機器學習算法對電池的安全風險進行分類預測,其中支持向量機、決策樹、隨機森林3 個算法表現出了不錯的分類效果.

綜上,目前的評價方法主要集中在動力電池的單一維度(溫度、電壓等)且預警時間較短.本文依托于2022 年數字汽車大賽提供的數據集,提出一種基于大數據的純電客車動力電池安全風險多維度評價方法.采用多源數據融合處理,得到用于表征電池運行狀態的參數,并采用機器學習方法,實現對動力電池的分等級故障預測,最終構建具有動態性、系統性的多維度評價體系,實現了對純電客車動力電池的多維度安全風險評價.

1 實車運行數據處理

2022 年數字汽車大賽官方所提供的數據是通過國家新能源汽車國家監測與管理平臺采集的某品牌10 輛純電動客車的實車運行數據,10 輛車均在城市內運行,沒有固定的路線.每輛車各采集了時間跨度為6 個月的運行數據,采樣間隔為10 s.車輛運行特征覆蓋長期擱置再行駛、一直行駛、先行駛再擱置等典型用戶使用特征,車輛運行環境覆蓋全天24 小時以及全年12 個月,具有充分的多樣性和廣泛性.數據集共計32 個數據采集字段.將數據進行如下的初步處理:①結合文獻[13]對數據字段的解釋,提取與動力電池相關的20個數據字段,如表1所示.② 偏移處理.在數據矩陣中,部分數據如電壓、溫度在數據存儲和傳遞過程時為無符號整型,需要進行偏移處理,轉化為標準單位下的數值.③ 二次解碼.在數據矩陣中,通用報警數據字段采用32 位二進制對通用故障進行編碼,其中低19 位有效,其他預留.通過二次解碼將通用報警數據轉化為19列的故障矩陣.

表1 保留的數據字段Tab.1 Reserved data

數據初步處理完成后,將數據字段劃分為數值數據(如電流、電壓、溫度),狀態數據(如充電狀態、車輛狀態)和故障數據(19 列的故障矩陣)3 類,通過逐一驗證各類數據的自洽性,檢查不同來源數據之間是否存在矛盾,核實數據反映情況與故障信息是否相符,逐層深入進行數據清洗,數據清洗流程如圖1所示.

圖1 數據清洗流程圖Fig.1 Data cleaning flow chart

經過數據清洗,最終獲得約510 萬條有效數據.為了便于對動力電池故障進行不同角度的研究,對數據進行切分.切分形式包括針對行駛累計里程切分、針對時間維度切分、針對故障等級切分3 種.

1.1 電池包容量估計和SOH 指標計算

電池的性能衰減是電池內部各種失效過程綜合作用的結果.電池內部物理化學性質的變化造成了電池外部性能特征的衰減,其主要表現包括開路電壓特性變化、電池可用容量減少、電池內阻的增加[14].本文以動力電池的剩余容量作為電池健康狀態(State of Health,SOH)的表征指標,因此需要對動力電池的容量進行估計.

車輛充電通常采用恒流充電,電流幾乎穩定,結合時間變化可以對每一時間間隔內的充電容量進行計算.因此,本文以充電片段的電流和時間變化來估算電池組在某時段內的容量增量,并進一步計算得到電池當前最大容量.計算式為

式中:It為t時刻電流大小,A;t0、t1分別為恒流充電片段始、末時刻,Δt為時間間隔,s;SOC0、SOC1分別為恒流充電片段始、末的電池荷電狀態,%.根據式(1)估算10 輛車的不同時間的容量,估算散點圖如圖2 所示.圖中不同顏色的散點代表不同編號車輛的容量估算結果.

圖2 不同車輛容量估計結果Fig.2 Different vehicle capacity estimation results

圖2 中展示了3 個車輛的電池容量變化的線性趨勢線,其中數據按時間排序,估算次數越多,使用時間越長.可以發現隨著使用時間的增加,車輛的動力電池最大容量逐漸降低,符合客觀規律,因此容量估算結果基本合理,能作為SOH 表征指標.

進一步通過分析發現LB47 號車輛累計里程最短,則電池健康狀態應較好,可以將其作為初始容量估計的車輛.LB47 號車估算容量的平均值為146.48 Ah,考慮到存在89 km 的累計里程,本文將電池標準的健康容量值設置為150 Ah,并以此計算電池的SOH,計算式為

式中:SOH 為電池健康狀態,%;Cmax為當前電池最大容量,Ah;Cfresh為電池初始的最大容量,值為150 Ah.

1.2 單體電池內阻估計和內阻一致性指標計算

根據混合脈沖能力特性(Hybrid Pulse Power Characteristic,HPPC)測試結果表明,內阻在低SOC 區間和高SOC 區間的變化較大[15],在中部SOC 區間(40%~80%)保持相對穩定,可視作定值[16].因此,在中部SOC 區間,恒流充電片段中電流切換處估算得到的阻值可基本代表電池內阻的平均水平.計算式為

公式中:Ri表示第i個單體的內阻,mΩ;Ui-A、Ui-B表示充電過程中電流切換前、后第i個單體的電壓,V;IA、IB表示充電過程中電流切換前、后的最后時刻的電流,A.根據式(3)估算10 輛車的單體電池內阻,估算散點圖如圖3 所示.

圖3 不同車輛電池內阻估計結果Fig.3 Different vehicle internal resistance estimation results

圖3 展示了3 個車輛電池內阻阻值變化的線性趨勢,可以發現隨著使用時間的增加,動力電池的內阻阻值增加,符合客觀規律,因此內阻估算結果合理,可以用于后續電池安全風險評價.

在得到單體電池內阻后,為表征電池的內阻一致性,計算單體電池內阻極差和單體電池內阻標準差,計算式分別為

式中:ΔR表示單體電池內阻極差,mΩ;Rmax和Rmin分別表示電阻的最大值和最小值,mΩ;Rˉ為單體電池內阻的平均阻值,mΩ;N1為單體電池個數;SR表示單體電池內阻的標準差,mΩ.

1.3 電池溫度相關指標計算

數據字段中與溫度相關的信息包括最高溫度、最低溫度、單體電池溫度列表.為表征電池的運行溫度狀況和溫度一致性,可以通過計算獲得固定時刻下的單體電池溫度極差、單體電池溫度平均值、單體電池溫度標準差以及最大單體電池溫度變化率.對應的計算式分別為

式中:ΔT表示溫度極差,℃;Tmax和Tmin分別表示溫度的最大值和最小值,℃;Tˉ表示溫度平均值,℃;Ti表示第i個監測點溫度,℃;Tt,i表示t時刻第i個檢測點的溫度,℃;N2表示溫度探針總數;ST表示溫度標準差,℃;ROCT表示最大的溫度變化率,(℃/s);Δt表示采樣時間間隔,s.

1.4 電池電壓相關指標計算

數據集中與電壓相關的有效信息包括總電壓、單體最高電壓、單體最低電壓、單體電池電壓列表.為表征電池的運行電壓狀況和電壓一致性,可以通過計算獲得固定時刻下的單體電池電壓極差、單體電池電壓平均值、單體電池電壓標準差以及非正常電壓電池占比.對應的計算式分別為

式中:ΔU表示單體電池電壓極差,V;Umax和Umin分別表示電壓的最大值和最小值,V;Uˉ表示單體電池電壓平均值,V;Ui表示第i個單體電池電壓,V;SU表示電壓標準差,V;PoutU表示超出正常電壓范圍的電池的數量占比;NoverU表示高于正常電壓范圍的單體電池個數,NunderU表示低于正常電壓范圍的單體電池個數.

2 動力電池故障等級預測算法

為確保故障等級預測的及時性和準確性,本文采用機器學習方法對電池故障狀態進行預測.將電池故障預測視為多分類問題,通過相關性分析選取合適的算法輸入,最終輸出預測的風險等級.經過對電池故障等級統計,發現數據集中電池各個故障等級的數量分布不均,這限制了神經網絡等要求樣本分布均勻的算法應用.因此本文擬采用決策樹、隨機森林以及近鄰算法(K-Nearest Neighbor,KNN)3 個算法進行故障等級預測.

綜合考慮預測效果和面對故障采取應對措施需要的時間,本文設定30 min 的預測時長,根據數據切分結果,提取有故障信息、故障前30 min 以及正常行駛的數據條目共計約32 萬條數據,作為數據集,并按照7∶3 的比例將數據劃分成訓練集和測試集,對算法采用十折交叉驗證.算法構建流程如圖4所示.

圖4 電池故障等級預測算法構建示意圖Fig.4 Schematic diagram of battery fault grade prediction algorithm construction

算法參數優化中,不同算法需要優化不同的參數.決策樹算法需要優化最大深度、節點可分最小樣本數和葉子節點所含最小樣本數3 個參數.隨機森林算法需要優化決策樹數量、樹最大深度、節點可分最小樣本數和葉子節點所含最小樣本數4 個參數.KNN 算法需要優化最近樣本數量1 個參數.

2.1 基于相關性分析的算法輸入確定

考慮到數據中存在非偏序關系參數如車輛運行狀態、充電狀態等,本文采用Spearman 秩相關系數進行相關性分析,并對非偏序關系參數采用one-hot編碼,保證相關性計算結果的合理性.相關性計算結果如圖5 所示.

圖5 參數Spearman 秩相關系數熱力圖Fig.5 Parameter Spearman rank correlation coefficient heat map

最終選取電池包SOH、SOC,最大電阻差,最大溫度差,溫度標準差,最大電壓差,電壓標準差,最大、最小溫度,最大、最小電壓,絕緣阻值和累計里程共計 13 個參數作為算法訓練的輸入.

2.2 基于性能指標的算法優選

經過網格化自動調參,3 種算法均達到當前最優.不同算法對不同故障等級的預測效果性能指標如表2 所示.其中一級故障指不影響車輛正常行駛的故障,二級故障指影響車輛性能、需要駕駛員限制行駛的故障,三級故障指駕駛員應立即停車處理或請求救援的故障[13].

表2 3 種算法對不同故障等級的預測效果Tab.2 Prediction effect of three algorithms on different fault grade

通過對比不同算法對不同故障等級預測的性能指標,發現對于無故障、一級故障、二級故障3 種狀態,3 種算法均顯示出較好的效果.對于三級故障,3 種算法效果沒有預測其他幾種故障等級時優異,這與三級故障的樣本數量較少有關.

綜合比較發現隨機森林算法,其預測效果綜合優于其他算法,同時在運算速度上,本文中的隨機森林算法依賴2.59 GHz 的CPU 運算,每組數據耗時5.6 ms,這與30 min 的預測時長相比足夠迅速,所以該預測算法的運算速度能夠滿足及時預測的需求.最終選取隨機森林算法作為電池故障等級預測算法.

3 基于AHP-EWM 的電池安全評價

結合數據處理結果和故障等級預測算法,構建了具有5 個維度、14 個指標的電池安全風險評價體系.層次結構如圖6 所示.

圖6 動力電池多維度安全風險評價層次結構示意圖Fig.6 Hierarchical chart of the multi-dimensional safety risk evaluation of power batteries

這5 個維度、14 個指標能夠充分體現單體電池狀態、單體電池之間交互影響和電池包狀態.狀態參數類型涵蓋電壓、溫度、電阻.時長涉及實時、短期變化、長期預測.構建的評價體系具備典型性、系統性和動態性特征,能夠全面評價電池安全風險.

3.1 數據標準化

為了避免由于不同類型指標量綱和數量級不同,對最終的安全風險評分產生的影響.本文對所有的指標進行了百分制打分處理,使得所有指標均標準化,并采用3σ 多層次篩選算法提取指標的閾值.百分制打分流程如下.

步驟1:利用3σ 多層次篩選算法計算數據集特征閾值.① 對于n維變量X=[x1,x2,…,xi,…,xn],X服從高斯分布,定義初始變量X0=X,即X0~(μ0,σ0),其中,xi為變量X的第i個取值,μ0為X0均值,σ0為X0標準差.②剔除X0中超出[μ0-3σ0,μ0+3σ0]范圍的元素,形成X1,X1中數值滿足μ0-3σ0≤≤μ0+3σ(0i∈[1,n]).③按②迭代計算j次,得到Xj.當滿足|μj-μj-1|≤(tt為迭代容差)時,終止迭代.④輸出μj+3σj和μj-3σj數值.

步驟2:結合文獻[17-18]規定與3σ 多層次篩選算法計算結果,確定閾值.

步驟3:確定0 分和100 分對應的指標數值,中間狀態采取線性插值方式打分.

步驟4:對于超出某一指標上、下閾值的,該項指標打分為-1 分,即安全風險總分0 分.

經過標準化處理后的評價指標一定程度上消除了量綱和數量級的影響.同時對超出上下限制的數據采取總分打0 分的方式,有利于提高對可能發生三級故障數據的甄別能力.

3.2 權重矩陣確定

為降低主觀因素對權值的影響,本文采用層次分析法和熵權法組合的方法來確定權重矩陣,在發揮各自方法優勢的情況下,一定程度上削弱了主觀偏差性和客觀片面性.

層次分析法(Analytic Hierarchy Process,AHP)可以將專家、決策者的經驗引入評價過程[19].本文采用7 標度對指標進行兩兩比較,構建比較矩陣,并進一步計算權重矩陣.7 標度法各個標度重要性含義如表3 所示.

表3 不同標度重要性含義Tab.3 Meaning of scale importance

熵權法(Entropy Weight Method,EWM)按照每個指標的信息量確定權重,信息熵可以衡量指標包含的有效信息[20].熵值越大,說明指標數據之間的變化程度越大,所反映的信息量也越大,其對應的權值也越大.

本文采用層次分析法和熵權法結合確定權重,權重的計算式為

式中:ωj為第j個指標的最終權重;uj為通過層次分析法確定的第j個指標的權重;vj為通過熵權法確定的第j個指標的權重;n為指標總數.最終通過計算,各個指標的權重如表4 所示.

表4 各指標對應權重Tab.4 Each index corresponds to the weight

綜上,本文基于多維度安全風險評價體系,對14 項指標進行百分制打分,再將各指標分數乘以對應的權重,最后求和得到對動力電池的安全風險評價分數.對數據集中所有數據進行多維度安全風險評價,統計各個故障不同區間分數的占比情況如圖7所示.

圖7 各故障等級評分占比堆積柱狀圖Fig.7 Accumulation bar chart of the score proportion of each fault

由圖7 可知,無故障的評分集中在70 分以上,占比66.39%.一級故障的評分集中在50 分到70 分之間,占比87.29%.二級故障的評分集中在40 分到60 分之間,占比98.32%.三級故障的評分全為0 分,占比100%.分數的集中區間的占比都達到了80%以上,具有一定的代表性,可以通過安全風險評價的分數作為劃分安全等級的依據.同時可以發現不同故障等級的分數分布具有一定的層次性,也有利于區別不同等級的故障.

對于存在未在集中分數區間的數據,主要原因有2 個.一是由于實時評價結果容易受到實車數據采集誤差的影響,存在部分偶發性的低分.這類數據可通過增加濾波算法或設置故障判定的時間來避免.二是由于算法對故障的提前預測,導致電池的未來安全評分降低,使得安全風險總分降低,分數未在集中分數區間.

4 具體事故應用分析

目前實車所采用的故障檢測方法是比對實際運行數據和設定的運行數據正常范圍,如果實際運行數據超出正常范圍,進行報警.這種方法能夠監控的電池狀態指標類型較少,只有電壓、溫度和電流.同時也沒有做到提前預警,突然發生故障時留給駕駛員操作和反應的時間不夠,不利于妥善處理安全風險問題.本文采用多維度的安全風險評價來對電池進行安全風險評價和故障預警,當電池安全風險評價分數在70 分以上時,視為安全狀態,當分數在70~50 之間時,視為一級故障,當分數在60~40 之間時,視為二級故障,對于50~60 這一分數重疊區域,則采用故障預測結果作為故障等級.這種方式能夠更好地體現電池安全風險等級的變化情況,并進行提前預測,提高運行安全.本文通過兩例具體的故障案例進行分析,來驗證本文方案的可行性.

1) 事故1.

編號LB42 的車輛在2020 年4 月11 日,約7 時27 分,故障信息從無故障到三級故障.圖8 為應用本文提出的多維度安全風險評價方法后,電池安全風險評價分數和故障等級預測的變化曲線.

圖8 安全風險評價分數和故障等級變化曲線Fig.8 Safety risk evaluation score and fault grade change curves

由圖8 可知,電池安全風險評價總分呈下降趨勢,中間產生分數上升是由于車輛從熄火狀態轉換到驅動狀態,電池的充放電狀態和電流大小更加符合驅動情況下的車輛,導致評分有所升高,但總體評分在40 分到60 分區間,處于二級故障的評分范圍.在6:25:00 之前,安全風險評分在50~60 的范圍內,根據預測算法的結果,風險等級從一級升到二級,6:57:00 之前安全風險分數在50 分以下,為二級故障,之后則為0 分,為三級故障,多維度安全風險評價得到的故障等級逐漸升高,反映了安全風險在不斷升級,相比于實車中突然從無故障到三級故障,更有利于技術人員及駕駛員把握風險情況做出合理的應對措施.同時,本方案向系統報告一級故障的時間,相較于車輛自身報警時間提早約90 min,向系統報告三級故障的時間提早約30 min,避免了故障突發導致技術人員及駕駛人員無法及時做出反應從而引起安全事故.

2) 事故2.

編號為LB79 的車輛在2020 年7 月16 日約17 時42 分報警,故障信息為儲能裝置欠壓.圖9 為應用本文提出的多維度安全風險評價方法后,部分相關分指標評分變化的曲線圖.

圖9 分指標評價分數變化曲線Fig.9 Sub-index evaluation score change curve

由圖9 可知,與電壓相關的評價指標如最高電壓、最低電壓、總電壓波動幅度很大,整體呈現下降趨勢,其中最低電壓的評分最低,說明動力電池出現了欠壓類型故障,同時電壓一致性的評分沒有降低的趨勢,說明欠壓的情況不是出現在小部分動力電池中而是大范圍地出現,溫度指標變化前期較為平穩,只有在后段呈現下降趨勢,推測是由于電壓的變化,導致電池產熱變化,從而影響溫度,說明電池的溫度方面并沒有出現故障.綜上,運用本文的方案,通過分數的大小和變化可以推斷出動力電池產生了欠壓的故障,相比于單一的故障等級,更加明確地指出了故障的類型.此事故的案例分析說明本文的多維度安全風險評價可以通過分析各指標的評分變化,鎖定故障的大致類型,便于技術人員及駕駛員采取相對應的措施.

5 結論

1) 針對目前動力電池安全風險評價維度單一的問題,提出了具有5 個維度、14 個指標的動力電池多維度安全風險評價體系,全面評價動力電池安全風險,通過數據集驗證了能夠通過分析各個具體指標評分的變化曲線,得到動力電池故障的大致類型.

2) 針對目前電池安全風險預測時間不長的問題,采用機器學習方法預測故障等級.經過性能指標優選,選定了隨機森林算法作為故障等級預測算法.可以提前30~90 min 預測故障發生.針對不同的故障等級,本文的預測算法平均預測精準度高達97.25%.

3) 結合數字汽車大賽提供的數據集對方案進行了驗證,通過本文的安全風險評價得到的動力電池安全風險分數與原始數據匹配程度高,且分數隨著故障等級有層次性.2 個實際安全風險案例的驗證結果表明,應用本文的方案能夠更早地提示故障的發生,并且能夠鎖定故障的類型.

本文的方案在預測預警電池安全風險和協助確定電池故障類型上有一定實用價值.但由于本數據集內故障等級和故障類型的數量分布不均勻,在未來可以通過更全面的數據集訓練不同的機器學習算法(如神經網絡)優化故障預測效果.

猜你喜歡
動力電池單體電池
電池很冤
“一粒鹽電池”
把電池穿身上
穿在身上的電池
動力電池礦戰
單體光電產品檢驗驗收方案問題探討
動力電池回收——崛起的新興市場
《動力電池技術與應用》
《動力電池材料》
相變大單體MPEGMA的制備與性能
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合