?

基于二次Lasso回歸的縱向駕駛員模型研究

2022-11-14 18:05劉通曾小華李泰祥宋大鳳莊曉
湖南大學學報·自然科學版 2022年8期
關鍵詞:回歸分析

劉通 曾小華 李泰祥 宋大鳳 莊曉

摘要:為了更好地模擬實際駕駛員行為,提出基于二次回歸和Lasso回歸方法的縱向駕駛員回歸模型.通過采集縱向駕駛行為數據,提取可能影響駕駛行為的狀態參數,進而建立二次回歸駕駛員模型;面向多參數回歸模型中的多重共線問題,采用Lasso回歸方法進行狀態參數篩選;結合篩選數據建立二次回歸駕駛員模型.為了驗證模型的有效性,與PI駕駛員模型和一次Lasso回歸駕駛員模型進行仿真對比.仿真結果表明,相較于其他兩種模型,所建立的駕駛員模型具備良好的工況跟隨效果,同時能較好地反映實際駕駛行為特征.

關鍵詞:車輛性能;回歸分析;縱向駕駛員模型;Lasso回歸;工況跟隨

中圖分類號:U469.79文獻標志碼:A

Research on a Longitudinal Driver Model Based on Quadratic-Lasso Regression

LIU Tong1,ZENG Xiaohua1,LI Taixiang2,SONG Dafeng1,ZHUANG Xiao3

(1. State Key Laboratory of Automotive Simulation and Control,Jilin University,Changchun 130025,China;2. CRRC Qingdao Sifang Rolling Stock Research Institute Co.,Ltd.,Qingdao 266031,China;3. FAW Jiefang Qingdao Automobile Co.,Ltd.,Qingdao 266043,China)

Abstract:To better simulate the real driver behavior,a longitudinal driver regression model based on quadratic regression and the Lasso regression method is proposed. Firstly,by collecting longitudinal driving behavior data,state parameters that may affect driving behavior are extracted,and a quadratic regression driver model was established. Then,the Lasso regression method is applied to screen the state parameters for the multicollinearity problem in the multi-parameter regression model. Finally,a quadratic regression driver model is developed based on the screened data. In order to verify the effectiveness of the model,a simulation comparison is made between the proposed model and PI driver and Lasso regression driver models. The simulation results show the driver model developed here not only has a better effect on driving cycle traction when compared with the other two models but can also better reflect the characteristics of actual driving behavior.

Key words:vehicle performance;regression analysis;longitudinal driver model;Lasso regression;driving cycle following

在整車控制策略設計過程中,基于仿真模型進行控制策略開發可以顯著節約研發時間和成本.目前,車輛控制策略仿真模型可分為前向模型和后向模型.相較于后向模型,前向模型的控制信號和功率流均為正向傳遞,符合車輛實際使用情況.通過引入駕駛員模型,前向模型中在線控制策略開發和測試更易實現[1-2],實車整車控制策略開發和驗證過程中多采用前向仿真模型.在臺架或仿真測試過程中,車輛輪速或仿真車速與目標車速的偏差,即工況跟隨偏差對油耗有顯著影響.此外,駕駛風格對整車油耗的影響也不可忽視,相同的控制策略和測試條件下,不同駕駛風格對車輛油耗的影響差異可高達40%[3].因此,構建縱向駕駛員模型時,除了工況跟隨偏差需要滿足國標要求外[4],加速與制動踏板等輸出信號也要盡可能符合實際駕駛員的操縱行為,以實現合理評價車輛能耗的目的.

目前,基于PI控制的駕駛員模型是最常用的駕駛員模型.PI駕駛員模型以實際車速和目標車速偏差為輸入,通過調整PI參數得到合適的踏板輸出,進而實現工況跟隨[5].為了改進簡單PI駕駛員模型參數難以確定的缺點,文獻[6]采用遺傳算法對PI參數進行優化,在給定工況下實現了良好的工況跟隨效果.有研究人員[7-8]采用模糊PI控制和單神經元自適應PID控制建立駕駛員模型,能夠實現控制參數的在線自整定,具有較好的適應性和魯棒性.但是,以上模型僅以工況跟隨誤差最小為目標,均未考慮模型特征和實際駕駛行為之間的差異.

面向復雜的駕駛行為決策問題,有研究人員提出采用智能控制算法建立駕駛員模型:文獻[9]采用局部神經網絡和遠端學習控制方法建立面向駕駛風格的駕駛員模型,充分考慮了環境因素對駕駛行為的影響,既保證了良好的車速跟隨效果,又保留了原始數據中的駕駛風格.根據駕駛員預瞄行為特征,沈沛鴻等[10]建立了基于自適應網絡模糊推理方法的縱向駕駛員模型,實現了良好的工況跟隨效果.但是,實際的駕駛行為往往由多種影響因素決定,以上研究并未充分考慮.另外,智能控制算法盡管能較好地模擬駕駛行為,但模型較為復雜,會顯著影響優化效率.

本文以一款行星式混合動力物流車為研究對象,通過轉鼓試驗臺試驗,采集整車和駕駛行為數據,建立二次線性回歸駕駛員模型,采用Lasso回歸方法篩選變量并優化回歸模型;最后,建立整車仿真模型、PI駕駛員模型和一次Lasso回歸駕駛員模型,對3種不同的駕駛員模型進行仿真驗證,并論述了本文所建模型的有效性和合理性.

1縱向駕駛行為數據采集

縱向駕駛行為是決定車輛縱向運動特征的駕駛員操縱行為,具體為駕駛員操縱加速踏板、制動踏板、離合器、變速器和駐車制動器的行為.本文所研究的行星式混合動力物流車動力系統無變速器和離合器,在進行循環工況測試時,駕駛員的縱向操縱信號只有加速和制動踏板開度信號.研究樣車及轉鼓試驗平臺如圖1所示.駕駛員在操縱踏板跟隨目標工況時,正前方放置工況跟隨顯示器,可動態顯示目標工況車速和實際車速軌跡,駕駛員通過觀察車速跟隨偏差,實時調整踏板開度以保證良好的工況跟隨效果.鑒于駕駛過程中歷史車速、加速度、駕駛員行為信息對駕駛員決策有顯著影響,本研究從實車控制器中提取車速、加速踏板開度、制動踏板開度等信息,從轉鼓試驗臺提取目標車速、加速度信息.

樣車臺架測試由熟練駕駛員進行操作,其駕駛行為與多數駕駛員的平均駕駛水平相吻合,然后按照國標GB/T 27840—2021的要求進行10次C-WTVC工況測試[4].測試數據通過整車CAN網絡和臺架數據進行采集.

根據臺架測試駕駛員反饋,歷史駕駛行為、歷史車速狀態、未來目標工況對駕駛行為均有影響,且影響時間不超過5 s.駕駛員模型初選輸入參數如表1 所示.駕駛員在操縱過程中加速和制動踏板不存在同時踩下的情況,本研究將兩踏板信號統一為踏板開度,以減少參數數量,提高模型運行效率.當踏板開度大于0、制動踏板開度為0時,表示為加速踏板開度,車輛處于驅動狀態,反之亦然.

2基于二次Lasso回歸的駕駛員模型

2.1二次回歸駕駛員模型

駕駛員行為決策具有復雜的非線性特征,輸入變量之間存在一定交互關系.兼顧模型效率和非線性特性,本文采用二次回歸模型.為了消除變量間量綱不同、自身變異或者數值相差較大所引起的誤差,首先需要對影響駕駛行為的多項參數進行標準化處理,然后建立二次回歸模型:

式中:x1,x2,…,xp為p個標準化后的模型自變量,按次序和表1中變量相對應;y為因變量;β0為回歸常數;β1,β2,…,βp為一次項回歸系數;β1,1,β1,2,…,βm,m為二次項回歸系數;ε為隨機誤差[11];二次項xixj(1≤i≤j≤m)包括二次主效應(i=j)和雙向交互效應(i≠j)[12],二次項可認為是新的自變量,綜合一次和二次項,輸入變量由27個初始變量擴展為406個.

在初始建模時,為了盡量考慮所有可能的影響因素,通常會選擇盡可能多的自變量.但是多維度自變量容易造成“維數災難”,使得模型求解困難.另外,高維自變量之間可能存在顯著的相關性,建模時容易出現過擬合的問題,進而影響模型性能.因此,有必要對回歸模型進行多重共線性檢測.方差擴大因子法(Variance inflation factor,VIF)是一種有效的多重共線性驗證方法.VIF定義式為:

2.2基于Lasso回歸的駕駛員模型優化

針對多重共線問題,本文采用Lasso回歸剔除相關性較高的自變量.Lasso回歸是一種有效的變量篩選方法,該方法是在嶺回歸的基礎上將懲罰項由L2范數變為L1范數,通過把一些不重要的變量的回歸系數縮減為0,以獲得稀疏解,進而篩選得到對因變量有顯著影響的自變量,并完成參數估計[13].

設因變量y∈R,輸入矩陣為X∈Rm,可得Lasso模型[14]:

式中:λ為正則參數或收縮算子;β0、βi為回歸系數向量.

Lasso回歸懲罰項非連續可導,需要采用求極值解法、坐標軸下降法和最小角回歸法等方法進行求解.其中,坐標軸下降法是一種最快解法,但是其變量計算過程只能沿坐標軸進行,而最小角回歸法是一種基于前向選擇算法和前向梯度算法的變量篩選算法,能夠得到更為精確的特征向量,本文采用最小角回歸法求解回歸系數.由于本研究采集的工況測試數據是典型的小樣本數據,因此采用K折交叉驗證的方法以充分利用數據信息,取參數K為9(即測試集為9個C-WTVC工況數據),可得式(3)中各參數回歸系數隨參數A變化軌跡如圖2所示,交叉驗證均方誤差隨A變化如圖3所示.圖3中MSE和誤差條分別表示9次訓練和測試得到的均方誤差和誤差限.

從圖2可以看出,隨著A增大,越來越多的回歸系數壓縮為0,當A取0.565 0時,回歸系數趨于穩定,這時只有28個參數的系數不為0,極大地降低了模型復雜程度.同時由圖3可知,當A逐漸增大至0.565 0的過程中,盡管回歸均方誤差有所增大,但是,在預測誤差范圍基本保持不變,能夠較好地兼顧預測精度和模型效率.綜合考慮,最終A取0.565 0,相應28個參數(包括復合參數)及其系數如表2所示,共需要22個初始變量,即建立的駕駛員模型為22元二次回歸模型.

從表2中可以看出:1)車速跟隨偏差(歷史車速跟隨偏差以及當前車速和未來目標車速的偏差)對駕駛行為的影響最明顯;2)歷史踏板開度信息對駕駛行為也有一定程度的影響;3)歷史特征和未來目標車速越接近當前決策時刻,對駕駛行為影響越大. 以上分析充分說明駕駛行為同時受到了歷史駕駛行為、車輛狀態信息以及未來預期狀態的影響,體現了駕駛決策的復雜性.

3仿真驗證

3.1工況跟隨效果對比

為了充分驗證二次Lasso回歸駕駛員模型的合理性,本文基于MATLAB/Simulink建立了整車仿真模型和實車控制策略模型.為了驗證本文提出的駕駛員模型的合理性,基于表1參數構建一次線性Lasso回歸駕駛員模型和PI駕駛員模型.將3種駕駛員模型仿真結果和實車測試結果進行了對比,從多個角度分析了各模型優缺點.

駕駛員模型首先應具備良好的工況跟隨效果,在此基礎上仿真得到的工況跟隨偏差和油耗測試結果偏差等指標也應該盡可能接近實車測試結果.仿真結果和臺架試驗結果如表3所示,不同駕駛員模型工況跟隨偏差如圖4所示.由于本研究基于多個C-WTVC工況測試結果建立駕駛員模型,仿真結果與單個實車測試工況進行對比是不合理的.因此,圖4展示了3種仿真模型單個工況測試結果,未考慮與實車測試工況進行對比.

由表3和圖4可以看出,3種駕駛員模型都具有良好的工況跟隨效果,車速偏差大于3 km/h的時間均滿足國標測試要求.其中,二次Lasso回歸駕駛員模型工況跟隨偏差大于其他兩種模型,但是跟隨偏差接近真實駕駛員,油耗相比實車小1.07%,接近實車測試結果.相比之下,PI駕駛員模型工況跟隨偏差最小,但是踏板開度波動劇烈,這說明PI駕駛員模型良好的工況跟隨效果是通過頻繁操縱踏板實現的,和實際駕駛行為差別較大.而激烈的駕駛行為會顯著增加油耗,表3中PI駕駛員模型油耗比實車大4.5%,顯然不利于車輛燃油經濟性分析.此外,一次線性Lasso回歸駕駛員模型踏板輸出特征與二次Lasso回歸駕駛員模型類似,但是油耗和工況跟隨效果較實車駕駛員存在較大偏差.

3.2不同駕駛員模型踏板開度分布和臺架測試結果對比

為了深入分析不同駕駛員模型輸出特征,本文對各駕駛員模型和臺架測試駕駛員輸出分布進行了量化分析.

如圖5所示,本文統計了實車以及各駕駛員模型在不同踏板開度和不同車速下的工作時間分布. 由圖5可知,兩種基于Lasso回歸的駕駛員模型的踏板開度分布相比PI駕駛員模型更接近實車駕駛員.

進一步采用分布相似性評價方法量化對比各模型與實車駕駛員之間踏板輸出分布差異.本文以常用的JS 散度(Jensen-Shannon Divergence)作為相似性評價指標.JS散度源于信息熵和KL距離(Kullback-Leibler Divergence).其中,KL距離也是一種度量兩個概率分布相似性的指標.假設分布P和Q對應的概率密度函數分別為p(x)和q(x),則兩分布的KL距離如式(4)所示,該距離滿足非負性.

式中:p(x)≥0;q(x)>0.顯然,P和Q的分布越相近,KL距離越小,當兩分布相同時,DKL(P,Q)=0.但是,

DKL(P,Q)≠DKL(Q,P),所以KL距離是非對稱的.JS散度在此基礎上進行了改進,其表達式如下:

可見,JS散度具有對稱性,值域為[0,1],相較于KL距離,JS散度能夠更確切地判別兩個概率分布的差異性.但是JS散度要求p(x)>0,q(x)>0,顯然本文中踏板開度分布不滿足要求.一種有效的解決方法是對p(x)和q(x)相加極小值ε,使得概率值均大于0,在不明顯影響概率分布特征的基礎上得到合理的JS散度值.

分別計算各駕駛員模型與實車駕駛員踏板開度分布之間的JS散度值,結果如表4所示.由表4可見,基于二次Lasso回歸的駕駛員模型與實車駕駛員的踏板輸出分布最為接近.

4總結

本文以一款行星式混合動力物流車為研究對象,通過對3種縱向駕駛員模型的研究和仿真對比,可得出如下結論:

1)基于二次Lasso回歸的縱向駕駛員模型的工況跟隨效果較好,滿足國標測試要求.

2)與PI駕駛員模型和一次線性Lasso回歸駕駛員模型相比,基于二次Lasso回歸的縱向駕駛員模型充分考慮了多種因素對駕駛行為的影響,縱向駕駛行為和能耗特征更接近真實駕駛員.

參考文獻

[1]王達.增程式電動汽車的動力分布設計方法與控制策略研究[D].長春:吉林大學,2016:29-56.

WANG D. Study on power distribution design method and control strategy of extended-range electric vehicles [D]. Changchun:Jilin University,2016:29-56.(In Chinese)

[2]周云山,賈杰鋒,李航洋,等. CVT插電式混合動力汽車經濟性控制策略[J].湖南大學學報(自然科學版),2016,43(8):25-31.

ZHOU YS,JIAJF,LIHY,et al. Economic control strategy for a plug-in hybrid electric vehicle equipped with CVT[J]. Journal of Hunan University (Natural Sciences),2016,43(8):25-31. (In Chinese)

[3] BINGHAM C,WALSH C,CARROLL S. Impact of driving characteristics on electric vehicle energy consumption and range[J]. IET Intelligent Transport Systems,2012,6(1):29-35.

[4]重型商用車輛燃料消耗量測量方法:GB/T27840—202[S].北京:中國標準出版社,2022:2-3.

Fuel consumption test methods for heavy-duty commercial vehicles:GB/T 27840—2021 [S]. Beijing:China Standard Press,2022:2-3.(In Chinese)

[5] HAO J X,YU Z P,ZHAO Z G,et al. Optimization of key parameters of energy management strategy for hybrid electric vehicle using DIRECT algorithm[J]. Energies,2016,9(12):1-24.

[6]胡斐,趙治國.基于遺傳算法的混合動力汽車前向仿真駕駛員模型參數優化[J].機械與電子,2010,28(5):76-78.

HU F,ZHAO Z G. Optimization of driver's model parameters for facing-forward simulation of HEV based on genetic algorithm[J]. Machinery & Electronics,2010,28(5):76-78. (In Chinese)

[7]鄧濤,孫冬野,胡豐賓,等.遺傳算法優化的方向與速度綜合控制駕駛員模型[J].重慶大學學報,2011,34(9):1-8.

DENG T,SUN D Y,HU F B,et al. Direction and speed integrated control driver model optimized by genetic algorithms[J]. Journal of Chongqing University,2011,34(9):1-8.(In Chinese)

[8]吳松松,鄭燕萍,杜政平,等.基于模糊PID控制理論的駕駛員模型的建立[J].公路與汽運,2012(4):14-16.

WU S S,ZHENG Y P,DU Z P,et al. Establishment of driver model based on fuzzy PID control theory[J]. Highways & Automotive Applications,2012(4):14-16.(In Chinese)

[9] XU L,HU J,JIANG H,et al. Establishing style-oriented driver models by imitating human driving behaviors[J]. IEEE Transactions on Intelligent Transportation Systems,2015,16(5):2522- 2530.

[10]沈沛鴻,趙治國,郭秋伊.基于ANFIS的工況跟蹤用縱向駕駛員模型開發[J].汽車工程,2019,41(7):815-822.

SHEN P H,ZHAO Z G,GUO Q Y. Development of longitudinal driver model for driving cycle tracking based on ANFIS[J].Auto- motive Engineering,2019,41(7):815-822.(In Chinese)

[11]何秀麗.多元線性模型與嶺回歸分析[D].武漢:華中科技大學,2005:2-6.

HE X L. Research on multivariate linear model and ridge regres- sion[D]. Wuhan:Huazhong University of Science and Technol- ogy,2005:2-6.(In Chinese)

[12]高露.高維二次回歸的正則化模型選擇[D].合肥:中國科學技術大學,2019:16-38.

GAO L. Model selection for high-dimensional quadratic regression via regularization[D]. Hefei:University of Science and Technology of China,2019:16-38.(In Chinese)

[13] TIBSHIRANI R. Regression shrinkage and selection via the lasso:a retrospective[J]. Journal of the Royal Statistical Society,Series B(Statistical Methodology),2011,73(3):267-288.

[14] LIU W,DOU Z H,WANG W G,et al.Short-term load forecasting based on elastic net improved GMDH and difference degree weighting optimization[J].Applied Sciences,2018,8(9):1603.

[15] MAJTEY A P,LAMBERTI P W,PRATO D P. Jensen-Shannon divergence as a measure of distinguishability between mixed quantum states[J]. Physical Review A,2005,72(5):762-776.

猜你喜歡
回歸分析
社會保障支出與GDP之間的關系研究
基于CGSS2003數據關于住房影響因素的報告
基于CGSS2003數據關于住房影響因素的報告
溶血標本對生化檢驗的準確性干擾及糾正性回歸分析
中國經濟發展狀況與大學生就業情況的相關性研究
北京市旅游產業與經濟增長的實證分析
城鄉居民醫療費用的相關性與回歸分析
基于變形監測的金安橋水電站壩體穩定性分析
森林碳匯影響因素的計量模型研究
河北省城鎮居民人均可支配收入與消費統計分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合