?

智能網聯汽車車載網絡異常檢測技術研究

2023-10-30 11:29都一博李玉峰
信息通信技術 2023年4期
關鍵詞:智能網車載車輛

王 鵬 都一博 李玉峰

1 中原工學院 鄭州 450007

2 網絡通信與安全紫金山實驗室 南京 210008

3 上海大學 上海 200444

引言

隨著智能網聯汽車的快速發展,云計算、人工智能、車聯網通信(V2X)等先進技術正在汽車中得到越來越廣泛的應用,這使得聯網汽車更加智能,為人們提供舒適的服務并保障駕駛員和乘客的安全。然而,隨著汽車變得越來越連接,打破了汽車現有的閉環狀態,為車載電子系統帶來了潛在的信息安全問題。當汽車開始變成車輪上的聯網計算機時,車載網絡安全問題成為了一個日益嚴重的問題[1]。

近年來,汽車信息安全事件不斷發生。2021年,黑客利用中繼裝置放大車主汽車鑰匙的信號,入侵解鎖并偷走了伯明翰路上的奔馳C級汽車;2022年,奇安信星輿實驗室Kevin2600發現本田汽車鑰匙存在設計缺陷,無線信號被重放[2];同年,蔚來汽車遭受了一起勒索攻擊事件,導致大量用戶數據泄露;2023年,包括豐田、奔馳、寶馬等全球20多家知名車企,由于應用程序接口的漏洞,導致車主個人信息泄露[3],暴露了用戶的敏感數據。這些事件無不顯示針對網聯汽車的攻擊不僅危及個人隱私、造成經濟損失,還可能危害人們的生命安全,甚至對國家的公共安全造成威脅,因此,迫切需要采取措施以保障車輛的網絡安全。

現有的車載網絡協議在設計之初缺乏信息安全考慮[4],沒有提供內置的身份驗證和加密設施來保護系統免受潛在的安全攻擊;此外CAN總線協議廣播消息的性質也為攻擊者提供了機會;汽車網聯化也將更多的設備如藍牙、GPS、傳感器等接入到車載網絡中,無形中增加了更多的攻擊入口,這些因素都導致網聯汽車容易受到攻擊損害。更改協議可能需要對車輛的硬件和軟件進行較大的改動,而異常檢測技術可以在保持CAN總線協議不變的情況下進行部署,及時發現攻擊后使其無害。因此,研究車載網絡異常檢測技術對提高車載網絡安全性有很大幫助。

1 車載網絡概述及其安全分析

智能網聯汽車的興起為我們帶來便利和智能化,也帶來了車輛網絡安全新挑戰。高度互聯性使其面臨廣泛、復雜的攻擊面,惡意攻擊者可操縱車載網絡和遠程控制系統,威脅乘客安全和交通系統穩定。因此,了解其架構、攻擊面和攻擊方式,對后續采取有效防御措施尤為關鍵。

1.1 智能網聯汽車系統架構

智能網聯汽車是一種基于互聯網和通信技術的新型汽車,通過使用大量ECU控制單元、傳感器、執行器相互協同工作來實現車身控制、智能駕駛等各類功能[5],智能網聯汽車系統架構如圖1所示。

圖1 智能網聯汽車系統架構

智能網聯汽車通過車內網絡與不同類型的ECU、遠程通信和車載娛樂系統和車載診斷系統(OBD-II)連接,以自動廣播消息。車內有不同的通信協議,如CAN、FlexRay、媒體導向系統傳輸(MOST)等。在這些協議中,CAN是汽車網絡應用最為廣泛的一種,負責不同系統功能的整體行為,如轉向、發動機管理、制動系統和導航等。智能網聯汽車融合了車輛自身的感知、計算和決策能力,通過與周圍環境的無線通信和數據交換,實現車輛之間的協同工作。

1.2 智能網聯汽車攻擊面分析

智能網聯汽車作為高度互聯的移動終端,面臨著廣泛的安全攻擊面。車載網絡攻擊面涵蓋了車輛中各種組件、接口和通信渠道等存在潛在安全風險和攻擊威脅的部分。以下是一些常見的車載網絡攻擊面。

1)無線通信:包括車輛與外部網絡連接的無線通信方式,如藍牙、Wi-Fi、蜂窩網絡等。攻擊者通過這些無線通信渠道入侵車輛系統,進行遠程控制、信息竊取或干擾。

2)CAN總線:CAN總線是車輛內部系統之間的主要通信網絡。攻擊者通過物理接入或遠程方式入侵CAN總線,進行惡意指令注入、篡改車輛數據或控制車輛的各種功能。

3)車載娛樂系統:車載娛樂系統通常與車輛的其他系統存在連接,攻擊者通過娛樂系統的漏洞或弱點入侵車輛系統,控制其他關鍵功能,如剎車、加速等。

4)外部存儲設備接口:車輛通常具有USB接口、SD卡插槽等外部存儲設備接口,攻擊者可以通過惡意軟件或病毒感染存儲設備,然后將其插入車輛系統,導致惡意代碼傳播或攻擊。

5)車載診斷系統(OBD-II):用于進行車輛維護和故障診斷。攻擊者可以通過物理訪問或遠程入侵診斷接口,操控車輛系統,執行惡意操作。

1.3 常見攻擊方式

針對智能網聯汽車終端,攻擊者主要通過物理侵入或遠程侵入的方式進行攻擊[6],利用DoS、重放、女巫攻擊等手段,針對車載總線和系統發動攻擊,以獲取車輛控制權和竊取車輛信息。物理攻擊針對接口和CAN總線進行,遠程攻擊包括遠程控制和對無線通信的攻擊等。典型攻擊方式與常見的防御方法見表1。

表1 典型攻擊方式及常見防御方法

2 車載網絡異常檢測技術研究進展

2.1 車載網絡異常檢測技術分析

異常檢測技術是保護車載網絡安全的有效手段,它用于尋找異常情況,并在第一時間發現攻擊并使其無害。針對智能網聯汽車車載網絡異常檢測技術,按照技術發展歷程分為基于設備指紋、參數監測、信息論和基于人工智能以及混合方法五個方面。如圖2所示。

圖2 車載網絡異常檢測技術

基于設備指紋、參數監測、信息論的方法屬于基于規則或特征的檢測方法,檢測準確度高,但只匹配特征庫里的攻擊,對于未知的攻擊,基本無能為力。隨著人工智能的發展,檢測方法變得智能化,借助機器學習(ML)、深度學習(DL)等技術,能在一定程度上檢測未知攻擊,相對于前述方法,人工智能方法具備顯著優勢且備受關注。近幾年,深度學習在各行業大熱,越來越多的深度學習技術被應用于車載網絡并取得較好的效果,是目前的研究熱點。

然而,這些方法仍是各自獨立的研究途徑,為實現更優異的檢測效果,更需善用技術的互補性,巧妙融合各種方法,取長補短,例如集成學習的協同效應以及結合多種技術優勢的混合方法,從而更好地應對多樣化的攻擊威脅。將各種方法的優勢和局限性進行比較如表2所示。后面對這幾種方法的研究展開詳細介紹。

表2 車載網絡異常檢測技術優勢及局限性比較

2.2 車載網絡異常檢測技術研究

2.2.1 基于設備指紋的異常檢測技術

基于設備指紋的車載網絡異常檢測技術是一種有效的安全防護方法。該技術通過對車載網絡中設備的唯一特征進行提取和分析,識別出異常行為并進行及時響應。

研究人員在車載網絡安全領域提出許多基于設備指紋的異常檢測技術。其中,Song等人[13]通過提取網絡信號特征并進行統計分析,實現了對入侵行為的檢測。另外,Lee等人[14]則利用CAN消息的返回時延和時間間隔等作為設備指紋信息,并取得了較好的檢測效果。VoltageIDS[15]利用CAN信號作為每個ECU的獨特指紋,考慮欺騙和總線斷開攻擊,通過觀察兩個ECU之間發送的相同信號來檢測電氣故障攻擊。

基于設備指紋的車載網絡異常入侵檢測技術具有精確性、實時性和適應性等優點,能夠有效地識別和響應入侵行為。然而,該技術存在特征提取復雜、且物理特征易受到如設備溫度和老化等影響而變化的問題。

2.2.2 基于參數監測的異常檢測技術

基于參數監測的異常檢測技術是通過監測網絡和消息級別的參數,如車輛的車速、加速度、剎車狀態、轉向角度等各種參數來檢測異常行為或攻擊跡象。

相關參數監測解決方案如下。李中偉等人[16]針對總線脫離攻擊所引發的車載CAN總線通信安全問題,提出了一種車載CAN總線脫離攻擊入侵檢測算法。WINDS[17]通過連續小波變換的設計來檢測CAN總線上的異常情況,利用小波變換精確地確定頻率分量在時間軸上的位置,在攻擊立即發生的情況下實現更高的檢測率。

基于參數監測的IDS具有較低的計算要求,為了提高檢測的準確性和魯棒性,可以考慮結合其他參數,以綜合評估車載網絡的安全狀態,并及時發現潛在的入侵行為。但容易受到噪聲影響。

2.2.3 基于信息論的異常檢測技術

信息論是一種數學處理通信系統中傳輸信息的概念、規則的方法。其中,熵是信息論中的關鍵概念之一,基于熵的異常檢測算法基于其統計熵水平來表征一組數據的預期行為[18],用于衡量無序度和與隨機變量相關的不確定性。

基于信息論的一些解決方案描述如下。張海春等人[19]在分析了基于信息熵的車載CAN總線異常檢測機制的基礎上,提出一種相對熵的檢測方法,彌補了前者無法檢測出異常細節信息的缺陷。譚凱等人[20]針對CAN總線通信安全問題,提出了基于報文位反轉特征和條件隨機場的CAN總線協議字段劃分算法,通過使用模糊測試技術來監視網絡的異常狀態并發現網絡漏洞,正確有效地檢測出大多數異常行為。文獻[21]中,研究者使用Bloom濾波器結合報文標識符和部分數據字段的信息,實現了對車載網絡中報文周期性的檢測,可有效發現潛在的重放或偽造攻擊。

基于信息熵的車載網絡異常檢測可以有效檢測重放、泛洪等攻擊,但不具備良好的穩健性,易受汽車狀態變化造成的信息熵抖動影響。另外,需要消耗大量的計算資源,特別是在大規模車載網絡中,可能會面臨實時性要求難以滿足的問題。

2.2.4 基于人工智能的異常檢測技術

1)傳統機器學習

傳統的基于機器學習的異常檢測技術,主要通過經驗來自動改進算法,旨在通過構建合適的特征工程和選擇適當的分類算法來檢測車載網絡中的異常行為,可以應用以理解CAN網絡數據的模式,從而學習系統的預期行為。

L.Yang等人[22]使用CAN入侵OTID數據集,決策樹、隨機森林、額外樹(ET)和XGBoost模型,并與KNN和SVM進行比較,結果表明,DT、RF和ET方法比KNN和SVM方法更有效,具有99.99%的準確性。文獻[23]中提到一個基于VGG的模型,與其他作者在先前研究中使用的傳統方法KNN、SVM和RF相比,假陽性率降低,準確率提高到96%。在文獻[24]中,OTID數據集與SVM、DT、MLP和RF一起使用。RF是性能最好的分類算法,準確率為98.5%。

基于ML的IDS通過審查大量數據發現人類未能明顯觀察到的趨勢和模式,能夠檢測未知攻擊。此外,隨著更多的數據被輸入到模型中,該模型不斷提高準確性和效率。缺點是計算要求高。

2)深度學習

通過構建和訓練深層神經網絡從大數據集中來提取和學習數據的高級特征,從而實現復雜的模式識別和分類任務。

基于深度學習方法的入侵檢測研究方面,Song等人[25]設計了一種基于深度卷積神經網絡的車輛網絡入侵檢測系統,并構建了CAN ID二維矩陣數據作為輸入,以訓練DCNN分類器。Ho等人[26]提出一種利用卷積神經網絡檢測已知和創新網絡攻擊的新入侵檢測模型。Lo等人[27]通過使用CNN和LSTM網絡自動提取時空特征并證明自動提取的頻譜和時間特征在表征網絡流量方面比人工特征工程表現更好。

深度學習方法與傳統ML相比避免了復雜的特征提取步驟,且可以通過網絡層將輸入的高維特征進行多維抽象變換,發現更深層次的潛在特征,但是深度學習方法需要海量數據和高算力,訓練時間長,泛化能力差,而且它像一個黑匣子,可解釋性差。

3)集成學習

集成學習方法是通過將多個弱分類器組合成一個強分類器來改善異常檢測的效果,以產生最優預測結果的技術。此外,集成學習還可以通過投票、加權或組合等方式來整合不同分類器的輸出,提供更可靠的異常檢測結果。

Khoei等人[28]研究了基于裝袋的、基于增強的和基于堆疊的三種不同的集成學習技術的性能。Shi等人[29]提出基于集成學習的極端樹網絡入侵檢測框架,通過改進極值樹減少集成訓練時間。Mowla等[30]提出基于動態投票的車載網絡可解釋方法,利用隨機森林和動態投票技術,通過特征和模型探索提供具有可解釋性的魯棒解決方案。

通過集成學習,IDS能夠綜合多個分類器的優勢,提高檢測率、降低誤報率,可以實現所需的準確性和魯棒性。但是,多個模型集成一定程度上增加了模型復雜度,反應時間變長、模型體積增大,降低在車輛上的可用性。

2.2.5 基于混合方法的異常檢測技術

基于混合方法的異常檢測技術是將多種不同的技術和方法結合起來,以增強檢測能力和提高準確性,和集成方法相似,但它一般按照某種規則進行分層,先后使用互補的技術。它綜合利用傳統的規則基礎方法和基于機器學習的方法,以及其他相關技術,以應對各種復雜的安全威脅和攻擊。

相關文獻如下:趙振堂等人[31]針對車內多種入侵行為難以檢測的問題進行分析,提出了基于SVDD的流量異常檢測方法以及基于HTM網絡的數據異常檢測方法。Wisanwanichthan等人[32]提出了一種基于樸素貝葉斯和SVM的雙層混合網絡入侵檢測方法,研究了不同攻擊類別的共同特征,在檢測罕見攻擊方面表現出出色的性能。

基于混合的方法結合兩種或幾種方法的優勢,從不同的點出發,各層有各層的工作,可以一定程度上節省時間,增加準確性,設計和部署混合方法的IDS面臨一些挑戰,如訓練數據的獲取和標記、算法選擇和參數調優、系統的可擴展性和實時性等方面的考慮。

3 基于集成學習的車載網絡異常檢測方法

車載網絡易受不同類型的攻擊,對各種攻擊檢測不同ML模型的預測性能差異很大,我們往往只能得到多個有偏好的模型,車載網絡的異常檢測存在單一模型檢測不全面的問題,集成學習即組合多個弱模型以期望得到一個更好更全面的強模型。因此本節提出了一種基于Stacking集成的異常檢測方法。

3.1 Stacking集成學習方法

集成學習通過構建并結合多個學習器來完成學習任務,以獲得比單一學習器顯著優越的泛化性能。Stacking是一種常見的集成方法,由兩層組成,先從初始數據集訓練出初級學習器,然后“生成”一個新的數據集用于訓練次級學習器,在這個新數據集中,初級學習器的輸出被當作樣例輸入特征,而初始樣本的標記仍被當作樣例標記。Stacking思想的原理示意如圖3所示。

圖3 Stacking思想原理圖

在Stacking方法中,每個基模型選取任意一種機器學習模型,比如KNN(K近鄰)、NB(樸素貝葉斯)、DT(決策樹)、SVM、邏輯回歸等。并將第一層訓練出最好的模型作為第二層集成的元分類器。經驗上來說,各個基模型之間差異性越顯著,集成效果越好。

3.2 實驗設計與實現

系統使用Python3.9實現,使用包含最新攻擊場景的標準IDS數據CICIDS2017[34],包含正常、Dos攻擊、PortScan攻擊、BruteForce攻擊等七類數據,該數據集共77種特征。選取了部分數據樣本進行實驗。

實驗選擇KNN,NB,RF(隨機森林)模型作為基礎分類器,隨機森林作為Stacking集成的元分類器進行多分類任務,流程如圖4所示。

圖4 實驗流程圖

在模型訓練之前,對數據進行歸一化處理、缺失值填入、標簽編碼等預處理,然后由于某些異常數據數量較少,使用過采樣(SMOTE)方法平衡數據集,數據分布樣本變化如表3所示,實驗選用準確率、檢測率、召回率、F1分數和預測時間作為評價指標。

表3 數據樣本情況

3.3 實驗結果與分析

通過實驗,生成如圖5所示的混淆矩陣,顯示了三個基礎分類器和集成模型在測試集上的預測結果。分析各模型針對各種攻擊的F1分數如表4所示,集成模型在各種攻擊檢測的F1分數均取得最優。

表4 各攻擊的F1分數

圖5 NB、KNN、RF、Stacking集成混淆矩陣

將訓練的模型性能與單一模型的效果進行比較,如表5所示,基于NB算法的準確率最低為66.346%,RF分類器在三者之中取勝作為Stacking集成的元分類器,將三種模型進行疊加后,預測時間雖然比最快的NB模型慢一點,但準確率、檢測率、召回率和F1分數均達到最優,相較于最優的RF模型準確率從99.541%提高到99.602%,即可以更好檢測到所有訓練好的攻擊。

表5 CICIDS2017數據集上的性能評估

4 車載網絡異常檢測技術發展趨勢

隨著汽車智能化的高速發展,車載網絡異常檢測技術的重要性與日俱增。然而,日益復雜和多樣化的安全威脅使得車載網絡異常檢測面臨著一系列挑戰。在保障車輛和乘客安全的同時,車載網絡異常檢測需具備全面、實時、準確和高效等特點,以應對不斷演化的威脅和攻擊手段。文章對當前車載網絡異常檢測技術面臨的挑戰進行深入分析,展望了其未來可能的發展方向。

4.1 強化對未知攻擊的檢測

隨著攻擊者不斷變化和創新攻擊方式,傳統的檢測方法很難有效應對未知攻擊。為提高車載網絡的安全性,需要開發更智能和自適應的檢測方法,以覆蓋更多的攻擊場景。未知攻擊的檢測可以借助機器學習、深度學習等先進技術。通過使用大規模數據集和實時學習算法,讓檢測系統不斷學習和適應新的攻擊方式,從而提高檢測的準確性和泛化能力。同時,可以采用行為分析的方法,對車輛和乘客的正常行為進行建模,當出現異常行為時,及時發出警報。

4.2 實時性和低延遲

車載網絡異常檢測系統需要具備及時發現和響應異常行為的能力,這是確保車輛安全的重要要求。然而,在實際應用中,車輛面臨著多種潛在的攻擊和異常行為,處理大規模數據可能導致計算和存儲的負擔增加,從而影響檢測系統的實時性能。對此,研究人員可以針對車載網絡的特點,通過采用數據流處理、分布式計算、輕量級算法和模型以及硬件優化等方法,提升系統的實時性,確保及時檢測和響應車載網絡的異常行為。這將為車輛提供更可靠的安全保障,保護乘客和車輛的安全。

4.3 輕量化和資源優化

一些先進的異常檢測方法,如深度學習模型,通常具有較大的規模和計算復雜度。然而,車載網絡環境受資源限制,為解決這一問題,可以采用模型壓縮和優化技術,減小模型的規模和計算復雜度,同時保持檢測的準確性。一種常見的方法是使用剪枝和量化技術,通過去除冗余參數和降低精度來減小模型的大小。此外,還可以采用輕量級的神經網絡結構,如MobileNet和EfficientNet等,這些網絡結構具有較少的參數和計算復雜度,適合在車載網絡中進行部署。此外,還可以考慮利用硬件加速器,如GPU和FPGA等,以提高車載網絡異常檢測系統的計算性能和能效。

4.4 多模態數據融合

智能網聯汽車產生的數據具有多模態性,包括傳感器數據、通信數據、地理位置數據等多種類型的數據[33]。目前的研究大多基于單一模態的數據,忽視了多模態數據之間的關聯和相互影響。因此,如何綜合利用多種數據源進行異常檢測,并通過數據融合和綜合分析來提高異常檢測的效果,成為未來車載網絡異常檢測技術的重要研究方向之一。

研究人員可以探索融合不同模態數據的方法,以獲取更全面的異常行為信息;還可以探索跨模態數據的遷移學習方法,通過在一個模態上學習到的知識,來輔助其他模態數據的異常檢測。減少在每個模態上進行訓練的工作量,并利用已有的知識來提升異常檢測的性能。這將幫助我們更好地理解車輛行為和交通環境,提升異常檢測的準確性和魯棒性,為智能網聯汽車的安全和可靠性提供更強大的保障。

5 結語

智能網聯汽車作為車聯網朝著“云-管-端”架構發展下的終端節點,面臨著日益嚴重的信息安全威脅。在此背景下,文章首先介紹了智能網聯汽車中車載架構,隨后總結了當前車載網絡安全問題,對比分析了車載網絡異常檢測技術現狀。最后總結了當前車載網絡異常檢測技術面臨的挑戰并展望未來的發展方向。

猜你喜歡
智能網車載車輛
5G賦能智能網聯汽車
高速磁浮車載運行控制系統綜述
智能網聯硬實力趨強
迎戰智能網聯大爆發
車輛
智能互聯勢不可擋 車載存儲需求爆發
冬天路滑 遠離車輛
基于SJA1000的CAN總線智能網橋設計
提高車輛響應的轉向輔助控制系統
基于ZVS-PWM的車載隔離DC-DC的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合