?

計算機病毒防御中數據挖掘的應用研究

2018-12-25 17:14何歡
數字技術與應用 2018年3期
關鍵詞:計算機病毒數據挖掘終端

何歡

(遵義醫學院,貴州遵義 563000)

1 數據挖掘概述

在計算機病毒不斷演化和發展的過程中,其數據信息的更新速度較快,而數據挖掘技術則是通過對于以往數據信息類型的總結,對比分析惡意程序代碼中的數據類型。這樣的方式更加有利于隱匿于系統內部的病毒被快速發現,數據挖掘從大量信息中搜索隱藏條件的基本功能,是支持病毒識別的關鍵。而數據挖掘算法中決策樹算法、K-means聚類分析、SVM回歸分析、Apriori布爾關聯規則頻繁項集等一系列算法在本質上均已達到了快速識別數據特征的基本要求。因此,能夠以計算機病毒在系統內部產生的無限繁衍機制,或數據類型的更替迭代來判斷計算機系統是否受到病毒攻擊。此外,對于以往病毒信息的總結,在數據庫內存儲的病毒特征也是提供預防措施的甄別環節,是為主動防御系統提供數據參數和量化指標的可控方式。因此,在計算機病毒不斷發展的過程中,以數據挖掘技術為基礎的計算機網絡安全服務或者預設防御系統也是目前極為關鍵的研究方向。

2 計算機病毒的的基本特征

2.1 廣泛傳播與實時擴散

計算機病毒的傳播過程需要兩種載體,網絡傳播或硬件傳播,但本質上網絡傳播的速度更快。在互聯網時代,其數據信息本身的使用頻次較高,病毒侵襲于交互信息的文本資料中,利用IP協議的漏洞攻擊終端系統,已經成為多數計算機病毒的主要攻擊路徑。而且當一臺終端系統受到侵襲之后,病毒可以將此終端設備作為后臺,通過自身的無限繁殖擴大破壞力與攻擊力。若終端系統的防護體系并未及時發現病毒,在之后的信息傳播與交互中也相當于輔助了病毒傳播。因此,計算機病毒在具備了廣泛性的傳播覆蓋面后更加形成了實時擴散的破壞力,是對于計算機網絡安全性能的最大威脅。

2.2 病毒種類型更新迭代

自計算機病毒問世以來,終端系統和網絡協議都在不斷更新換代,其根本目標便是規避自身漏洞,降低病毒攻擊頻次,并增強自身的防御體系功能性。但是計算機系統本身的漏洞也為計算機病毒留有可攻擊的條件,計算機病毒自身的修改和更新速度造成了進一步的安全風險威脅。My Doom、Worm.Blaster、So big等早期的病毒類型以Microsoft Outlook電子郵件系統傳播為主,用戶在終端系統仍然可以通過設置防火墻加以防御,即便防御失敗損失也基本控制在終端系統內部。而新一輪的網絡勒索病毒,以撒旦(Satan)勒索病毒為代表,攻擊重心在于服務器數據庫,同時在控制終端系統之后對用戶勒索至少0.3個比特幣的贖金,否則數據信息將永遠無法解密。從植入惡意代碼攻擊系統程序,到攻擊數據庫勒索用戶贖金,其計算機病毒的更新迭代速度之快是極為重要的特征表現[1]。

2.3 較強的破壞性與攻擊性

早期黑客所使用的木馬病毒雖然產生了較大的破壞力,但是在系統自主修復之后仍然可以恢復運行速度和常規使用。其中較為重要的數據信息仍然可以得到恢復,且攻擊目標多為個體用戶。而新一輪的勒索病毒席卷全球,超過150個國家至少30萬名用戶的終端系統受到攻擊,直接損失高達80億美元。

3 計算機病毒防御中數據挖掘的應用模式

3.1 數據收集模塊

數據收集是應用數據挖掘技術的基礎條件,需要總結網絡病毒的基本數據,收集其特征數據作為分析演算的原始資料。在收集信息的過程中,必須梳理計算機病毒的特征屬性,并將其定義為搜索對象,在不可預測的條件下歸納攻擊類型的嚴重程度,降低數據挖掘的盲目性才能達到預期的數據信息收集效果[2]。

3.2 數據特征挖掘

數據特征挖掘模式是將收集到的計算機病毒信息進行分類,依據其攻擊特征、侵襲路徑、破壞力等一系列特征屬性劃分事件庫。在事件庫中可以將數據挖掘算法作為判定病毒特征的主要依據,通過更為清晰的數據分析結果,歸納和總結防御體系的操作方向。

3.3 關聯規則庫

事件庫僅能夠對病毒數據進行分組描述其基本特征,而并不能直接總結病毒特征的識別規律。而關聯規則庫的應用,則是為數據挖掘提供了聚類分析模式,或者是基于病毒特征的識別機制。在此模塊中,病毒攻擊終端系統時的運行軌跡、執行程序、基本特征進行了詳細的記錄和規則集合匯總。因此能夠以病毒演化和攻擊規則來識別病毒特征,加強防御系統的識別效果。其中極為重要的聚類分析算法,更是將病毒攻擊路徑中差異度極小的數據特征進行了更為詳細的歸納。當不同執行程序同時運行時,其數據信息的應用頻次、后臺處理條件、復雜程度、復制速度均為識別惡意代碼的客觀規律,因此可以為計算機安全防御系統提供更為直接的對比參照,支持對于病毒類型的快速識別。

3.4 決策機制

決策模塊在數據挖掘過程中起到了極為關鍵的作用,是以數據類型的匹配程度來判定規則庫信息符合度的制約條件。此前,360防火墻對于騰訊軟件的識別度較低,以至于誤判其病毒屬性,導致提示系統卸載并不存在病毒特征的軟件系統。其本質因素便是決策模塊的功能并未健全,對于規則運算條件的約束力不足。在全新的勒索病毒以加密算法庫為載體,實時對應腳本文件的Http請求,讀取或下載遠程服務器文件的特征中,失去對于病毒類型的決策效率,也相當于為病毒侵襲提供了遍歷終端系統文件的優勢。因此,在防御計算機病毒的整體機制中,雖然數據挖掘技術歸納了相當全面的病毒特征,但是也需要就其決策模塊的適應度和考察方向加以調整,否則系統誤判的情況仍然會導致數據類型不匹配的情況,最終造成病毒侵蝕數據庫盜取重要文件的不利影響[3]。

3.5 數據預處理方案

數據預處理方案是在病毒特征信息和決策條件均已完備之后的最終數據處理結果,可以將其視為分析歸類的最終審核,或者是對于開展數據信息時的最后特征驗證。例如將端口信息、IP地址信息、目標IP地址等基礎信息類型進行整理、歸納、集合,并最終呈現在網絡防御系統之中。這樣的數據信息處理流程,增加了多重驗證病毒信息的操作方案,可以為防御系統提供更為可靠的數據參量或驗證指標。因此,通過數據預處理方案的最終判定也能夠加強數據挖掘的整體效果,進而精準描述病毒類型的原始特征,增強其防御系統的識別度和精準度。

4 結語

綜上所述,計算機系統本身的漏洞并無法直接消除,在與病毒不斷博弈的的過程中逐步完善之后,才能規避病毒攻擊。因此,借助數據挖掘技術能夠加強計算機防御系統的安全性,通過快速識別病毒類型及其基本屬性提供更為可靠的參考數據支持。

[1]李嘉嘉.淺談數據挖掘在計算機網絡病毒防御中的應用[J].網絡安全技術與應用,2017,(08):84+89.

[2]張燕.數據挖掘技術在計算機網絡病毒防御中的應用探究[J].太原城市職業技術學院學報,2016,(04):174-176.

[3]唐穎.數據挖掘技術在計算機網絡病毒防御中的運用[J].信息與電腦(理論版),2015,(21):133-134.

猜你喜歡
計算機病毒數據挖掘終端
X美術館首屆三年展:“終端〉_How Do We Begin?”
通信控制服務器(CCS)維護終端的設計與實現
計算機病毒防范技術及應用實踐微探
基于并行計算的大數據挖掘在電網中的應用
多功能北斗船載終端的開發應用
集成免疫小波神經網絡模型在計算機病毒檢測中的應用
一種基于Hadoop的大數據挖掘云服務及應用
ABB Elastimold 10kV電纜終端及中間接頭
對于計算機病毒防護措施的探索
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合