?

數據挖掘技術在軟件工程中的應用研究

2022-03-11 08:41
信息記錄材料 2022年1期
關鍵詞:漏洞代碼數據挖掘

李 娜

(西安文理學院 陜西 西安 710000)

0 引言

在信息化時代下,傳統處理技術不能滿足信息處理需求,無法精準傳輸和存儲海量信息。而數據挖掘技術,可以高效處理數據信息,實現準確傳輸與記錄。當前,各行業領域開始應用數據挖掘技術,尤其是軟件工程領域。該領域發展速度快,軟件工程和信息技術發展關聯性強。

1 數據挖掘技術概述

數據挖掘,是在海量數據內探測有價值的規律行為,能夠應用到研究領域,確保研究人員獲取目標數據,同時可以應用到商業領域。數據挖掘技術,能夠掌握數據潛在規律,通過歷史數據預測未來。此外,技術可檢測數據內的異常數據,探索特殊數據對象。數據挖掘系統快速發展,初代系統成為獨立應用,能夠支持單一算法、若干算法?,F代系統可以連接移動數據,并且存儲到計算模型內,應用到移動設備中。數據挖掘操作中,能夠預處理數據,清除不完整、不一致數據,同時做好數據抽樣,維護數據統一性與正確性。深度挖掘數據,應用多種挖掘算法,科學預測和分類數據。在分類操作中,通過模型建設分類新數據與原數據。在分類操作中,能夠以模型方式分類數據,建設函數值模型,準確預測數據,涉及到關聯算法、聚類算法。按照挖掘過程選擇算法與結果,評價整個數據挖掘過程,同時將結果傳輸至用戶,轉換信息模式,確保用戶能夠理解。

2 數據挖掘技術在軟件工程中的應用問題

2.1 數據信息復雜度高

基于當前發展可知,軟件工程數據涉及結構化數據、非結構化數據。在非結構化數據中,軟件代碼的作用顯著,且軟件版本信息會極大影響結構化數據。結構化數據、非結構化數據的關系密切,通過數據挖掘技術可以優化整合結構化數據、非結構化數據。

2.2 缺乏一致性評價標準

在生產生活中,多領域開始應用數據挖掘技術,通過該項技術,能夠評價處理結果。由于評價方式不一致,所以軟件工程的評價標準不一致,加劇軟件工程信息復雜度[1]。表達方式差異性顯著,人員無法比對和應用相關信息,導致軟件工程的建設難度加大。

3 數據挖掘技術的應用流程

在軟件工程中,應用數據挖掘技術的涉及內容較多,比如數據預處理、數據挖掘、模型表現等。見圖1為數據挖掘流程。數據預處理操作中,主要任務與目標在于處理原始數據,清晰劃分目標對象,準確分離不同數據。在數據預處理中,注重清理軟件工程涉及的原始數據、冗余信息,同時補充缺失數據,形成完整的數據鏈,為軟件開發、軟件管理、軟件評測提供參考。數據挖掘操作中,為了維護挖掘效果,必須確定挖掘人物,分類、歸納和評估數據,選擇針對性挖掘方法。在選擇期間,聯合數據自身特點、軟件工程實際要求,優化調整數據挖掘方法,維護挖掘有效性。為了維護挖掘結果表達完整度,使用知識表示、模型評價方式,確保數據挖掘結果完整性,并以系統化方式呈現,確保技術人員在數據挖掘結果指導下,能夠針對性開發、管理、測評軟件,提升軟件工程時效性,為后續工作開展奠定基礎。

4 數據挖掘技術在軟件工程中的應用策略

4.1 應用分析

(1)挖掘結構。數據挖掘技術在結構與流程代碼中的應用流程如下:首先,檢測克隆代碼方法?;诳寺〈a角度分析,按照軟件工程云隱標準,復制部分代碼流程和工具。在特殊情況下,聯合實際情況更改部分代碼,管理和檢測上述代碼,避免傳遞故障問題,盡早實現系統維護目標。應用克隆代碼方式,確保軟件系統運行順利性?,F階段,克隆代碼檢測方式,包括標識符比較、文本對比、程序結構、度量等[2]。不同克隆代碼檢測技術,都具備獨特診斷與評估方式,技術應用期間,按照實際情況選擇。其次,Aspect挖掘法,該項技術利用橫切關注點獲取挖掘方式。軟件工程中,應用Aspect挖掘法,優化改造系統。尤其是處理問題時,可以提供多種方式方法。形式概念、度量分析法的效果顯著[3]。上述技術方法,需要通過重新構建選集方式,科學處理橫切點挖掘問題。合理應用數據挖掘技術,可以發揮出特殊應用功能。數據挖掘示意圖見圖2。

(2)軟件項目管理。在軟件工程管理活動中,合理應用數據挖掘技術。在版本控制信息中,挖掘組織關系;版本控制信息挖掘?;谲浖こ谭治?,系統繁瑣性比較強,對組織關系挖掘的標準高,優化配置資源,落實應用依據。將軟件工程管理流程作為主體,按照電子郵件、共享文件,深度挖掘數據信息,形成不同工種組織關系,避免出現流程混亂問題,全面落實軟件工程管理工作[4]。此外,版本控制可以記錄文件內部信息變化,將其作為用戶掌握版本內容的依據。在版本控制信息中,合理應用數據挖掘技術,降低系統維護成本支出,以此展示出警示作用,體現出系統修復環節披露問題,全面加強軟件工程管理水平。

(3)軟件開發。數據挖掘技術將數據庫作為基礎。在發展過程中,先前理論應用到實踐中,并且形成深層次科學內容,實現共同發展。軟件工程為工程化學科,可以聯合不同項目指標、用戶需求、資金需求,研究開發出新型產品。在軟件工程開發中,整個開發流程繁瑣,但是隨著技術成熟度提升,開始推廣到各領域,顯著提升技術應用性。在軟件工程中,合理應用數據庫挖掘技術[5]。由于受到數據庫信息影響,可以存儲大量高價值內容,有效指導軟件工程開發。同時,軟件工程掌握大量信息挖掘內容,可以擴大應用范圍。軟件工程版本,能夠統一化處理開發信息,實時更新軟件開發問題,維護軟件開發質量。當前,軟件開發更換數據信息,包含大量數據挖掘內容,科學劃分軟件內部,找尋問題并予以處理,可以實現軟件開發目標。

(4)掃描軟件漏洞。首先,創建測試項目:按照用戶需求,制定軟件測試方案,明確掃描漏洞類型,掃描方案等;其次,收集漏洞信息。漏洞掃描前提,在于正確認知漏洞,能夠準確定義漏洞。收集軟件缺陷信息,對屬性實行定量化處理。再者,選擇理論模型:按照掃描要求,選擇適宜數據挖掘模型,按照前期收集數據資料,充分訓練模型,獲得有效訓練集與測試集,確保掃描策略的有效性。最后,掃描漏洞:按照前期獲取的模型,能夠將其應用到軟件掃描測試中。見圖3為掃描軟件漏洞測試流程。通過數據分類與特征分析,能夠提取漏洞信息。按照掃描結果修復漏洞,可以重新掃描處理,確保漏洞修復成功率。見圖4為數據漏洞掃描圖。

(5)故障檢測?;诠收蠙z測,圍繞程序執行記錄實施數據挖掘,可以提供程序交互模式與說明。上述信息可以定位軟件故障,提供檢查憑證。對于程序執行數據挖掘來說,屬于信息追蹤、逆向建模過程,深入了解和優化流程,為后續維護管理提供條件。當前,挖掘方式主要為常規方式,深度挖掘程序行為,找尋對應流程,按照事態落實表述。

4.2 應用方式

(1)分類。數據挖掘技術中,涉及較多分類方式,對于同種預測分類標號執行動作。在實踐操作中,建立對應分析模型,聯合對應流程標準,輸入數據信息,將其作為分析模式應用依據。當前,在軟件工程應用中,合理應用數據挖掘技術,分離方式涉及判斷樹法、網絡分類法、支持向量機、貝葉斯分類法等[6]。在分類方式應用中,必須合理應用判斷樹法,通過貪心算法作為邏輯依據,以由上而下標準,建立判斷樹框架。在判斷樹中,包含大量子節點,且不同子節點代表不同軟件類別符號。

(2)聚類。聚類主要研究環節包含數據信息,按照標準予以細化,形成不同類型流程,確保相同類型對象的相似性較強,同時保證不同類型對象的差異性。聚類與分類存在本質偏差,聚類過程劃分對象,具備不可預測性,即無指導學習。在其他算法處理中,合理應用聚類分析方式,可以擴大應用范圍,尤其是數據分析獨立性,不僅可以挖掘孤立點,還可以確保檢測結果精準性與真實性。

(3)關聯。在軟件工程數據挖掘技術中,合理應用關聯方法。在大規模數據中,形成關聯機制。數據挖掘技術中的關聯方法,具備如下屬性:首先,支持度:在A與B數據集間,出現事物集D;其次,置信度:出現A事物集D中,B存在相同概率。強規則是滿足最小支持度、最小置信度規則[7]。在特定事物集D中,挖掘技術關聯規則,一般是形成支持度、可信度,比軟件終端用戶設置最小支持度、最小可信度的關聯規則。

4.3 軟件工程數據檢索

在數據挖掘過程中,包括信息錄入、信息查找、信息內容分析等挖掘過程。信息錄入,主要是維護錄入檢索信息對象。數據信息查找,是軟件工程最終用戶獲取信息對象,將檢索關鍵詞維護到檢索框內。通過查找分析功能,分析研究對象。數據信息分析,是軟件工程終端用戶聯合個人需求,在線閱讀、線下分析數據分析需求。軟件工程終端用戶下載數據,會產生下載信息,簡單查找客戶獲取信息記錄,便于分析和處理用戶行為。

5 數據挖掘技術應用挑戰與未來發展

5.1 技術應用挑戰

將數據挖掘技術應用到軟件工程中,軟件工程數據庫具備特殊性,會影響數據挖掘技術應用。從整體角度分析,軟件工程應用數據挖掘技術,面臨以下挑戰:軟件工程數據復雜度高,已經成為軟件工程數據挖掘面臨難題。軟件工程中,數據信息包含結構式、非結構式數據類型,但是不是所有數據挖掘算法,都可以應用到軟件工程中。應用數據挖掘技術分析軟件代碼問題時,由于結構式數據類型存在相應比例數據,會增加數據挖掘算法設計難度。

軟件工程中,系統數據較為復雜,已經成為數據挖掘技術的應用難題,同時面臨非傳統分析問題。將數據挖掘技術應用在軟件工程中,將數據知識提供為軟件用戶,已經成為終極應用目標。長期以來,應用數據挖掘技術,涉及傳統金融領域、新型電子商務應用,數據信息內容包含文字、圖表存儲方式。在軟件工程中,存儲數據內容并非簡單統計數據。為了提升軟件開發工作配合度,必須關注到軟件缺陷、開發模板信息、實際案例、結構設計等,要求軟件工程應用數據挖掘技術時,可以研究開發新型信息存儲方式,同時包含信息展示、知識評價等[8]。同時,軟件工程結果評價中,合理應用數據挖掘技術,面對問題非常多。傳統金融與應用領域內,數據挖掘技術形成成熟評價體系,并未完善結果評價體系。由于軟件工程開發面對的數據信息復雜,無法通過積極定量方式,高效評價軟件工程數據挖掘。

5.2 技術應用發展

在軟件工程領域,合理應用數據挖掘技術,與工程程序開發編寫相關。然而,編寫軟件工程代碼,會面臨動態規則、靜態規則、代碼重用等問題,對數據挖掘技術的應用影響較大。數據量持續增長,改變了數據信息處理方式,需要調整數據挖掘發展方向。從本質上看,互聯網信息應用云處理方式,可以處理數據高復雜度問題,數據挖掘處理效率較高。在信息化時代下,逐漸形成大數據趨勢,引導數據挖掘技術發展。所以,在應用數據挖掘技術時,應當深入分析數據處理與管理變化,以此提升技術應用效果。

6 結語

綜上所述,在軟件工程中應用數據挖掘技術,可以激發數據挖掘技術作用,提升軟件工程研發效率,降低管理成本投放,避免出現不良問題。從本文分析可知,數據挖掘技術應用到軟件工程中,具備較強的現實意義,值得推廣。

猜你喜歡
漏洞代碼數據挖掘
漏洞
改進支持向量機在特征數據挖掘中的智能應用
探討人工智能與數據挖掘發展趨勢
基于事故數據挖掘的AEB路口測試場景
基于selenium的SQL注入漏洞檢測方法
偵探推理游戲(二)
軟件工程領域中的異常數據挖掘算法
神秘的代碼
一周機構凈增(減)倉股前20名
漏洞在哪兒
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合