?

關于數據挖掘技術在軟件工程中的應用分析

2021-01-29 03:06谷安楠北京交通大學海濱學院
數碼世界 2020年12期
關鍵詞:結構化漏洞數據挖掘

谷安楠 北京交通大學海濱學院

引言

目前,我國互聯網普及率已經超過了60%,并且互聯網用戶已經超過了8億,這充分說明了我國互聯網用戶體量的龐大,在此背景下,有力的推動了軟件行業的發展。為了進一步推動軟件行業的發展,軟件開法過程中對數據挖掘技術的應用越來越廣泛,不僅提升了自身的競爭力,而且也能更好的滿足用戶的需求。

1 數據挖掘技術分析

1.1 數據挖掘的概念分析

數據挖掘技術伴隨著計算機技術而產生,計算機科技的發展,產生了海量的數據信息,而這些信息有的屬于顯性信息,有的屬于隱性信息。應用數據挖掘技術,便是對海量信息背后的價值進行充分挖掘和利用,使其更好的為人們服務。數據挖掘技術的實現,通常情況下都需要結合在線分析學、統計學、情報學等方面技術,這樣才能更好的實現數據挖掘。

1.2 數據挖掘技術的流程分析

數據挖掘技術流程是指從數據清理到知識的整個過程,并且在此過程中的每一個流程都十分重要。第一,信息收集流程,在數據挖掘過程中,信息收集是第一階段內容,信息收集的作用在于可以從數據中分析出需要的特征信息,并將需要的特征信息進行收集。信息收集完成后需要進行數據存入。第二,數據集成流程,通過信息收集流程,實現了對數據的收集和儲存,在此基礎上,對數據進行集成分類。數據集成分類的作用在于可以滿足對數據的不同需求,能夠為數據的共享奠定基礎。第三,數據規約流程,數據挖掘通常都會面對數量龐大的數據信息,再加之數據挖掘的算法十分復雜,會消耗大量時間,因此,數據挖掘的壓力相對較大。而通過數據規約流程,不僅可以減少數據處理的時間,而且還可以有效保證數據的完整性,避免因數據挖掘而影響數據的質量。第四,數據清理流程,通過這一流程,能夠提升數據的有效性,雖然以上幾個環節可以對數據信息進行處理,但是仍然還會存在無效數據以及數據不完整的情況,而數據清理便是將這些無效數據以及不完整數據進行清理,進而保障整個數據庫的質量。與此同時,在數據清理的過程中,還可以對那些完整以及準確的信息進行分類與儲存,進而可以進一步提升數據的有效性。第五,數據變換流程,在數據挖掘過程中,數據變換流程是十分重要的流程之一。數據變換流程實現了對數據形式的轉換,為數據的離散以及數據的分層奠定基礎。第六,數據挖掘流程,應用模糊集、統計方法以及決策樹等方法進行數據挖掘,進而幫助人們獲取有價值的信息。第七,模式評估流程,在此流程中,主要是由香港專家對數據挖掘結果進行評估,確保數據的有效性以及數據的真實性等。第八,知識表示流程,知識表示流程是指將所挖掘的數據呈現給用戶??v觀整個數據挖掘的流程,其中成本耗費量最大的為數據收集環節,耗費精力最多的為數據處理環節,因此,在數據挖掘的過程中應加強對數據收集和數據處理兩個環節的優化,在提升數據挖掘效率的同時降低數據挖掘的成本。

2 應用數據挖掘技術過程中存在的問題

2.1 信息數據具有復雜性

在開發軟件工程系統的過程中,會涉及到結構化數據和非結構化數據,軟件代碼在非結構化數據中起到了非常重要的作用,而軟件的版本信息則在結構化數據中發揮著至關重要的作用。這便需要明確區分結構化數據與非結構化數據,這是數據挖掘的關鍵所在。如果二者之間的區分不明確,則會導致數據處理的難度與數據挖掘技術水平不一致,這必將會給數據挖掘帶來不利影響,導致數據挖掘質量相對較低。但是針對結構化屬于與非結構化數據的分類十分復雜,難度較大,進而會導致數據挖掘技術的應用存在較大的局限性,難以充分發揮出數據挖掘技術的作用,因此也會給軟件工程的開發帶來不利影響。

2.2 工作標準方面存在問題

隨著計算機科技的不斷發展,計算機科技的作用以及影響范圍也在不斷擴大,目前計算機科技已經基本被應用于各個領域之中,絕大多數行業都需要應用計算機科技。這種現象決定了數據挖掘技術也會存在于多個行業之中,不同的行業對數據挖掘技術制定了不同的標準,因此便導致了數據挖掘工作標準多樣化的問題,這在很大程度上提升了軟件信息的復雜程度。除此之外,不同領域之中存在著較大的差異,相關的應用信息差別巨大,這些因素都會對數據的挖掘結果產生影響。

3 數據挖掘技術在軟件工程中的應用

3.1 優化漏洞檢測工作

在軟件工程開發過程中,漏洞檢測是十分關鍵的環節之一,通過漏洞檢測,可以幫助人們發現軟件工程中存在的疏漏,進而可以通過補丁來完善數據系統,有效彌補漏洞。根據相關調查顯示,在商業應用過程中出現的信息泄露事件,有86%都是因為系統漏洞所造成的,而要想避免信息泄露事件的發生,應不斷優化漏洞檢測工作,提升系統的穩定性。要結合客戶的需求來開展漏洞檢測,對檢測出來的漏洞要加強數據分析,為以后的軟件工程提供數據參考。另外,還要注重數據清理工作,確保系統空間充足。應用數據挖掘技術,能夠實現對漏洞的精準定位,進而為漏洞彌補帶來了極大的便利。因此,合理應用數據挖掘技術,能在很大程度上提升漏洞檢測的效率。值得注意的是,在數據轉化過程中要保證數據轉化后的有效性,避免出現數據不對等現象,因為數據不對等現象會給漏洞的檢測帶來不利影響。

3.2 提升挖掘版本控制信息水平

多人編輯統一檔案的情況在信息挖掘過程中并不罕見,針對這種情況,需要對檔案做出及時的更新,這樣才能使每個工作人員都能了解到檔案的最新情況。軟件開發工程采用版本控制技術來達到這一目標。在版本控制信息挖掘的過程中,要加強對變更工作的重視,優化工作程序,提升對檔案未來變化情況的檢測能力。針對漏洞的檢測,一方面要加強對當下漏洞的檢測,另一方面要對未來漏洞進行預測,這樣可以在很大程度上降低維護成本,同時還可以為系統軟件維護效率提供保障。

3.3 將數據挖掘技術與軟件項目管理相結合

項目管理對于系統的優化具有十分重要的作用,而數據挖掘有助于項目管理水平的提升,將數據挖掘技術與軟件項目管理相結合,可以為項目管理帶來極大的便利,同時還能夠推動項目管理水平和效率的提升。除此之外,數據挖掘技術還可以為崗位工作人員的職責分配提供幫助,有助于保障軟件工程的發展。將數據挖掘技術與軟件項目管理相結合,可以更好控制軟件工程,同時也給系統信息的查找帶來了極大的便利。

4 結束語

隨著軟件工程的發展,其開發難度也在不斷提升,而數據挖掘技術的應用,可以為軟件工程提供重要的保障。因此我們應加強對數據挖掘技術的應用,同時拓展對該技術應用的深度和范圍。

猜你喜歡
結構化漏洞數據挖掘
漏洞
改進支持向量機在特征數據挖掘中的智能應用
改進的非結構化對等網絡動態搜索算法
深度學習的單元結構化教學實踐與思考
探討人工智能與數據挖掘發展趨勢
基于事故數據挖掘的AEB路口測試場景
結構化面試方法在研究生復試中的應用
左顧右盼 瞻前顧后 融會貫通——基于數學結構化的深度學習
基于selenium的SQL注入漏洞檢測方法
偵探推理游戲(二)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合